自动化学报  2018, Vol. 44 Issue (10): 1833-1841   PDF    
基于非线性增益递归滑模的船舶轨迹跟踪动态面自适应控制
沈智鹏1, 张晓玲1     
1. 大连海事大学信息科学技术学院 大连 116026
摘要: 针对三自由度全驱动船舶存在模型不确定和未知外部环境扰动的情况,设计出一种基于非线性增益递归滑模的船舶轨迹跟踪动态面自适应神经网络控制方法.该方法综合考虑船舶位置和速度误差之间关系设计递归滑模面,引入神经网络对船舶模型不确定部分进行逼近,设计带σ-修正泄露项的自适应律对神经网络逼近误差与外界环境扰动总和的界进行估计,并应用一种非线性增益函数构造动态面控制律,选取李雅普诺夫函数证明了该控制律能够保证轨迹跟踪闭环系统内所有信号的一致最终有界性.最后,基于一艘供给船进行仿真验证,结果表明,船舶轨迹跟踪响应速度快、精度高,所设计控制器对系统模型参数摄动及外界扰动具有较强的鲁棒性.
关键词: 船舶轨迹跟踪     非线性增益     递归滑模     动态面自适应控制    
Recursive Sliding-mode Dynamic Surface Adaptive Control for Ship Trajectory Tracking With Nonlinear Gains
SHEN Zhi-Peng1, ZHANG Xiao-Ling1     
1. School of Information Science and Technology, Dalian Maritime University, Dalian 116026
Manuscript received : April 14, 2017, accepted: August 2, 2017.
Foundation Item: Supported by National Natural Science Foundation of China (51579024), Science Foundation of Liaoning Province of China (201602072), and Fundamental Research Funds for the Central Universities (3132016311, 3132017126)
Author brief: ZHANG Xiao-Ling  Master student at the School of Information Science and Technology, Dalian Maritime University. Her main research interest is ship motion adaptive control.
Corresponding author. SHEN Zhi-Peng  Professor at the School of Information Science and Technology, Dalian Maritime University. His research interest covers adaptive control, optimal control, and intelligent control with the application in vehicle. Corresponding author of this paper.
Recommended by Associate Editor GUO Ge
Abstract: The trajectory tracking problem of three degrees of freedom fully actuated ship with model uncertainty and unknown external environmental disturbances is analyzed, and a recursive sliding-mode dynamic surface adaptive robust control method with nonlinear gains for ship trajectory tracking is proposed. The recursive sliding-mode surface which considers the relationship between position and velocity errors is designed. Neural networks are constructed to provide estimation of model uncertainty and feedforward compensation for control amount. The adaptive laws based on leakage terms of σ modification are used to estimate bounds of neural network errors and unknown external environmental disturbances. A new function with nonlinear gains is used to construct the dynamic surface control law. With a new Lyapunov function, all signals in the ship's closed-loop trajectory tracking system can be guaranteed to have the uniformly ultimate boundedness by using the proposed control law. Simulation results show that the tracking speed is fast and the accuracy is high, and the proposed controller is strongly robust to model uncertainty and unknown external environmental disturbances.
Key words: Ship trajectory tracking     nonlinear gains     recursive sliding-mode     dynamic surface adaptive control    

具有动力定位系统的三自由度全驱动海洋工程船舶通过对船舶推进器的精确控制, 可使船舶以一定姿态保持在海面某一固定位置或精确地跟踪某一设定轨迹, 以完成深海勘探、海底管道建设、海上石油钻探和供给等工程领域作业.轨迹跟踪属于广义上的动力定位, 轨迹跟踪技术的理论挑战和海上新兴应用需求的增长, 使得相关人员对船舶轨迹控制的研究给予了极大的关注.

鉴于船舶运动方程的非线性特性, Fossen等[1]提出的反演法可有效避免对船舶模型进行线性化的要求, 构造中间虚拟控制量逐步回推获得控制律, 得到闭环系统全局指数稳定.船舶在航行过程中不可避免地遭受来自外部环境扰动, 例如风、浪、流等的影响, 反演法与其他控制方法相结合也取得了一定的研究成果. Yang等[2]采用扰动观测器对外部环境扰动进行估计并补偿, 结合反演法和李雅普诺夫理论, 实现船舶轨迹跟踪; 付明玉等[3]引入自适应与反演法结合进行控制律设计, 其中自适应控制项实现扰动参数的在线更新, 增强鲁棒性, 实现协同路径跟踪.而在被控对象相对阶增长的高阶系统情况下, 传统反演法对虚拟控制量求导引起的计算膨胀给控制器设计带来不便.为解决这个问题, Swaroop等[4]首次提出动态面控制(Dynamic surface control, DSC)方法, 引入一阶低通滤波器避免对虚拟控制量的求导, 简化计算, 易于工程实现; 杜佳璐等[5]将动态面控制技术融合到反演法中, 并设计自适应律对未知外部环境扰动的界进行估计, 增强鲁棒性, 实现船舶的动力定位.

在上述研究过程中, 需要已知精确的模型相关参数以确保控制性能, 而实际情况下是很难实现的.许多新的智能控制方法, 由于学习和适应的近似能力, 不需要花费很多精力进行系统建模, 被广泛应用于各类控制问题中. Wang等[6]采用径向基(Radial basis function, RBF)神经网络(Neural network, NN)逼近系统不确定项, 设计神经网络自适应动态面控制器; Xu等[7]采用最小参数学习法减少计算负担, 结合动态面技术, 通过小增益定理证明超高速飞行器良好的跟踪性能.刘希等[8]引入递归滑模解决常规动态面对低通滤波器时间常数和神经网络自适应参数摄动脆弱的缺点, 得到闭环系统所有状态半全局一致最终有界.考虑船舶模型参数未知、具有未建模动态和风浪流等环境扰动, 贾鹤鸣等[9]采用非线性迭代滑模对无人水下航行器(Unmanned underwater vehicle, UUV)进行航迹跟踪控制, 无需对系统模型不确定部分和海流干扰进行估计, 避免舵的抖振、减小稳态误差与超调; 沈智鹏等[10]在此基础上, 引入模糊系统对迭代滑模参数进行优化, 设计模糊自适应非线性迭代滑模控制器, 增强参数在不同海况环境下的自适应性, 实现更好的风帆助航船舶航向控制; Li等[11]采用RBF神经网络逼近系统的不确定因素, 构造自适应RBF神经网络控制器, 实现船舶轨迹跟踪; 王昊等[12]将动态面技术引入单隐层(Single hidden layer, SHL)神经网络进行控制律设计, 简化控制算法, 实现协同路径跟踪; Wang等[13]采用模糊系统逼近系统不确定部分, 引入Nussbaum函数解决控制方向不确定的问题, 结合动态面技术, 实现领导者-跟随者的输出同步.

然而, 常规动态面基于线性增益设置, 使得当系统误差较大时, 需要较大的控制量以保证控制精度, 然而过大的控制量容易引起系统输入饱和限制; 当系统误差较小时, 影响控制精度.采用"小误差大增益, 大误差小增益"的非线性函数可解决上述矛盾, 但无法得到系统稳定.且常规动态面采用的低通滤波器具有一定的延迟, 各子系统跟踪误差并不能代表真实的跟踪误差, 神经网络本身也会使系统稳定性变差, 加剧基于子系统跟踪误差依次反推的不利性.为此采用递归滑模面考虑各子系统误差间的相互关系, 恰好也能解决引入非线性函数后对系统稳定性证明的问题.孙秀霞等[14]引入一种非线性增益函数, 设计含有积分项的递归滑模面考虑各子系统间误差, 利用新的李雅普诺夫函数证明稳定性, 实现无人机航迹角跟踪.但该方法假设模型参数摄动和外界大气扰动总和的界已知, 实际情况下很难实现.刘希等[15]考虑不确定非线性系统, 利用神经网络在线逼近系统不确定项, 提出一种非线性增益递归滑模动态面自适应控制方法, 有效解决系统的跟踪控制问题.但该方法假设神经网络逼近误差界已知, 且所设计非线性增益函数为分段函数, 构造略显复杂, 实际应用具有一定的局限性, 且仅针对单输入-单输出严反馈系统进行控制器设计, 故该方法不能直接用于多输入-多输出的船舶轨迹跟踪控制问题.

根据以上研究结果, 在文献[15]基础上, 针对多输入-多输出三自由度全驱动船舶的轨迹跟踪控制问题, 当存在模型不确定和未知外部环境扰动时, 引入一种新的简单非线性增益函数和递归滑模面, 结合神经网络、动态面技术和自适应鲁棒反演控制, 设计出一种基于非线性增益递归滑模的船舶轨迹跟踪动态面自适应控制方法.该方法综合考虑船舶位置和速度误差之间关系设计递归滑模面, 引入神经网络对船舶模型不确定部分进行逼近, 设计带$\sigma$-修正泄露项的自适应律[16]对神经网络逼近误差与外界环境扰动总和的界进行估计, 并应用一种非线性增益函数构造动态面控制律, 选取李雅普诺夫函数可证明该控制律能够保证轨迹跟踪闭环系统内所有信号的一致最终有界性.最后应用一艘供给船进行控制仿真研究, 验证所设计控制器的有效性.

1 问题描述

假设船舶左右对称, 考虑前进、横漂和艏摇的三自由度轨迹跟踪船舶轨迹跟踪数学模型可表示为

$ \dot{{\pmb \eta}} = {J}(\psi){{\pmb \upsilon}} $ (1)
$ {M}\dot{{\pmb \upsilon}} +{C}({\pmb \upsilon}){\pmb \upsilon} +{D}{\pmb \upsilon} +{\pmb \Delta}_f={\pmb \tau}+{\pmb d} $ (2)

其中, ${\pmb \eta}=[x, y, \psi]^{\rm T}$为船舶在大地参考坐标系下的实际位置$(x, y)$和艏摇角$\psi$组成的向量; ${\pmb \upsilon}=$ $[u$, $\nu$, $r]^{\rm T}$为船舶在附体坐标系下前进速度$u$、横漂速度$\nu$和艏摇角速度$r$组成的向量; ${\pmb \tau}=[\tau_1, \tau_2, \tau_3]^{\rm T}$为船舶推进器控制输入前进力$\tau_1$、横漂力$\tau_2$以及艏摇力矩$\tau_3$组成的控制向量; ${\pmb d}=[d_1, d_2, d_3]^{\rm T}$为船舶在附体坐标系下受风、浪、流等引起的横向干扰力$d_1$、纵向干扰力$d_2$和艏向干扰力矩$d_3$组成的未知外部环境扰动向量; ${J}(\psi)$为坐标系转换矩阵, 其表达式为

$ {J}(\psi)= \begin{bmatrix} \cos(\psi)&-\sin(\psi)&0 \\ \sin(\psi)&\cos(\psi)&0 \\ 0&0&1 \end{bmatrix} $

且具备${J}^{-1}(\psi)={J}^{\rm T}(\psi)$$\|{J}(\psi)\|$的特性; ${M}$为船舶重量惯性和水动力附加惯性组成的矩阵; ${C}({\pmb \upsilon})$为科氏向心矩阵; ${D}$为线性水动力阻尼参数矩阵; ${\pmb \Delta}_f$ $=[\Delta_{f, 1}, \Delta_{f, 2}, \Delta_{f, 3}]^{\rm T}$为船舶模型不确定部分.

假设1.  船舶的参考轨迹${\pmb \eta}_d$是光滑可导且有界的, 其一阶导数$\dot{{\pmb \eta}}_d$和二阶导数$\ddot{{\pmb \eta}}_d$亦是有界的.

假设2.  轨迹跟踪船舶数学模型中, 船舶重量惯性和水动力附加惯性矩阵$M$已知且为对角阵、科氏向心矩阵$C({\pmb \upsilon})$和阻尼矩阵$D$已知; 船舶模型不确定部分${\pmb \Delta}_f$未知但有界; 外部环境扰动${\pmb d}$未知但有界.

本文的控制目标是针对船舶轨迹跟踪数学模型(1)和模型(2), 在满足假设1和假设2的情况下, 考虑船舶存在参数不确定部分且遭受完全未知的有界时变环境扰动, 设计控制律${\pmb \tau}$, 使船舶可以沿期望轨迹航行, 并保证闭环系统所有信号一致最终有界, 实现船舶轨迹跟踪.

2 船舶轨迹跟踪控制器设计

考虑轨迹跟踪船舶存在模型不确定部分和外部环境扰动, 引入一种新的简单非线性增益函数和递归滑模面, 结合神经网络、动态面技术和自适应鲁棒反演技术, 设计非线性增益递归滑模的船舶轨迹跟踪动态面自适应神经网络控制器.

2.1 一种非线性增益函数

为解决常规动态面控制基于线性增益设置使得系统的控制精度与动态品质之间存在矛盾的问题, 设计一种非线性增益函数, 其表达式为

$ \begin{align} g(x)=a|x|^{\frac {1}{2}} \textrm{sgn}{(x)} \end{align} $ (3)

其中, $a>0$.该函数具有"小误差大增益, 大误差小增益"的优良性质, 可有效解决上述矛盾.在常规动态面方法中引入非线性增益函数对李雅普诺夫函数的稳定性证明增加了难度, 这在后续采用递归滑模后将得到解决.

性质1.  函数$g(x)$关于自变量$x$严格单调递增, 为避免$x=0$时斜率过大的问题, 设置其导数

$ \begin{align} \frac{{\rm d}g(x)}{{\rm d}x}= \begin{cases} 1,& x=0\\[2mm] {\dfrac {a}{2}}{\left | x \right |^{-\frac{1}{2}}},&x\neq0 \end{cases} \end{align} $ (4)

性质2.  定义

$ \begin{align} l(x)=\frac{1}{2}\left[\frac{{\rm d}g(x)}{{\rm d}x}x+g(x)\right] \end{align} $ (5)

则对于任意的$x$, 有

$ \begin{align} x\times l(x)=\frac{1}{2}\left[\frac{{\rm d}g(x)}{{\rm d}x}x^2+x\times g(x)\right] \geq\frac{1}{2}x\times g(x)\nonumber \end{align} $

成立.

性质3.  为避免$x=0$时除数为零的情况, 定义

$ \begin{align} n(x)= \begin{cases} 1,& x=0\\[2mm] \dfrac{l(x)}{x},&x\neq0 \end{cases} \end{align} $ (6)

则对于任意的$x$, 有

$ \begin{align} n(x)=\frac{1}{2}\left[\frac{{\rm d}g(x)}{{\rm d}x}+\frac{g(x)}{x}\right]>0\nonumber \end{align} $

成立.

$a$取不同值时, 函数$l(x)$图像如图 1所示.

图 1 函数$l(x)$曲线图 Figure 1 The curves of function $l(x)$

可见, 在$x$较小时, $l(x)$变化增益较大, 而$x$较大时, $l(x)$变化增益较小, 即"小误差大增益, 大误差小增益".

2.2 控制器设计

步骤1.  考虑船舶位置误差向量, 定义第一个滑模面向量$ {\pmb s}_1\in {\bf{R}}^3$

$ \begin{align} \begin{cases} {\pmb z}_1 = J^{\rm T}(\psi)({\pmb \eta}-{\pmb \eta}_d)\\ {\pmb s}_1={\pmb z}_1 \end{cases} \end{align} $ (7)

其中, ${\pmb \eta}_d=[x_d, y_d, \psi_d]^{\rm T}$为轨迹跟踪船舶在大地坐标系下的期望位置和艏摇角组成的向量.考虑$\dot{J}(\psi)$ $=$ $J(\psi)R(r)$, 其中, $R(r)= \begin{bmatrix} 0&-r&0 \\ r&0&0 \\ 0&0&0 \end{bmatrix}$, 对式(7)两边关于时间求导, 并由式(1)可得

$ \begin{align} \dot{{\pmb s}}_1= &\ \dot {J}^{\rm T}(\psi)({\pmb \eta}-{\pmb \eta}_d)+ J^{\rm T}(\psi)(\dot{{\pmb \eta}}-\dot{{\pmb \eta}}_d)= \nonumber\\ &\ R^{\rm T}(r){\pmb s}_1+ {\pmb \upsilon}- J^{\rm T}(\psi)\dot{{\pmb \eta}}_d \end{align} $ (8)

设计${\pmb \upsilon}$的虚拟控制向量${\pmb \alpha}_1\in {\bf{R}}^3$

$\begin{align} {\pmb \alpha}_1=-K_1{\pmb l}_1({\pmb s}_1) + J^{\rm T}(\psi)\dot{{\pmb \eta}}_d -R^{\rm T}(r){\pmb s}_1 \end{align} $ (9)

其中, $K_1\in {\bf{R}}^{3\times3}$为设计的正定参数对角阵; ${\pmb l}_1({\pmb s}_1)$ $=$ $[l(s_{1, 1}), l(s_{1, 2}), l(s_{1, 3})]^{\rm T} \in {\bf{R}}^{3}$, $l(s_{1, i})$为如式(5)定义的$s_{1, i}$的非线性函数.

根据Swaroop等[4]提出的动态面方法, 引入一个新的状态向量${\pmb \upsilon}_d\in {\bf{R}}^3$作为${\pmb \alpha}_1$的一阶低通滤波输出, 数学表达式为

$ \begin{align} T\dot{{\pmb \upsilon}}_d+{\pmb \upsilon}_d={\pmb \alpha}_1, \quad{\pmb \upsilon}_d(0)={\pmb \alpha}_1(0) \end{align} $ (10)

其中, $T$为滤波器时间常数.用滤波器的$\dot{{\pmb \upsilon}}_d \in {\bf{R}}^3$代替$\dot{\pmb \alpha}_1$项, 避免传统反演法中对虚拟控制向量直接求导产生的计算复杂问题, 易于工程实现.

定义系统滤波器跟踪误差向量${\pmb y}\in {\bf{R}}^3$:

$ \begin{align} {\pmb y}={\pmb \upsilon}_d-{\pmb \alpha}_1 \end{align} $ (11)

步骤2.  根据船舶速度误差向量${\pmb z}_2={\pmb \upsilon}-{\pmb \upsilon}_d$和步骤1得到的位置误差向量${\pmb s}_1$, 综合考虑两者误差间的相互关系, 定义第二个递归滑模面向量${\pmb s}_2\in {\bf{R}}^3$

$ \begin{align} {\pmb s}_2=C_1{\pmb s}_1+{\pmb z}_2 \end{align} $ (12)

其中, $C_1\in {\bf{R}}^{3 \times 3}$为设计的正定参数对角阵.

考虑到三自由度全驱动轨迹跟踪船舶模型存在参数不确定部分${\pmb \Delta}_f$, 式(2)是一个三维状态方程组, 故引进3个RBF神经网络[17]对其进行逼近.

$ \begin{align} {\pmb \Delta}_f=W^{*{\rm T}}{\pmb h}({\pmb z})+{\pmb e}({\pmb z}) \end{align} $ (13)

其中, ${\pmb z}=[u, \nu, r]^{\rm T}$为RBF神经网络输入向量; ${\pmb e}({\pmb z})$ $=[e_1({\pmb z}), e_2({\pmb z}), e_3({\pmb z})]^{\rm T}$为RBF神经网络逼近误差向量; $W^*= \begin{bmatrix} {\pmb w}^{*{\rm T}}_1&0_{1\times l}&0_{1\times l} \\ 0_{1\times l}&{\pmb w}^{*{\rm T}}_2 &0_{1\times l} \\ 0_{1\times l}& 0_{1\times l}&{\pmb w}^{*{\rm T}}_3 \end{bmatrix}^{\rm T} \in {\bf{R}}^{3l \times 3}$为理想的权值向量构成的矩阵, ${\pmb w}^*_i=[w^*_{i, 1}, \cdots, w^*_{i, l}]^{\rm T}$为第$i$个神经网络的理想权值向量, 即对于所有的${\pmb z}$ $\in$ $\Omega_{{\pmb z}}$使得$|e_i({\pmb z})|$最小的向量${\pmb w}_i$的值, 在实际中无法得到, $i=1, 2, 3$, $l$为隐含层节点数; ${\pmb h}({\pmb z})=$ $[{\pmb h}^{\rm T}_1({\pmb z}), {\pmb h}^{\rm T}_2({\pmb z}), {\pmb h}^{\rm T}_3({\pmb z})]^{\rm T}\in {\bf{R}}^{3l}$为径向基函数构成的向量, ${\pmb h}_i({\pmb z})=[h_{i, 1}({\pmb z}), \cdots, h_{i, l}({\pmb z})]^{\rm T}\in {\bf{R}}^{l}$为第$i$个神经网络的径向基函数向量, 通常使用高斯基函数进行构造, 其表达式为

$ \begin{align} h_{i, j}=\exp\left[-\frac{({\pmb z}-{\pmb c}_j)^{\rm T}({\pmb z}-{\pmb c}_j)}{2b^2_{i, j}} \right] \nonumber \end{align} $

其中, $j=1, \cdots, l$, ${\pmb c}_j=[c_{j, 1}, c_{j, 2}, c_{j, 3}]^{\rm T}\in {\bf{R}}^{3}$为第$j$个隐层神经元的中心点向量值, $b_{i, j}>0$为第$i$个神经网络隐含层神经元$j$的高斯基函数的宽度.

假设3.  对于所有的${\pmb z} \in \Omega_{{\pmb z}}$, 神经网络理想权值${\pmb w}_i^*$和逼近误差${e}_i({\pmb z})$有界, 即存在正的常数$w_{i, M}$和有界函数$e_{i, M}({\pmb z})$, 使得$\|{\pmb w}_i^*\|\leq w_{i, M}$$|{e}_i({\pmb z})|\leq$ $e_{i, M}({\pmb z})$成立; 再由假设2, 则对于轨迹跟踪船舶外部环境扰动${\pmb d}$和RBF神经网络逼近误差${\pmb e}({\pmb z})$每一分量来说, 存在有界函数$\delta_i>0$, 使$|e_i({\pmb z})|+|d_i|<\delta_i$, $i$ $=1, 2, 3$, 即神经网络逼近误差${\pmb e}({\pmb z})$和外部环境扰动${\pmb d}$的界向量可表示为${\pmb \delta}=$ $[\delta_1$, $\delta_2, \delta_3]^{\rm T}$.

设计船舶轨迹跟踪状态反馈控制律为

$ \begin{align} {\pmb \tau} = &\ C({\pmb \upsilon}){\pmb \upsilon}+D{\pmb \upsilon}+M\dot{{\pmb \upsilon}}_d- MC_1\dot{\pmb s}_1 +\hat{W}^{\rm T}{\pmb h}({\pmb z})\, - \nonumber\\ &\ K_2{\pmb l}_2({\pmb s}_2) -C_2{\pmb s}_2- {N_2({\pmb s}_2)}{\pmb l}_1({\pmb s}_1)- {\Xi}\hat{\pmb \delta} \end{align} $ (14)

其中, ${\pmb l}_2({\pmb s}_2)=[l(s_{2, 1}), l(s_{2, 2}), l(s_{2, 3})] ^{\rm T} \in {\bf{R}}^3$; $K_2$, $C_2$ $\in$ ${\bf{R}}^{3 \times 3}$为设计的正定参数对角阵; ${N_2({\pmb s}_2)}={\rm diag}\{n^{-1}_2(s_{2, 1})$, $n^{-1}_2(s_{2, 2}), n^{-1}_2(s_{2, 3})\} \in {\bf{R}}^{3\times3}$; ${\Xi}={\rm diag}\{ \tanh[\frac{l_2(s_{2, 1)}}{\varepsilon_1}]$, $\tanh[\frac{l_2(s_{2, 2)}}{\varepsilon_2}]$, $\tanh[\frac{l_2(s_{2, 3)}}{\varepsilon_3}] \}$ $\in$ ${\bf{R}}^{3\times 3}$, $\varepsilon_i$为正的设计常数, $s_{2, i}$${\pmb s}_2$的第$i$个分量; $\hat{W}=\begin{bmatrix} \hat{{\pmb w}}^{\rm T}_1&0_{1\times l}&0_{1\times l} \\ 0_{1\times l}&\hat{{\pmb w}}^{\rm T}_2 &0_{1\times l} \\ 0_{1\times l}& 0_{1\times l}&\hat{{\pmb w}}^{\rm T}_3 \end{bmatrix}^{\rm T}\in {\bf{R}}^{3l\times3}$为理想权值向量构成的矩阵$W^*$的估计; $\hat{\pmb \delta}$${\pmb \delta}$的估计值向量.

设计权值向量自适应律为

$ \begin{align} \dot{\hat{\pmb w}}_i={\Gamma}_i \left[-{\pmb h}_i({\pmb z})l_2(s_{2, i})-\sigma_i \hat{\pmb w}_i\right] \end{align} $ (15)

其中, ${\Gamma}_i\in {\bf{R}}^{l\times l}$为设计的正定参数对角阵; $\sigma_i$为正的设计常数.

对神经网络逼近误差和外部环境扰动组成的界向量${\pmb \delta}$, 设计其估计值的自适应律为

$ \begin{align} \dot{\hat{{\pmb \delta}}}=Q\left[{\Xi} {\pmb l}_2({\pmb s}_2)- {\Lambda}(\hat{{\pmb \delta}}-{\pmb \delta}^0)\right] \end{align} $ (16)

其中, $Q\in {\bf{R}}^{3\times 3}$为设计的正定参数对角阵; ${\Lambda}=$ ${\rm diag} \{o_1, o_2, o_3 \}\in {\bf{R}}^{3\times 3}$亦为设计的正定参数对角阵, 选得很小, 但要保持不使$\hat{{\pmb \delta}}$增长到无界; ${\pmb \delta}^0=[\delta^0_1$, $\delta^0_2$, $\delta^0_3]^{\rm T}$, $\delta^0_i$$\delta_i$的先验估计, $i=1, 2, 3$.

注1.  本文为多输入-多输出的船舶轨迹跟踪控制问题, 定义${\pmb z}_1=J^{\rm T}(\psi)({\pmb \eta}-{\pmb \eta}_d)$代替常规动态面的${\pmb z}_1={\pmb \eta}-{\pmb \eta}_d$, 用以解决稳定性证明的难题; 对式(9)引入具有"小误差大增益, 大误差小增益"特性的非线性项$K_1{\pmb l}_1({\pmb s}_1)$提高系统控制性能.

注2.  在控制律式(14)中, 采用具有非线性增益功能的${\pmb l}_2({\pmb s}_2)$代替${\pmb s}_2$, 有效改善系统控制精度与动态品质之间的矛盾; 递归滑模面$C_2{\pmb s}_2$项解决常规动态面方法引入非线性增益函数后对李雅普诺夫函数稳定性证明的难题; ${N_2({\pmb s}_2)}{\pmb l}_1({\pmb s}_1)$项用于消除耦合项; 双曲正切函数${\Xi}$有效消除滑模抖振现象.

注3.  神经网络权值的自适应律式(15)和对神经网络逼近误差及外部环境扰动的界的自适应律式(16)中, 引入递归滑模函数${\pmb s}_2$的非线性增益函数${\pmb l}_2({\pmb s}_2)$, 有效防止神经网络及自适应的过度学习, 提高系统稳定性.

注4.  在设计状态反馈控制器的过程中, 文献[15]没有考虑外界环境扰动, 用神经网络逼近系统的不确定性; 且假设逼近误差界已知, 用逼近误差的界构造鲁棒项对逼近误差进行补偿.考虑实际作业船舶不可避免地遭受未知外界环境扰动, 且假设逼近误差界已知的情况不容易满足, 本文在设计船舶轨迹跟踪控制器的过程中, 用神经网络逼近模型不确定部分, 逼近误差和外界环境扰动采用基于$\sigma$-修正泄露项的自适应律对其界进行估计补偿, 提高船舶轨迹跟踪精确性, 增强鲁棒性.

2.3 稳定性分析

选择系统李雅普诺夫函数为

$ \begin{align} V=&\ \frac{1}{2}{{\pmb g}_1^{\rm T}({\pmb s}_1){\pmb s}_1} +\frac{1}{2}{{\pmb g}_2^{\rm T}({\pmb s}_2) M {\pmb s}_2} \, + \nonumber\\ &\ \frac{1}{2}{\sum\limits^{3}_{i=1}\tilde{\pmb w}^{\rm T}_i{\Gamma}^{-1}_i\tilde{\pmb w}_i}+\frac{1}{2}{\pmb y}^{\rm T}{\pmb y}+\frac{1}{2}\tilde{{\pmb \delta}}^{\rm T} Q^{-1}\tilde{{\pmb \delta}} \end{align} $ (17)

其中, ${\pmb g}_i({\pmb s}_i)=[g(s_{i, 1}), g(s_{i, 2}), g(s_{i, 3})]^{\rm T}$为式(3)定义的函数组成的向量, $i=1, 2$; $\tilde{\pmb w}_i=\hat{\pmb w}_i-{\pmb w}^*_i$为神经网络权值估计误差组成的向量; $\tilde{\pmb \delta}=\hat{\pmb \delta}-{\pmb \delta}$为自适应律估计误差向量.

对式(17)两边关于时间求导, 可得

$ \begin{align} \dot{V}= &\ {\pmb l}_1^{\rm T}({\pmb s}_1) \dot{\pmb s}_1 +{{\pmb l}_2^{\rm T}({\pmb s}_2) M\dot{\pmb s}_2}+ {\sum\limits^{3}_{i=1}\tilde{\pmb w}^{\rm T}_i{\Gamma}^{-1}_i\dot{\hat{\pmb w}}_i}\, + \nonumber \\ &\ {{\pmb y}^{\rm T}\dot{\pmb y}} + {\tilde{\pmb \delta}^{\rm T} Q^{-1}\dot{\hat{\pmb \delta}}} \end{align} $ (18)

其中, ${\pmb l}^{\rm T}_1({\pmb s}_1) \dot{{\pmb s}_1}$由式(8), (9), (11), (12)可得

$ \begin{align} {\pmb l}^{\rm T}_1({\pmb s}_1) \dot{\pmb s}_1=&\ {\pmb l}^{\rm T}_1({\pmb s}_1)\left[R^{\rm T}(r) {\pmb s}_1+{\pmb \upsilon}-J^{\rm T}(\psi)\dot{{\pmb \eta}}_d \right]= \nonumber \\ &\ {\pmb l}^{\rm T}_1({\pmb s}_1)\left[-K_1{\pmb l}_1({\pmb s}_1)+{\pmb s}_2-C_1{\pmb s}_1+{\pmb y} \right] \end{align} $ (19)

${\pmb l}_2^{\rm T}({\pmb s}_2)M\dot{{\pmb s}}_2$由式(2), (12), (14), 并考虑假设3可得

$ \begin{align} {\pmb l}^{\rm T}_2({\pmb s}_2)M\dot{\pmb s}_2= &\ {\pmb l}^{\rm T}_2({\pmb s}_2)M(C_1\dot{{\pmb s}}_1+\dot{{\pmb z}}_2)= \nonumber \\ &\ {\pmb l}^{\rm T}_2({\pmb s}_2)M\left\{C_1\dot{{\pmb s}}_1+M^{-1}\left[{\pmb \tau}+{\pmb d}\right. \right.- \nonumber \\ &\left.\left.C({\pmb \upsilon}){\pmb \upsilon}-D{\pmb \upsilon}-{\pmb \Delta}_f-M\dot{{\pmb \upsilon}}_d \right] \right\} \leq \nonumber \\ &\ {\pmb l}^{\rm T}_2({\pmb s}_2)\left[\tilde{W}^{\rm T}{\pmb h}({\pmb z})-K_2{\pmb l}_2({\pmb s}_2)-C_2{\pmb s}_2\, -\right. \nonumber \\ &\left. {N}_2({\pmb s}_2){\pmb l}_1({\pmb s}_1)-{\Xi}\hat{{\pmb \delta}}+{\pmb \delta} \right] \end{align} $ (20)

根据以上论述, 考虑式(15)和式(16), 则式(18)变为

$ \begin{align} \dot V\leq &\ {\pmb l}^{\rm T}_1({\pmb s}_1)\left[-K_1{\pmb l}_1({\pmb s}_1)-C_1{\pmb s}_1+{\pmb y} \right]+ {\pmb l}^{\rm T}_2({\pmb s}_2) \nonumber \\ &\left[-K_2{\pmb l}_2({\pmb s}_2)-C_2{\pmb s}_2+{\pmb \delta}\right]+ \sum\limits^{3}_{i=1}\tilde{{\pmb w}}^{\rm T}_i(-\sigma_i\hat{\pmb w}_i)\, +\nonumber \\ &\ {\pmb y}^{\rm T}\dot{{\pmb y}}-{\pmb \delta}^{\rm T}{\Xi} {\pmb l}_2({\pmb s}_2)-(\hat{{\pmb \delta}}-{\pmb \delta})^{\rm T} {\Lambda}(\hat{{\pmb \delta}}-{\pmb \delta}^0) \end{align} $ (21)

考虑不等式

$ \begin{align} -\sigma_i \tilde{\pmb w}^{\rm T}_i \hat{\pmb w}_i =& -\sigma_i \tilde{\pmb w}^{\rm T}_i(\tilde{\pmb w}_i + {\pmb w}^{*}_i)\leq \nonumber \\ &-\sigma_i \tilde{\pmb w}^{\rm T}_i \tilde{\pmb w}_i+ \frac{\sigma_i}{2}\tilde{\pmb w}^{\rm T}_i \tilde{\pmb w}_i + \frac{\sigma_i}{2}\|{\pmb w}^{*}_i\|^2 = \nonumber \\ & -\frac{\sigma_i}{2} \tilde{\pmb w}^{\rm T}_i \tilde{\pmb w}_i+ \frac{\sigma_i}{2}w_{i, M}^2 \nonumber \end{align} $

及不等式

$ \begin{align} & -(\hat{\delta}_i-{\delta}_i)(\hat{\delta}_i-{\delta}^0_i)= \nonumber \\ &\qquad-\frac{1}{2}(\hat{\delta}_i-{\delta}_i)^2-\frac{1}{2}(\hat{\delta}_i-{\delta}^0_i)^2+ \frac{1}{2}({\delta}_i-{\delta}^0_i)^2 \leq \nonumber \\&\qquad -\frac{1}{2}\tilde{\delta}_i^2+\frac{1}{2}({\delta}_i-{\delta}^0_i)^2 \nonumber \end{align} $

其中, $i=1, 2, 3$; 且根据双曲正切函数的性质, 对于$\varepsilon$ $>$ $0$, $a\in {\bf R}$, 有$0\leq|a|-a\tanh(a/\varepsilon)\leq 0.2785\varepsilon$, 故

$ \begin{align} \dot V \leq&-{\pmb l}^{\rm T}_1({\pmb s}_1)K_1{\pmb l}_1({\pmb s}_1)-{\pmb l}^{\rm T}_1({\pmb s}_1)C_1{\pmb s}_1+{\pmb l}^{\rm T}_1({\pmb s}_1){\pmb y}\, - \nonumber \\ &\ {\pmb l}^{\rm T}_2({\pmb s}_2)K_2{\pmb l}_2({\pmb s}_2)-{\pmb l}^{\rm T}_2({\pmb s}_2)C_2{\pmb s}_2+0.2785{{\pmb \varepsilon}}^{\rm T} {\pmb \delta}\, - \nonumber \\ &\ \frac{1}{2} {\beta}_0 \sum\limits^{3}_{i=1} \tilde{\pmb w}^{\rm T}_i {\Gamma}^{-1}_i\tilde{\pmb w}_i +\sum\limits^{3}_{i=1} \frac{{\sigma}_i}{2}w_{i, M}^2+{\pmb y}^{\rm T}\dot{{\pmb y}}\, - \nonumber \\ &\ \frac{1}{2} \lambda_{\min}({\Lambda} Q)\tilde{{\pmb \delta}}^{\rm T}Q^{-1}\tilde{{\pmb \delta}} +\frac{1}{2}({\pmb \delta}-{\pmb \delta}^0)^{\rm T}{\Lambda}({\pmb \delta}-{\pmb \delta}^0) \end{align} $ (22)

其中, $\beta_0=\min[\lambda_{\min}(\sigma_1{\Gamma}_1), \lambda_{\min}(\sigma_2{\Gamma}_2), \lambda_{\min}(\sigma_3{\Gamma}_3)]$; ${{\pmb \varepsilon}}$ $=$ $[\varepsilon_1, \varepsilon_2, \varepsilon_3]^{\rm T}$.

根据非线性增益函数的性质, 有如下不等式:

$ {\pmb l}^{\rm T}_1({\pmb s}_1){\pmb y} \leq a_1 {\pmb l}^{\rm T}_1({\pmb s}_1){\pmb l}_1({\pmb s}_1)+\frac{1}{4a_1}{\pmb y}^{\rm T}{\pmb y} $ (23)
$ {\pmb l}^{\rm T}_i({\pmb s}_i)C_i{\pmb s}_i \geq \frac{1}{2} {\pmb g}^{\rm T}_i({\pmb s}_i)C_i{\pmb s}_i $ (24)

其中, $a_1$为正常数, $i=1, 2$.

${\pmb y}^{\rm T}\dot{{\pmb y}}$, 由式(10)可得

$ \begin{align} \dot{{\pmb y}} = &\ \dot{{\pmb \upsilon}}_d - \dot{\pmb \alpha}_1=-\frac{{\pmb y}}{T} - K_1\dot{{\pmb l}}_1({\pmb s}_1) + \dot{J}^{\rm T}(\psi)\dot{{\pmb \eta}}_d\, + \nonumber \\ &\ J^{\rm T}(\psi)\ddot{{\pmb \eta}}_d- \dot{R}^{\rm T}(r){\pmb s}_1-R^{\rm T}(r)\dot{{\pmb s}}_1 \end{align} $ (25)

考虑紧集$ \Omega_1 = \{ [{\pmb s}^{\rm T}_1, {\pmb s}^{\rm T}_2, {\pmb y}^{\rm T}]^{\rm T} : V \leq \varpi _0 \}$$\Omega_d$ $=$ $\{ [{\pmb \eta}^{\rm T}_d, \dot{{\pmb \eta}}^{\rm T}_d, \ddot{{\pmb \eta}}^{\rm T}_d]^{\rm T} : \| {\pmb \eta}_d \|^2 + \| \dot{{\pmb \eta}}_d \|^2 +\| \ddot{{\pmb \eta}}_d \|^2 \leq B_0 \} $, 其中, $\varpi_0$, $B_0$为给定的正数.可知$\Omega_1 \times \Omega_d$也是紧集, 则存在非负的连续函数$\beta(\cdot)$, 使得$ \| \dot{{\pmb y}}+\frac{{\pmb y}}{T}\| \leq \beta({\pmb s}_1$, ${\pmb s}_2, {\pmb y}, {\pmb \eta}_d, \dot{{\pmb \eta}}_d, \ddot{{\pmb \eta}}_d)$, 且$\beta(\cdot)$在空间$\Omega_1 \times \Omega_d$上有最大值$N$.故

$ \begin{align} {\pmb y}^{\rm T} \dot{{\pmb y}} =&-\frac{{\pmb y}^{\rm T}{\pmb y}}{T} + \frac{{\pmb y}^{\rm T}{\pmb y}}{T} +{\pmb y}^{\rm T} \dot{{\pmb y}} =\nonumber \\ &-\frac{{\pmb y}^{\rm T}{\pmb y}}{T}+{\pmb y}^{\rm T}\left(\frac{\pmb y}{T}+\dot{{\pmb y}} \right) \leq \nonumber \\ &-\frac{{\pmb y}^{\rm T}{\pmb y}}{T}+a_2{\pmb y}^{\rm T}{\pmb y}+\frac{N^2}{4a_2} \end{align} $ (26)

其中, $a_2$为正常数.

由式(23), (24), (26), 当$\lambda_{\min}(K_1)>a_1$时, 式(22)变为

$ \begin{align} \dot{V} \leq &\, -\lambda_{\min}(C_1){\pmb g}^{\rm T}_1({\pmb s}_1){\pmb s}_1 - \frac{\lambda_{\min}(C_2)}{\lambda_{\max}(M)}{\pmb g}_2^{\rm T}({\pmb s}_2)M{\pmb s}_2\, - \nonumber \\ &\ \frac{1}{2} \beta_0 \sum\limits^{3}_{i=1}\tilde{\pmb w}^{\rm T}_i { \Gamma}^{-1}_i\tilde{\pmb w}_i - \left( \frac {1}{T}-\frac {1}{4a_1}-{a_2} \right){\pmb y}^{\rm T}{\pmb y}\, - \nonumber \\ &\ \frac {1}{2}\lambda_{\min} ({\Lambda} Q)\tilde{{\pmb \delta}}^{\rm T}Q^{-1}\tilde{{\pmb \delta}}+0.2785{{\pmb \varepsilon}}^{\rm T} {\pmb \delta}+\frac{N^2}{4a_2}\, + \nonumber\\ &\sum\limits^{3}_{i=1}\frac{\sigma_i}{2}w_{i, M}^2+\frac{1}{2}({\pmb \delta}-{\pmb \delta}^0)^{\rm T}\Lambda({\pmb \delta}-{\pmb \delta}^0) \nonumber \leq \\ &-\mu V + C \end{align} $ (27)

其中, $ \mu = \min [2\lambda_{\min}(C_1), \frac{ 2\lambda_{\min}(C_2)}{\lambda_{\max}(M)}, \beta_0, \lambda_{\min}({\Lambda} Q)$, $2( \frac {1}{T}-\frac {1}{4a_1}-\frac {1}{a_2} )]$; $C = 0.2785{{\pmb \varepsilon}}^{\rm T} {\pmb \delta}+ \sum^{3}_{i=1}\frac{\sigma_i}{2}w_{i, M}^2+$ $\frac{N^2}{4a_2}$ $+$ $\frac{1}{2}({\pmb \delta}-{\pmb \delta}^0)^{\rm T}{\Lambda}({\pmb \delta}-{\pmb \delta}^0)$; $\frac {1}{T}-\frac {1}{4a_1}-{a_2} > 0$, $\lambda_{\min}(\cdot)$为矩阵的最小特征值, $\lambda_{\max}(\cdot)$为矩阵的最大特征值.

按照上述分析, 总结定理如下:

定理1.  针对三自由度轨迹跟踪船舶的非线性运动学和动力学方程, 考虑船舶存在模型不确定部分且遭受未知外部环境扰动, 在假设1 $\sim$ 3成立的情况下, 构造一种新型非线性增益函数式(3), 引入神经网络对系统未知不确定部分进行逼近, 设计神经网络权值向量自适应律式(15), 采用$\sigma$-修正泄露项的自适应律式(16)对神经网络逼近误差和外界环境扰动的界进行估计, 最终在非线性递归动态面自适应鲁棒控制律式(14)的作用下, 得到闭环系统所有信号的一致最终有界性.适当对设计参数$K_1$, $K_2$, $C_1$, $C_2$, $\sigma_i$, ${ \Gamma}_i$, $Q$, ${\Lambda}$, $\varepsilon_i$, $\delta_i^0$和滤波器时间常数$T$进行调整选择, 可以使船舶实现高精度的轨迹跟踪.

证明  解不等式(27), 可得

$ \begin{align} 0 \leq V(t) \leq \frac{C}{\mu} + \left[V(0)- \frac{C}{\mu}\right]{\rm e}^{-\mu t} \end{align} $ (28)

故可知, $V(t)$一致最终有界; 再由式(17)可得系统中的信号${\pmb s}_1$, ${\pmb s}_2$, ${\pmb y}$, $\tilde{\pmb w}_i$$\tilde{{\pmb \delta}}$一致最终有界; 从而由式(7), (9)及(11)可知${\pmb \alpha}_1$, ${\pmb \upsilon}_d$${\pmb \upsilon}$有界; 由${\pmb \eta}_d$${\pmb s}_1$的有界性可知${\pmb \eta}$是有界的; 由$\tilde{{\pmb \delta}}$${\pmb \delta}$的有界性可知$\hat{{\pmb \delta}}$也是有界的.从而得到船舶轨迹跟踪闭环系统内所有信号的一致最终有界性.

结合式(7), (17), (28), 可得

$ \begin{align} 0 \leq \| {\pmb \eta} - {\pmb \eta}_d\| \leq \sqrt{\frac{2C}{\mu}+2 \left[V(0)-\frac{C}{\mu} \right] {\rm e} ^{-\mu t}} \end{align} $ (29)

则对任意的$\vartheta \geq \sqrt{2C/\mu}$, 存在常数$t_\vartheta$, 使得对于所有的$t>t_\vartheta$, 均有$\| {\pmb \eta} - {\pmb \eta}_d\| \leq \vartheta$, 即轨迹跟踪船舶位置误差向量$\| {\pmb \eta} - {\pmb \eta}_d\|$收敛于紧集$\Omega_{{\pmb \eta}-{\pmb \eta}_d}=\{ {\pmb \eta}-{\pmb \eta}_d$ $\in$ ${{\bf{R}}}^3 | \| {\pmb \eta}-{\pmb \eta}_d \| \leq \vartheta \} $.适当对设计参数$K_1$, $K_2$, $C_1$, $C_2$, $\sigma_i$, ${\Gamma}_i$, $Q$, ${\Lambda}$, $\varepsilon_i$, $\delta_i^0$和滤波器时间常数$T$进行调整, 可以使紧集$\Omega_{{\pmb \eta}-{\pmb \eta}_d}$任意小, 即可以使船舶实现高精度的轨迹跟踪.

3 仿真研究

为验证所设计控制律的有效性, 以文献[18]中一艘供给船作为仿真对象进行仿真试验.此船长度为76.2 m, 质量为$4.591 \times 10^6$ kg, 船舶重量惯性和水动力附加惯性组成的矩阵、科氏向心矩阵、线性水动力阻尼参数矩阵分别为

$ \begin{align*} &{M}=10^6\times \begin{bmatrix} 5.3122&0&0 \\ 0&8.2831&0 \\ 0&0&3745.4 \end{bmatrix}\\[1mm] &{C}({\pmb \upsilon})=10^6\times \begin{bmatrix} 0&0&8.2831\nu \\ 0&0&5.3122u \\ 8.2831\nu&5.3122u &0 \end{bmatrix}\\[1mm] &{D}=10^4\times \begin{bmatrix} 5.0242 &0&0 \\ 0&27.299&-439.33 \\ 0&-439.33 &41\, 894 \end{bmatrix}\end{align*} $

船舶模型不确定部分为

$ \begin{align*}{\pmb \Delta}_f=10^4\times \begin{bmatrix} 0.2 \times 5.0242 u^2 + 0.1 \times 5.0242u^3\\ 0.2 \times 27.299\upsilon^2 + 0.1 \times 27.299\upsilon^3\\ 0.2 \times 41\, 894r^2 + 0.1 \times 41\, 894r^3 \end{bmatrix}\end{align*} $

在仿真中, 选择船舶航行期望轨迹为

$ \begin{align*} &x_d = 500 \sin\left(0.02t+\frac{\pi}{4}\right) \\ & y_d = 500 \left[1-\cos\left(0.02t+\frac{\pi}{4}\right)\right]\\ & \psi_d = 0.01t \end{align*} $

外部环境扰动为

$ {d_1}=10^5\times \left[\sin(0.2t)+\cos(0.5t)\right]\\ {d_2}=10^5\times \left[\sin(0.1t)+\cos(0.4t)\right]\\ {d_3}=10^6\times\left[\sin(0.5t)+\cos(0.3t)\right] $

船舶初始位置和速度状态信息为

$ \begin{align*} & [x(0), y(0), \psi(0), u(0), \nu(0), r(0)]^{\rm T}=\\ & \qquad [100\, {\rm m}, 400\, {\rm m}, \frac{\pi}{4}, 0\, {\rm m/s}, 0\, {\rm m/s}, 0\, {\rm rad/s}]^{\rm T}\end{align*} $

RBF神经网络的隐含层节点数选择为61个, 取$c_{j, 1}$$c_{j, 2}$$[-18, 18]$之间平均分布, $c_{j, 3}$在[$-0.3, 0.3]$之间平均分布, $b_{1, j}=b_{2, j}=3$, $b_{3, j}=$ $1$, $j = 1, \cdots, 61$; 网络权值估计的初始值为$\hat{\pmb w}_i=$ $[\hat{w}_{i, 1}, \hat{w}_{i, 2}, \cdots, \hat{w}_{i, l}]^{\rm T}=[0, 0, \cdots, 0]^{\rm T}$, $i=1, 2, 3$; 取非线性增益函数参数$a=1$; 取控制器参数矩阵为$K_1={\rm diag}\{0.08, 0.08, 0.08\}$, $K_2={\rm diag} \{100, 100$, $100 \}$, $C_1={\rm diag}\{1, 1, 1 \}$, $C_2= {\rm diag}\{10^5, 10^5, 2$ $\times$ $10^8 \}$, ${\Gamma}={\rm diag}\{10^5, 10^5, 10\}$, $\sigma_1=\sigma_2=10^{-6}$, $\sigma_3$ $= 10^{-2}$, $Q =10^5\times {\rm diag}\{5, 5, 10 \}$, ${\Lambda}=10^{-7}$ $\times$ ${\rm diag}\{1, 1, 0.2 \}$, $\varepsilon_1=\varepsilon_2=1$, $ \varepsilon_3=0.01$, $\delta^0_1 =\delta^0_2=$ $\delta^0_3$ $=0.1$; 滤波器时间常数$T=0.3$; 故当正常数$a_1$, $a_2$满足$1/(4a_1)+a_2 <(1/T)= 3.333$$a_1< 0.08$的情况下, 可使船舶按期望轨迹航行, 保证闭环系统所有信号的有界性, 实现轨迹跟踪.

在相同海况下, 采用本文算法与文献[6]基于神经网络的常规动态面算法对船舶轨迹跟踪性能进行仿真比较, 系统的初始条件相同, 仿真结果如图 2 $\sim$ 8所示.

图 2 外部环境扰动下船舶的期望轨迹和实际轨迹 Figure 2 Desired trajectory and actual trajectory under external environment disturbances
图 3 外部环境扰动下期望轨迹${\pmb \eta}_d=[x_d, y_d, \psi_d]^{\rm T}$和文算法实际轨迹${\pmb \eta}=[x, y, \psi]^{\rm T}$历时曲线 Figure 3 Curves of desired trajectory ${\pmb \eta}_d=[x_d, y_d, \psi_d]^{\rm T}$ and actual trajectory ${\pmb \eta}=[x, y, \psi]^{\rm T}$ with proposed controller versus time under external environment disturbances
图 4 外部环境扰动下前进速度$u$、横移速度$\nu$和艏摇角速度$r$历时曲线 Figure 4 Curves of surge velocity $u$, sway velocity $\nu$ and yaw rate $r$ versus time under external environment disturbances
图 5 神经网络逼近历时曲线 Figure 5 Curves of learning behavior of neural networks
图 6 控制器输出 Figure 6 Curves of controller outputs
图 7 外部环境扰动和逼近误差的界$\delta_1$, $\delta_2$, $\delta_3$及其估计值$\hat{\delta}_1$, $\hat{\delta}_2$, $\hat{\delta}_3$历时曲线 Figure 7 Curves of the bounds of external environment disturbances and approximation errors $\delta_1$, $\delta_2$, $\delta_3$ and their estimations $\hat{\delta}_1$, $\hat{\delta}_2$, $\hat{\delta}_3$ verse time with proposed controller
图 8 相同海况下本文算法与常规动态面算法跟踪性能比较 Figure 8 Comparison of tracking errors under the same sea conditions between the proposed method and the dynamic surface control method

图 2是相同海况下, 大地参考坐标系内船舶的期望轨迹和本文设计控制律及常规动态面设计控制律驱动船舶航行的实际轨迹, 表明在模型不确定和未知外部环境扰动存在的情况下, 本文设计控制律相较于常规动态面而言, 能够较快地跟踪上期望轨迹, 且跟踪精度较高; 图 3是大地参考坐标系下船舶的期望位置、期望艏摇角和本文设计控制律驱动船舶航行的实际位置、实际艏摇角的历时曲线, 表明船舶在大约50 s左右即能大概跟踪上期望轨迹; 图 4是前进速度$u$、横漂速度$\nu$和艏摇角速度$r$的历时曲线; 图 5是系统不确定部分$\Delta_{f, 1}$, $\Delta_{f, 2}$, $\Delta_{f, 3}$及RBF神经网络的逼近值$NN_1$, $NN_2$, $NN_3$的历时曲线, 表明在50 s以后神经网络基本跟踪上所要逼近的不确定项; 图 6是本文设计控制器输出, 可以看出控制律光滑合理; 图 7是外部环境扰动和逼近误差的界$\delta_1$, $\delta_2$, $\delta_3$及其估计值$\hat{\delta}_1$, $\hat{\delta}_2$, $\hat{\delta}_3$历时曲线, 且放大$\hat{\delta}_1$从20 s到300 s的跟踪曲线, 可以看出所设计修正泄漏项的自适应律参数选取合适, 能够对外部环境扰动和逼近误差的界进行估计; 结合图 5神经网络逼近效果, 可以看出在神经网络跟踪有误差的情况下, 自适应律也能够进行很好的估计从而保证船舶的高精度航行; 图 8是相同海况下本文算法与常规动态面算法跟踪性能比较, 其中$e_{\eta}=\|{\pmb \eta}-{\pmb \eta}_d\|$表示位置误差范数, 可以看出, 本文算法跟踪性能较常规动态面虽然前30 s稍慢, 但30 s后明显优于常规动态面, 跟踪误差衰减快; 且基于"小误差大增益, 大误差小增益"的本文算法考虑递归滑模在一定程度上削弱神经网络造成的误差, 45 s后基本跟踪上期望轨迹, 稳态误差小, 总体上性能优于常规动态面.

4 结论

考虑三自由度全驱动船舶具有模型不确定部分且遭受未知外部环境扰动, 引入非线性增益函数和递归滑模面, 结合神经网络、动态面技术和自适应鲁棒反演控制, 设计出一种基于非线性增益递归滑模的船舶轨迹跟踪动态面自适应控制器.非线性函数的引入和递归滑模面的设计, 能有效解决常规动态面方法对低通滤波器时间常数和神经网络自适应参数摄动脆弱的缺点.基于李雅普诺夫函数证明了该控制律可实现船舶的高精度轨迹跟踪, 并保证系统内所有信号的一致最终有界性.最后以一艘供给船舶进行仿真试验, 验证了所设计控制器的有效性, 仿真结果表明, 采用非线性增益递归滑模的船舶轨迹跟踪动态面自适应控制方法, 可提高船舶轨迹跟踪速度和控制精度, 且控制力和力矩光滑合理, 更加符合船舶的实际操作要求, 在工程实际中具有一定参考价值.

参考文献
1
Fossen T I, Berge S P. Nonlinear vectorial backstepping design for global exponential tracking of marine vessels in the presence of actuator dynamics. In: Proceedings of the 36th Conference on Decision and Control. San Diego, California, USA: IEEE, 1997, 5: 4237-4242 http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=649499
2
Yang Y, Du J L, Liu H B, Guo C, Abraham A. A trajectory tracking robust controller of surface vessels with disturbance uncertainties. IEEE Transactions on Control Systems Technology, 2014, 22(4): 1511-1518. DOI:10.1109/TCST.2013.2281936
3
Fu Ming-Yu, Jiao Jian-Fang, Zhang Ai-Hua. Coordinated path following control for multiple surface vessels by using virtual-leader. Journal of Huazhong University of Science and Technology (Natural Science Edition), 2013, 41(2): 102-108.
( 付明玉, 焦建芳, 张爱华. 基于虚拟领航者的多艘船舶协调路径跟踪控制. 华中科技大学学报(自然科学版), 2013, 41(2): 102-108.)
4
Swaroop D, Hedrick J K, Yip P P, Gerdes J C. Dynamic surface control for a class of nonlinear systems. IEEE Transactions on Automatic Control, 2000, 45(10): 1893-1899. DOI:10.1109/TAC.2000.880994
5
Du Jia-Lu, Yang Yang, Hu Xin, Chen Hai-Quan. Control law design of dynamic positioning for ship based on dynamic surface control. Journal of Traffic and Transportation Engineering, 2014, 14(5): 36-42, 50.
( 杜佳璐, 杨杨, 胡鑫, 陈海泉. 基于动态面控制的船舶动力定位控制律设计. 交通运输工程学报, 2014, 14(5): 36-42, 50. DOI:10.3969/j.issn.1671-1637.2014.05.005)
6
Wang D, Huang J. Neural network-based adaptive dynamic surface control for a class of uncertain nonlinear systems in strict-feedback form. IEEE Transactions on Neural Networks, 2005, 16(1): 195-202. DOI:10.1109/TNN.2004.839354
7
Xu B, Zhang Q, Pan Y P. Neural network based dynamic surface control of hypersonic flight dynamics using small-gain theorem. Neurocomputing, 2016, 173: 690-699. DOI:10.1016/j.neucom.2015.08.017
8
Liu Xi, Sun Xiu-Xia, Liu Shu-Guang, Xu Song, Hao Zhen. Non-fragile recursive sliding mode dynamic surface control with adaptive neural network. Control Theory and Applications, 2013, 30(10): 1323-1328.
( 刘希, 孙秀霞, 刘树光, 徐嵩, 郝震. 非脆弱递归滑模动态面自适应神经网络控制. 控制理论与应用, 2013, 30(10): 1323-1328.)
9
Jia He-Ming, Zhang Li-Jun, Cheng Xiang-Qin, Bian Xin-Qian, Yan Zhe-Ping, Zhou Jia-Jia. Three-dimensional path following control for an underactuated UUV based on nonlinear iterative sliding mode. Acta Automatica Sinica, 2012, 38(2): 308-314.
( 贾鹤鸣, 张利军, 程相勤, 边信黔, 严浙平, 周佳加. 基于非线性迭代滑模的欠驱动UUV三维航迹跟踪控制. 自动化学报, 2012, 38(2): 308-314.)
10
Shen Zhi-Peng, Jiang Zhong-Hao, Wang Guo-Feng, Guo Chen. Fuzzy-adaptive iterative sliding-mode control for sail-assisted ship motion. Journal of Harbin Engineering University, 2016, 37(5): 634-639.
( 沈智鹏, 姜仲昊, 王国峰, 郭晨. 风帆助航船舶运动的模糊自适应迭代滑模控制. 哈尔滨工程大学学报, 2016, 37(5): 634-639.)
11
Li G Y, Li W, Hildre H P, Zhang H X. Online learning control of surface vessels for fine trajectory tracking. Journal of Marine Science and Technology, 2016, 21(2): 251-260. DOI:10.1007/s00773-015-0347-9
12
Wang Hao, Wang Dan, Peng Zhou-Hua, Sun Gang. Adaptive dynamic surface control for cooperative path following of multiple autonomous surface vessels. Control Theory and Applications, 2013, 30(5): 637-643.
( 王昊, 王丹, 彭周华, 孙刚. 多自主船协同路径跟踪的自适应动态面控制. 控制理论与应用, 2013, 30(5): 637-643.)
13
Wang W, Wang D, Peng Z H, Li T S. Prescribed performance consensus of uncertain nonlinear strict-feedback systems with unknown control directions. IEEE Transactions on Systems, Man, and Cybernetics:Systems, 2016, 46(9): 1279-1286. DOI:10.1109/TSMC.2015.2486751
14
Sun Xiu-Xia, Liu Xi, Xu Song, Cai Ming, Gao Yang-Jun, Tang Qiang. Nonlinear gains recursive sliding mode control for flight-path angle of UAVs. Systems Engineering and Electronics, 2015, 37(2): 379-384.
( 孙秀霞, 刘希, 徐嵩, 蔡鸣, 高杨军, 唐强. 无人机航迹角的非线性增益递归滑模控制. 系统工程与电子技术, 2015, 37(2): 379-384.)
15
Liu Xi, Sun Xiu-Xia, Liu Shu-Guang, Xu Song, Cheng Zhi-Hao. Recursive sliding-mode dynamic surface adaptive NN control with nonlinear gains. Acta Automatica Sinica, 2014, 40(10): 2193-2202.
( 刘希, 孙秀霞, 刘树光, 徐嵩, 程志浩. 非线性增益递归滑模动态面自适应NN控制. 自动化学报, 2014, 40(10): 2193-2202.)
16
Polycarpou M M, Ioannou P A. A robust adaptive nonlinear control design. Automatica, 1996, 32(3): 423-427. DOI:10.1016/0005-1098(95)00147-6
17
Jiao Li-Cheng, Yang Shu-Yuan, Liu Fang, Wang Shi-Gang, Feng Zhi-Xi. Seventy years beyond neural networks:retrospect and prospect. Chinese Journal of Computers, 2016, 39(8): 1697-1716.
( 焦李成, 杨淑媛, 刘芳, 王士刚, 冯志玺. 神经网络七十年:回顾与展望. 计算机学报, 2016, 39(8): 1697-1716.)
18
Fossen T I, Sagatun S I, Sørensen A J. Identification of dynamically positioned ships. Modeling, Identification and Control, 1996, 17(2): 153-165. DOI:10.4173/mic.1996.2.7