欠驱动UUV自适应RBF神经网络反步跟踪控制

引用本文

张伟, 滕延斌, 魏世琳, 等. 欠驱动UUV自适应RBF神经网络反步跟踪控制[J]. 哈尔滨工程大学学报, 2018, 39(1): 93-99. DOI: 10.11990/jheu.201611010.

ZHANG Wei, TENG Yanbin, WEI Shilin, et al. Underactuated UUV tracking control of adaptive RBF neural network and backstepping method[J]. Journal of Harbin Engineering University, 2018, 39(1): 93-99. DOI: 10.11990/jheu.201611010.

基金项目

国家自然科学基金项目（E091002/51309067）；黑龙江省科学基金项目（E2016020）；中央高校基本科研业务费专项基金资助（HEUCF201736，HEUCFM171011）

通信作者

张伟, E-mail:dawizw@163.com

作者简介

张伟(1978-), 男, 教授, 博士生副导师

文章历史

收稿日期：2016-11-02
网络出版日期：2017-11-02

Contents Abstract Full text Figures/Tables PDF

欠驱动UUV自适应RBF神经网络反步跟踪控制

张伟, 滕延斌, 魏世琳, 胡守一, 张吉楠

哈尔滨工程大学自动化学院, 黑龙江哈尔滨 150001

收稿日期：2016-11-02；网络出版日期：2017-11-02

基金项目：国家自然科学基金项目（E091002/51309067）；黑龙江省科学基金项目（E2016020）；中央高校基本科研业务费专项基金资助（HEUCF201736，HEUCFM171011）

作者简介：张伟(1978-), 男, 教授, 博士生副导师.

通信作者：张伟, E-mail:dawizw@163.com.

摘要：针对水下无人航行器（UUV）模型存在一定的误差以及流体中存在时变扰动问题，引入径向基函数（RBF）神经网络控制技术进行自适应补偿估计，结合反步法设计UUV的位置、姿态及速度控制器，使用虚拟速度来代替姿态误差的控制手段，将姿态跟踪控制转化为对速度控制。仿真结果说明此种方法是有效的，提高了UUV的鲁棒性及自适应能力。

关键词：反步法自适应RBF神经网络水下无人航行器轨迹跟踪多扰动自适应控制鲁棒性时变扰动

Underactuated UUV tracking control of adaptive RBF neural network and backstepping method

ZHANG Wei, TENG Yanbin, WEI Shilin, HU Shouyi, ZHANG Ji'nan

College of Automation, Harbin Engineering University, Harbin 150001, China

Abstract: An underwater unmanned vehicle (UUV) model has an error that causes time-varying perturbation in the fluid. Therefore, the radial basis function (RBF) neural network control technique was introduced in order to carry out an adaptive compensation estimate. Additionally, the backstepping method was utilized in order to design the position, attitude, and velocity controller of the UUV. Virtual speed was used in order to replace the attitude error for the purpose of converting the attitude tracking control to speed control. The simulation results show that this method was effective in improving the robustness and adaptability of the UUV.

Key words: backstepping adaptive RBF neural network underwater unmanned vehicle (UUV) trajectory tracking multi-disturbance adaptive control robust time-varing perturbation

UUV深水作业下潜机动需要较长时间，但由于自身所携带的能源有限，使其作业时间严重压缩。为了实现UUV能源的补充、数据的上传、新任务的下载必须就要对UUV进行回收，快速安全回收一直是研究的热点。在水下回收方面，一种对线控位的回收方法被应用于欠驱动UUV的回收中^[1]。对于常规的UUV，其推进装置主要为尾推，执行机构为水平舵、垂直舵，在运动过程中在侧面方向和垂直方向一般没有足够的控制力，需要通过舵和推力间接控制，因此UUV空间的运动具有欠驱动性。贾鹤鸣等^[2]将自适应方法与反步法相结合，设计一种自适应反步法来对航行器的三维轨迹进行跟踪控制，并取得良好效果；徐健等^[3-4]将滑模控制方法与反步法相结合，设计反步滑模控制器来对UUV的三维轨迹进行跟踪控制，并进行了相关仿真，证明了所设计控制器的有效性；朱齐丹等^[5]将反步法与神经网络相结合，并应用到船舶的航迹跟踪控制上，证明了算法的有效性；程相勤^[6]将滑模理论应用到UUV的空间路径跟踪上，进行了相关仿真验证，取得较好的效果；贾鹤鸣等将神经网络反步法^[7]和滤波反步法^[8]分别应用到移动机器人和水下航行器的空间三维路径跟踪上，验证了算法的有效性，取得较好的进展；周佳加等^[9-10]将神经网络控制应用到了UUV的航速和跟踪控制上，通过仿真验证了算法的有效性；针对回收过程中的规划控制和路径跟踪问题，文献[11-12]进行了相关研究，并取得一定的进展；严浙平等^[13-14]采用滑模控制方法对UUV地形跟踪控制进行研究，实现了UUV地形跟踪，证明了算法的有效性。在UUV的自主回收过程中，跟踪控制作为重要的一环，是不可或缺的，是值得深入研究。

1 控制理论与UUV模型 1.1 反步法与神经网络

反步法是将整个非线性系统进行分解，每一个子系统都是不超过系统最高阶数的系统，然后针对每个子系统分别设计Lyapunov控制函数和中间虚拟控制量，使得每个子系统都是镇定的，一直“后退”到整个非线性系统，最终通过设计的控制律保证整个系统的稳定性。

神经网络与传统的控制策略相比具有对任意函数的学习能力，因而与传统自适应控制相比可以避免需要大量的精确复杂数学分析。对于高维非线性控制问题，多层的神经网络的隐含层采用激活函数，具有非线性的映射能力，可以逼近任意非线性函数，因此神经网络广泛应用在不确定模型的控制问题上。

RBF神经网络有3层^[15-16]：输入层、隐含层、输出层。隐含层的神经元激活函数由径向基函数构成。隐含层由节点组成，节点中包含一个中心向量，和输入向量具有相同的维数，其欧式距离为‖x(t)-c_j(t)‖，隐含层的输出为非线性激活函数：

$ {h_j}\left( t \right) = \exp \left( {\frac{{{{\left\| {\mathit{\boldsymbol{x}}\left( t \right) - {\mathit{\boldsymbol{c}}_j}\left( t \right)} \right\|}^2}}}{{2b_j^2}}} \right),j = 1,2, \cdots ,m $

(1)

式中：b_j＞0，表示高斯基函数的宽度，m是隐含层的节点数量。

网络的输出由加权函数实现：

$ {y_i}\left( t \right) = \sum\limits_{j = 1}^m {{w_{ji}}{h_j}\left( t \right)} ,\;i = 1,2, \cdots ,n $

(2)

式中：w_j是输出层的权值，n是输出节点个数，y是神经网络输出。

1.2 UUV模型

本研究所针对的白鲨UUV外形是左右对称、上下对称，并且欠驱动UUV的重心和浮心在同一垂线上，运动过程中横倾角及角速度一般很小，工程中可以忽略。根据UUV的欠驱动特性建立五自由度含扰动项的动力学模型和运动学模型^[17-18]。

UUV运动学模型

$ \left\{ \begin{array}{l} \dot x = \cos \psi \cos \theta u - \sin \psi v + \sin \theta \cos \psi w\\ \dot y = \sin \theta \cos \psi u + \cos \psi v + \sin \theta \sin \psi w\\ \dot z = - \sin \theta u + \cos \theta w\\ \dot \theta = q\\ \dot \psi = r/\cos \theta \end{array} \right. $

(3)

UUV动力学模型

$ \left\{ \begin{array}{l} \dot u = \frac{{{a_1}}}{{{m_{11}}}}vr - \frac{{{a_2}}}{{{m_{11}}}}vq - \frac{{{a_3}}}{{{m_{11}}}}u - \frac{{{a_4}}}{{{m_{11}}}}{r^2} - \frac{{{\tau _{d1}}}}{{{m_{11}}}} + \frac{{{\tau _u}}}{{{m_{11}}}}\\ \dot v = \frac{{{b_1}}}{{{m_{22}}}}ur - \frac{{{b_2}}}{{{m_{22}}}}v - \frac{{{b_3}}}{{{m_{22}}}}\dot r + \frac{{{\tau _{d2}}}}{{{m_{22}}}}\\ \dot w = \frac{{{c_1}}}{{{m_{33}}}}uq - \frac{{{c_2}}}{{{m_{33}}}}w - \frac{{{c_3}}}{{{m_{33}}}}\dot q + \frac{{{c_4}}}{{{m_{33}}}}pr + \frac{{{\tau _{d3}}}}{{{m_{33}}}}\\ \dot q = \frac{{{d_1}}}{{{m_{55}}}}uv - \frac{{{d_2}}}{{{m_{55}}}}q - \frac{{{d_3}}}{{{m_{55}}}}\sin \theta - \frac{{{d_4}}}{{{m_{55}}}}\dot w + \frac{{{\tau _{d4}}}}{{{m_{55}}}} + \frac{{{\tau _q}}}{{{m_{55}}}}\\ \dot r = \frac{{{e_1}}}{{{m_{66}}}}nv - \frac{{{e_2}}}{{{m_{66}}}}r - \frac{{{e_3}}}{{{m_{66}}}}\dot v - \frac{{{e_4}}}{{{m_{66}}}}pq + \frac{{{\tau _{d5}}}}{{{m_{66}}}} + \frac{{{\tau _r}}}{{{m_{66}}}} \end{array} \right. $

(4)

式中：τ_u、τ_q、τ_r为控制量，τ_d1、τ_d2、τ_d3、τ_d4、τ_d5为扰动量，$ {m_{11}} = m-{X_{\dot u}} $，$ {m_{22}} = m-{Y_{\dot u}}, {m_{33}} = m-{Z_{\dot w}}$，$ {m_{55}} = {I_y}-{M_{\dot q}}，{m_{66}} = {I_z} - {N_{\dot r}} $，a₁=(m+X_vr)，a₂=(m-X_wq)，a₃=(X_u+X_u‖u‖|u|)，a₄=X_rr，b₁=(m-Y_ur)，b₂=(Y_v+Y_v|v||v|)，$ {b_3} = {Y_{\dot r}} $，c₁=(m+Z_uq)，c₂=(Z_w+Z_w|w||w|)，${c_3} = {Q_{\dot q}} $，c₄=Y_pr，d₁=M_uv，d₂=(M_q+Mq|q||q|)，$ {d_3} = \rho g\nabla \overline {G{M_L}} $，$ {d_4} = {M_{\dot w}} $，e₁=N_nw，e₂=(N_r+N_r|r||r|)，$ {e_3} = {N_{\dot v}}, {e_4} = {M_{\dot q}} $，ρ为流体密度，∇为UUV排水体积，g为重力加速度，m为UUV的质量。

其中UUV的水动力系数相关说明在文献[18]中有详细论述，此处不再说明。

为了简化UUV的运动学方程和动力学方程，方便控制器的设计来定义如下：$ {v_t} = \sqrt {\dot v_d^2 + \dot y_d^2} $为二维期望合速度；$ {v_p} = \sqrt {{{\dot x}_d^2} + {{\dot y}_d^2} + {{\dot z}_d^2}} $为三维期望合速度；$ {\psi _d} = \arctan ({{\dot y}_d}/{{\dot x}_d}) $为期望的航向角；$ {\theta _d} =-\arctan ({{\dot z}_d}/{\mathit{\boldsymbol{v}}_t}) $为期望的纵倾角；定义位置和姿态误差变量为

$ \left\{ \begin{array}{l} {{\dot x}_e} = u - {v_p}\cos {\theta _d}\cos \theta \cos {\psi _e} - \\ \;\;\;\;\;\;{v_p}\sin {\theta _d}\sin \theta + r{y_e} - q{z_e}\\ {{\dot y}_e} = v + {v_p}\cos {\theta _d}\sin \theta \cos {\psi _e} - \\ \;\;\;\;\;\;r{x_e} - r{z_e}\tan \theta \\ {{\dot z}_e} = w - {v_p}\cos {\theta _d}\sin \theta \cos {\psi _e} + \\ {v_p}\sin {\theta _d}\cos \theta + q{x_e} + r{y_e}\tan \theta \end{array} \right. $

(5)

实际中总有∀t≥0, |θ(t)|＜π/2，且期望轨迹变量u_d、r_d、q_d、$ {{\dot u}_d} $、$ {{\dot r}_d} $、$ {{\dot q}_d} $是有界的。

2 轨迹跟踪器的设计 2.1 控制器设计

对于欠驱动UUV模型进行轨迹跟踪可以采用反步法进行设计，首先构造李雅普诺夫函数为

$ \left\{ \begin{array}{l} {V_1} = \left( {x_e^2 + y_e^2 + z_e^2} \right)/2\\ {{\dot V}_1} = {x_e}{{\dot x}_e} + {y_e}{{\dot y}_e} + {z_e}{{\dot z}_e} \end{array} \right. $

(6)

把$ {{\dot x}_e}, {{\dot y}_e}, {{\dot z}_e} $代入式子整理得到

$ \begin{array}{*{20}{c}} {{{\dot V}_1} = {x_e}\left( {u - {v_p}\cos {\theta _d}\cos \theta \cos {\psi _e}} \right) - }\\ {{x_e}\left( {{\mathit{\boldsymbol{v}}_p}\sin {\theta _d}\sin \theta + r{y_e} - q{z_e}} \right) + }\\ {{y_e}\left( {{\mathit{\boldsymbol{v}}_p}\cos {\theta _d}\sin \theta \cos {\psi _e} + \mathit{\boldsymbol{v}} - r{x_e} - r{z_e}\tan \theta } \right) + }\\ {{z_e}\left( {w - {v_p}\cos {\theta _d}\sin \theta cos{\psi _e}} \right) + }\\ {{z_e}\left( {{v_p}\sin {\theta _d}\cos \theta + q{x_e} + r{y_e}\tan \theta } \right)} \end{array} $

定义虚拟控制量为

$ \left\{ \begin{array}{l} {\alpha _1} = {v_p}\cos {\theta _d}\sin {\psi _e}\\ {\alpha _2} = {v_p}\sin {\theta _e} = {v_p}\left( {\cos {\theta _d}\sin \theta - \sin {\theta _d}\cos \theta } \right) \end{array} \right. $

(7)

将ψ_e和θ_e进行替换，从而可以避免初始状态约束引起的奇异值问题。

为了使目标达到$ {{\dot V}_1} < 0 $，把u、α₁、α₂作为虚拟控制量，令$ e = \sqrt {1 + x_{_e}^{^2} + y_{_e}^{^2} + z_{_e}^{^2}} $, 则期望值选取为

$ \left\{ \begin{array}{l} {u_d} = {v_p}\cos {\theta _d}\cos \theta \cos {\psi _e} + {v_p}\sin {\theta _d}\sin \theta - {k_1}{x_e}/e\\ {\alpha _{1d}} = - v - {k_2}{y_e}/e\\ {\alpha _{2d}} = w - {v_p}\cos {\theta _e}\sin \theta \left( {\cos {\psi _e} - 1} \right) + {k_3}{z_e}/e \end{array} \right. $

式中：k₁、k₂、k₃均为正常数，u_d、α_1d、α_2d是虚拟控制量，但实际不可控，因此定义误差变量及误差导数为

$ {u_e} = u - {u_d};{\alpha _{1e}} = {\alpha _1} - {\alpha _{1d}}; $

$ {\alpha _{2e}} = {\alpha _2} - {\alpha _{2d}};{{\dot u}_e} = \left( {{F_1} + {\tau _u}} \right)/{m_{11}} $

$ \begin{array}{l} {{\dot \alpha }_{1e}} = {{\dot v}_t}\sin {\psi _e} + {v_t}\cos {\psi _e}\left( {r/\cos \theta - {{\mathit{\dot \Psi }}_D}} \right) + \\ \;\;\;\;\;\;\;\;{F_3}/{m_{33}} + {Q_1} \end{array} $

$ {{\dot \alpha }_{2e}} = {{\dot v}_p}\sin {\theta _e} + {v_p}\cos {\theta _e}\left( {q - {{\dot \theta }_d}} \right) - {F_4}/{m_{33}} + {Q_2} $

(8)

其中

$ {F_q} = {\alpha _1}vr - {\alpha _2}wq - {\alpha _3}u - {\alpha _4}{r^2} + {\tau _{d1}} - {m_{11}}{u_d} $

$ {F_3} = - {b_1}ur - {b_2}v - {b_3}\dot r + {\tau _{d2}} + {{\dot r}_d} $

$ {F_4} = {c_1}uq - {c_2}w - {c_3}\dot q + {c_4}pr + {\tau _{d3}} $

$ {Q_1} = {k_2}\left( {{{\dot y}_e}e - {y_e}\left( {{x_e}{{\dot x}_e} + {y_e}{{\dot y}_e} + {z_e}{{\dot z}_e}} \right)/e} \right)/{e^2} $

$ {Q_2} = {v_t}\sin \theta \left( {\cos {\varphi _c} - 1} \right) - {k_3}{z_e}/e $

结合前面的式子，可得到

$ \dot V = - \left( {{k_1}x_e^2 + {k_2}y_e^2} \right)/e + {x_e}{u_e} + {y_e}{\alpha _{1e}} - {z_e}{\alpha _{2e}} $

(9)

定义$ M = ({k_1}x_{_e}^{^2} + {k_2}y_{_e}^{^2} + {k_3}z_{_e}^{^2})/e $，则有$ \dot V =-M + {x_e}{u_e} + {y_e}{\alpha _{1e}}-{z_e}{\alpha _{2e}}, M > 0 $。

接下来对欠驱动UUV轨迹跟踪RBF神经网络控制系统进行设计，如图 1所示，运用RBF神经网络对含有未知扰动的力进行逼近估计，同时结合反步法进行控制器的设计以及控制器稳定性的分析。神经网络逼近未知函数为

图 1 欠驱动UUV轨迹跟踪RBF神经网络控制系统 Fig.1 Underactuated UUV tracking RBF nerual network control system

$ \left\{ \begin{array}{l} \mathit{\boldsymbol{F}} = {\mathit{\boldsymbol{W}}^{\rm{T}}}h + \varepsilon \\ \mathit{\boldsymbol{\hat F = }}{{\mathit{\boldsymbol{\hat W}}}^{\rm{T}}}h\\ h = g\left( {{{\left\| {\mathit{\boldsymbol{x}} - {\mathit{\boldsymbol{c}}_{ij}}} \right\|}^2}/b_j^2} \right)\\ g\left( x \right) = {{\rm{e}}^{ - x}} \end{array} \right. $

(10)

控制器控制律推导步骤如图 2所示。控制器及自适应控制律为

图 2 控制器控制律获得步骤 Fig.2 The steps of obtaining control law

$ \left\{ \begin{array}{l} {\tau _u} = - {c_1}{u_e} - {x_e} - {{\mathit{\boldsymbol{\hat W}}}_1}{h_1},{\tau _r} = - {c_3}{r_e} - {{\mathit{\boldsymbol{\hat W}}}_3}{h_3}\\ {\tau _q} = - {c_5}{q_e} - {{\mathit{\boldsymbol{\hat W}}}_5}{h_5},{{\mathit{\boldsymbol{\dot {\hat W}}}}_1} = {\mathit{\Gamma }_1}\left( {{h_1}{u_e} - {l_1}{{\mathit{\boldsymbol{\hat W}}}_1}} \right)\\ {{\mathit{\boldsymbol{\dot {\hat W}}}}_2} = {\mathit{\Gamma }_2}\left( {{h_2}{a_{1e}} - {l_2}{{\mathit{\boldsymbol{\hat W}}}_2}} \right),{{\mathit{\boldsymbol{\dot {\hat W}}}}_3} = {\mathit{\Gamma }_3}\left( {{h_3}{r_e} - {l_3}{{\mathit{\boldsymbol{\hat W}}}_3}} \right)\\ {{\mathit{\boldsymbol{\dot {\hat W}}}}_4} = {\mathit{\Gamma }_4}\left( {{h_4}{a_{2e}} - {l_4}{{\mathit{\boldsymbol{\hat W}}}_4}} \right),{{\mathit{\boldsymbol{\dot {\hat W}}}}_5} = {\mathit{\Gamma }_5}\left( {{h_5}{q_e} - {l_5}{{\mathit{\boldsymbol{\hat W}}}_5}} \right) \end{array} \right. $

(11)

2.2 稳定性分析

欠驱动UUV的运动学模型和动力学模型满足假设条件1、2、3，会存在控制器和自适应率(11)保证欠驱动UUV跟踪误差系统半全局一致有界，也就是说对任意的压缩集Ω₀，其中$ \left( {\eta \left( 0 \right), V\left( 0 \right), \hat F\left( 0 \right)} \right) \in {{\mathit{\Omega}} _0} $，轨迹跟踪误差$ [{\eta _e}({\rm{t}}), {V_e}(t), \hat F\left( t \right)] $收敛到零值附近的一个压缩有界集。

假设1 对于时变外界扰动τ_d(i)(i=1, 2, 3, 4, 5)，存在一个常数τ_d∈R⁺, ∀＞τ₀，满足‖τ_d(i)(t)‖≤τ_d。

假设2 对于给定的任意光滑的函数h(Z)，都会存在一个理想的权值函数W对其进行逼近，使得有误差量|ε|≤ε^*, ε^*为小量。

假设3 欠驱动UUV的时变速度V(t)有界，即存在一个正常数V_M=sup‖V(t)‖，满足V_M＜+∞。

对式子(11)中的调整项$ {l_{1\;}}\mathit{\boldsymbol{\tilde W}}_1^{\rm{T}}\mathit{\boldsymbol{\hat W}} $有：

$ \begin{array}{*{20}{c}} {{l_1}\mathit{\boldsymbol{\tilde W}}_1^{\rm{T}}{{\mathit{\boldsymbol{\hat W}}}_1} = {l_1}\mathit{\boldsymbol{\tilde W}}_1^{\rm{T}}\left( {{\mathit{\boldsymbol{W}}_1} - {{\mathit{\boldsymbol{\tilde W}}}_1}} \right) \le }\\ {{l_1}\left\| {{{\mathit{\boldsymbol{\tilde W}}}_1}} \right\| \cdot \left\| {{\mathit{\boldsymbol{W}}_1}} \right\| - {l_1}\left\| {\mathit{\boldsymbol{\tilde W}}_1^2} \right\| \le }\\ {\frac{1}{2}{l_1}{{\left\| {{{\mathit{\boldsymbol{\tilde W}}}_1}} \right\|}^2} - \frac{1}{2}{l_1}{{\left\| {{{\mathit{\boldsymbol{\tilde W}}}_1}} \right\|}^2}} \end{array} $

(12)

从而有：

$ \begin{array}{*{20}{c}} {{l_1}\mathit{\boldsymbol{\tilde W}}_1^{\rm{T}}{{\mathit{\boldsymbol{\hat W}}}_1} + {l_2}\mathit{\boldsymbol{\tilde W}}_2^{\rm{T}}{{\mathit{\boldsymbol{\hat W}}}_2} + {l_3}\mathit{\boldsymbol{\tilde W}}_3^{\rm{T}}{{\mathit{\boldsymbol{\hat W}}}_3} + {l_4}\mathit{\boldsymbol{\tilde W}}_4^{\rm{T}}{{\mathit{\boldsymbol{\hat W}}}_4} + }\\ {{l_5}\mathit{\boldsymbol{\tilde W}}_5^{\rm{T}}{{\mathit{\boldsymbol{\hat W}}}_5} \le \left( {\frac{1}{2}{l_1}{{\left\| {{\mathit{\boldsymbol{W}}_1}} \right\|}^2} + \frac{1}{2}{l_2}{{\left\| {{\mathit{\boldsymbol{W}}_2}} \right\|}^2} + } \right.}\\ {\left. {\frac{1}{2}{l_3}{{\left\| {{\mathit{\boldsymbol{W}}_3}} \right\|}^2} + \frac{1}{2}{l_4}{{\left\| {{\mathit{\boldsymbol{W}}_4}} \right\|}^2} + \frac{1}{2}{l_5}{{\left\| {{\mathit{\boldsymbol{W}}_5}} \right\|}^2}} \right) - }\\ {\frac{1}{2}\left( {{l_1}\left\| {{{\mathit{\boldsymbol{\tilde W}}}_1}} \right\| + \frac{1}{2}{l_2}{{\left\| {{{\mathit{\boldsymbol{\tilde W}}}_2}} \right\|}^2} + \frac{1}{2}{l_3}{{\left\| {{{\mathit{\boldsymbol{\tilde W}}}_3}} \right\|}^2} + } \right.}\\ {\left. {\frac{1}{2}{l_4}{{\left\| {{{\mathit{\boldsymbol{\tilde W}}}_4}} \right\|}^2} + \frac{1}{2}{l_5}{{\left\| {{{\mathit{\boldsymbol{\tilde W}}}_5}} \right\|}^2}} \right)} \end{array} $

(13)

所以对式(11)可以推导出：

$ \begin{array}{*{20}{c}} {{{\dot V}_6} \le - \left( {{k_1}x_e^2 + {k_2}y_e^2 + {k_3}z_e^2} \right)/e - {c_{10}}u_e^2 - {c_{20}}a_{1e}^2 - }\\ {{c_{30}}r_e^2 - {c_{40}}a_{2e}^2 - {c_{50}}q_e^2 + \frac{{\varepsilon _1^{ * 2}}}{{4{c_{11}}}} + \frac{{\varepsilon _2^{ * 2}}}{{4{c_{21}}}} + \frac{{\varepsilon _3^{ * 2}}}{{4{c_{31}}}} + \frac{{\varepsilon _4^{ * 2}}}{{4{c_{41}}}} + }\\ {\frac{{\varepsilon _5^{ * 2}}}{{4{c_{51}}}} + \left( {\frac{1}{2}{l_1}{{\left\| {{\mathit{\boldsymbol{W}}_1}} \right\|}^2} + \frac{1}{2}{l_2}{{\left\| {{\mathit{\boldsymbol{W}}_2}} \right\|}^2} + } \right.}\\ {\left. {\frac{1}{2}{l_3}{{\left\| {{\mathit{\boldsymbol{W}}_3}} \right\|}^2} + \frac{1}{2}{l_4}{{\left\| {{\mathit{\boldsymbol{W}}_4}} \right\|}^2} + \frac{1}{2}{l_5}{{\left\| {{\mathit{\boldsymbol{W}}_5}} \right\|}^2}} \right) - }\\ {\frac{1}{2}\left( {{l_1}\left\| {{{\mathit{\boldsymbol{\tilde W}}}_1}} \right\|^2 + \frac{1}{2}{l_2}{{\left\| {{{\mathit{\boldsymbol{\tilde W}}}_2}} \right\|}^2} + \frac{1}{2}{l_3}{{\left\| {{{\mathit{\boldsymbol{\tilde W}}}_3}} \right\|}^2} + } \right.}\\ {\left. {\frac{1}{2}{l_4}{{\left\| {{{\mathit{\boldsymbol{\tilde W}}}_4}} \right\|}^2} + \frac{1}{2}{l_5}{{\left\| {{{\mathit{\boldsymbol{\tilde W}}}_5}} \right\|}^2}} \right)} \end{array} $

(14)

选取c_k0使得c_k0≥γ/2, (k=1, 2, 3, 4, 5)且γ＞0；同时选取l_k和Γ_k使得l_k≥γλ_max{Γ_k^-1}，

$ \begin{array}{*{20}{c}} {\lambda = \min \left\{ {{k_1}/e,{k_2}/e,{k_3}/e,{c_{10}},{c_{20}},{c_{30}},{c_{40}},{c_{50}},} \right.}\\ {\left. {{m_{11}}/2,{m_{22}}/2,{m_{33}}/2,{m_{55}}/2,{m_{66}}/2} \right\}} \end{array} $

(15)

则式(15)化为如下形式

$ {{\dot V}_6} \le - \lambda {V_6} + \delta ,且\;\delta = \sum\limits_{k = 1}^5 {\frac{{{l_k}{{\left\| {{\mathit{\boldsymbol{W}}_k}} \right\|}^2}}}{2}} + \sum\limits_{k = 1}^5 {\frac{{\varepsilon _k^{ * 2}}}{{4{c_{k1}}}}} $

(16)

因此闭环跟踪误差渐进收敛到零值附近的一个压缩有界集，最终系统误差半全局一致有界，系统是稳定收敛。

3 UUV轨迹跟踪控制仿真

为了验证UUV轨迹跟踪控制效果进行轨迹跟踪控制仿真，设置系统总的仿真时间为800 s，控制周期为1 s，RBF神经网络的学习周期为0.5 s分别有海流干扰和无海流干扰情况分别仿真，以三维螺旋曲线为目标轨迹进行跟踪，轨迹方程为

$ x = 150\sin \left( {0.01t} \right),y = 150\cos \left( {0.01t} \right),z = 0.3t $

设z轴向下为正，期望轨迹的起点为(0，150，0), UUV的运动起点为(30，-10，20)，给其扰动量(可视为稳定扰动)分别为

$ \left\{ \begin{array}{l} \left( {0 < {T_1} \le 500} \right) \sim \left( {700 < {T_3} \le 800} \right)\\ f = \sin \left( {0.01t} \right) + 1.5\cos \left( {0.01t + {\rm{ \mathsf{ π} }}/4} \right) + \\ \;\;\;\;\;\;\;0.5\sin \left( {0.01t + {\rm{ \mathsf{ π} }}/6} \right)\\ {\tau _{d1}} = {\tau _{d2}} = {\tau _{d3}} = 2f\\ {\tau _{d5}} = {\tau _{d6}} = 5f \end{array} \right. $

(17)

在500~700 s扰动量变化为式(18)来模拟乱流，在700~800 s扰动又恢复为稳定扰动。

$ \left\{ \begin{array}{l} \left( {500 < {T_2} \le 700} \right)\\ f = \sin \left( {0.01t} \right) + 1.5\cos \left( {0.01t + p/4} \right) + \\ \;\;\;\;\;\;\;0.5\sin \left( {0.01t + p/6} \right)\\ {\tau _{d1}} = 20f;{\tau _{d2}} = 40f;{\tau _{d3}} = 30f;\\ {\tau _{d5}} = 17f;{\tau _{d6}} = 17f; \end{array} \right. $

(18)

神经网络中$ \mathit{\boldsymbol{\hat W}}_1^{\rm{T}}{h_1} $包含150个神经元，即l₁=150，中心向量c_i(i=1, 2, …, l₁)均匀分布在[-10, 10]×[-10, 10]×[-10, 10]×[-10, 10]×[-10, 10]×[-10, 10]，宽度b₁=4；同理，$ \mathit{\boldsymbol{\hat W}}_2^{\rm{T}}{h_2} $包含100个神经元，l₂=100中心向量c_i(i=1, 2, …, l₁)均匀分布在[-10, 10]×[-10, 10]×[-10, 10]×[-10, 10]，选取宽度b₂=4；$ \mathit{\boldsymbol{\hat W}}_3^{\rm{T}}{h_3}$包含175个神经元，l₃=175中心向量c_i(i=1, 2, …, l₁)均匀分布在[-10, 10]×[-10, 10]×[-10, 10]×[-10, 10]×[-10, 10]×[-10, 10]×[-10, 10]，宽度b₃=3；神经网络$ \mathit{\boldsymbol{\hat W}}_4^{\rm{T}}{h_4} $包含150个神经元，l₄=150，均匀分布在[-10, 10]×[-10, 10]×[-10, 10]×[-10, 10]×[-10, 10]×[-10, 10]，宽度b₄=3；神经网络$ \mathit{\boldsymbol{\hat W}}_5^{\rm{T}}{h_5} $包含125个神经元l₅=125均匀分布在[-10, 10]×[-10, 10]×[-10, 10]×[-10, 10]×[-10, 10], 宽度。参数选取为

$ {k_1} = 2.5;{k_2} = 1;{k_3} = 1;{c_1} = 0.8, $

$ {c_2} = 1.5;{c_3} = 1;{c_4} = 8, $

$ {c_5} = 4H5;{l_1} = 20;{l_2} = 12, $

$ {l_3} = 20;{l_4} = 15;{l_5} = 120, $

船体运动仿真参数为

$ m = 3400\;{\rm{kg}};{I_z} = {I_y} = 7359.7, $

$ {X_u} = - 137;{X_u} = 21.125;{X_{\left. u \right|\left. u \right|}} = 120.4, $

$ {X_{rr}} = 2740;{X_{vr}} = 1373.25;{X_{wq}} = 1991.3, $

$ {Y_{\dot v}} = - 346.5;{Y_v} = - 248.6;{Y_{\left. v \right|\left. v \right|}} = - 929.5, $

$ {Y_r} = 521.78;{Y_{\left. {rr} \right|}} = 9639.4;{Y_{ur}} = 3803.55, $

$ {Z_{\dot v}} = - 3468.5;{Z_{\dot q}} = - 5517.2;{Z_{qq}} = - 253.5, $

$ {Z_{uq}} = - 3762.4;{Z_{\left. w \right|\left. w \right|}} = - 4436.25;{Z_w} = - 248.6, $

$ {Z_q} = - 521.78;{N_{\dot r}} = - 5517.2;{N_{\dot v}} = - 1338, $

$ {N_r} = - 3456.7;{N_{uv}} = - 4943.25;{N_{\left. v \right|\left. v \right|}} = 3432.8, $

$ {N_{\left. r \right|\left. r \right|}} = - 696.2;{{M'}_{\dot q}} = - 5517.2;{{M'}_q} = - 789, $

$ {M_{\dot w}} = - 1338.8;{M_{uw}} = - 823.88, $

$ {M_{\left. w \right|\left. w \right|}} = - 1573;{M_{\left. q \right|\left. q \right|}} = - 6967 $

在无海流扰动情况下进行仿真，跟踪效果如图 3和图 4，从中可以看出存在稳定扰动的情况下，跟踪轨迹在160 s左右跟踪上了期望轨迹，并且抖动范围很小，能很好的跟踪上目标曲线。

图 3 稳定扰动跟踪运动曲线与500~700 s间轨迹跟踪曲线误差 Fig.3 Tracking of stable disturbance and tracking error in 500~700 s

图 4 扰动突变情况下误差e、ψ_e、θ_e以及位置误差x_e、y_e、z_e曲线 Fig.4 e, ψ_e, θ_e error and position error in disturbance mutation

从图 3可以看出当扰动突然增加后，跟踪轨迹总体仍是稳定的。原设计500~700 s是扰动突然增加时间段，由扰动突然增加而引起的轨迹抖动到560 s左右开始出现，持续了30 s跟踪系统逐渐趋于稳定。从图 4中可以看出500~700 s扰动突然增加时间段对UUV的运动姿态ψ、θ影响还是挺大的，但整体的误差$ e = \sqrt {1 + x_{_e}^{^2} + y_{_e}^{^2} + z_{_e}^{^2}} $还是趋于1的，即误差$ x_{_e}^{^2} + y_{_e}^{^2} + z_{_e}^{^2} \approx 0 $，从而说明系统依然是稳定的。

从图 4可以看出状态误差和位置误差都在零值附近，图 5在500~700 s线速度控制出现了漂移，图 6在500~700 s控制力矩τ_q、τ_u出现了很大的抖动，说明力矩在这个时间段内产生作用。此外，对目标运动轨迹可以精准的跟踪，同时轨迹波动很小，说明反步法与神经网络结合起来对UUV的轨迹跟踪能够很好的控制。运用RBF神经网络来对扰动量进行估计，尤其当遇到突变的扰动量时也能很好的估计，从而快速响应控制力矩达到系统稳定的目的，从而减小不确定外力对系统总体运动的影响。

图 5 UUV线速度跟踪控制曲线 Fig.5 UUV speed of tracking

图 6 控制力矩值曲线 Fig.6 Control moment

4 结论

1) 通过结合反步法和自适应RBF神经网络方法设计了虚拟速度控制器，并运用李雅普诺夫稳定理论证明了该控制系统误差最终一致有界。

2) 对流体中不存在海流和存在海流的情况分别进行仿真，从两个仿真结果看出反步法结合RBF神经网络控制方法在系统参数不精确和存在时变扰动情况下对UUV三维轨迹跟踪是有效的，能够实现三维轨迹较精确跟踪控制，达到了预期的目的。

3) 仿真存在一定的局限性，条件过于理想；并且由于硬件条件以及算法复杂程度的限制，尚未进行实物试验，仅进行了仿真。

希望在本次研究的基础上进行更深入的总结，并进行适当地简化，为以后进行实际UUV试验打下基础。

参考文献

[1]	张伟, 徐达, 王南南, 等. 基于对线控位策略的UUV回收运动控制研究[J]. 船舶工程, 2013, 35(5): 64-67. ZHANG Wei, XU Da, WANG Nannan, et al. Study of UUV recovery control based on positioning to line[J]. Ship engineering, 2013, 35(5): 64-67. (0)
[2]	贾鹤鸣, 程相勤, 张利军, 等. 基于自适应Backstepping的欠驱动AUV三维航迹跟踪控制[J]. 控制与决策, 2012, 27(5): 652-657, 664. JIA Heming, CHENG Xiangqin, ZHANG Lijun, et al. Underactuated AUV 3D tracking control based on adaptive backstepping[J]. Control and design, 2012, 27(5): 652-657, 664. (0)
[3]	徐健, 汪慢, 乔磊, 等. 欠驱动UUV三维轨迹跟踪的反步动态滑模控制[J]. 华中科技大学学报(自然科学版), 2015, 43(8): 107-113. XU Jian, WANG Man, QIAO Lei, et al. Underactuated UUV 3D tracking on backstepping slid mode control[J]. Journal of Huazhong University of Science and Technology(natural science edition), 2015, 43(8): 107-113. (0)
[4]	徐健, 汪慢, 乔磊. 欠驱动无人水下航行器三维轨迹跟踪的反步控制[J]. 控制理论与应用, 2014, 31(11): 1589-1596. XU Jian, WANG Man, QIAO Lei. Underactuated unmanned underwater vehicle 3D tracking backstepping control[J]. Control theory and applications, 2014, 31(11): 1589-1596. (0)
[5]	段海庆, 朱齐丹. 基于反步自适应神经网络的船舶航迹控制[J]. 智能系统学报, 2012, 7(03): 259-264. DUAN Haiqing, ZHU Qidan. Ship tracking control based on backstepping adaptive neural networks[J]. CAAI transactions on intelligent system, 2012, 7(03): 259-264. DOI:10.3969/j.issn.1673-4785.201205056 (0)
[6]	程相勤. 基于滑模理论的欠驱动UUV空间曲线路径跟踪控制[D]. 哈尔滨: 哈尔滨工程大学, 2011. CHENG Xiangqin. Underactuated UUV space curve path tracking control based on sliding mode control theory[D]. Harbin: Harbin Engineering University, 2011. http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y2054064 (0)
[7]	贾鹤鸣, 宋文龙, 陈子印, 等. 基于神经网络反步法的移动机器人路径跟踪控制[J]. 南京理工大学学报, 2014, 38(1): 27-33. JIA Heming, SONG Wenlong, CHEN Ziyin, et al. Mobile robot path tracking control based on neural networks backstepping method[J]. Journal of Nanjing University of Science and Technology, 2014, 38(1): 27-33. (0)
[8]	王宏健, 陈子印, 贾鹤鸣, 等. 基于滤波反步法的欠驱动AUV三维路径跟踪控制[J]. 自动化学报, 2015, 41(3): 631-645. WANG Hongjian, CHEN Ziyin, JIA Heming, et al. Underactuated AUV 3D path tracking control based filter backstepping method[J]. Acta automatica sinica, 2015, 41(3): 631-645. (0)
[9]	周佳加, 郭少彬, 贾鹤鸣, 等. 基于自适应神经网络的UUV航速控制仿真研究[J]. 船舶工程, 2013, 35(6): 72-75. ZHOU Jiajia, GUO Shaobin, JIA Heming, et al. The simulation study of UUV speed control based on adaptive neural networks[J]. Ship engineering, 2013, 35(6): 72-75. (0)
[10]	周佳加, 严浙平, 贾鹤鸣, 等. 改进规则下自适应神经网络的UUV水平面路径跟随控制[J]. 中南大学学报(自然科学版), 2014, 45(9): 3021-3028. ZHOU Jiajia, YAN Zheping, JIA Heming and, et al. Adaptive neural networks UUV level path following control under the improved rules[J]. Journal of Central South University(natural science edition), 2014, 45(9): 3021-3028. (0)
[11]	WANG Hongjian, XIONG Wei. Research on global path planning based on ant colony optimization for AUV[J]. Journal of marine science and application, 2009, 8(1): 58-64. DOI:10.1007/s11804-009-8002-7 (0)
[12]	YAN Zheping, CHI Dongnan, ZHOU Jiajia, et al. Following Control for a UUV using Temporary Path Generation Guidance[J]. Journal of marine science and application, 2012, 11(2): 236-243. DOI:10.1007/s11804-012-1128-z (0)
[13]	严浙平, 于浩淼, 李本银, 等. 基于积分滑模的欠驱动UUV地形跟踪控制[J]. 哈尔滨工程大学学报, 2016, 37(5): 701-706. YAN Zheping, YU Haomiao, LI Benyin, et al. Underactuated UUV terrain following control based on integral sliding mode[J]. Journal of Harbin Engineering University, 2016, 37(5): 701-706. (0)
[14]	黎南, 湛鑫, 陈涛, 等. UUV水下回收中的视觉和短基线定位融合[J]. 智能系统报, 2013, 8(2): 156-161. LI Nan, ZHAN Xin, CHEN Tao, et al. Data fusion method of vision and SBL position for UUV underwater docking[J]. CAAI transactions on intelligent systems, 2013, 8(2): 156-161. (0)
[15]	周维华. RBF神经网络隐层结构与参数优化研究[D]. 上海: 华东理工大学, 2014. ZHOU Weixiong. Study of RBF neural networks hidden layer structure and parameter optimization[D]. Shanghai: East China University of Science and Technology, 2014. http://cdmd.cnki.com.cn/Article/CDMD-10251-1014169369.htm (0)
[16]	陈亮, 何为, 韩力群. RBF神经网络的行车路径代价函数建模[J]. 智能系统学报, 2011, 6(05): 424-431. CHEN Liang, HE Wei, HAN Liqun. Radial basis function neural network modeling of the traffic path cost function[J]. CAAI transactions on intelligent systems, 2011, 6(05): 424-431. DOI:10.3969/j.issn.1673-4785.2011.05.006 (0)
[17]	DO K D, PAN J. Control of ships and underwater vehicles[J]. Advances in industrial control, 2009. (0)
[18]	李殿璞. 船舶运动与建模[M]. 哈尔滨: 哈尔滨工程大学出版社, 1999. (0)