二维平面自主水下航行器的复合轨迹跟踪控制

引用本文

张宇飞, 张华, 谢永和. 二维平面自主水下航行器的复合轨迹跟踪控制. 舰船科学技术, 2026, 48(6): 125-131 复制到剪切板

ZHANG Yufei, ZHANG Hua, XIE Yonghe. Composite trajectory tracking control of autonomous underwater vehicle in a two-dimensional plane. Ship Science and Technology, 2026, 48(6): 125-131 复制到剪切板

二维平面自主水下航行器的复合轨迹跟踪控制

张宇飞¹, 张华², 谢永和¹

1. 浙江海洋大学船舶与海运学院，浙江舟山 316022;
2. 武汉理工大学船海与能源动力工程学院，湖北武汉 430063

收稿日期: 2025-05-06.

作者简介: 张宇飞（1997 − ），男，硕士，研究方向为自主水下航行器的运动控制

摘要: 针对存在未知动态和时变扰动的欠驱动自主水下航行器（Autonomous Underwater Vehicle，AUV）设计了一种复合学习跟踪控制方案。采用视线跟踪控制处理AUV的欠驱动，用自适应神经网络近似AUV的未知动态，通过建立串行-并行估计模型来获得预测误差。利用预测误差和跟踪误差设计复合权重更新法，构建了基于复合学习控制的非线性扰动观测器估计时变扰动。通过Lyapunov方法的稳定性分析表明，AUV轨迹跟踪闭环控制系统的所有误差信号都最终一致有界。仿真结果验证了所提出的复合学习跟踪控制方案的有效性和优越性。

关键词: 自主水下航行器轨迹跟踪神经网络

Composite trajectory tracking control of autonomous underwater vehicle in a two-dimensional plane

ZHANG Yufei¹, ZHANG Hua², XIE Yonghe¹

1. Naval Architecture and Shipping College, Zhejiang Ocean University, Zhoushan 316022, China;
2. College of Marine and Energy Power Engineering, Wuhan University of Technology, Wuhan 430063, China

Abstract: In this paper, a composite learning tracking control scheme is designed for an underactuated autonomous underwater vehicle (AUV) in the presence of unknown dynamics and time-varying disturbance. Line-of-sight tracking control is used to handle the underactuated of the AUV. Approximating the unknown dynamics of the AUV with an adaptive neural network. Prediction error is obtained by modeling serial-parallel estimation. The prediction error and tracking error are utilized to design the composite weight update law. A nonlinear disturbance observer based on composite learning control is constructed to estimate time-varying disturbances. The stability analysis by Lyapunov method shows that all signals of the AUV trajectory tracking closed-loop control system have uniformly ultimately boundedness. The simulation results verify the effectiveness and superiority of the proposed composite learning tracking control scheme.

Key words: AUV trajectory tracking neural network

0 引　言

自主水下航行器（Autonomous Underwater Vehicle，AUV）已经成为水下资源勘探和环境监测的支柱，轨迹跟踪运动控制是目前研究的重点之一^[1]。轨迹跟踪控制任务要求AUV精确并快速地跟踪一条随时间变化的路径，即在特定的时间点到达预定的空间点。该问题本质上具有高度非线性和复杂性^[2]。

当前针对该问题有许多研究，提出了相应的解决方案，很多控制方法被应用于处理具有未知动态和时变扰动的AUV轨迹跟踪问题，如抗扰自适应性控制^[3]、滑模控制^[4]、基于非线性扰动观测器的控制^[5]、神经网络^[6]以及模糊逻辑^[7]。实际应用的大部分AUV是欠驱动，即AUV驱动器的数量少于AUV本身自由度的数量。KHOSHNAM等^[8]用神经网络解决欠驱动AUV的未知动态（水动力参数的不确定性）。针对欠驱动AUV目前存在的未知动态问题，QIN等^[9]提出了一种鲁棒自适应控制方案。SHOJAEI等^[10]设计了一种基于LOS（Light-Of-Sight）制导法的动态面跟踪控制器，以解决AUV的欠驱动问题，再通过神经网络和自适应控制法补偿模型的未知动态和环境扰动。WANG等^[11]针对未知动态和外部时变干扰的问题，设计了一种基于神经网络和自适应控制技术的指令滤波轨迹跟踪控制器。GONG等^[12]在预定义参考坐标的基础上提出了一种抗扰的非线性控制器。神经网络的近似能力和自适应技术一般用来处理模型的未知动态和水下环境的时变扰动问题。

自适应控制大多应用于处理系统的未知动态。为了获得更高的追踪精度和更好的参数收敛性，RATRE等^[13]设计了一种复合自适应控制方案。PAN等^[14]也验证了这种控制方案有更快的参数收敛性和更小的跟踪误差。YANG等^[15]用预测误差来构建神经网络权重更新律。YUCELEN等^[16]提出一种自适应控制修正以更新控制律并提高瞬态性能。GOEL等^[17]在参考模型中引入了误差反馈项，以获得更好的瞬态性能。YANG等^[18]针对严格反馈系统，提出的基于智能控制的复合学习结构相较于神经网络控制有更好的追踪性能。在复合学习中，修正后的模型误差构建为预测误差，跟踪误差和预测误差都用于更新神经网络的权重。

神经网络和模糊逻辑一般用来近似未知动态，但二者都无法直接逼近环境扰动，而非线性扰动观测器需要精确的系统模型。因此，神经网络结合非线性扰动观测器可以解决各自的局限性。

受上述讨论的启发，本文提出一种复合学习轨迹跟踪控制方案，旨在同时应对未知动态与时变扰动的双重挑战。引入坐标变换来解决AUV欠驱动的问题。通过复合学习方案近似未知动态，再利用近似结果设计非线性扰动观测器。本文方案可以更快、更准确地近似未知动态。与现有基于神经网络和扰动观测器的方案相比，本文所提方案在提升控制精度、加快误差收敛速度方面具有显著优势，从而为AUV在复杂水下环境中的稳定运行提供理论与实践支持。

1 问题的表述及前提 1.1 AUV动力学与运动学模型

本文采用的是3自由度欠驱动AUV数学模型。

运动学模型：

$ \left\{\begin{aligned}&\dot{x}=u\mathrm{cos}\psi -v\mathrm{sin}\psi ，\\& \dot{y}=u\mathrm{sin}\psi +v\mathrm{cos}\psi，\\&\dot{\psi }=r。\end{aligned}\right.$

(1)

动力学模型：

$ \left\{\begin{aligned}&\dot{u}=\frac{{m}_{22}vr-\mathrm{\Omega }{f}_{u}}{{m}_{11}}+\frac{{d}_{u}}{{m}_{11}}+\frac{{\mathrm{\tau }}_{u}}{{m}_{11}} ，\\&\dot{v}=-\frac{{m}_{11}ur-\mathrm{\Omega }{f}_{v}}{{m}_{22}}+\frac{{d}_{v}}{{m}_{22}}，\\&\dot{r}=\frac{\left({m}_{11}-{m}_{22}\right)uv-\mathrm{\Omega }{f}_{r}}{{m}_{66}}+\frac{{d}_{r}}{{m}_{66}}+\frac{{\mathrm{\tau }}_{r}}{{m}_{66}}。\end{aligned}\right.$

(2)

式中：$ x、y $为北东下坐标系中AUV的坐标；$ \psi $为AUV在北东下坐标系中的偏航角；$ u、v、r $分别为AUV在北东下坐标系中的纵荡速度、横荡速度、偏航角速度；$ {\tau }_{u} $、$ {\tau }_{r} $分别为由螺旋桨推进器所提供的纵荡控制力、偏航控制力；$ {d}_{u} $、$ {d}_{v} $、$ {d}_{r} $分别为各个方向上的时变扰动；$ {m}_{ii} $，$ i=\mathrm{1,2},6 $为AUV的附加质量参数和惯性；$ \mathrm{\Omega }{f}_{n} $，$ n=u,v,r $为AUV的含非线性阻尼项的未知动态。当AUV低速工作时，上述模型有效。

AUV在NED坐标系中的坐标设为$ \eta=\left[x,y\right]\mathrm{^T} $，期望路径上的点坐标设为：$ \eta_d=\left[x_d,y_d\right]^{\mathrm{T}} $。

在AUV附体坐标系中定义位置跟踪误差如下:

$ {x}_{e}=\left(x-{x}_{d}\right)\mathrm{cos}\psi +\left(y-{y}_{d}\right)\mathrm{cos}\psi，$

(3)

$ {y}_{e}=-\left(x-{x}_{d}\right)\mathrm{sin}\psi +\left(y-{y}_{d}\right)\mathrm{c}\mathrm{o}\mathrm{s}\psi。$

(4)

式(3)、式(4)对时间求导得：

$ {\dot{x}}_{e}=u+ry\mathrm{e}-{\dot{x}}_{d}\mathrm{cos}\psi -{\dot{y}}_{d}\mathrm{sin}\psi，$

(5)

$ {\dot{y}}_{e}=v-rx\mathrm{e}+{\dot{x}}_{d}\mathrm{sin}\psi -{\dot{y}}_{d}\mathrm{cos}\psi。$

(6)

为了获得AUV的位置、速度、角速度以及加速度信息，需要加装惯性导航系统。则可定义跟踪误差为$ {\rho }_{e}-{\rho }_{o} $，偏航角误差为$ {\psi }_{e} $。

$ {\rho }_{e}=\sqrt{{{x}_{e}}^{2}+{{y}_{e}}^{2}}，$

(7)

$ {\psi }_{e}=\mathrm{arctan}2\left({y}_{e},{x}_{e}\right)。$

(8)

正常数$ {\rho }_{o} $的设计是为了防止所设计的控制律$ {\alpha }_{u} $和$ {\alpha }_{r} $可能出现的奇异性。

假设1　横荡速度是被动有界的，即$ \underset{t\geqslant 0}{\mathrm{sup}}\left|v\right| \lt {v}_{m} $。根据文献[19]，可发现假设1总是满足的。因为在式(2)中，流体动力阻尼力在横摇和滚转方向上占主导地位，这些速度会被这些阻尼力消耗掉。因此，假设1在实际中符合逻辑。

假设2　未知的时变环境扰动是有界的，存在着$ \left|{\dot{d}}_{n}\right|\leqslant {\overline{d}}_{n}，\;n=u,v,r $，其中$ {\overline{d}}_{n} $为未知的正常数。

假设3　参考轨迹$ \eta_d=\left[x_d,y_d\right]\mathrm{^T{ }} $，其对时间的前2次导数有界。

基于假设1～假设3，控制目标是为AUV构建的复合学习律$ {\tau }_{u} $、$ {\tau }_{r} $可以保证$ {\rho }_{e}-{\rho }_{o} $、$ {\psi }_{e} $的误差值在未知动态和时变干扰的影响下会收敛到零点附近的区域。

1.2 径向基神经网络逼近原理

对于未知的连续函数$ f\left(Z\right) $，如果选择足够大的神经网络节点数$ l $，就可以使神经网络来估计任意未知的非线性函数。径向基神经网络的输入向量可定义为$ Z\in {R}_{m} $。基函数向量可以选择高斯函数。

$ \phi\left(\mathrm{Z}\right)={\mathrm{exp}}^{(-(Z-c_j)^{\mathrm{T}}(Z-c_j)/b_j^2)} 。$

(9)

式中：$ {c}_{j} $和$ {b}_{j} $为高斯函数的中心和宽度。根据通用近似能力，存在理想权重向量$ {W}^{\mathit{*}} $满足以下条件：

$ f\left(Z\right)=W^{*\mathrm{T}}\phi\left(Z\right)+\xi_w。$

(10)

式中：$ {\xi }_{w} $为固有的近似误差，满足$ \left|\xi w\right|\leqslant{\overline{\xi }}_{w} $；理想权重向量 $ {W}^{\mathrm{*}} $为 $ {W}^{\mathrm{*}}={\mathrm{arg}}\underset{W\in {R}^{l}}{\mathrm{min}}\left\{\underset{Z\in {R}^{m}}{\mathrm{sup}}\left|f\left(Z\right)-{W}^{\mathrm{{T}}} \mathrm{\phi }\left(Z\right)\right|\right\} $，满足 $ \parallel {W}^{\mathrm{*}}\parallel =\overline{W} $。

径向基神经网络结构示意图如图1所示。

图 1 径向基神经网络结构示意图 Fig. 1 Schematic diagram of radial basis neural network structure

2 控制器设计

基于假设1～假设3，在返步法的基础上，使用结合扰动观测器的复合控制结构设计AUV的控制律。控制系统结构框图如图2所示。

图 2 AUV轨迹跟踪控制系统结构框图 Fig. 2 Schematic of the trajectory control of AUV

由式(1)及式(3)、式(4)可得：

$ {x}_{e}={\rho }_{e}\mathrm{cos}{\psi }_{e} ，$

(11)

$ {y}_{e}={\rho }_{e}\mathrm{sin}{\psi }_{e}。$

(12)

对式(7)求导，可得出：

$ {\dot{\rho }}_{e}{\rho }_{e}={\dot{x}}_{e}{x}_{e}+{\dot{y}}_{e}{y}_{e} 。$

(13)

定义$ {\rho }_{s}={\rho }_{e}-{\rho }_{0} $。结合式(5)、式(6)及式(13)，则$ {\rho }_{s} $的导数可表示为：

$ {\dot{\rho }}_{s}=u\mathrm{cos}{\psi }_{e}+v\mathrm{sin}{\psi }_{e}+\mathrm{cos}{\psi }_{e}{\zeta }_{1}+\mathrm{sin}{\psi }_{e}{\zeta }_{2} 。$

(14)

式中：$ {\zeta }_{1} $、$ {\zeta }_{2} $定义为：

$ \left\{\begin{aligned}&{\zeta }_{1}=-{\dot{x}}_{d}\mathrm{cos}\psi -{\dot{y}}_{d}\mathrm{sin}\psi ，\\ &{\zeta }_{2}={\dot{x}}_{d}\mathrm{sin}\psi -{\dot{y}}_{d}\mathrm{cos}\psi。\end{aligned}\right. $

(15)

由式(14)及返步法设计纵荡方向的虚拟控制律$ {\alpha }_{u} $为：

$ {{\alpha _u} = {\left( {{\text{cos}}{\psi _e}} \right)^{ - 1}}\left( { - {k_\rho }{\rho _s} - \nu {\text{sin}}{\psi _e}} \right) - {\text{cos}}{\psi _e}{\zeta _1} - {\text{sin}}{\psi _e}{\zeta _2}。}$

(16)

式中：$ {k}_{\rho } $为正设计常数。

定义纵荡方向的速度误差为$ {u}_{e}=u-{\alpha }_{u} $，$ {\rho }_{s} $的导数表示为：

$ {\dot{\rho }}_{s}=-{k}_{\rho }{\rho }_{s}+{u}_{e}\mathrm{c}\mathrm{o}\mathrm{s}{\psi }_{e}。$

(17)

根据式(2)和$ {u}_{e}=u-{\alpha }_{u} $，纵荡方向的误差可以表示为：

$ {m}_{11}{\dot{u}}_{e}={m}_{22}\nu r-\mathrm{\Omega }{f}_{u}+{d}_{u}+{\tau }_{u}-{m}_{11}{\dot{\alpha }}_{u} 。$

(18)

利用神经网络逼近AUV的未知动态，即：

$ m_{22}vr-\mathrm{\Omega}f_u=W_u^{\mathrm{*}\mathrm{T}}\varphi_u+\xi_u 。$

(19)

式中：$ {{W}_{u}}^{\mathrm{*}} $为理想NN的权重参数；$ {\xi }_{u} $为固有近似误差，有界且满足$ \left|{\xi }_{u}\right|\leqslant {\bar{\xi }}_{u} $。

复合扰动$ {D}_{u} $为由神经网络逼近误差和时变环境扰动组成。定义$ {D}_{u} $为$ {D}_{u}={\xi }_{u}+{d}_{u} $，它可以满足最大值：$ \left|{D}_{u}\right|\leqslant {\chi }_{u0}，\left|{\dot{D}}_{u}\right|\leqslant {\chi }_{u} $，其中，$ {\chi }_{u0} $和$ {\chi }_{u} $是正常数。

式(18)可以改写为：

$ {m}_{11}{\dot{u}}_{e}={W}_{u}^{*\mathrm{T}}{\varphi }_{u}+{D}_{u}+{\tau }_{u}-{m}_{11}\dot{\alpha }。$

(20)

设计如下控制器：

$ {\tau }_{u}=-{k}_{u}{u}_{e}-{{\widehat{W}}_{u}}^{\text T}{\varphi }_{u}-{\widehat{D}}_{u}+{m}_{11}{\dot{\alpha }}_{u}。$

(21)

式中：$ {k}_{u} $为正常数；$ {\widehat{W}}_{u} $为$ {{W}_{u}}^{\mathrm{*}} $的估计值；$ {\widehat{D}}_{u} $为$ {D}_{u} $的估计值。

将式(21)代入式(20)得：

$ m_{11} \dot{u}_e = -k_u u_e + \widetilde{W}_u^{\mathrm{T}} \varphi_u + \widetilde{D}_u。$

(22)

式中：$ {\tilde {W}}_{u}={W}_{u}^{\mathrm{*}}-{\widehat{W}}_{u} $；$ {\stackrel{~}{D}}_{u}={D}_{u}-{\widehat{D}}_{u} $。

预测误差为：

$ {z}_{u}=u-\widehat{u}。$

(23)

式中：$ \dot{\widehat{u}} $可由串行-并行估计模型SPEM构建：

$ \dot{\widehat{u}}=\frac{1}{{m}_{11}}\left({{\widehat{W}}_{u}}^{\text T}{\varphi }_{u}+{\widehat{D}}_{u}+{\tau }_{u}+{\phi }_{u}{z}_{u}\right) 。$

(24)

式中：$ {\phi }_{u} $为正常数。

根据式(2)、式(23)、式(24)，$ {z}_{u} $的导数表示为:

$ {\dot{z}}_{u}=\frac{1}{{m}_{11}}\left({{\widehat{W}}_{u}}^{\text T}{\varphi }_{u}+{\tilde{D}}_{u}-{\phi }_{u}{z}_{u}\right)。$

(25)

复合学习律为可设计为：

$ {\dot{\widehat{W}}}_{u}={\gamma }_{u}\left[\left({u}_{e}+{\gamma }_{zu}{z}_{u}\right){\varphi }_{u}-{\kappa }_{u}{\widehat{W}}_{u}\right]。$

(26)

式中：$ {\gamma }_{u} $、$ {\gamma }_{zu} $、$ {\kappa }_{u} $为自行设计的正常数。

结合近似信息，非线性扰动观测器可按以下形式构建：

$ \left\{\begin{aligned}&{\widehat{D}}_{u}={m}_{11}u-{\sigma }_{u}，\\&{\dot \sigma _u} = {\hat W_u}^{\rm T}{\varphi _u} + {\hat D_u} + {\tau _u} - \left( {{u_e} + {\gamma _{zu}}{z_u}} \right)。\end{aligned} \right.$

(27)

根据式(2)、式(27)和$ {\tilde{D}}_{u}={D}_{u}-{\widehat{D}}_{u} $，$ {\stackrel{~}{D}}_{u} $的导数可写为：

$ {\dot{\tilde{D}}}_{u}={\dot{D}}_{u}-\left({{\tilde{W}}_{u}}^{\rm T}{\varphi }_{u}+{\stackrel{~}{D}}_{u}\right)-\left({u}_{e}+{\gamma }_{zu}{z}_{u}\right)。$

(28)

对式(8)中的$ {\psi }_{e} $求导，可得：

$ {\dot{\psi }}_{e}=-r\mathrm{cos}{\psi }_{e}+\frac{\mathrm{cos}{\psi }_{\mathrm{e}}\left(v+{\zeta }_{2}\right)}{{\rho }_{e}}-\frac{\mathrm{sin}{\psi }_{e}\left(u+{\zeta}_{1}\right)}{{\rho }_{e}}。$

(29)

根据式(29)，可得到艏摇方向的虚拟控制律$ {\alpha }_{r} $：

$ {\alpha }_{r}=\left({k}_{\psi }{\psi }_{e}+\frac{\mathrm{cos}{\psi }_{\mathrm{e}}\left(v+{\zeta }_{2}\right)}{{\rho }_{e}}-\frac{\mathrm{sin}{\psi }_{e}\left(u+{\zeta }_{1}\right)}{{\rho }_{e}}\right)。$

(30)

式中：$ {k}_{\psi } $为一个正常数。

艏摇方向的控制律设计与纵荡方向设计方式相同，设计的控制器如下：

$ {\tau }_{r}=-{k}_{r}{r}_{e}-{{\widehat{W}}_{u}}^{\rm T}{\varphi }_{r}-{\widehat{D}}_{r}+{m}_{66}{\dot{\alpha }}_{r}+{\psi }_{e}。$

(31)

式中：$ {k}_{r} $为正常数；$ {\widehat{W}}_{r} $为$ {W}_{r}^{*} $的估计值；$ {\widehat{D}}_{r} $为$ {D}_{r} $的估计值。

复合学习律可设计为：

$ {\dot{\widehat{W}}}_{r}={\gamma }_{r}\left[\left({r}_{e}+{\gamma }_{zr}{z}_{r}\right){\varphi }_{r}-{\kappa }_{r}{\widehat{W}}_{r}\right]。$

(32)

式中：$ {\gamma }_{r} $、$ {\kappa }_{r} $、$ {\gamma }_{zr} $为自行设计的正常数。

预测误差$ {z}_{r} $定义为：

$ {z}_{r}=r-\widehat{r}。$

(33)

其中，$ \dot{\widehat{r}} $构建为：

$ \dot{\widehat{r}}=\frac{1}{{m}_{66}}\left({{\stackrel{~}{W}}_{r}}^{\rm T}{\varphi }_{r}+{\widehat{D}}_{r}+{\tau }_{r}+{\phi }_{r}{z}_{r}\right)。$

(34)

式中：$ {\phi }_{r} $为正常数。

预测误差$ {z}_{r} $的导数表示为：

$ {\dot{z}}_{r}=\frac{1}{{m}_{66}}\left({{\stackrel{~}{W}}_{r}}^{\rm T}{\varphi }_{r}+{\tilde{D}}_{r}-{\phi }_{r}{z}_{r}\right)。$

(35)

非线性扰动观测器构建为：

$\left\{ \begin{aligned}&{\widehat{D}}_{r}={m}_{66}r-{\sigma }_{r}，\\&{\dot{\sigma }}_{r}={\widehat{W}}_{r}^{\mathrm{T}}{\varphi }_{r}+{\widehat{D}}_{r}+{\tau }_{r}-\left({r}_{e}+{\gamma }_{zr}{z}_{r}\right)。\end{aligned}\right.$

(36)

根据式(2)、式(36)，可得$ {\stackrel{~}{D}}_{r}={D}_{r}-{\widehat{D}}_{r} $，$ {\stackrel{~}{D}}_{r} $导数可表示为：

$ {\dot{\tilde{D}}}_{r}={\dot{D}}_{r}-\left({{\stackrel{~}{W}}_{r}}^{\rm T}{\varphi }_{r}+{\tilde{D}}_{r}\right)-\left({r}_{e}+{\gamma }_{zr}{z}_{r}\right)。$

(37)

注1　为了防止所提出的虚拟控制律式(16)和式(30)可能出现奇异性，应满足$ \mid {\psi }_{e}\mid \lt \text{π} /2 $。

注2　在式(26)和式(32)中，如果参数$ {\gamma }_{zu} $和$ {\gamma }_{zr} $设计得较大，则$ {\widehat{W}}_{u} $和$ {\widehat{W}}_{r} $的更新主要由预测误差调整，而如果参数$ {\gamma }_{zu} $和$ {\gamma }_{zr} $设计得较小，则$ {\widehat{W}}_{u} $和$ {\widehat{W}}_{r} $的更新主要由跟踪误差调整。

包含不确定性和干扰在内的复合未知项在纵摇和艏摇方向分别记为$ {\Sigma }_{u} $和$ {\Sigma }_{r} $。

$\left\{\begin{aligned} &{\Sigma }_{u}={m}_{22}vr-{m}_{33}wq-\mathrm{\Omega }{f}_{u}+{d}_{u}，\\&{\Sigma }_{r}=\left({m}_{11}-{m}_{22}\right)u\nu -\mathrm{\Omega }{f}_{r}+{d}_{r}。\end{aligned}\right.$

(38)

注3　扰动观测器包含神经网络的近似项。预测误差包含干扰估计的误差信息。非线性扰动观测器和神经网络相互交换信息，这意味着二者分担了“估计工作”。如果$ {{\widehat{W}}_{u}}^{\mathrm{T}}{\varphi }_{u}+{\widehat{D}}_{u} $和$ {{\widehat{W}}_{r}}^{\mathrm{T}}{\varphi }_{r}+{\widehat{D}}_{r} $能够紧跟系统总不确定性$ {\Sigma }_{u} $和$ {\Sigma }_{r} $，系统模型的估计就会更加准确。因此，利用神经网络和非线性扰动观测器进行复合学习的目标已经实现。

对于假设1～假设3下的系统式(1)～式(2)，如果设计了控制律式(16)和式(30)，复合学习律式(26)、式(32)和非线性扰动观测器式(27)、式(36)，则式(39)中的误差信号是最终一致有界的（UUB）。

2.1 稳定性证明

Lyapunov函数可设计为：

$ \begin{split} {V}^{2}=\, &\frac{1}{2}{{\rho }_{s}}^{2}+{m}_{11}{{u}_{e}}^{2}+\frac{1}{{\gamma }_{u}}{{\widetilde{W}}_{u}}^{{\mathrm{T}}}{\widetilde{W}}_{u}+{{\widetilde{D}}_{u}}^{2}+{m}_{11}{\gamma }_{zu}{{z}_{u}}^{2}+\\ &{{\psi }_{e}}^{2}+{m}_{66}{{r}_{e}}^{2}+ \frac{1}{{\gamma }_{r}}{{\widetilde{W}}_{r}}^{{\mathrm{T}}}{\widetilde{W}}_{r}+{{\widetilde{D}}_{r}}^{2}+{m}_{66}{\gamma }_{zr}{{z}_{e}}^{2}。\end{split} $

(39)

式(37)的时间导数计算公式为：

$\begin{split} \dot{\mathrm{V}}= \, &{\rho }_{s}{\dot{\rho }}_{e}+{m}_{11}{u}_{e}{\dot{u}}_{e}+\frac{1}{{\gamma }_{u}}{{\widetilde{W}}_{u}}^{\rm T}\left(-{\dot{\widehat{W}}}_{u}\right)+{\widetilde{D}}_{u}\left(-{\dot{\widehat{D}}}_{u}\right)+\\&{m}_{11}{\gamma }_{zu}{z}_{u}{\dot{z}}_{u} + {\psi }_{e}{\dot{\psi }}_{e}+{m}_{66}{r}_{e}{\dot{r}}_{e}+\\&\frac{1}{{\gamma }_{r}}{{\widetilde{W}}_{r}}^{\rm T}\left(-{\dot{\widehat{W}}}_{r}\right)+{\widetilde{D}}_{r}\left(-{\dot{\widehat{D}}}_{r}\right)+{m}_{66}{\gamma }_{zr}{z}_{r}{\dot{z}}_{r}。\end{split}$

(40)

根据式(17)、式(29)、式(22)、式(26)、式(32)、式(27)、式(36)、式(25)和式(35)及杨氏不等式，式(40)可以进一步计算为：

$ {\begin{split} \dot{V}\leqslant\, & -\left({k}_{\rho }-\frac{1}{2}\right){{\rho }_{s}}^{2}-\left({k}_{u}-\frac{1}{2}\right){{u}_{e}}^{2}-\left(\frac{1}{2}{\kappa }_{u}-\frac{1}{2{\zeta }_{u}}\right){{\widetilde{W}}_{u}}^{\mathrm{T}}{\widetilde{W}}_{u}-\\ &\left(\frac{1}{2}-\frac{1}{2}{\zeta }_{u}{{\pi }_{u}}^{2}\right){{\widetilde{D}}_{u}}^{2}-{\gamma }_{zu}{\phi }_{u}{{z}_{u}}^{2}-{k}_{\psi }{{\psi }_{e}}^{2}-{k}_{r}{{r}_{e}}^{2}-\\ &\left(\frac{1}{2}{\kappa }_{r}-\frac{1}{2{\zeta }_{r}}\right){{\widetilde{W}}_{r}}^{\mathrm{{T}}}{\widetilde{W}}_{r} -\left(\frac{1}{2}-\frac{1}{2}{\zeta }_{r}{{\pi }_{r}}^{2}\right){\widetilde{D}}_{r}^{2}-{\gamma }_{zr}{\phi }_{r}{{z}_{r}}^{2}+\\ &\frac{1}{2}{\kappa }_{u}\parallel {{W}_{u}}^{\mathrm{*}}{\parallel }^{2} + \frac{1}{2}{\kappa }_{r}\parallel {{W}_{r}}^{\mathrm{*}}{\parallel }^{2} + \frac{1}{2}{{\chi }_{u}}^{2} + \frac{1}{2}{{\chi }_{r}}^{2}\leqslant -2aV+b。\end{split}}$

(41)

式中：a=min$ ({( {{k_\rho } - 1/2} ), {k_\psi },\left( {{k_u} - 1/2} \right),{k_r},1/2,} $ $ ( {\vartheta _u}/2 - 1/2 {\mu _u} ), ( {{\vartheta _r}/2 - 1/2{\mu _r}} ) ) $；$ b = ({k}_{wu}{{\delta }_{gu}}^{2} + k_{wr}{{\delta }_{gr}}^{2} + {\vartheta }_{u} \parallel {W}_{u}^{\mathrm{*}}{\parallel }^{2} +$$ {\vartheta }_{r}\parallel {W}_{r}^{\mathrm{*}}{\parallel }^{2}+ {k}_{wr}{{\delta }_{gr}}^{2}+ {\vartheta }_{u}\parallel {{W}_{u}}^{\mathrm{*}}{\parallel }^{2} +{\vartheta }_{r}\parallel {{W}_{r}}^{\mathrm{*}}{\parallel }^{2})/2 $。

通过选择适当的参数使得：$ {k}_{\rho } \gt 1/2，{k}_{\psi } \gt 0 $，$ {k}_{u} \gt 1/2,{k}_{r} \gt 0,{\vartheta }_{u}/2-1/2{\mu }_{u} \gt 0,{\vartheta }_{r}/2-1/2{\mu }_{u} \gt 0 $。

进一步，可得到以下不等式：

$ 0\leqslant V\leqslant \frac{b}{2a}+\left[V\left(0\right)-\frac{b}{2a}\right]{e}^{2at}。$

(42)

显然，当$ V\to b/2a $时，$ t\to \mathrm{\infty } $。可以得到Lyapunov函数(39)中的所有信号都是一致最终有界（UUB）。证明到此结束。

注4　在实际应用中，通过设置$ {k}_{\psi }\gg {k}_{\rho } $可使$ {\psi }_{e} $的收敛速度快于($ {\rho }_{e}-{\rho }_{o} $)。图4可以进一步验证这一点。参数$ {\rho }_{o} $可以设计为一个小的正常数。此外，通过反复试验，选择设计参数$ \left({k}_{\rho } \gt 1/2\right) $、$ \left({k}_{\psi } \gt 0\right) $，以确保系统稳定。然后，适当调节其他设计参数$ {\gamma }_{u}、{\gamma }_{r}、{\kappa }_{u}、{\kappa }_{r} $，以获得满意的控制性能。$ {\gamma }_{zu} $和$ {\gamma }_{zr} $越小，AUV的跟踪误差收敛越快，跟踪精度越高。最后可对参数$ {\varphi }_{u} $和$ {\varphi }_{r} $进行适当调节。

图 4 跟踪误差、偏航角误差 Fig. 4 Tracking error, yaw angle error

3 仿真模拟

为了验证所提出的控制策略的有效性和优越性，本文选择在一个名为WL-II的欠驱动AUV上进行了仿真模拟。参照文献[20]，本文设定了以下模型参数。

本文在控制器设计中使用单隐层径向基神经网络（RBFNN）逼近系统的未知动态。该神经网络包括20个隐含节点，节点中心在区间[−2,20]上均匀分布，所有节点使用固定宽度h=5。具体参数设置如表1所示。

表 1 径向基神经网络参数设置 Tab.1 Radial basis neural network parameterization

m₁₁=47.5 kg；m₂₂=94 kg；m₆₆=13.4 kg·m²；AUV的未知动态表示为：$ [\mathrm{\Delta }{f}_{u}, {\Omega }{f}_{\nu }, {\Omega }{f}_{r}{]}^{\mathrm{{T}}}=[\left(15.6+8.4\left|u\right|\right)u,$$ \left(55+123.4\left|v\right|\right)v, \left(28.2+4.8\left|r\right|\right) $。时变扰动式(2)的外部时变扰动设计为：$ [{d}_{u},{d}_{v},{d}_{r}{]}^{\mathrm{{T}}} = [7\mathrm{sin}\left(0.8t - \text{π} /3\right) + 7\mathrm{cos}\left(0.8t + \text{π} /3\right) + $$ 5\mathrm{c}\mathrm{o}\mathrm{s} \times ( 0.4 t + \text{π} /7)+3] $。

3.1 对比仿真

控制律设计参数$ {\gamma }_{zu} $=$ {\gamma }_{zr} $=0且不带观测器的设计是传统的神经网络控制方案，记为$ {\tau }_{\mathrm{n}\mathrm{n}} $。其他仿真参数设置与不变。模拟结果如图3～图8所示。

图 3 参考轨迹与实际轨迹 Fig. 3 Reference and actual trajectories

本文提出的控制器记为$ \tau $；仿真参数设置：参考轨迹选为$ {x}_{d}=20\mathrm{c}\mathrm{o}\mathrm{s}\left(0.2t\right)，{y}_{d}=20\mathrm{s}\mathrm{i}\mathrm{n}\left(0.2t\right) $；选择该圆形轨迹可以测试所设计控制律的运动控制能力。初始条件为$ \left[\right(x\left(0\right),y\left(0\right),u\left(0\right),r\left(0\right)]=[(\mathrm{15,6},\mathrm{0,0})] $；控制律设计参数和复合学习律选取为：$ {\rho }_{0}=0.8 $；$ {k}_{\rho }=0.7 $；$ {k}_{\psi }=4 $；$ {k}_{u} = {k}_{r} = 9 $；$ {\gamma }_{u}={\gamma }_{r}=0.6 $；$ {\gamma }_{zu}=100 $；$ {\gamma }_{zr}=30 $；$ {\kappa }_{u}={\kappa }_{r}= 0.3 $；$ {\phi }_{u}={\phi }_{r}=30 $。

图3显示，AUV在受未知动态和海洋扰动的影响情况下，2种控制器都能使AUV成功地跟踪距离为$ {\rho }_{0} $的理想轨迹。从图4所示的结果来看，传统神经网络控制法（红线）的跟踪误差最终在0.54～1.07 m范围内波动，而复合学习控制法（蓝线）的跟踪误差值范围仅为0.81～0.79 m，稳态误差也从0.57 m下降至0.02 m，充分显示出本文方法更高的跟踪精度。艏向角误差$ {\psi }_{e} $最终收敛到0.01 m，2种方法效果基本相同。而跟踪距离误差$ {\rho }_{e} $中可以看到传统神经网络控制法有一定的波动，而相对复合学习控制法来说误差平稳。

图5～图6所示的是非线性函数近似结果。图5(a)中本文提出的方法（红线）对非线性函数（蓝线）的拟合平均误差约为0.2 N·m，传统神经网络方法（见图5(b)）与非线性函数平均拟合误差约3.1 N·m，更加直观地验证本文提出的控制策略非常精确。图6中2种方法的拟合效果相近。

图 5 $ {\mathrm{\Sigma }}_{u} $及其估计值 Fig. 5 $ {\mathrm{\Sigma }}_{u} $ and estimation of $ {\mathrm{\Sigma }}_{u} $

图 6 $ {\mathrm{\Sigma }}_{{r}} $及其估计值 Fig. 6 $ {\mathrm{\Sigma }}_{{r}} $ and estimation of $ {\mathrm{\Sigma }}_{{r}} $

图7显示了2种控制策略下2个方向的权值估计的2范数，纵摇方向的权值估计中（见图7(a)），本文提出的控制方法（蓝线）波动较明显，对扰动变化更敏感，而传统神经网络法（红线）波动较小，对扰动的反应较小。说明在“复合学习”下，权值估计更灵敏。

图 7 $ { \widehat{W}}_{u}、{\widehat{W}}_{r} $的2范数$ \| \widehat{W}_{u}\|、\|\widehat{W}_{r}\| $ Fig. 7 2-norms $\|\widehat{W}_{u}\|，\|\widehat{W}_{r}\| $ of parameters $ {\widehat{W}}_{u}，{\widehat{W}}_{r} $

相应的控制输入$ {\tau }_{u} $和$ {\tau }_{r} $如图8所示。仿真结果表明，纵向推进力与艏向控制力矩在初始阶段均呈现显著波动现象，其机理可归因于欠驱动系统初始位姿偏差引发的动态调节需求。随着误差向量的渐进收敛，控制量幅值同步趋于稳态工作区间。

图 8 控制信号$ {\tau }_{u} $和$ {\tau }_{r} $ Fig. 8 Control signals $ {\tau }_{u} $ and $ {\tau }_{r} $

4 结　语

本文提出一种基于复合学习机制的欠驱动AUV轨迹跟踪控制方法，针对二维平面运动场景中存在的模型不确定性与时变扰动耦合问题，构建具有动态补偿能力的鲁棒控制架构。

通过视线导航方法重构虚拟控制量以突破欠驱动约束，设计融合预测误差与跟踪误差的双重学习机制，实现对未知动态及外界扰动的在线联合估计。利用复合学习近似信息构建了扰动观测器。对闭环系统的稳定性进行了分析。仿真结果证实了本文控制器的有效性和优越性。基于Lyapunov稳定性理论严格证明闭环系统的渐近稳定性，通过数值仿真验证控制器在时变扰动下的跟踪精度与抗扰特性。下一步工作是将本文方法扩展到三维空间中未知动态和时变扰动的欠驱动自主水下机器人的输出约束控制。此外，后续将进一步在实际水池实验或实物平台上开展控制器的验证工作，以评估其在真实复杂环境中的适应性和工程可行性，增强研究成果的现实意义与应用价值。

参考文献

[1]	DING W, ZHANG L, ZHANG G, et al. Research on 3D trajectory tracking of underactuated AUV under strong disturbance environment[J]. Computers and Electrical Engineering, 2023, 111: 108924. DOI:10.1016/j.compeleceng.2023.108924
[2]	LI D, DU L. AUV trajectory tracking models and control strategies: a review[J]. Journal of Marine Science and Engineering, 2021, 9(9): 1020. DOI:10.3390/jmse9091020
[3]	MOKHTARI M, TAGHIZADEH M, MAZARE M. Adaptive model-free fault-tolerant control for autonomous underwater vehicles subject to actuator failure[J]. Journal of the Brazilian Society of Mechanical Sciences and Engineering, 2024, 46(6): 330. DOI:10.1007/s40430-024-04860-8
[4]	LAKHEKAR G V, WAGHMARE L M. Robust self-organising fuzzy sliding mode-based path-following control for autonomous underwater vehicles[J]. Journal of Marine Engineering & Technology, 2023, 22(3): 131-152. DOI:10.1080/20464177.2022.2120448
[5]	CHEN B, HU J, ZHAO Y, et al. Finite-time observer based tracking control of uncertain heterogeneous underwater vehicles using adaptive sliding mode approach[J]. Neurocomputing, 2022, 481: 322-332. DOI:10.1016/j.neucom.2022.01.038
[6]	ZHANG G, CHU S, ZHANG W, et al. Adaptive neural fault-tolerant control for USV with the output-based triggering approach[J]. IEEE Transactions on Vehicular Technology, 2022, 71(7): 6948-6957. DOI:10.1109/TVT.2022.3167038
[7]	PHAM NGUYEN NHUT Thanh, NGO AN THUYEN, HO PHAM HUY ANH. Adaptive fuzzy 3-D trajectory tracking control for autonomous underwater vehicle (AUV) using modified integral barrier lyapunov function[J]. Ocean Engineering, 2023, 283: 115027. DOI:10.1016/j.oceaneng.2023.115027
[8]	KHOSHNAM SHOJAEI. Neural network feedback linearization target tracking control of underactuated autonomous underwater vehicles with a guaranteed performance[J]. Ocean Engineering, 2022, 258: 111827. DOI:10.1016/j.oceaneng.2022.111827
[9]	QIN J, DU J. Robust adaptive asymptotic trajectory tracking control for underactuated surface vessels subject to unknown dynamics and input saturation[J]. Journal of Marine Science and Technology, 2022, 27(1): 307-319. DOI:10.1007/s00773-021-00835-9
[10]	SHOJAEI K, DOLATSHAHI M. Line-of-sight target tracking control of underactuated autonomous underwater vehicles[J]. Ocean Engineering, 2017, 133: 244-252. DOI:10.1016/j.oceaneng.2017.02.007
[11]	WANG J, WANG C, WEI Y, et al. Command filter based adaptive neural trajectory tracking control of an underactuated underwater vehicle in three-dimensional space[J]. Ocean Engineering, 2019, 180: 175-186. DOI:10.1016/j.oceaneng.2019.03.061
[12]	GONG H, ER M J, LIU T, et al. Three-dimensional optimal trajectory tracking control of underactuated autonomous underwater vehicles using double closed-loop control[C]//5th International Conference on Intelligent Autonomous Systems (ICoIAS). 2022: 316-321.
[13]	PATRE P M, BHASIN S, WILCOX Z D, et al. Composite adaptation for neural network-based controllers[J]. IEEE Transactions on Automatic Control, 2010, 55(4): 944-950. DOI:10.1109/TAC.2010.2041682
[14]	PAN Y, SUN T, YU H. Composite adaptive dynamic surface control using online recorded data[J]. International Journal of Robust and Nonlinear Control, 2016, 26(18): 3921-3936. DOI:10.1002/rnc.3541
[15]	YANG Y, CHEN D, LIU Q, et al. Predictor-based neural dynamic surface control of a nontriangular system with unknown disturbances[J]. IEEE Transactions on Circuits and Systems I: Regular Papers, 2022, 69(8): 3353-3365. DOI:10.1109/TCSI.2022.3166988
[16]	YUCELEN T, HADDAD W M. Low-frequency learning and fast adaptation in model reference adaptive control for safety-critical systems[C]//American Control Conference, 2013: 5116−5121.
[17]	GOEL R, ROY S B. Closed-loop reference model based distributed model reference adaptive control for multi-agent systems[C]// American Control Conference (ACC), 2021: 1082−1087.
[18]	YANG Y, LIU Q, YUE D, et al. Predictor-based neural dynamic surface control for strict-feedback nonlinear systems with unknown control gains[J]. IEEE Transactions on Cybernetics, 2023, 53(7): 4677-4690. DOI:10.1109/TCYB.2021.3127389
[19]	ZHANG J X, CHAI T. Singularity-free continuous adaptive control of uncertain underactuated surface vessels with prescribed performance[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2022, 52(9): 5646-5655. DOI:10.1109/TSMC.2021.3129798
[20]	LIANG X, QU X, WANG N, et al. Three-dimensional trajectory tracking of an underactuated AUV based on fuzzy dynamic surface control[J]. IET Intelligent Transport Systems, 2020, 14(5): 364-370. DOI:10.1049/iet-its.2019.0347


舰船科学技术 2026, Vol. 48 Issue (6): 125-131 DOI: 10.3404/j.issn.1672-7649.2026.06.017	PDF