舰船科学技术  2025, Vol. 47 Issue (7): 87-93    DOI: 10.3404/j.issn.1672-7649.2025.07.017   PDF    
基于改进鹦鹉算法优化的USV轨迹跟踪滑模控制
刘海涛, 黄桂羚, 田雪虹, 彭照强     
广东海洋大学 机械工程学院,广东 湛江 524088
摘要: 针对存在外部海洋环境干扰的无人船轨迹跟踪控制精确度不高、耗时低效的问题,提出一种基于改进鹦鹉算法优化的无人水面船(USV)轨迹跟踪滑模控制方法。设计控制器利用RBF神经网络快速的非线性映射对不定干扰进行估计,补偿滑模控制输出,引入切换步长因子及可控变化概率改进原始鹦鹉算法,利用改进的具有优异求解能力的 PSPO 算法自动求解 RBF 神经网络的各项参数,进一步提升其拟合效果。最终输出纵向推力和转向力矩,实现欠驱动无人船的轨迹跟踪控制。仿真结果表明,该控制器能对干扰进行快速精确地估计以提升系统的鲁棒性,误差收敛速度较单一神经网络滑模控制和滑模控制分别提高约25%和60%,能够实现对预设轨迹有效跟踪。
关键词: 欠驱动无人船     神经网络控制     滑模控制     优化算法    
Sliding mode control of USV trajectory tracking based on improved parrot algorithm optimization
LIU Haitao, HUANG Guiling, TIAN Xuehong, PENG Zhaoqiang     
School of Mechanical Engineering, Guangdong Ocean University, Zhanjiang 524088, China
Abstract: A sliding mode control method for USV trajectory tracking based on improved parrot algorithm optimization is proposed to address the issues of low accuracy and low efficiency in trajectory tracking control of unmanned ships with external marine environmental interference. Design a controller that utilizes the fast nonlinear mapping of RBF neural network to estimate uncertain disturbances, compensate for sliding mode control output, introduce switching step factor and controllable change probability to improve the original Parrot algorithm, and use the improved PSPO algorithm with excellent solving ability to automatically solve the various parameters of RBF neural network, further improving its fitting effect. The final output includes longitudinal thrust and steering torque, achieving trajectory tracking control of underactuated unmanned ships. The simulation results show that the controller can quickly and accurately estimate disturbances to improve the robustness of the system, and the error convergence speed is about 25% and 60% faster than single neural network sliding mode control and sliding mode control, respectively. It can achieve effective tracking of preset trajectories.
Key words: underactuated unmanned vessel     neural network control     sliding mode control     optimization algorithm    
0 引 言

我国作为海洋大国,对海洋空间探索及权益十分重视,以无人水面船(Unmanned Surface Vehicle,USV)为代表的海洋航行器需求迅速增长[1]。综合考虑安全、经济以及特殊任务要求,无人水面船须按照既定路线航行,例如布设水雷、铺设管道和管道维修等。水面欠驱动船舶是一类具有非线性特性的系统,由于船舶建模的不确定因素[2],加之海洋环境的扰动,使得船舶航行时的参数摄动更加复杂。

传统轨迹跟踪控制方法是通过系统的局部线性化或多变量模型解耦[3],利用状态反馈法[4]、模型预测控制法(Model Predict Control,MPC) [5]、滑模控制法(Sliding Mode Control,SMC)[6]等。张强等[7]利用神经网络实现船舶的未知动力学和不确定性重构,实现了对欠驱动船舶的跟踪控制,但逼近效果不佳,控制精度不足。Ashrafiuon等[8]提出一种渐近稳态轨迹跟踪控制,引入二次滑模变结构控制给出了船舶艏摇速度的有界值。其不足之处在于,存在着航向摆动,且初始位置一定要在预定轨道上,与实际不符。王茹等[9]引入了一种结合低频学习和自适应动态面输出反馈的控制策略,采用了最小参数学习法来降低控制器设计的复杂度。由于采用神经网络权值的上界估计、不等式放大的方法,导致控制算法过于保守[10]。优化算法作为一种高效的寻优手段,在路径规划领域有深度应用,但在欠驱动无人船的轨迹跟踪控制方面却鲜有使用。

为避免在欠驱动USV轨迹跟踪控制中出现的各种局限性,同时保持较高的跟踪精度效果,本文提出基于改进鹦鹉算法(Parrot Optimizer,PO)优化的USV轨迹跟踪滑模控制,自动优化RBF参数,提高逼近速度,实现快速精确轨迹跟踪。

1 数学模型建立

仅考虑USV的前向、横漂、艏摇三自由度的水平面运动(见图1),引入欠驱动水面船舶的运动学数学模型如下[10-11]

图 1 平面USV运动模型示意图 Fig. 1 Schematic diagram of planar underactuated USV motion model
$ \left\{\begin{aligned} &\dot{x}=u{\mathrm{cos}}\left(\psi \right)-\nu {\mathrm{sin}}\left(\psi \right),\\ &\dot{y}=u{\mathrm{sin}}\left(\psi \right)+\nu {\mathrm{cos}}\left(\psi \right),\\ &\dot{\psi }=r,\\ &\dot{u}=\frac{1}{{m}_{11}}({m}_{22}\nu r-{d}_{11}u-\Delta {f}_{u})+\frac{{\tau }_{u}+{\tau }_{wu}}{{m}_{11}},\\ &\dot{\nu }=\frac{1}{{m}_{22}}(-{m}_{11}ur-{d}_{22}\nu -\Delta {f}_{v})+\frac{{\tau }_{wv}}{{m}_{22}},\\ &\dot{r}=\frac{1}{{m}_{33}}\left[\right({m}_{11}-{m}_{22})uv-{d}_{33}r-\Delta {f}_{v}]+\frac{{\tau }_{r}+{\tau }_{wt}}{{m}_{33}}。\end{aligned}\right. $ (1)

式中:$ x、y、\psi $分别为USV在惯性坐标系中的前进、横漂2个方向上的位移及偏航角;$ u、v、r $分别为附体坐标系下船舶的前进、横漂2个方向上的速度及偏航方向的角速度;$ {m}_{11} $$ {m}_{22} $$ {m}_{33} $为已知附加质量,引入USV模型不确定项$ \mathrm{\Delta}f=\left[\mathrm{\Delta}f_u,\mathrm{\Delta}f_v,\mathrm{\Delta}f_r\right]\mathrm{^T} $$ {\tau }_{c}={\left[{\tau }_{u},0,\right.} {\left.{\tau }_{r}\right]}^{\mathrm{T}} $为欠驱动船舶的2个控制信号,分别为控制力和控制力矩;$ {\tau }_{{w}}={\left[{\tau }_{wu},{\tau }_{{wv}},{\tau }_{{wr}}\right]}^{\mathrm{T}} $为外界的未知时变干扰。

2 基于RBFNN的自适应滑模控制器 2.1 控制器设计

滑模控制器可以使系统输出直接跟踪期望指令,但是外部干扰越大,切换增益越大,系统的抖振就越容易发生[11]。依靠神经网络进行控制量补偿是一种被广泛采用的策略[12]。为适应由式(1)中建立的包含模型不确定项和未知外界干扰的三自由度欠驱动USV数学模型,USV的预设轨迹 $ ({x}_{d},{y}_{d}) $存在一阶、二阶导数[13]。假设作用于欠驱动船舶上的外界干扰为时变干扰,且满足$ \left|{\tau }_{{wu}}\right|\leqslant {\tau }_{{wu}}^{*}{、}\left|{\tau }_{{wv}}\right|\leqslant {\tau }_{{wv}}^{*}{、}\left|{\tau }_{{wr}}\right|\leqslant {\tau }_{{wr}}^{*} $,其中,$ {\tau }_{{wu}}^{*}\mathrm{、}{\tau }_{{wv}}^{*}\mathrm{、}{\tau }_{{wr}}^{*} $为外界环境干扰未知上界[14]。设计2个控制输入$ \tau_u、\tau_r $的控制律。

设计虚拟控制律。定义跟踪位置误差为${x}_{{e}}=x-{x}_{{d}} $$ {y}_{{e}}=y-{y}_{{d}} $,对时间求导,结合式(1)可得:

$ \left[\begin{array}{c}{\dot{x}}_{e}\\ {\dot{y}}_{e}\end{array}\right]=\left[\begin{array}{cc}\mathrm{c}\mathrm{o}\mathrm{s}\left(\psi \right)& -\mathrm{s}\mathrm{i}\mathrm{n}\left(\psi \right)\\ \mathrm{s}\mathrm{i}\mathrm{n}\left(\psi \right)& \mathrm{c}\mathrm{o}\mathrm{s}\left(\psi \right)\end{array}\right]\left[\begin{array}{c}u\\ \nu \end{array}\right]-\left[\begin{array}{c}{\dot{x}}_{d}\\ {\dot{y}}_{d}\end{array}\right]。$ (2)

为控制USV跟踪误差的收敛,记$ D=\sqrt{{x}_{e}^{2}+{y}_{e}^{2}+C} $,设计虚拟控制律如下:

$ \left[\begin{array}{c}{\alpha }_{{u}}\\ {\alpha }_{{v}}\end{array}\right]=\left[\begin{array}{cc}\mathrm{c}\mathrm{o}\mathrm{s}\left(\psi \right)& \mathrm{s}\mathrm{i}\mathrm{n}\left(\psi \right)\\ -\mathrm{s}\mathrm{i}\mathrm{n}\left(\psi \right)& \mathrm{c}\mathrm{o}\mathrm{s}\left(\psi \right)\end{array}\right]\left[\begin{array}{c}{\dot{x}}_{{d}}-k{x}_{{e}}/D\\ {\dot{y}}_{{d}}-k{y}_{{e}}/D\end{array}\right]。$ (3)

式中:$ \alpha\mathit{_{\mathrm{\mathrm{\mathit{u}}}}} $$ \alpha_{\mathrm{\mathit{v}}} $分别为纵向与横向的虚拟控制律,$ k $$ C $均为大于0的设计系数,可得:

$\begin{split}\left[\begin{array}{c}{\dot{x}}_{e}\\ {\dot{y}}_{e}\end{array}\right]= &\left[\begin{array}{c}-k{x}_{e}/D\\ -k{y}_{e}/D\end{array}\right]+\\ &\left[\begin{array}{cc}\cos\left(\psi \right)& \sin\left(\psi \right)\\ -\sin\left(\psi \right)& \cos\left(\psi \right)\end{array}\right]\left[\begin{array}{c}u-{\alpha }_{u}\\ v-{\alpha }_{v}\end{array}\right]。\end{split}$ (4)

对式(3)求导:

$ \begin{split} \left[\begin{array}{c}{\dot{\alpha }}_{{u}} \\ {\dot{\alpha }}_{{v}}\end{array}\right]= & \left[\begin{array}{c}r{\alpha }_{{v}}\\ -r{\alpha}_{{u}}\end{array}\right]+ \left[\begin{array}{cc}\cos\left(\psi \right)& \sin\left(\psi \right)\\ -\sin\left(\psi \right)& \cos\left(\psi \right)\end{array}\right]\text{×}\\ & \left[\begin{array}{c}{\ddot{x}}_{d}-k\left({w}^{-1}-{w}^{-3}{x}_{{e}}^{2}\right){\dot{x}}_{{e}}+k{D}^{-3}{x}_{{e}}{y}_{{e}}{\dot{y}}_{{e}}\\ {\ddot{y}}_{d}-k\left({w}^{-1}-{w}^{-3}{y}_{{e}}^{2}\right){\dot{y}}_{{e}}+k{D}^{-3}{x}_{{e}}{y}_{{e}}{\dot{x}}_{{e}}\end{array}\right]。\end{split} $ (5)

定义横向速度误差$ {\nu }_{e}=v-{\alpha }_{v} $,纵向速度误差$ {u}_{e}=u-{\alpha }_{u} $,设计的一阶滑模面分别为:

$ \left\{\begin{aligned} & s_1=\dot{\nu}_e+\lambda_1\nu_e,\\ & s_2=u_e+\lambda_2\int_0^tu_e\left(\tau\right)\mathrm{d}\tau。\end{aligned}\right. $ (6)

对其二次求导得:

$ \left\{\begin{aligned} & \dot{s}_1=\ddot{\nu}_e+\lambda_1\dot{\nu}_e=\left(\ddot{\nu}-\ddot{\alpha}_v\right)+\lambda_1\left(\dot{\nu}-\dot{\alpha}_v\right),\\ & \begin{split}\dot{s}_2= & (m_{22}\nu r-d_{11}u-\mathrm{\Delta}f_u)/m_{11}+ \\ & (\tau_u+\tau_{wu})/m_{11}-\dot{\alpha}_u+\lambda_2u_e。\end{split}\end{aligned}\right. $ (7)

式中:$ {\lambda }_{1} $$ {\lambda }_{2} $为引设计常数。针对USV模型中的不确定项$ \mathrm{\Delta }{f}_{{r}}\mathrm{、}\mathrm{\Delta }{f}_{{u}} $,无法直接设计控制律,引入RBFNN控制算法,利用其强大的非线性映射能力,对不确定项逼近,其神经网络输出表达式为[15]

$ \left\{\begin{array}{c}\Delta f_r=W_r^{*\mathrm{T}}h\left(z\right)+\zeta_1,\\ \Delta f_u=W_u^{*\mathrm{T}}h\left(z\right)+\zeta_2。\end{array}\right. $ (8)

式中:$ {W}_{r}^{*}=\left[{{w}_{{r},1}}^{*},{{w}_{{r},2}}^{*},\cdots ,{{w}_{{r},{n}}}^{*}\right]^{\mathrm{T}}\in {R}^{n \times l}、{W}_{u}^{*}= \left[{{w}_{{u},1}}^{*}, \right. \left.{{w}_{{u},2}}^{*},\cdots ,{{w}_{{u},{n}}}^{*}\right]^{\mathrm{T}}\in {R}^{n \times l} $为隐含层传输到输出层的权值向量;$ z={\left[u,v,r\right]}^{\mathrm{T}} $为RBFNN的输入向量;$ {\zeta }_{1}\mathrm{、}{\zeta }_{2} $为逼近误差,定义为误差界值$ {\zeta }_{{r}}\mathrm{、}{\zeta }_{{u}} $$ h\left(x\right)=\left[{h}_{1}\left(x\right), \right. \left. {h}_{2}\left(x\right),..., {h}_{n}\left(x\right)\right]^{\mathrm{T}} $为径向基函数向量,基函数的输出表达式为:

$ h_j\left(x\right)=\mathrm{e}\mathrm{x}\mathrm{p}[-\frac{\parallel x-c_j\parallel^2}{2b_j^2}],j=1,\cdots,n。$ (9)

式中:$ j $为神经网络隐含层节点数;$ {h}_{j} $为神经元计算的高斯函数;$ n $为神经元数;$ {c}_{j} $为隐藏层中心点坐标向量;$ x $为输入信号向量;传输到隐藏层的每一个神经元;$ {{b}_{j}}^{} $对应方差,即宽度。记为:

$ \begin{split} \begin{split} U= & \left[\ddot{y}_d-k\left(w^{-1}-w^{-3}y_e^2\right)\dot{y}_e+kw^{-3}x_ey_e\dot{x}_e\right]\cos\left(\psi\right)- \\ &\left[\ddot{x}_d-k\left(w^{-1}-w^{-3}x_e^2\right)\dot{x}_e+kw^{-3}x_ey_e\dot{y}_e\right]\sin\left(\psi\right)。\end{split} \end{split} $ (10)

则由式(7)的第一项可写出:

$ {\ddot{\alpha }}_{v}=-\dot{r}{\alpha }_{u}-r{\dot{\alpha }}_{u}+\dot{U} 。$ (11)

由式(3)、式(7)、式(11)可推导出:

$ \begin{split}{\dot{s}}_{1}=&\ddot{\nu }+{\alpha }_{u}\left[\right({m}_{11}-{m}_{22})u\nu -{d}_{33}r-\Delta {f}_{r}+ \\ & {\tau }_{r}+{\tau }_{{w}{r}}]/{m}_{33}+r{\dot{\alpha }}_{u}-\dot{U}+{\lambda }_{1}(\dot{\nu }-{\dot{\alpha }}_{v})。\end{split} $ (12)

实际理想权值$ {W}_{{r}}^{*} $无法求出,假设$ {W}_{{r}}^{*} $有界且存在一个大于0的常数$ {W}_{{r}} $可以使得${W}_{{r}}^{*}\leqslant {W}_{{r}} $,定义$ {\widehat{W}}_{{r}} $$ {W}_{{r}}^{*} $的估计值。对$ {W}_{{u}}^{*} $$ z\in \mathrm{\Omega } $条件下,使$ \left|{\zeta }_{1}\right| $最小的值,$ {W}_{{u}}^{*} $同理,可写为如下形式:

$ \left\{\begin{array}{c}{W}_{{r}}^{*}=\mathrm{arg}\underset{W\in {\mathrm{R}}^{n}}{\mathrm{min}}\left[\underset{z\in \mathrm{\Omega }}{sup}\left|\mathrm{\Delta }{f}_{\mathrm{r}}\right(x)-{W}_{{r}}^{\text{T}}h(x\left)\right|\right],\\ {W}_{{u}}^{*}=\mathrm{arg}\underset{W\in {\mathrm{R}}^{n}}{\mathrm{min}}\left[\underset{z\in \mathrm{\Omega }}{sup}\left|\mathrm{\Delta }{f}_{{u}}\right(x)-{W}_{{u}}^{\text{T}}h(x\left)\right|\right]。\end{array}\right. $ (13)

结合表达式(12),可设计转向控制律:

$ \begin{split} {\tau }_{{r}}=&-{m}_{33}\left[\ddot{\nu }+r{\dot{\alpha }}_{{u}}-\dot{U}+{\lambda }_{1}\left(\dot{\nu }-{\dot{\alpha }}_{{v}}\right)\right]/\\ &{\alpha }_{{u}}-\left({m}_{11}-{m}_{22}\right)u\nu +{d}_{33}r+\\ &{\widehat{W}}_{{r}}^{\mathrm{T}}h\left(z\right)-{\eta}_{1}{s}_{1} -{\widehat{\tau }}_{{w}{r}}^{*}\varphi \left({s}_{1}\right)。\end{split} $ (14)

式中:$ \varphi\left(s_1\right)=\tan\mathrm{h}(s_1/\varepsilon_1) $$ {\eta }_{1} $$ {\varepsilon }_{1} $为设计常数,且$ {\eta }_{1} $大于0;$ {\widehat{\tau }}_{\mathrm{w}\mathrm{r}}^{*} $为外界干扰界估计值。则构建权值自适应律为:

$ {\dot{\widehat{W}}}_{{r}}=-{\mathit{\Gamma }}_{1}\left[{s}_{1}h\right(z)+{\vartheta }_{1}{\widehat{W}}_{{r}}]。$ (15)

参数自适应律为:

$ {\dot{\widehat{\tau }}}_{{w}{r}}^{*}={\gamma }_{1}\left[{s}_{1}\varphi \right({s}_{1})-{\sigma }_{1}({\widehat{\tau }}_{{w}{r}}^{*}-{\tau }_{{w}{r}}^{0}\left)\right]。$ (16)

同理,可设计纵向$ {u} $的控制律:

$ \begin{split}{\tau }_{u}=&-{m}_{22}vr+{d}_{11}u+{\widehat{W}}_{u}^{\mathrm{T}}h\left(z\right)+{m}_{11}{\dot{\alpha }}_{u}- \\ &{\lambda }_{2}{m}_{11}{u}_{e}-{\eta }_{2}{s}_{2}-{\widehat{\tau }}_{{w}{u}}^{*}\varphi \left({s}_{2}\right)。\end{split} $ (17)

权值自适应律为:

$ {\dot{\widehat{W}}}_{{u}}=-{\mathit{\Gamma }}_{2}\left[{s}_{2}h\right(z)+{\vartheta }_{2}{\widehat{W}}_{{u}}]。$ (18)

参数自适应律为:

$ {\dot{\widehat{\tau }}}_{{w}{u}}^{*}={\gamma }_{2}\left[{s}_{2}\varphi \right({s}_{2})-{\sigma }_{2}({\widehat{\tau }}_{{w}{u}}^{*}-{\tau }_{{w}{u}}^{0}\left)\right]。$ (19)

式中:$ {\mathit{\Gamma }}_{1} $$ {\vartheta }_{1} $$ {\sigma }_{1}\mathrm{、}{\gamma }_{1}{\mathrm{、}\mathit{\Gamma }}_{2} $$ {\vartheta }_{2} $$ {\sigma }_{2}{\mathrm{、}\gamma }_{2} $均为大于0的设计常数;$ {\tau }_{{w}{u}}^{0} $$ {\widehat{\tau }}_{{w}{u}}^{*} $的先验估值;$ {\tau }_{{w}{r}}^{0} $$ {\widehat{\tau }}_{{w}{r}}^{*} $的先验估值。

2.2 稳定性分析

为了确保控制器设计的稳定性,需要进行稳定性分析。定义$ {\widetilde{\tau }}_{{w}{u}}^{*} $$ {\widetilde{\tau }}_{{w}{r}}^{*} $为参数估计误差,$ {\widetilde{W}}_{{u}} $$ {\widetilde{W}}_{{r}} $为权值估计误差,则有$ {\widetilde{\tau }}_{{w}{u}}^{*}={\tau }_{{w}{u}}^{*}-{\widehat{\tau }}_{{w}{u}}^{*},{\widetilde{\tau }}_{{w}{r}}^{*}={\tau }_{{w}{r}}^{*}-{\widehat{\tau }}_{{w}{r}}^{*},{\widetilde{W}}_{{u}}= {\widehat{W}}_{{u}}-{W}_{{u}}^{*},{\widetilde{W}}_{{r}}={\widehat{W}}_{{r}}-{W}_{{r}}^{*} $。构造Lyapunov函数:

$ \begin{split} V=&\frac{1}{2}\left({{m}_{33}{{s}_{1}}^{2}+m}_{11}{{s}_{2}}^{2}+{\widetilde{\tau }}_{{w}{r}}^{*2}/{\gamma }_{1}+{\widetilde{\tau }}_{{w}{u}}^{*2}/{\gamma }_{2} +\right.\\ &\left.\frac{1}{{\mathit{\Gamma }}_{1}}{\widetilde{W}}_{{r}}^{T}{\widetilde{W}}_{{r}}+\frac{1}{{\mathit{\Gamma }}_{2}}{\widetilde{W}}_{u}^{T}{\widetilde{W}}_{u}\right)。\end{split} $ (20)

将式(7)、式(12)、式(14)~式(19)代入式(20),对其求导后,整理可得:

$\begin{split} \dot{V}= &{{m}_{33}s}_{1}{\dot{s}}_{1}+{{m}_{11}s}_{2}{\dot{s}}_{2}-{\widetilde{\tau }}_{{w}{r}}^{*}{\dot{\widehat{\tau }}}_{{w}{r}}^{*2}/{\gamma }_{1}-{\dot{\widetilde{\tau }}}_{{w}{u}}^{*}{\dot{\widehat{\tau }}}_{{w}{u}}^{*}/{\gamma }_{2} +\\ &{\widetilde{W}}_{{r}}^\mathrm{T}\dot{{\widehat{W}}_{{r}}}/{\mathit{\Gamma }}_{1}+{{\widetilde{W}}_{{u}}^\mathrm{T}{\dot{\widehat{W}}}_{{u}}/{\mathit{\Gamma }}_{2}}_{} ,\\ {c}\leqslant &-{\eta }_{1}{s}_{1}^{2}-{\eta }_{2}{s}_{2}^{2}+{\tau }_{{w}{r}}^{*}\left[\left|{s}_{1}\right|-{s}_{1}\varphi \left({s}_{1}\right)\right]+{\tau }_{{w}{u}}^{*}\\ &\left[\left|{s}_{2}\right|- {s}_{2}\varphi \left({s}_{2}\right)\right]-{\zeta }_{1}{s}_{1}-{\zeta }_{2}{s}_{2}+{\sigma }_{1}\\ &\left({\tau }_{{w}{r}}^{*}-{\widehat{\tau }}_{{w}{r}}^{*}\right)\left({\widehat{\tau }}_{{w}{r}}^{*}-{\tau }_{{w}{r}}^{0}\right)+ {\sigma }_{2}\left({\tau }_{{w}{u}}^{*}-{\widehat{\tau }}_{{w}{u}}^{*}\right)\\ &\left({\widehat{\tau }}_{{w}{u}}^{*}-{\tau }_{{w}{u}}^{0}\right)- {\vartheta }_{1}{\widetilde{W}}_{r}^{\mathrm{T}}{\widehat{W}}_{r}-{\vartheta }_{2}{\widetilde{W}}_{u}^{\mathrm{T}}{\widehat{W}}_{u}。\end{split}$ (21)

可知,$ {s}_{1} $$ {s}_{2} $$ {\tau }_{{w}{u}}^{*} $$ {\tau }_{{w}{r}}^{*} $$ {\widetilde{W}}_{{u}} $$ {\widetilde{W}}_{{r}} $一致最终有界,由于数学公理可得如下不等式:

$ \left\{\begin{aligned} &-{\zeta }_{1}{s}_{1}\leqslant \frac{{\zeta }_{{r}}^{2}}{2}+\frac{{s}_{1}^{2}}{2},\\ &-{\zeta }_{2}{s}_{2}\leqslant \frac{{\zeta }_{{u}}^{2}}{2}+\frac{{s}_{2}^{2}}{2},\\ &{\dfrac{{\vartheta }_{1}}{2}\left({\widetilde{W}}_{{r}}^{\mathrm{T}}{\widetilde{W}}_{{r}}+{W}_{{r}}^{2}\right)\leqslant \vartheta }_{1}{\widetilde{W}}_{{r}}^{\mathrm{T}}{\widehat{W}}_{{r}},\\ &\dfrac{{\vartheta }_{2}^{}}{2}\left({\widetilde{W}}_{{u}}^{T}{\widetilde{W}}_{{u}}+{W}_{{u}}^{2}\right){\leqslant \vartheta }_{2}{\widetilde{W}}_{u}^{\mathrm{T}}{\widehat{W}}_{u}。\end{aligned}\right. $ (22)

应用文献[16]中的引理:

$ 0\leqslant\left|\varpi_i\right|-\tan h(\varpi_i/\varepsilon_i)\leqslant0.2785\varepsilon_i。$ (23)

式中:$ {\varepsilon }_{i}\text{、}{\varpi }_{i}\in {R},(i=\mathrm{1,2})\text{,} {\varepsilon }_{i}\text{、}{\varpi }_{i} $均大于0。为简化公式,记$ \mu =\min\left\{2{\eta }_{1}-\mathrm{1,2}{\eta }_{2}-1,{\sigma }_{1},{\sigma }_{2},{\vartheta }_{1},{\vartheta }_{2}\right\} $$ \mathit{Q}=0.2785 \left( \;{\varepsilon }_{1}{\tau }_{{w}{r}}^{*}+{\varepsilon }_{2}{\tau }_{{w}{u}}^{*}\;\right)+\dfrac{1}{2}\left(\;{\zeta }_{{r}}^{2}+{\zeta }_{{u}}^{2}\;\right)+\dfrac{{\sigma }_{1}}{2}{\left(\;{\tau }_{{w}{r}}^{*}-{\tau }_{{w}{r}}^{0}\;\right)}^{2}+\dfrac{{\sigma }_{2}}{2}\left(\;{\tau }_{{w}{u}}^{*}- \right. \left.{\tau }_{{wu}}^{0}\right)^{2} + \dfrac{{\vartheta }_{1}}{2}{W}_{{r}}^{2}+\dfrac{{\vartheta }_{2}}{2}{W}_{{u}}^{2} $,结合式(22)可得:

$ \begin{split}&\dot{V}\leqslant \frac{1-2{\eta }_{1}}{2}{s}_{1}^{2}+\frac{1-2{\eta }_{2}}{2}{s}_{2}^{2}-\frac{{\sigma }_{1}}{2}({\widehat{\tau }}_{{w}{r}}^{*}-{\tau }_{{w}{r}}^{*}{)}^{2}-\\ &\frac{{\sigma }_{2}}{2}({\widehat{\tau }}_{{w}{u}}^{*}-{\tau }_{{w}{u}}^{*}{)}^{2}+Q\leqslant \mu V+Q。\end{split}$ (24)

由上式可得:

$ 0\leqslant V\left(t\right)\leqslant\frac{\mathrm{\mathit{Q}}}{\mu}+\left[V\left(0\right)-\frac{Q}{\mu}\right]e^{-\mu t}。$ (25)

式(25)表明,$ V\left(t\right) $收敛且收敛于一球域内。又因为$ {s}_{1} $$ {s}_{2} $$ {\tau }_{{w}{r}}^{*} $$ {\tau }_{{w}{u}}^{*} $$ {\widetilde{W}}_{{r}}{、}{\widetilde{W}}_{{u}} $一致最终有界,所以纵向速度误差$ {u}_{e} $、横向速度误差$ {\nu }_{e} $有界。若$ (u-{\alpha }_{{u}}) $$ (\nu -{\alpha }_{{v}}) $趋近于0时,式(4)可写为:

$ \left[\begin{array}{c}\dot{x}_e \\ \dot{y}_e\end{array}\right]=\left[\begin{array}{c}-kx_e/\sqrt{x_e^2+y_e^2+C} \\ -ky_e/\sqrt{x_e^2+y_e^2+C}\end{array}\right]。$ (26)

构造Lyapunov函数:

$ V=\frac{1}{2}x_e^2+\frac{1}{2}y_e^2。$ (27)

对上式求导得:

$ \dot{V}=x_e\dot{x}_e+y_e\dot{y}_e=-k(x_e^2+y_e^2)/\sqrt{x_e^2+y_e^2+C}。$ (28)

显然$ \underset{t\to \mathrm{\infty }}{\mathrm{lim}}\dot{V}\leqslant 0 $,位置误差$ x_{\mathrm{\mathit{e}}} $$ y_{\mathrm{\mathit{e}}} $逐渐收敛于0。根据上述分析,即通过设计参数$ {k\mathrm{、}C\mathrm{、}\eta }_{1}\mathrm{、}{\eta }_{2}\mathrm{、}{\lambda }_{1}{\mathrm{、}\lambda }_{2}\mathrm{、} {\gamma }_{1}\mathrm{、}\gamma _{2}{\mathrm{、}\mathit{\Gamma }}_{1}{\mathrm{、}\mathit{\Gamma }}_{2}\mathrm{、}{\vartheta }_{1}{\mathrm{、}\vartheta }_{2} $的合理设计,可使所设计USV控制闭环系统各误差有界。

3 改进 PSPO-RBFNN的自适应滑模控制器设计

在上文设计中产生了较多的设计参数,此外 RBF 神经网络模型的逼近效果还受高斯基函数中心点$ c $、宽度$ b $影响[17],上述设计需要大量参数,人为设置参数不合理会导致网络补偿效果变差,无法良好跟踪期望轨迹,且控制量之间的耦合关系会影响控制器的补偿结果变差[18]。为应对上述问题,引入PO优化算法[19],用于选择RBF神经网络的参数,减少人工调试时间,提升系统响应速度和精确度。流程图如图2所示。

图 2 改进 PSPO-RBFNN算法流程图 Fig. 2 Improved PSPO-RBFNN algorithm flowchart
3.1 改进鹦鹉优化算法

PO 优化算法通过模拟驯化后鹦鹉的行为习惯需求最优解,其首先随机生成一组预定义的候选解群体。利用觅食、停留、交流和怯生行为过程,PO 的搜索策略会导航到最佳解决方案附近发现最佳解决方案的位置。在优化过程中,每个解决方案都会受 PO算法迄今为止确定最佳解决方案的影响,动态调整其位置,搜索一直持续到满足预定终止标准。该算法利用了探索和利用的优势,使其能够有效地浏览搜索空间,同时向最优解靠拢。

在PO算法的觅食行为过程中,其主要通过观察食物的位置或考虑主人的位置来估计食物的大致位置,然后飞向相应的位置。因此,位置移动遵循以下公式:

$ {X}_{i}^{t+1}=\left({X}_{i}^{t}-{X}_{b}\right)\cdot L\left(d\right)+G\left(t\right)\cdot {X}_{m}^{t}。$ (29)

式中:$ {X}_{i}^{t} $为当前位置,$ {X}_{i}^{t+1} $为更新后的位置;$ {X}_{m}^{t} $为当前种群内的平均位置;$ {X}_{b} $为从初始化到当前搜索到的最佳位置,也表示主人与食物的当前位置;$ t $表示当前迭代次数;$ L\left(d\right) $为Levy分布,用于描述鹦鹉的飞行情况,即算法的随机搜索路径。

$ L\left(d\right)=\frac{a}{100|b{|}^{\frac{2}{3}}}。$ (30)

式中:$ a $$ b $为服从正态分布的随机数;$ ({X}_{i}^{t}-{X}_{b})\cdot L \left(d\right) $为根据自己相对于主人的位置进行移动的过程;$ G\left(t\right) $为观察整个种群的位置,以进一步确定食物的方向。

PO算法的交流行为过程模仿驯化鹦鹉群体在群体中密切交流。这种交流行为包括飞向鸟群和不飞向鸟群交流。在原始PO算法中,假定这2种行为发生的概率相同,并采用当前种群的平均位置来象征鹦鹉群体的中心。更新公式:

$ X_i^{t+1}=\left\{\begin{aligned}&0.2r\left[1-Y\left(t\right)\right]\left(X_i^t-X_m\right),P\leqslant0.5, \\ & 0.2r\cdot\mathrm{exp}\left[-Y\left(t\right)\right],P > 0.5。\end{aligned}\right. $ (31)

式中:$ Y\left(t\right) $为简化表示引入的有关时间函数,上式第一项表示个体加入鹦鹉群体进行交流的过程,第二项表示个体在交流后立即飞出的过程。位置更新后生成随机数$ r\in [0,1] $,2种行为的使用在[0,1]范围内随机生成的$ P $来实现。

分析可知,如采用小步长,神经元感知范围收窄,缺乏多样性的同时,系统的调节时间增大,搜索效率低;采用步长过大,搜索精度降低,协调能力弱,易陷入局部最优解[19]。本文提出一种切换步长因子对其PO优化算法的觅食行为过程进行控制,以解决受 $ a $$ b $影响 $ L\left(d\right) $步长随机性强的问题,为改进优化算法在搜索过程更优的解留存概率增加,以控制PO算法取得效率和精度平衡较为的状态,同时在搜索的前后阶段,希望可以切换步长,进一步优化搜索过程。本文引入切换步长因子表达式如下:

$ s_i^{t+1}=\left|1-\frac{q'}{q}\right|s_i^t。$ (32)

式中:${s}_{i}^{t+1} $$ {s}_{i}^{t} $为第$ t+1 $轮和第$ t $轮的搜索步长,$ q $为现最佳解值;$ {q'} $为位置更新后对比择优位置对应的目标解值。通过计算当前搜索解的值与全局最优解之间的差距值,自适应调整算法在觅食行为阶段的搜索步长大小。前期求解函数迅速收敛时,切换步长因子会根据表达式自适应增大,将PO算法的觅食搜索过程维持在大步长状态;当求解函数进行到后期缓慢收敛时,PO算法的觅食搜索过程步长会受控减小,提高全局最优值的发现概率。

原始PO算法概率P为随机变化时,飞向鸟群和不飞向鸟群交流概率近似相同,这也意味着无论当前求解值优劣程度,都会以相同的可能性被替换为其他随机解,损失了一定的寻优效率。本文提出可控变化概率,用以控制更新淘汰概率随求解值优劣程度改变,提高寻优效率,如式:

$ P={P}_{m}-0.1\cdot({t}_{m}-t)/{t}_{m}。$ (33)

式中:$ {P}_{m} $为最大概率,$ {t}_{m} $为最大迭代次数。利用上式将原始概率P控制为随着迭代次数增大而提高的动态切换概率。在PO算法进行前期,降低求解的整体搜索切换为局部搜索的概率,增加整体搜索的次数,扩大在全局寻求最优解的区域,通过此阶段的改进能够进一步增强算法的求解多样性及搜索能力。后期随迭代次数推移,P逐渐增大,至后期个体加入鹦鹉群体进行交流的过程发生概率相对较高,在接近全局最优解时局部精细搜索次数增加,提高最优解的留存概率。通过改进使概率能够与整个PO算法迭代过程适应关联,有助于平衡全局与局部的搜索,提升PO算法的灵活性。

3.2 改进PSPO-RBFNN滑模控制算法

将改进后的鹦鹉算法(PSPO),应用于RBF 神经网络的参数最优选择中。在PSPO算法的觅食行为过程中,其位置移动优化后公式为:

$ X_i^{t+1}=\left|1-\frac{q'}{q}\right|\left(X_i^t-X_b\right)\cdot L\left(d\right)+G\left(t\right)\cdot X_m^t。$ (34)

针对复杂海洋环境的工程应用,为控制算法的平滑连续,可设置原始PO算法觅食、停留、交流和怯生4个行为过程的占比,将觅食、停留、交流和怯生4个行为过程的占比设置为1∶1∶1∶2,增大怯生行为的占比,其模仿对陌生人的天然恐惧是鸟类的共同特征,这促使鹦鹉离开不熟悉的个体。综上所述,可以得到改进的PSPO-RBFNN滑模控制算法系统框图,如图3所示。

图 3 控制算法系统框图 Fig. 3 Control algorithm system block diagram
4 仿真结果及分析

通过进行仿真实验,可以验证所设计的控制器的合理性和先进性。本节采用文献[20]中的1艘长为32 m 的USV实验艇模型进行仿真。仿真实验控制参数见表1

表 1 仿真实验控制参数表 Tab.1 Simulation experiment control parameter table

图4为模型参数在上述设定情况下输出控制点的轨迹跟踪控制曲线,较单一神经网络滑模控制和滑模控制,本文提出的控制器显著减小其控制点摆动幅度。图5 为3种控制方法对应控制点的xyuv的路径跟踪误差曲线,可以看出,在模拟海洋环境干扰,模型参数不确定情况下,经PSPO算法优化的RBF神经网络滑模控制路径跟踪误差在20 s左右时间收敛到0,而单一神经网络滑模控制需26 s左右,单一滑模控制法需50 s以上。误差收敛速度较单一神经网络滑模控制和滑模控制分别提高约25%和60%。图6为RBFNN控制算法对不确定项的估计效果,该算法存在时变干扰情况下,仍具有良好的实时补偿能力。图7 为控制律$ {\tau }_{{u}} $$ {\tau }_{{r}} $的时间响应曲线。可知,控制输出在任务期间,控制力和力矩变化经过25 s以内的时间调节,可变为较光滑的曲线,抖动控制在很小的范围内,具有实际工程应用性。图8 为外界干扰估计效果图,可以看出,所设计的经PSPO算法优化求解的自适应律对于模拟海洋环境不定干扰具有良好精确的估计效果,同时避免了采用最小参数学习法和不等式放大后以神经网络权值上界作为估计值,从而解决设计控制算法过于保守的问题。图9为欠驱动无人水面船(USV)在纵向、横向以及艏摇角速度方面的变化趋势。实际速度和舵角变化幅度均较小以内,在系统稳定后变化平稳,验证了所设计控制器可有效精确地完成欠驱动无人船轨迹跟踪控制。

图 4 轨迹跟踪效果图 Fig. 4 Track tracking rendering

图 5 跟踪误差曲线图 Fig. 5 Tracking error curve chart

图 6 神经网络逼近曲线 Fig. 6 Neural network approximation curve graph

图 7 控制律时间响应曲线 Fig. 7 Time response curve of control law

图 8 外界干扰估计效果图 Fig. 8 Effect diagram of external interference estimation

图 9 USV实际速度曲线图 Fig. 9 Actual speed curve of USV
5 结 语

本文提出一种基于改进鹦鹉算法优化的USV轨迹跟踪滑模控制策略,并采用切换步长因子及动态适应的可控变化概率设计PSPO算法,应用到 RBF 神经网络的参数选择中,以减少人工调试时间,进一步提升系统的响应速度,使USV较快跟踪上期望轨迹通过神经网络滑模控制,并且能够对系统中的不确定性项进行有效估计。经过理论推导与仿真实验,证实本文所提出的控制策略能够使欠驱动无人水面船迅速且准确地追踪预定轨迹。追踪过程中的误差被有效控制在较小范围内,同时确保了整体追踪过程的平滑性,展现出了较强的抗干扰能力以及良好的鲁棒性。

参考文献
[1]
骆丽霞, 李志娟, 吴明发. 陆海统筹视域下海洋空间规划研究综述[J]. 合作经济与科技, 2023(24): 4-7. DOI:10.13665/j.cnki.hzjjykj.2023.24.022
[2]
余文曌, 韩素敏, 徐海祥, 等. 智能船舶路径跟踪自抗扰模型预测控制[J]. 华中科技大学学报(自然科学版), 2023, 51(4): 55-61. DOI:10.13245/j.hust.239269
[3]
于瑞亭, 朱齐丹, 刘志林, 等. 欠驱动不对称船舶全局K指数镇定的解耦实现[J]. 控制与决策, 2012, 27(5): 781-786. DOI:10.13195/j.cd.2012.05.144.yurt.006
[4]
于浩淼. 非线性因素约束下欠驱动UUV轨迹跟踪控制方法研究[D]. 哈尔滨:哈尔滨工程大学, 2016.
[5]
曹兴飞, 刘树锋, 史国友, 等. 基于模型预测控制的无人艇轨迹跟踪[J]. 船舶工程, 2023, 45(S1): 354-357. DOI:10.13788/j.cnki.cbgc.2023.S1.070
[6]
陈欣然. 基于视线制导与自适应滑模控制的无人船路径跟踪研究[D]. 长春:吉林大学, 2023.
[7]
张强, 朱雅萍, 孟祥飞, 等. 欠驱动船舶自适应神经网络有限时间轨迹跟踪[J]. 中国舰船研究, 2022, 17(4): 24-31. DOI:10.19693/j.issn.1673-3185.02564
[8]
ASHRAFIUON H , MUSKE R K , MCNINCH C L , et al. Sliding-Mode tracking control of surface vessels[J]. IEEE Transactions on Industrial Electronics, 2008, 55(11): 4004−4012.
[9]
沈智鹏, 邹天宇, 王茹. 基于扩张观测器的欠驱动船舶轨迹跟踪低频学习自适应动态面输出反馈控制[J]. 控制理论与应用, 2019, 36(6): 867-876.
[10]
贾丽红. 风浪流干扰下欠驱动船舶航迹直线控制数学模型构建[J]. 舰船科学技术, 2020, 42(20): 40-42.
JIA L H. Mathematical model construction of underactuated ship trajectory linear control under wind, wave and current interference[J]. Ship Science and Technology, 2020, 42(20): 40-42.
[11]
方世鹏, 胡昌华, 扈晓翔, 等. 基于切换滑模控制的抖振抑制方法[J]. 控制与决策, 2017, 32(7): 1210-1216. DOI:10.13195/j.kzyjc.2016.0488
[12]
孙霄阳, 周平. 基于未知状态估计与神经网络补偿的增强PID控制方法[J]. 中国科学: 信息科学, 2023, 53(4): 715-736.
[13]
李荣辉, 陈志娟, 李宗宣, 等. 基于欧拉迭代模型预测的欠驱动水面船舶路径跟踪控制[J]. 广东海洋大学学报, 2020, 40(1): 104-110. DOI:10.3969/j.issn.1673-9159.2020.01.014
[14]
孙浩男, 陈世才, 张键, 等. 基于速度观测器的欠驱动船舶自适应滑模控制[J]. 舰船科学技术, 2023, 45(13): 48-52.
SUN H N, CHEN S C, ZHANG J, et al. Adaptive sliding mode control of underactuated ships based on velocity observer[J]. Ship Science and Technology, 2023, 45(13): 48-52. DOI:10.3404/j.issn.1672-7649.2023.13.010
[15]
王茹. 欠驱动船舶轨迹跟踪的自适应滑模控制研究[D]. 大连:大连海事大学, 2018.
[16]
DO K, JIANG Z, PAN J. Robust adaptive path following of underactuated ships[J]. Automatica, 2004, 40(6): 929-944. DOI:10.1016/j.automatica.2004.01.021
[17]
简安东. 基于改进鱼群算法优化RBF网络的变压器故障诊断[D]. 西安:西安理工大学, 2023.
[18]
唐志勇, 马福源, 裴忠才. 四旋翼的改进PSO-RBF神经网络自适应滑模控制[J]. 北京航空航天大学学报, 2023, 49(7): 1563-1572. DOI:10.13700/j.bh.1001-5965.2021.0477
[19]
LIAN J, HUI G, MA L, et al. Parrot optimizer: Algorithm and applications to medical problems[J]. Computers in Biology and Medicine, 2024: 108064.
[20]
李博文, 宋文广, 徐加军. 基于改进布谷鸟搜索优化RBF神经网络的抽油机故障诊断[J]. 中国工程机械学报, 2023, 21(6): 624-628. DOI:10.15999/j.cnki.311926.2023.06.002