舰船科学技术  2024, Vol. 46 Issue (10): 87-91    DOI: 10.3404/j.issn.1672-7649.2024.10.015   PDF    
基于自适应非奇异终端滑模自抗扰的ROV控制
台立钢, 徐龙, 张禹     
沈阳工业大学 机械工程学院,辽宁 沈阳 110870
摘要: ROV浮游工作时由于存在系统模型不确定性和环境干扰导致跟踪效果不佳的问题,因此,提出一种参数变化的非奇异终端滑模自抗扰控制方法;首先,建立ROV的动力学模型;其次,利用非奇异终端滑模控制器代替了传统线性自抗扰的线性控制器,提高了系统的控制性能和抗干扰能力,考虑到引入参数过多问题利用梯度下降的RBF神经网络调整趋近率系数,通过李雅普诺夫定理证明了该系统的稳定性;最后,通过轨迹跟踪仿真实验与线性自抗扰对比,提高了系统响应过程的快速性和平稳性。
关键词: 滑模自抗扰     RBF神经网络     参数调整     轨迹跟踪    
ROV control based on adaptive non-singular terminal sliding mode active disturbance rejection
TAI Li-gang, XU Long, ZHANG Yu     
School of Mechanical Engineering, Shenyang University of Technology, Shenyang 110870, China
Abstract: This paper proposes a non-singular terminal sliding mode active disturbance rejection control method with parameter variation caused by the uncertainty of the system model and environmental disturbance when the tracked underwater robot works floating. Secondly, a non-singular terminal sliding-mode controller is used to replace the traditional linear self-resisting linear controller to improve the control performance and anti-disturbance capability of the system. The convergence rate is adjusted by using a gradient-descent RBF neural network considering the problem of introducing too many parameters, and the stability of the system is proved by Lyapunov's theorem. Finally, the trajectory tracking simulation experiments are compared to linear self immunity, rapidity and smoothness of the response process of the system is improved.
Key words: sliding mode active disturbance rejection     RBF neural network     parameter adjustment     trajectory tracking    
0 引 言

我国87%以上的水库建于19世纪70年代前,受当时条件制约,目前已经存在着不同程度的安全隐患,人工检修会存在较大的危险,ROV可以代替人工完成危险系数高的工作[1]。在浮游检修作业时,轨迹跟踪则是一个重要的环节,由于ROV存在强非线性和耦合性、系统的不确定性、复杂的动力学和环境干扰,所以设计的轨迹跟踪控制系统应满足响应快速和平稳的要求[2]

目前,非奇异终端滑模控制和线性自抗扰控制方法具有强鲁棒性被广泛应用于轨迹跟踪问题,Ali等 [3]针对各种水动力不确定性和外部环境干扰,提出一种有限时间扩张观测器与非奇异终端滑模控制相结合,减小了处于滑模面的抖振,提高了系统的响应性。Qiao等[4]针对水下机器人的轨迹跟踪问题,提出一种自适应非奇异终端滑模方法,提高收敛速度,保证了瞬态收敛接近平衡点范围。针对滑模控制对系统模型的建立有一定的要求,所以有人将线性自抗扰和滑模控制相结合,经慧祥等[5]将线性自抗扰与传统滑模相结合,利用滑模控制器代替线性控制器,提高了水下机器人的抗干扰能力。秦朝宇等[6]将线性自抗扰与快速终端滑模相结合,利用快速终端滑模器代替线性控制器,提高了水下机器人的跟踪收敛速度并且减小了滑模面抖振。王尧尧等[7]利用非奇异终端滑模结合干扰估计,提高了控制器的鲁棒性和控制性能。FAN等[8]利用RBF神经网络调整自抗扰控制器的系数,对比传统自抗扰控制提高了抗干扰能力。

针对ROV轨迹跟踪困难的问题,本文提出一种基于参数调整的非奇异终端滑模自抗扰控制方法,利用线性自抗扰控制与非奇异终端滑模控制相结合,提高了控制系统的性能和抗干扰能力,考虑引入参数过多的问题,使用梯度下降的RBF神经网络算法调整趋近率系数,降低了调参难度,提高了ROV的轨迹跟踪能力,结果表明本文方法提高了系统的响应过程的快速性和平稳性。

1 ROV模型构建

图1所示,建立了ROV的坐标系,机器人坐标系为O-uvw,固定坐标系为E-xyz,机器人坐标系的原点设为机器人的重心,固定坐标系的原点设为机器人运动的起始点。

图 1 ROV坐标系 Fig. 1 Coordinate system for crawler underwater vehicle

根据文献[9]动力学模型可写为如下形式:

$ \boldsymbol{M} \ddot{\eta}+\boldsymbol{C}_{A}(\boldsymbol{\eta}, \boldsymbol{\dot{\eta}}) \boldsymbol{\dot{\eta}}=\boldsymbol{\tau}_{u}+\boldsymbol{\tau}_{f}(\boldsymbol{\eta}, \boldsymbol{\dot{\eta}}, \boldsymbol{\ddot{\eta}})+\boldsymbol{\tau}_{G}(\boldsymbol{\eta})+\boldsymbol{D}(\boldsymbol{t})。$ (1)

式中:η为位置和姿态对角矩阵;M为质量惯性矩阵;CA为科氏向心矩阵;τu为输入力和力矩对角矩阵;τf为水动力矩阵;τG为静力矩阵;D(t)为干扰力矩阵。

在式(1)建立机器人动力学的基础上,同时考虑存在建模误差的基础上,可以将式(1)改为:

$ \boldsymbol{M} \ddot{\eta}+\boldsymbol{C}_{A}(\boldsymbol{\eta}, \boldsymbol{\dot{\eta}}) \boldsymbol{\dot{\eta}}=\boldsymbol{\tau}_{{u}}+\boldsymbol{F}。$ (2)

式中:F为ROV的水动力扰动、建模误差、模型参数误差和不可预测扰动的总和,所以为:

$ {\boldsymbol{F}}=\boldsymbol{\tau}_{f}(\boldsymbol{\eta}, \boldsymbol{\dot{\eta}}, \boldsymbol{\bar{\eta}})+\boldsymbol{\tau}_{G}(\boldsymbol{\eta})+\boldsymbol{D}-\Delta \boldsymbol{M} \boldsymbol{\bar{\eta}}-\Delta \boldsymbol{C}_{A}(\boldsymbol{\eta}, \boldsymbol{\dot{\eta}}) \boldsymbol{\dot{\eta}}。$ (3)
2 ROV控制器设计

为了保障ROV的浮游轨迹跟踪运动,针对ROV在作业时候会受到环境干扰会造成机器人在运动时产生较大的波动,并且机器人的模型不确定性也会给运动控制带来影响,本文提出非奇异终端滑模自抗扰控制方法,本节利用跟踪微分器获取期望轨迹的微分信号和二阶微分信号并且线性扩张观测器处理环境干扰和系统建模的未知量,引入非奇异终端滑模控制器来处理系统的误差,针对引入参数过多的问题利用梯度下降RBF神经网络逼近趋近率参数,所提出的控制器总体结构如图2所示。

图 2 控制器总体结构图 Fig. 2 Controller overall structure diagram
2.1 跟踪微分器设计

为了模拟现实情况,本文的期望轨迹采用离散形式,采用二阶跟踪微分器可以对期望轨迹进行跟踪并且提取微分信号,面对离散信号时具有一定滤波能力,能提高系统的鲁棒性,本文将再次利用跟踪微分器提取二阶微分信号为后续滑模控制器的建立提供[10]

$ \left\{\begin{aligned} & fh=\mathrm{fhan}\left(x_1(k)-v(k),r,h\right),\\ & x_1(k+1)=x_1(k)+hx_2(k),\\ & x_2(k+1)=x_2(k)+hfh。\end{aligned}\right. $ (4)

式中:x1(k)为跟踪期望轨迹信号;x2(k)为期望轨迹信号的近似微分信号;γ为跟踪速度因子与系统性能有关;γ越大跟踪微分器性能越好;h为系统的采样周期;fhan()函数如下所示。

$ \left\{\begin{aligned} & d=r h^{2}, a_{0}=h x_{2} ,\\ & y_{a}=x_{1}+a_{0},\\ & a_{1}=\sqrt{d\left(d+8\left|y_{a}\right|\right)} ,\\ & a_{2}=a_{0}+\operatorname{sign}\left(y_{a}\right)\left(a_{1}-d\right) / 2 ,\\ & s_{y}=\left(\operatorname{sign}\left(y_{a}+d\right)-\operatorname{sign}\left(y_{a}-d\right)\right) / 2,\\ & a=\left(a_{0}+y_{a}-a_{2}\right) s_{y}+a_{2},\\ & s_{a}=(\operatorname{sign}(a+d)-\operatorname{sign}(a-d)) / 2 ,\\ & \text { fhan }=-r(a / d-\operatorname{sign}(a)) s_{a}-r \operatorname{sign}(a)。\end{aligned}\right. $ (5)
2.2 线性扩张观测器设计

为了建立线性扩张观测器,可以根据式(3)将系统改写为:

$ \left\{\begin{aligned} & \bar{\eta}=b_{0} \tau_{u}+\sigma ,\\ & \sigma=M^{-1} f-M^{-1} C_{A}(\eta, \bar{\eta}) \dot{\eta}。\end{aligned}\right. $ (6)

式中:b0=M−1,σ为系统的广义扰动,由式(7)和科氏力组成,假设σ其有界;定义x3为σ,x3的导数为δ,则用状态空间可以表达为:

$ \left\{\begin{aligned} & \eta=x_{1},\\ & \dot{x}_{1}=x_{2},\\ & \dot{x}_{2}=x_{3}+b_{0} u,\\ & \dot{x}_{3}=\delta。\end{aligned}\right. $ (7)

所以通过式(7)可以建立如下的线性扩张观测器:

$ \left\{\begin{aligned} & e_{1}=z_{1}-y_{1},\\ & \dot{z}_{1}=z_{2}-l_{1} e_{1},\\ & \dot{z}_{2}=z_{3}-l_{2} e_{1}+b u_{1},\\ & \dot{z}_{3}=-l_{3} e_{1}。\end{aligned}\right. $ (8)

式中:$ l_{1}、l_{2}、l_{3} $均为观测器的增益,假设观测器的增益系数如下:

$ \left[\begin{array}{lll} l_{1} & l_{2} & l_{3} \end{array}\right]=\left[\begin{array}{lll} \lambda_{1} & \lambda_{2} & \lambda_{3} \end{array}\right]。$ (9)

根据文献[11]可知,$ s^{3}+\lambda_{1} s^{2}+\lambda_{2} s+\lambda_{3} $满足Hurwitz条件,λ通过调整特征根的位置可以获得,配置为:

$ s^{3}+\lambda_{1} s^{2}+\lambda_{2} s+\lambda_{3}=\left(s+\omega_{0}\right)^{3}。$ (10)

式中:ω0为线性扩张观测器的带宽,则可以得到$\lambda_{1}=3\omega_{0} $$ \lambda_2=3\omega_0^2 $$\lambda_{3}=3\omega_0^3 $

2.3 非奇异终端滑模控制器设计

定义机器人的跟踪微分器输出的跟踪轨迹信号为yd,线性扩张观测器输出的轨迹跟踪信号为z1,且假设其有界,所以可以通过式(7)和式(8)可以定义滑模面函数为:

$ s={\boldsymbol{\beta}}^{-1}\dot{e}^{{\boldsymbol{q}}/{\boldsymbol{p}}}+e。$ (11)

式中:ez1yd的差;β为对角正定矩阵;qp为对角正定奇数矩阵,且满足一下条件:

$ 1<\frac{\boldsymbol{q}}{\boldsymbol{p}}<2 。$ (12)

为了减小收敛时间,采用如式(13)的趋近率,同时为了减小处于滑模面的抖振,采用饱和函数代替传统趋近方式中的符号项:

$ \dot{s}={\boldsymbol{\beta}}^{-1}\frac{\boldsymbol{q}}{\boldsymbol{p}}\dot{e}_1^{\left(\frac{{\boldsymbol{q}}}{{\boldsymbol{p}}}-1\right)}\left(-\boldsymbol{\beta}_1s-\boldsymbol{\beta}_2{\mathrm{sat}}(s)\right),$ (13)
$ \operatorname{sat}(s)=\left\{\begin{array}{cc} s I\|s\|,\|s\|>\chi ,\\ s I \chi,\|s\| \leqslant \chi。\end{array}\right. $ (14)

式中:β1β2均为对角正定矩阵;χ为边界层厚度。

对滑模函数求导,且通过式(8)可以得到:

$ \dot{s}={\boldsymbol{\beta}}^{-1}\frac{\boldsymbol{q}}{\boldsymbol{p}}\dot{e}_1^{(q/p-1)}\left(\sigma+b_0u-\ddot{y}_d\right)+\dot{e}_1。$ (15)

通过式(11)、式(14)、式(16)建立滑模控制器对系统的输入,u1u2为式(13)与式(15)联立得出:

$ u=\frac{1}{b}\left(u_{1}+u_{2}-z_{3}\right),$ (16)
$ u_1=\frac{b}{b_0}\left(-{\boldsymbol{\beta}}\frac{{\boldsymbol{p}}}{{\boldsymbol{q}}} \dot e^{(2-{\boldsymbol{q}}/{\boldsymbol{p}})}+\ddot{y}_d\right),$ (17)
$ u_2=\frac{b}{b_0}\left(-{\boldsymbol{\beta}}_1s-{\boldsymbol{\beta}}_2\mathrm{sat}(s)\right)。$ (18)

将式(16)~式(18)代入式(15)中,所以有:

$ \overline{s}={\boldsymbol{\beta}}^{-1}\frac{\boldsymbol{q}}{\boldsymbol{p}}\dot{e}^{\left(\frac{{\boldsymbol{q}}}{{\boldsymbol{p}}}-1\right)}\left(x_3-\boldsymbol{\beta}_1s-\boldsymbol{\beta}_2\mathrm{sat}(s)-\frac{b_0}{b}z_3\right)。$ (19)

设计李雅普诺夫函数为:

$ v=\frac{1}{2} s^{2} 。$ (20)

将式(20)求导并且将式(19)代入,所以有:

$ \dot{v}=s\left({\boldsymbol{\beta}}^{-1} \frac{\boldsymbol{q}}{\boldsymbol{p}} \dot{e}^{\left(\frac{{\boldsymbol{q}}}{{\boldsymbol{p}}}-1\right)}\left(x_{3}-\boldsymbol{\beta}_{1} s-\boldsymbol{\beta}_{2} {\mathrm{sat}}(s)-\frac{b_{0}}{b} z_{3}\right)\right)。$ (21)

$ \boldsymbol{\beta}_{2}={{\boldsymbol{\vartheta}}\overline{\left(x_{3}-\dfrac{b_{0}}{b} z_{3}\right)}}+\rho $,代入式(21)所以有:

$\dot {v} \leqslant \beta^{-1} \frac{{\boldsymbol{q}}}{{\boldsymbol{p}}} \dot{e}^{\left(\frac{{\boldsymbol{q}}}{{\boldsymbol{p}}} - 1\right)}\left(x_{3} s - \boldsymbol{\beta}_{1} s^{2} - \left(\vartheta \overline{\left( x _ { 3 } - \frac {b_0}{b}z_3 \right)} + \rho\right) \|s \| - \frac{b_{0}}{b} z_{3}s\right) ,$ (22)
$ \bar{v}<-\boldsymbol{\beta}_{1} s^{2}-\rho\|s\|<0。$ (23)

式中:$ \vartheta>1 $时,李雅普诺夫函数的导数小于0,所以可以证明控制系统渐进稳定。

2.4 基于RBF神经网络的控制参数自整定

在传统的线性自抗扰控制基础上,引入非奇异终端滑模控制器,提高性能的同时也带来需要调整参数过多的问题,参数qpβ易于调整,所以利用梯度下降法的RBF神经网络对式(16)的β1β2进行调节,设机器人的期望轨迹为ym,实际输出为y,则可以定义跟踪误差为:

$ e_{c}=y_{m}-y。$ (24)

如式(28)以跟踪误差为输入利用RBF神经网络可以对β1β2进行调节:

$ {\boldsymbol{\beta}}_{i}=w_{1} h_{1}+\cdots+w_{j} h_{j}+\cdots+w_{m} h_{m} 。$ (25)

式中:i=1,2,m为隐含层节点数量;wj为节点的权重;hj为高斯基函数,表示为:

$ h_{j}=\exp \left(-\frac{\left\|e_{c}-c_{j}\right\|^{2}}{2 b_{j}^{2}}\right)。$ (26)

式中:cj为中心矢量;bj为一个正数表示高斯基函数的宽度。

定义RBF神经网络的学习调整参数指标为$ E=\dfrac{1}{2} e^{2} $,根据式(13)由梯度下降法调整网络的学习算法为:

$ \left\{\begin{aligned} & \Delta w_{j}=-\eta \frac{\partial E}{\partial w_{j}}=-\eta e_{c} \frac{\partial y}{\partial u} \frac{S_{s}}{b_{0}} h_{j},\\ & w_{j}(k)=w_{j}(k-1)+\eta \Delta w_{j}+\alpha\left(w_{j}(k-1)-w_{j}(k-2)\right) ,\\ & \Delta b_{j}=-\eta \frac{\partial E}{\partial b_{j}}=-\eta e_{c} \frac{\partial y}{\partial u} \frac{S_{s}}{b_{0}} w_{j} h_{j} \frac{\left|\left|e_{c}-c_{j}\right|\right|^{2}}{b_{j}^{3}},\\ & b_{j}(k)=b_{j}(k-1)+\eta \Delta b_{j}+\alpha\left(b_{j}(k-1)-b_{j}(k-2)\right),\\ & \Delta b_{j}=-\eta \frac{\partial E}{\partial b_{j}}=-\eta e_{c} \frac{\partial y}{\partial u} \frac{S_{s}}{b_{0}} w_{j} h_{j} \frac{e_{c}-c_{j}}{b_{j}^{2}},\\ & c_{j}(k)=c_{j}(k-1)+\eta \Delta c_{j}+\alpha\left(c_{j}(k-1)-c_{j}(k-2)\right)。\end{aligned}\right. $ (27)

式中:η为学习速率;α为动量因子,其中Ss当调整参数为β1时为s,当为β2时为sat(s);$\dfrac{\partial y}{\partial u} $为雅可比阵表达了输出对输入的灵敏度;kk-1、k-2为了更清楚地说明迭代方式。

3 仿真验证

为了验证本文所提出的基于梯度下降法RBF参数调整的非奇异终端滑模自抗扰控制方法的有效性,以ROV为对象研究,以一阶高斯-马尔可夫模拟小浪环境干扰且存在模型不缺定的条件下的轨迹跟踪效果,ROV运动工作观测时基本为xyz方向移动和首向运动,下面将对这4个方向的轨迹跟踪进行仿真且与线性自抗扰进行对比。

仿真实验中非奇异终端滑模控制器的参数为q=[21,19,13,15],p=[17,17,11,13],β=[0.6,0.6,0.5,0.5], β1β2的初始值为0,隐含层节点数5,学习率η为0.35,动量因子α为0.05,b的初始值为0.5,初始值c=[0,1,2,3,4],线性扩张观测器ω=[210,250,200,15], b=[3,2,3,3],跟踪微分控制器r取30,采样周期0.01,ROV初始位置为原点初始首向角为0,为了验证ROV对位置和首向的跟踪能力,将0~100 s期望轨迹设定为:

$ \left\{ {\begin{aligned} & {x = \frac{1}{4}t + 3},\\ & {y = \frac{1}{4}t - 3},\\ & {z = 10\sin (0.1t) + \frac{1}{4}t + 3},\\ & {\psi = 10\sin (0.1t) + 1.57}。\end{aligned}} \right. $ (28)

图3为轨迹跟踪对比图,图4为各自由度上轨迹跟踪误差对比图。通过对比线性自抗扰控制器可以发现,本文方法在空间轨迹跟踪上可以实现平稳过渡,在xyz和首向上本文方法未产生超调量;在调整时间上,x方向上减少了35.71%,y方向上减少了54.76%,z方向上减少了57.14%,首向减少了41.20%;稳态平均误差xyz分别减少了6.23%、5.21%、77.74%。

图 3 轨迹跟踪图 Fig. 3 Trajectory tracking chart

图 4 各自由度上轨迹跟踪误差图 Fig. 4 Plot of trajectory tracking error in each degree of freedom

通过图5可知,在xyz和首向跟踪时,由于初始阶段存在起始点与理想起始点不同,不断调整参数保证平稳接近起始点,达到稳态之后由于有干扰存在也会存在小范围的波动。

图 5 各自由度上的参数调整图 Fig. 5 Parameter tuning diagram on each degree of freedom
4 结 语

针对ROV浮游作业时难以控制的问题,本文建立了ROV的动力学模型,将非奇异终端滑模控制器代替线性自抗扰控制的pd控制器,利用线性扩张观测器观测环境扰动和模型的不确定性同时利用跟踪微分器获取理想轨迹的速度信号和二阶微分信号,考虑到引入参数过多的问题利用梯度下降的RBF神经网络调整趋近率系数。仿真结果表明,本文所提出方法可以实现ROV的轨迹跟踪,与比线性自抗扰方法对比说明该方法的在轨迹跟踪效果上有较好的平稳性和响应能力。

参考文献
[1]
王智永, 杨茹云. 中小型水库现状分析及除险加固措施研究[J]. 科技创新导报, 2019, 16(13): 50-51.
[2]
YU C, XIANG X, LAPIERRE L, et al. Robust magnetic tracking of subsea cable by AUV in the presence of sensor noise and ocean currents[J]. IEEE Journal of Oceanic Engineering, 2017, 43(2): 311-322.
[3]
ALI N, TAWIAH I, ZHANG W. Finite-time extended state observer based nonsingular fast terminal sliding mode control of autonomous underwater vehicles[J]. Ocean Engineering, 2020, 218: 108179. DOI:10.1016/j.oceaneng.2020.108179
[4]
QIAO L, ZHANG W. Trajectory tracking control of AUVs via adaptive fast nonsingular integral terminal sliding mode control[J]. IEEE Transactions on Industrial Informatics, 2019, 16(2): 1248-1258.
[5]
经慧祥, 侯冬冬, 王凯, 等. 水下作业机器人滑模自抗扰控制方法研究[J]. 舰船科学技术, 2023, 45(1): 101-107.
[6]
秦朝宇, 李伟, 宁君, 等. 基于快速终端滑模自抗扰的船舶曲线航迹跟踪控制[J]. 舰船科学技术, 2016, 38(15): 57-61.
[7]
王尧尧, 顾临怡, 陈柏, 等. 水下机器人-机械手系统非奇异终端滑模控制[J]. 浙江大学学报(工学版), 2018, 52(5): 934-942.
[8]
FAN P F, BU R X, LIU X H, et al. Prediction of leeway and drift angle based on back propagation neural network[C]//2019 6th International Conference on Information Science and Control Engineering, 2019.
[9]
孙艺展. 履带式水下机器人运动控制系统设计与实现[D]. 沈阳:沈阳工业大学, 2022.
[10]
韩京清. 自抗扰控制技术[J]. 前沿科学, 2007(1): 24−31.
[11]
GAO Z Q. Scaling and bandwidth-parameterization based control tuning[C]// Proceedings of the 2003 American Controller Conference. Denver, USA. IEEE, 2003(6): 4989−4996.