机器人 2022, Vol. 44 Issue (1): 19-34, 44  
0
引用本文
李陇南, 黄攀峰, 马志强. 基于时变输出约束的机器人遥操作有限时间控制方法[J]. 机器人, 2022, 44(1): 19-34, 44.  
LI Longnan, HUANG Panfeng, MA Zhiqiang. Finite-time Control Method for Robot Teleoperation Based on Time-varying Output Constraints[J]. ROBOT, 2022, 44(1): 19-34, 44.  

基于时变输出约束的机器人遥操作有限时间控制方法
李陇南1,2 , 黄攀峰1,2 , 马志强1,2     
1. 西北工业大学航天飞行动力学技术重点实验室, 陕西 西安 710072;
2. 西北工业大学智能机器人研究中心, 陕西 西安 710072
摘要:受操作时间窗口和工作空间的限制,空间遥操作任务需要在有限时间内完成,同时确保末端执行器满足物理约束。此外,时延和外部扰动使不确定遥操作系统的稳定性和控制性能受到严重影响。为此,本文提出了一种基于时变输出约束的机器人遥操作有限时间控制方法。首先,利用积分障碍李雅普诺夫函数处理操作空间的时变约束问题,实用有限时间李雅普诺夫稳定定理保证了系统的快速稳定性。然后,利用神经网络估计环境力以及消解模型不确定性带来的影响,利用鲁棒项补偿神经网络的估计偏差和消解未知外部扰动的影响。最后,在Matlab/Simulink环境下同其他算法进行仿真对比,并在地面实验平台上验证了该算法,理论仿真和实验结果表明该方法进一步提高了误差收敛速率和收敛精度,且系统的输出不会超出预先设定的时变边界。
关键词空间遥操作    积分障碍李雅普诺夫函数    有限时间    时变输出约束    神经网络    
中图分类号:V448.2            文献标志码:A            文章编号:1002-0446(2022)-01-0019-16
Finite-time Control Method for Robot Teleoperation Based on Time-varying Output Constraints
LI Longnan1,2 , HUANG Panfeng1,2 , MA Zhiqiang1,2     
1. National Key Laboratory of Aerospace Flight Dynamics, Northwestern Polytechnical University, Xi'an 710072, China;
2. Research Center of Intelligent Robotics, Northwestern Polytechnical University, Xi'an 710072, China
Abstract: Limited by the operation time window and working space, the space teleoperation tasks need to be completed in a finite time while ensuring that the end effector meets the physical constraints. In addition, time delay and external disturbance seriously affect the stability and control performance of uncertain teleoperation system. Therefore, a finitetime control method for robot teleoperation based on time-varying output constraints is proposed. Firstly, the integral barrier Lyapunov function is used to deal with the time-varying constraints of the operation space, and the rapid stability of the system is guaranteed by the practical finite-time Lyapunov stability theorem. Then, the neural network is utilized to estimate the environment force and resolve the impact of model uncertainty, and the robust term is used to compensate for the estimation bias of the neural network and eliminate the influence of unknown external disturbances. Finally, the proposed algorithm is compared with other algorithms in Matlab/Simulink simulation environments and verified on the ground experiment platform. The results of theoretical simulation and experiment show that the proposed method can further improve the error convergence rate and convergence accuracy, and the output of the system never violates the prescribed time-varying boundary.
Keywords: space teleoperation    integral barrier Lyapunov function (IBLF)    finite-time    time-varying output constraint    neural network    

1 引言(Introduction)

遥操作技术充分利用了人的智能和机器人的操作能力,很大程度上延伸了人类在遥远、非结构化及危险环境中的感知和操作能力,是深空探测任务中不可或缺的关键技术[1-5]。典型的空间遥操作系统(space teleoperation system,STS)主要由地面运控中心、地面基站、传输链路、空间基站和操作目标等5部分组成[6],如图 1所示。主端操作者通过传输链路将指令发送给从端机器人,随后从端执行任务并将交互信息传递给主端,但主从端间的信号传输和处理环节都不可避免地会给系统带来时延。

图 1 空间遥操作系统框架 Fig.1 The architecture of space teleoperation system

稳定性、透明性及任务执行效能是评价遥操作系统的3大指标[7]。稳定性是确保遥操作系统顺利执行任务的前提,是指当系统遭受时延、不确定性及外部干扰的影响时,依然能够平稳地执行任务。为了降低时延对系统的负面影响,研究者提出了形式多样的控制策略,并取得了丰硕的成果,诸如无源控制[8]、H$ _{\infty} $鲁棒控制[9]、波变量控制[10]、滑模控制[11-13]及PD(比例-微分)控制[14]等策略。然而,非结构化环境、机器人模型的强非线性和未知外部干扰同样会给系统的稳定性造成威胁,影响任务的执行效能。自适应技术是处理不确定性问题的一种典型方法,将其与神经网络或者模糊逻辑相结合,可以有效地补偿机器人系统中的不确定性和未知干扰带来的影响[15-16]

受操作窗口时间限制,遥操作机器人需要在有限时间内完成操作任务。而以上提及的控制策略均未考虑系统能否在有限时间内完成在轨操作任务,因此,适应性存在一定不足。有限时间控制策略具有收敛时间短、鲁棒性强及追踪性能好等优点,在遥操作系统中的应用已有先例。为了获取好的位置追踪效果和更短的收敛时间,Yang等[17]将自适应控制和有限时间理论结合取得了较好的暂态和稳态效果;利用积分滑模,Wang等[18]将反步法与鲁棒控制相结合实现了空间遥操作机器人位置和速度误差的有限时间收敛;Zhang等[19]将神经网络和有限时间理论结合,研究了变时延遥操作系统的输入饱和问题;Zhai等[20]针对非线性变时延遥操作系统,提出一种切换控制策略来实现主从位置的有限时间收敛。为了消解时延给系统带来的影响,Shen等[21]利用多智能体中混合类型的反馈信号,设计了一种自适应非奇异终端滑模控制方法,提升了收敛速度,并取得了较好的追踪效果和力感知能力。然而,混合类型反馈信号的引入给系统的稳定性带来了巨大挑战。

此外,空间机器人在执行任务时不可避免地会遇到各种限制条件,此时任务的执行效能和系统的稳定性将会受到影响。如空间机械臂在执行巡视任务时,在通过狭小的空间时不能与周围的物体发生碰撞,因此为了保证操作的安全性,有必要对机器人的关节角和末端位置加以限制。近些年,针对输出约束问题,研究者做了大量工作,提出了诸如预设性能控制[22]、漏斗法控制[23]和障碍李雅普诺夫函数(barrier Lyapunov function,BLF)[24-25]等策略。总体上,以上控制策略大致分为间接法和直接法两类。间接法是将输出约束问题转化为误差约束问题。在遥操作系统中,Yang等[13]利用BLF限制位置误差,进而达到对位置限制的目的。为了解决约束条件下在人机交互中对操作者运动意图的理解问题,Yu等[26]利用传统的BLF约束位置和速度,实现人机交互的安全性。基于BLF策略,Tee等[24-25]设计自适应控制器分别处理了常值输出约束和时变输出约束问题。然而以上研究均存在被控变量的不直观性和输出约束转换为误差约束的保守性问题。为此,Tee等[27]提出了积分障碍李雅普诺夫函数(integral barrier Lyapunov function,IBLF),并结合反步法直接对输出进行约束,使输出限制在预定的区域内;基于IBLF方法,Tang等[28]针对单输入单输出全状态反馈系统,提出了一种自适应神经网络控制方法确保系统状态不会超出边界;随后,Liu等[29]将上述自适应控制策略扩展到多输入多输出非线性系统,解决了系统的全状态约束问题;He等[30]将IBLF方法成功应用到人机交互场景中,提出了一种基于导纳的人机交互控制策略,将机器人的工作空间约束在限定区域内,实现了人与机器人的安全交互。以上基于IBLF方法的控制策略虽然解决了传统BLF控制方法中存在的保守性限制问题,但是状态限制边界为常值约束。因此,研究非线性系统的时变输出约束问题迫在眉睫。Liu等[31]针对该问题首次提出了基于时变IBLF方法的自适应控制方法,成功解决了未知非线性系统的全状态约束问题;但是,上述方法为渐近收敛,无法满足操作窗口时间约束条件。尽管Wei等[32]提出了一种基于IBLF的有限时间控制方法,成功解决了无人飞船位置和速度约束问题,但是该方法针对的是常值约束问题。

因此,本文以受时延、模型不确定性及未知干扰影响的遥操作系统为研究对象,针对操作窗口时间和操作空间受限问题,提出了一种基于IBLF方法的时变输出约束的自适应有限时间控制方法。本文工作的亮点如下:为确保机器人操作的安全性,此方法直接对输出进行限制,同文[26] 相比,克服了间接法存在的不直观现象和保守型限制问题;同时,此方法实现了主从机器人位置的有限时间同步追踪,同文[31] 相比,该方法具有更快的收敛速度;同文[32] 相比,该方法解决了时变输出约束问题,时变边界约束更具有实际意义。最后,为了验证该策略的有效性和可行性,进行了大量的理论仿真和实验。

2 问题描述和基础理论(Problem description and basic theory) 2.1 遥操作系统的动力学

遥操作系统由一对3自由度主从机械臂组成,机械臂在关节空间的动力学有如下形式:

$ \begin{align} &{{{\mathit{\boldsymbol{M}}}}}_{j} ({{{\mathit{\boldsymbol{q}}}}}_{j}) {{\ddot{{{\mathit{\boldsymbol{q}}}}}}}_{j} +{{{\mathit{\boldsymbol{C}}}}}_{j} ({{{\mathit{\boldsymbol{q}}}}}_{j}, {{\dot{{{\mathit{\boldsymbol{q}}}}}}}_{j}) {{ \dot{\mathit{\boldsymbol{q}}}}}_{j} +{{{\mathit{\boldsymbol{g}}}}}_{j} ({{{\mathit{\boldsymbol{q}}}}}_{j}) +{{{\mathit{\boldsymbol{f}}}}}_{j}^{{\rm f}} ({{\dot{{{\mathit{\boldsymbol{q}}}}}}}_{j})+ \\ &\; \; \; \; \; {{\delta}} _{j} ({{{\mathit{\boldsymbol{q}}}}}_{j}, {{\dot{{{\mathit{\boldsymbol{q}}}}}}}_{j}, t)={{{\mathit{\boldsymbol{u}}}}}_{j} +{{{\mathit{\boldsymbol{J}}}}}_{j}^{\rm T} ({{{\mathit{\boldsymbol{q}}}}}_{j}) {{{\mathit{\boldsymbol{F}}}}}_{j{ν}} \end{align} $ (1)

式中:$ j\in \{{\rm m, s}\} $,代表主、从机器人标识。$ {{ \ddot{\mathit{\boldsymbol{q}}}}}_{j} \in {\rm R}^{3\times 1} $$ {{\dot{{{\mathit{\boldsymbol{q}}}}}}}_{j} \in {\rm R}^{3\times 1} $$ {{{\mathit{\boldsymbol{q}}}}}_{j} \in {\rm R}^{3\times 1} $分别表示机器人关节空间的加速度、速度和位置。$ {{{\mathit{\boldsymbol{M}}}}}_{j} $为惯性量矩阵,$ {{{\mathit{\boldsymbol{C}}}}}_{j} $为离心力和哥氏力矩阵,$ {{{\mathit{\boldsymbol{g}}}}}_{j} $为重力项矩阵,$ {{\mathit{\boldsymbol{f}}}}_{j}^{\rm f} $为关节摩擦力矩,见文[33],$ {{\delta}} _{j} $为未知有界外部干扰项,$ {{{\mathit{\boldsymbol{u}}}}}_{j} $表示控制输入,$ {{{\mathit{\boldsymbol{F}}}}}_{{\rm mν}} ={{{\mathit{\boldsymbol{F}}}}}_{{\rm h}} $表示主端操作者施加力,$ {{{\mathit{\boldsymbol{F}}}}}_{{\rm sν}} ={{{\mathit{\boldsymbol{F}}}}}_{{\rm e}} $表示从端机器人和环境之间的接触力。从端的环境力建模如下[34]

$ \begin{equation} {{{\mathit{\boldsymbol{F}}}}}_{{\rm e}} ={{{\mathit{\boldsymbol{B}}}}}_{{\rm e}} {{\dot{{{\mathit{\boldsymbol{x}}}}}}}_{{\rm s}} +{{{\mathit{\boldsymbol{K}}}}}_{{\rm e}} {{{\mathit{\boldsymbol{x}}}}}_{{\rm s}} +{{{\mathit{\boldsymbol{C}}}}}_{{\rm e}} \end{equation} $ (2)

式中:$ {{{\mathit{\boldsymbol{B}}}}}_{{\rm e}} $$ {{{\mathit{\boldsymbol{K}}}}}_{{\rm e}} $$ {{{\mathit{\boldsymbol{C}}}}}_{{\rm e}} $分别表示环境的阻尼系数矩阵、刚度系数矩阵和常向量。定义线性回归向量和参数向量为$ { {\varphi}} (t)=[{{\dot{{{\mathit{\boldsymbol{x}}}}}}}_{{\rm s}} (t), {{{\mathit{\boldsymbol{x}}}}}(t), 1]^{\rm T} $$ {{\theta}} (t)=[{{{\mathit{\boldsymbol{B}}}}}_{{\rm e}}, { {{\mathit{\boldsymbol{K}}}}}_{{\rm e}}, {{{\mathit{\boldsymbol{C}}}}}_{{\rm e}}]^{{\rm T}} $,则式(2) 可改写为

$ \begin{equation} {{{\mathit{\boldsymbol{F}}}}}_{{\rm e}} ={{\varphi}} ^{\rm T}(t){{\theta }}(t) \end{equation} $ (3)

机器人在笛卡儿空间和关节空间的转换关系为

$ \begin{equation} \begin{cases} {{{\mathit{\boldsymbol{x}}}}}_{j} ={{{\mathit{\boldsymbol{h}}}}}_{j} ({{{\mathit{\boldsymbol{q}}}}}_{j}) \\ {{\dot{{{\mathit{\boldsymbol{x}}}}}}}_{j} ={{{\mathit{\boldsymbol{J}}}}}_{j} ({{{\mathit{\boldsymbol{q}}}}}_{j}) {{ \dot{\mathit{\boldsymbol{q}}}}}_{j} \\ {{\ddot{{{\mathit{\boldsymbol{x}}}}}}}_{j} ={{\dot{{{\mathit{\boldsymbol{J}}}}}}}_{j} ({\mathit{\boldsymbol{q}}}_{j}) {{ \dot{\mathit{\boldsymbol{q}}}}}_{j} +{{{\mathit{\boldsymbol{J}}}}}_{j} ({{{\mathit{\boldsymbol{q}}}}}_{j}) {{\ddot{\mathit{\boldsymbol{q}}}}}_{j} \\ \end{cases} \end{equation} $ (4)

式中:$ {{{\mathit{\boldsymbol{h}}}}}_{j} ({{{\mathit{\boldsymbol{q}}}}}_{j} ) $表示关节空间和笛卡儿空间的映射关系,其中,$ {{{\mathit{\boldsymbol{x}}}}}_{j} $$ {{{\mathit{\boldsymbol{q}}}}}_{j} $维数相同,机械臂为非冗余机械臂。雅可比矩阵可通过$ {{{\mathit{\boldsymbol{J}}}}}_{j} ={\partial {{{\mathit{\boldsymbol{x}}}}}_{j}}/{\partial {{{\mathit{\boldsymbol{q}}}}}_{j}} $得到,$ { {{\mathit{\boldsymbol{J}}}}}_{j} $为非奇异矩阵[35]。因此,笛卡儿空间的动力学为

$ \begin{align} &{{{\mathit{\boldsymbol{M}}}}}_{{\rm x}j} ({{{\mathit{\boldsymbol{q}}}}}_{j}) \ddot{{{\mathit{\boldsymbol{x}}}}}_{j} + {{{\mathit{\boldsymbol{C}}}}}_{{\rm x}j} ({{{\mathit{\boldsymbol{q}}}}}_{j}, {{\dot{{{\mathit{\boldsymbol{q}}}}}}}_{j}) {{\mathit{\boldsymbol{x}}}}_{j} +{ {{\mathit{\boldsymbol{g}}}}}_{{\rm x}j} ({{{\mathit{\boldsymbol{q}}}}}_{j}) +{{\mathit{\boldsymbol{f}}}}_{{\rm x}j}^{{\rm f}} ({{{\mathit{\boldsymbol{q}}}}}_{j}, {{\dot{{{\mathit{\boldsymbol{q}}}}}}}_{j})+ \\ &{{\delta}} _{{\rm x}j} ({{{\mathit{\boldsymbol{q}}}}}_{j}, {{ \dot{\mathit{\boldsymbol{q}}}}}_{j}, t)={{{\mathit{\boldsymbol{u}}}}}_{{\rm x}j} +{{{\mathit{\boldsymbol{F}}}}}_{jν} \end{align} $ (5)

为了简化起见,$ {{{\mathit{\boldsymbol{M}}}}}_{{\rm x}j} ({{{\mathit{\boldsymbol{q}}}}}_{j}), {{{\mathit{\boldsymbol{C}}}}}_{{\rm x}j} ({{{\mathit{\boldsymbol{q}}}}}_{j}, {{\dot{{{\mathit{\boldsymbol{q}}}}}}}_{j}), {{{\mathit{\boldsymbol{g}}}}}_{{\rm x}j} ({{{\mathit{\boldsymbol{q}}}}}_{j}) $$ {{\mathit{\boldsymbol{f}}}}_{{\rm x}j}^{{\rm f}} ({{{\mathit{\boldsymbol{q}}}}}_{j}, {{\dot{{{\mathit{\boldsymbol{q}}}}}}}_{j}) $均写为$ {{{\mathit{\boldsymbol{M}}}}}_{{\rm x}j}, {{{\mathit{\boldsymbol{C}}}}}_{{\rm x}j}, {{{\mathit{\boldsymbol{g}}}}}_{{\rm x}j}, {{{\mathit{\boldsymbol{f}}}}}_{{\rm x}j}^{{\rm f}} $,后续不再赘述。对比式(1) 和式(5) 可得:

$ \begin{equation} \!\!\!\!\begin{cases} {{{\mathit{\boldsymbol{M}}}}}_{{\rm x}j} =({{{\mathit{\boldsymbol{J}}}}}_{j}^{-1}) ^{\rm T}{{{\mathit{\boldsymbol{M}}}}}_{j} ({{{\mathit{\boldsymbol{J}}}}}_{j}^{-1}) ^{\rm T} \\ {{{\mathit{\boldsymbol{C}}}}}_{{\rm x}j} =({{{\mathit{\boldsymbol{J}}}}}_{j}^{-1}) ^{\rm T}({{{\mathit{\boldsymbol{C}}}}}_{j} -{{{\mathit{\boldsymbol{M}}}}}_{j} ({{{\mathit{\boldsymbol{J}}}}}_{j}^{-1}) ^{\rm T}{{\dot{\mathit{\boldsymbol{J}}}}}_{j}){{{\mathit{\boldsymbol{M}}}}}_{j} ({{{\mathit{\boldsymbol{q}}}}}_{j}) ({{{\mathit{\boldsymbol{J}}}}}_{j}^{-1}) ^{\rm T} \\ {{{\mathit{\boldsymbol{g}}}}}_{{\rm x}j} =({{{\mathit{\boldsymbol{J}}}}}_{j}^{-1}) ^{\rm T}{{{\mathit{\boldsymbol{g}}}}}_{j} \\ {{\mathit{\boldsymbol{f}}}}_{{\rm x}j}^{{\rm f}} =({{{\mathit{\boldsymbol{J}}}}}_{j}^{-1}) ^{\rm T}{ {{\mathit{\boldsymbol{f}}}}}_{j}^{{\rm f}} \\ {{\delta}} _{{\rm x}j} =({{{\mathit{\boldsymbol{J}}}}}_{j}^{-1}) ^{\rm T}{ {\delta}} _{j} \\ {{{\mathit{\boldsymbol{u}}}}}_{{\rm x}j} =({{{\mathit{\boldsymbol{J}}}}}_{j}^{-1}) ^{\rm T}{{{\mathit{\boldsymbol{u}}}}}_{j} \\ \end{cases}\!\!\!\!\!\!\!\! \end{equation} $ (6)

遥操作系统满足如下的性质和假设[21, 36]

属性1:惯量矩阵$ {{{\mathit{\boldsymbol{M}}}}}_{j} ({{{\mathit{\boldsymbol{q}}}}}_{j}) $$ {{{\mathit{\boldsymbol{M}}}}}_{{\rm x}j} ({{{\mathit{\boldsymbol{q}}}}}_{j}) $对称正定,且具有上下界,即存在$ \lambda _{j1} >0 $$ \lambda_{j2} >0 $使得$ \lambda_{j1} {{{\mathit{\boldsymbol{I}}}}}\leqslant {{{\mathit{\boldsymbol{M}}}}}_{j/{\rm x}j} ({{{\mathit{\boldsymbol{q}}}}}_{j}) \leqslant \lambda_{j1} {{{\mathit{\boldsymbol{I}}}}} $

属性2:$ {{\dot{{{\mathit{\boldsymbol{M}}}}}}}_{j/{\rm x}j} -2{{{\mathit{\boldsymbol{C}}}}}_{j/{\rm x}j} $为斜对称矩阵,对于任意的$ {{{\mathit{\boldsymbol{x}}}}}\in {\rm R}^{3\times 1} $$ {{{\mathit{\boldsymbol{x}}}}}^{\rm T}({{{\mathit{\boldsymbol{M}}}}}_{j/{\rm x}j} -2{{{\mathit{\boldsymbol{C}}}}}_{j/{\rm x}j}) { {{\mathit{\boldsymbol{x}}}}}=0 $

假设1:$ {{{\mathit{\boldsymbol{F}}}}}_{{\rm h}} $$ {{{\mathit{\boldsymbol{F}}}}}_{{\rm e}} $均可通过力传感器测量。

假设2:未知干扰$ {{\delta}} _{{\rm x}j} $有上界,即$ \|{{\delta}} _{{\rm x}j} \|\leqslant \bar{{\delta}} _{{\rm x}j} $,其中$ \bar{{\delta }}_{xj} \in {\rm R}^{+} $

假设3:时变时延包含两部分且有上界,形式为$ T_{i} =\bar{{T}}_{i} +\sigma_{i} (t) $$ i\in\{{\rm f, b}\} $$ \bar{{T}}_{i} $为常值时延,$ \sigma_{i} (t) $为未知波动时延且满足$ \left| {\dot{{\sigma}} _{i} (t)} \right|\leqslant 1 $

2.2 径向基神经网络

神经网络主要用来处理模型的不确定性,它包含输入层、隐含层和输出层,其形式为[30]

$ \begin{equation} {{\mathit{\boldsymbol{f}}}}_{i} ({{\mathit{\boldsymbol{X}}}})={{{\mathit{\boldsymbol{W}}}}}_{i}^{\rm T} {{{\mathit{\boldsymbol{S}}}}}_{i} ({ {{\mathit{\boldsymbol{X}}}}}), \; \; i=1, 2, \cdots, o \end{equation} $ (7)

式中:$ {{\mathit{\boldsymbol{X}}}}=[x_{1}, x_{2}, \cdots, x_{q}]\in {\rm R}^{q} $为输入向量,$ q $表示向量$ {{{\mathit{\boldsymbol{X}}}}} $的维数,$ o $表示径向基神经网络的总数,$ {{{\mathit{\boldsymbol{W}}}}}_{i} =[w_{1}, w_{2}, \cdots, w_{p}]^{{\rm T}} $表示神经网络的权重向量,$ p $为神经网路的节点数。$ {{{\mathit{\boldsymbol{S}}}}}_{i} ({ {{\mathit{\boldsymbol{X}}}}})=[s_{1} ({{\mathit{\boldsymbol{X}}}}), s_{2} ({{\mathit{\boldsymbol{X}}}}), \cdots, s_{p} ({ {{\mathit{\boldsymbol{X}}}}})]^{\rm T} $为径向基函数,且$ s_{k} ({{\mathit{\boldsymbol{X}}}}) $$ k=1, 2, \cdots, p $)表示神经元激活函数,有形式如下:

$ \begin{equation} s_{k} ({{\mathit{\boldsymbol{X}}}})=\exp \left(-\frac{\left\| {{{{\mathit{\boldsymbol{x}}}}}-{{{\mathit{\boldsymbol{c}}}}}_{k} } \right\|^{2}}{b_{k}^{2}}\right) \end{equation} $ (8)

式中$ {{{\mathit{\boldsymbol{c}}}}}_{k} $$ b_{k} $分别表示节点$ k $的中心矢量和基宽度参数。存在最优的权重$ {{\mathit{\boldsymbol{W}}}}_{i}^{\ast} $使得估计偏差$ \left| {{{\varepsilon}} _{i}} \right| $最小化:

$ \begin{equation} {{\mathit{\boldsymbol{f}}}}_{i} ({{\mathit{\boldsymbol{X}}}})={{{\mathit{\boldsymbol{W}}}}}_{i}^{\ast {\rm T}} {{{\mathit{\boldsymbol{S}}}}}_{i} ({{\mathit{\boldsymbol{X}}}})+{\varepsilon}_{i} \end{equation} $ (9)
2.3 其他假设和引理

假设4:参考信号$ {{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}} (t) $$ j\in\{{\rm m, s}\} $)可持续微分且有界,对于时变边界$ k_{c_{1}} (t) $,存在函数$ K_{0} (t):{\rm R}^{+}\to {\rm R}^{+} $和常数$ K_{1} $,使得$ | {{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}} (t)} |\leqslant K_{0} (t)<k_{c_{1}} (t) $$ | {{{\dot{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}} (t)} |<K_{1} $,对于$ \forall t\geqslant 0 $均成立。

引理1[37]:对于非线性系统$ {{ \dot{\mathit{\boldsymbol{\varsigma}}}}} ={{\mathit{\boldsymbol{f}}}}(t, {{\varsigma }}) $,如果有正定标量函数$ V({\varsigma }) $使得$ \dot{{V}}({{\varsigma }})\leqslant -\iota_{1} V({{\varsigma}}) -\iota_{2} V^{\xi} ( {{\varsigma}}) $ $ + $ $ \varXi $成立,式中$ \iota_{1} >0 $$ \iota_{2} >0 $$ \varXi >0 $$ 0<\xi<1 $,则系统$ {{\dot{{\varsigma}}}} ={\mathit{\boldsymbol{f}}}(t, {{\varsigma }}) $为实用有限时间稳定,则闭环系统的残差集能够在有限时间$ T_{{\rm reach}} $稳定在平衡点附近的邻域内,即

$ \begin{align*} \left\{\!\lim\limits_{t\to T_{{\rm reach}}} {{\varsigma }}\Big|V({{\varsigma}}) \leqslant \min \left\{{\frac{\varXi }{(1\!-\!{\rlap{--} \lambda}) \iota_{1}}, \left({\frac{\varXi }{(1\!-\!{\rlap{--} \lambda}) \iota_{2}}} \right)^{\frac{1}{\xi}}} \right\} \!\right\} \end{align*} $

式中$ {\rlap{--} \lambda} \in (0, 1) $。收敛时间$ T_{{\rm reach}} $的上界满足:

$ \begin{align*} T_{{\rm reach}} &\leqslant \max \left\{t_{0} +\frac{1}{{\rlap{--} \lambda} \iota_{1} (1-\xi) }\ln \frac{{\rlap{--} \lambda} \iota_{1} V^{1-\xi} ({{\varsigma}} _{0}) +\iota_{2}} {\iota_{2}}, \right. \\ &\qquad\quad\; \; \left.t_{0} +\frac{1}{\iota_{1} (1-\xi) }\ln \frac{\iota_{1} V^{1-\xi }({{\varsigma}} _{0}) +{\rlap{--} \lambda} \iota_{2} }{{\rlap{--} \lambda} \iota_{2}} \right\} \end{align*} $

式中$ t_{0} $表示起始时刻。

3 控制器设计和稳定性分析(Controller design and stability analysis) 3.1 遥操作系统的控制框架

基于IBLF时变输出约束的空间遥操作系统控制框架如图 2所示。主端的位置信号$ {{{\mathit{\boldsymbol{x}}}}}_{{\rm m}} (t) $传递到从端,经从端参考轨迹生成器后,生成从端的参考轨迹($ {{{\mathit{\boldsymbol{x}}}}}_{{\rm s}}^{{\rm r}} (t), \; {{\dot{{{\mathit{\boldsymbol{x}}}}}}}_{{\rm s}}^{{\rm r}}(t) $),随后在从端设计时变输出约束的有限时间控制器$ {{\mathit{\boldsymbol{u}}}}_{{\rm s}} $,实现对从端参考轨迹的追踪。同时,利用神经网络对从端的环境参数进行估计并将其传递到主端。在主端,利用主端的运动信} 息和从端的虚拟环境参数实现环境力重建。该方式规避了环境力在传输通道的直接传递,有效地避免了无源性问题。为了使操作者拥有较好的力感知能力,则主端的参考轨迹基于操作者的行为而生成。随后在主端设计时变输出约束的有限时间控制器$ {{\mathit{\boldsymbol{u}}}}_{{\rm m}} $,实现对主端参考轨迹的追踪。

图 2 空间遥操作系统控制框架 Fig.2 Control framework of the space teleoperation system
3.2 参考轨迹生成器 3.2.1 主端参考轨迹生成器

为了避免力信号在网络通道直接传输,本文采用神经网络对环境力进行建模,则式(3) 可重写为

$ \begin{equation} {{{\mathit{\boldsymbol{F}}}}}_{{\rm e}} ={{{\mathit{\boldsymbol{W}}}}}_{{\rm e}}^{\rm T} {{{\mathit{\boldsymbol{S}}}}}_{{\rm e}} ({{\mathit{\boldsymbol{X}}}}_{{\rm e}}) \end{equation} $ (10)

式中:$ {{{\mathit{\boldsymbol{W}}}}}_{{\rm e}} $为未知虚拟环境参数,$ {{\mathit{\boldsymbol{X}}}}_{{\rm e}} $$ {{{\mathit{\boldsymbol{x}}}}}_{{\rm s}}, {{\dot{{{\mathit{\boldsymbol{x}}}}}}}_{{\rm s}} $相关,根据式(9) 存在最优的权重$ {{{\mathit{\boldsymbol{W}}}}}_{{\rm e}}^{\ast} $,使偏差$ {{\varepsilon}} _{{\rm e}} $最小化。因此,为了使环境估计参数尽可能接近真实值,设计如下更新律;

$ \begin{equation} {{\dot{{ \hat{\mathit{\boldsymbol{W}}}}}}}_{{\rm e}} =-k_{{\rm e}} {{\varGamma }}_{{\rm e}} {{{\mathit{\boldsymbol{S}}}}}_{{\rm e}} ({{{\mathit{\boldsymbol{S}}}}}_{{\rm e}}^{\rm T} { { \hat{\mathit{\boldsymbol{W}}}}}_{{\rm e}} -{{{\mathit{\boldsymbol{F}}}}}_{\rm e}^{\rm T}) \end{equation} $ (11)

式中:$ {{ \tilde{\mathit{\boldsymbol{W}}}}}_{{\rm e}} ={{\hat{\mathit{\boldsymbol{W}}}}}_{{\rm e}} -{{{\mathit{\boldsymbol{W}}}}}_{{\rm e}} $为环境参数的估计值$ {{\hat{\mathit{\boldsymbol{W}}}}}_{{\rm e}} $与真实值$ {{{\mathit{\boldsymbol{W}}}}}_{{\rm e}} $之间的偏差。

证明:定义李雅普诺夫函数$ V_{{\rm e}} $

$ \begin{equation} V_{{\rm e}} =\frac{1}{2}{\rm tr}({{\tilde{\mathit{\boldsymbol{W}}}}}_{{\rm e}}^{\rm T} {{\varGamma}} _{{\rm e}}^{-1} {{\tilde{\mathit{\boldsymbol{W}}}}}_{{\rm e}}) \end{equation} $ (12)

$ V_{{\rm e}} $求导可得:

$ \begin{equation} \dot{{V}}_{{\rm e}} ={\rm tr}({{\tilde{\mathit{\boldsymbol{W}}}}}_{{\rm e}}^{\rm T} {{\varGamma}} _{{\rm e}}^{-1} {{\dot{{\tilde{\mathit{\boldsymbol{W}}}}}}}_{{\rm e}} )=-k_{{\rm e}} {\rm tr}({{\tilde{\mathit{\boldsymbol{W}}}}}_{{\rm e}}^{\rm T} { {{\mathit{\boldsymbol{S}}}}}_{{\rm e}} {{{\mathit{\boldsymbol{S}}}}}_{\rm e}^{\rm T} {{\tilde{\mathit{\boldsymbol{W}}}}})\leqslant 0 \end{equation} $ (13)

根据式(8) 中高斯基函数的定义,可知$ {{{\mathit{\boldsymbol{S}}}}}_{\rm e} {{{\mathit{\boldsymbol{S}}}}}_{\rm e}^{\rm T} \ne 0 $。由式(13) 可得$ \dot{{V}}_{{\rm e}} \leqslant 0 $$ \dot{{V}}_{{\rm e}} =0 $仅当$ {{{\mathit{\boldsymbol{S}}}}}_{\rm e}^{\rm T} {{ \tilde{\mathit{\boldsymbol{W}}}}}=0 $。基于以上分析,环境参数估计偏差是渐近收敛的。

将式(11) 中的虚拟环境估计参数$ {{\hat{\mathit{\boldsymbol{W}}}}}_{{\rm e}} $传递到主端,同时结合主端的运动信息重建环境力。由于时延$ T_{{\rm b}} (t) $的存在,重建环境力的形式可改写为

$ \begin{equation} {{{\mathit{\boldsymbol{F}}}}}_{{\rm e}} ={{{\mathit{\boldsymbol{W}}}}}_{{\rm e}}^{\rm T} (t-T_{{\rm b}} (t)){{{\mathit{\boldsymbol{S}}}}}_{{\rm m}} ({{\mathit{\boldsymbol{X}}}}_{{\rm m}}) \end{equation} $ (14)

式中:$ {{\mathit{\boldsymbol{X}}}}_{{\rm m}} $$ {{{\mathit{\boldsymbol{x}}}}}_{{\rm m}}, {{ \dot{\mathit{\boldsymbol{x}}}}}_{{\rm m}} $有关。在这里,假设控制器$ {{{\mathit{\boldsymbol{u}}}}}_{{\rm s}} $可确保从端对主端位置的高精度追踪。

利用$ {{{\mathit{\boldsymbol{F}}}}}_{{\rm h}} $$ {{\hat{\mathit{\boldsymbol{F}}}}}_{{\rm e}} $,则基于操作者行为可生成主端的参考轨迹,其形式为[21, 40]

$ \begin{equation} {{{\mathit{\boldsymbol{M}}}}}_{{\rm r}} \ddot{{{\mathit{\boldsymbol{x}}}}}_{{\rm m}}^{{\rm r}} +{{{\mathit{\boldsymbol{C}}}}}_{{\rm r}} \dot{{{\mathit{\boldsymbol{x}}}}}_{{\rm m}}^{{\rm r}} +{{{\mathit{\boldsymbol{g}}}}}_{{\rm r}} =\Im_{1} {{{\mathit{\boldsymbol{F}}}}}_{{\rm h}} -\Im_{2} {{\hat{\mathit{\boldsymbol{F}}}}}_{{\rm e}} \end{equation} $ (15)

式中:$ {{\ddot{{{\mathit{\boldsymbol{x}}}}}}}_{{\rm m}}^{{\rm r}}, {{ \dot{\mathit{\boldsymbol{x}}}}}_{{\rm m}}^{{\rm r}}, {{{\mathit{\boldsymbol{x}}}}}_{{\rm m}}^{{\rm r}} $分别为主端参考轨迹的加速度、速度和位置;$ \Im_{1}, \Im_{2} $分别为操作者力和环境估计力的比例系数;$ {{{\mathit{\boldsymbol{M}}}}}_{{\rm r}}, {{{\mathit{\boldsymbol{C}}}}}_{{\rm r}}, {{{\mathit{\boldsymbol{g}}}}}_{{\rm r}} $分别为操作者行为的目标阻抗参数。

3.2.2 从端参考轨迹生成器

主端的位置信号$ {{{\mathit{\boldsymbol{x}}}}}_{{\rm m}} (t) $经传输通道传递到从端。将文[38] 中的滤波器作为从端的轨迹生成器,该滤波器的主要作用是对信号$ {{{\mathit{\boldsymbol{x}}}}}_{{\rm m}} (t-T_{{\rm f}} (t)) $进行平滑处理,同时抑制噪声干扰。

$ \begin{equation} \begin{cases} {{\dot{{\zeta}}}} _{1} ={{\zeta}} _{2} +c_{1}^{\prime} c_{2}^{\prime} ({{{\mathit{\boldsymbol{x}}}}}_{{\rm md\ast y}} (t)-{{\zeta}} _{1}) \\ {{\dot{{\zeta}}}} _{2} =c_{1}^{\prime2} c_{3}^{\prime} ({{{\mathit{\boldsymbol{x}}}}}_{{\rm md\ast y}} (t)-{{\zeta}} _{1}) \\ \end{cases} \end{equation} $ (16)

式中:$ {{{\mathit{\boldsymbol{x}}}}}_{{\rm md\ast y}} (t)={{{\mathit{\boldsymbol{x}}}}}_{\rm m} (t-T_{{\rm f}} (t)) $$ c_{i}^{\prime} $$ i=1, 2, 3 $)为常数,且为正。合适的$ c_{i}^{\prime} $可以保证滤波器输出信号的连续性和准确性。滤波器的输入为$ {{{\mathit{\boldsymbol{x}}}}}_{{\rm md\ast y}} (t) $,输出为$ {{\zeta}} _{1}, {{\zeta }}_{2} $,则可获取从端的参考轨迹信号,即$ {{{\mathit{\boldsymbol{x}}}}}_{{\rm s}}^{{\rm r}} (t)={{\zeta}} _{1} $$ {{\dot{{{\mathit{\boldsymbol{x}}}}}}}_{{\rm s}}^{{\rm r}} (t) $ $ = $ $ {{\zeta}} _{2} $

3.3 控制器设计

定义变量:$ {{{\mathit{\boldsymbol{x}}}}}_{\eta 1} =[{{{\mathit{\boldsymbol{x}}}}}_{j1}, {{{\mathit{\boldsymbol{x}}}}}_{j2}, \cdots, {{{\mathit{\boldsymbol{x}}}}}_{jn}]^{\rm T} $$ {{{\mathit{\boldsymbol{x}}}}}_{\eta 2} =[{{ \dot{\mathit{\boldsymbol{x}}}}}_{j1}, $ $ {{\dot{{{\mathit{\boldsymbol{x}}}}}}}_{j2}, $ $ \cdots, {{ \dot{\mathit{\boldsymbol{x}}}}}_{jn}]^{\rm T} $$ \eta \in \{{\rm l, r}\} $$ j\in \{{\rm m, s}\} $,则式(5) 可改写为

$ \begin{equation} \begin{cases} {{\dot{{{\mathit{\boldsymbol{x}}}}}}}_{\eta 1} ={{{\mathit{\boldsymbol{x}}}}}_{\eta 2} \\ {{\dot{{{\mathit{\boldsymbol{x}}}}}}}_{\eta 2} ={{{\mathit{\boldsymbol{M}}}}}_{{\rm x}j}^{-1} ({{{\mathit{\boldsymbol{u}}}}}_{{\rm x}j} +{{{\mathit{\boldsymbol{F}}}}}_{jν} -{{{\mathit{\boldsymbol{C}}}}}_{{\rm x}j} {{\mathit{\boldsymbol{x}}}}_{\eta 2} -\\ \quad {{{\mathit{\boldsymbol{g}}}}}_{{\rm x}j} - {{\mathit{\boldsymbol{f}}}}_{{\rm x}j}^{{\rm f}} -{{\delta}}_{{\rm x}j}) \\ \end{cases} \end{equation} $ (17)

定义误差变量$ {{\mathit{\boldsymbol{e}}}}_{j1}, {{\mathit{\boldsymbol{e}}}}_{j2} $$ j\in \{{\rm m, s}\} $)为

$ \begin{equation} \begin{cases} {{\mathit{\boldsymbol{e}}}}_{j1} ={{{\mathit{\boldsymbol{x}}}}}_{\eta 1} -{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}} \\ {{\mathit{\boldsymbol{e}}}}_{j2} ={{{\mathit{\boldsymbol{x}}}}}_{\eta 2} -{{\alpha}} _{j1} \\ \end{cases} \end{equation} $ (18)

式中:$ {{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}} $$ j\in \{{\rm m, s}\} $)为主从端的参考轨迹,$ {{\alpha}} _{j1} $为待设计的虚拟控制量。

控制目标:通过设计控制器$ {{{\mathit{\boldsymbol{u}}}}}_{{\rm x}j} $实现对参考轨迹$ {{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}} $的有限时间追踪,同时要保证输出$ {{{\mathit{\boldsymbol{x}}}}}_{\eta 1} $在设定的时变边界内,即$ \left| {{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}} \right|<\left| {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)\right| $

虚拟控制量$ {{\alpha}} _{j1} $和控制器$ {{{\mathit{\boldsymbol{u}}}}}_{{\rm x}j} $设计为

$ \begin{align} {{\alpha}} _{j1} &=-\frac{k_{j1} {{\mathit{\boldsymbol{e}}}}_{j1}^{2\xi_{j} -1} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2\xi_{j} -2} (t)}{ ({{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1} }^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} )^{\xi_{j} -1}}+ \frac{{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} }{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{\dot{{{\mathit{\boldsymbol{x}}}}}}}_{j}^{{\rm r}} \varpi_{j1} +\\ &\quad\; \frac{\dot{{{{\mathit{\boldsymbol{k}}}}}}_{{\rm c}_{1}} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)}{{\mathit{\boldsymbol{e}}}}_{j1} -\frac{ {{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} }{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}\dot{{{{\mathit{\boldsymbol{k}}}}}}_{{\rm c}_{1}} (t)\gamma_{j1} -{{{\mathit{\boldsymbol{K}}}}}_{j1} {{\mathit{\boldsymbol{e}}}}_{j1} \end{align} $ (19)
$ \begin{align} {{{\mathit{\boldsymbol{u}}}}}_{{\rm x}j} &=-({{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T}) ^{+}\frac{{ {{\mathit{\boldsymbol{e}}}}}_{j1} {{\mathit{\boldsymbol{e}}}}_{j2} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} - ({{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T}) ^{+}k_{j2} ({{{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} { {{\mathit{\boldsymbol{e}}}}}_{j2}} )^{\xi_{j}} -\\ &\quad\; {{{\mathit{\boldsymbol{K}}}}}_{j2} {{\mathit{\boldsymbol{e}}}}_{j2} - {{\hat{\mathit{\boldsymbol{W}}}}}_{j}^{\rm T} {{{\mathit{\boldsymbol{S}}}}}({{\mathit{\boldsymbol{X}}}}_{j}) -{{\hat{\mathit{\boldsymbol{\beta}}}}} _{j} \tanh \frac{{{\mathit{\boldsymbol{e}}}}_{j2}} {b_{j}} -{{{\mathit{\boldsymbol{F}}}}}_{jν} \end{align} $ (20)

式(19)(20) 中,变量$ \varpi_{j1} $$ \gamma_{j1} $见后续稳定性分析部分,$ {{{\mathit{\boldsymbol{F}}}}}_{jν} $$ j\in \rm\{m, s\} $)分别为操作者施加的力和机器人与环境间的接触力,$ {{{\mathit{\boldsymbol{K}}}}}_{j1}, { {{\mathit{\boldsymbol{K}}}}}_{j2} $为正对角阵,$ k_{j1}, k_{j2}, b_{j} $为正常数,$ {{ \hat{\mathit{\boldsymbol{W}}}}}_{j} $为模型不确定性的估计参数,$ {{\hat{\mathit{\boldsymbol{\beta}}}}} _{j} $为神经网络估计偏差$ {{\varepsilon}} ({{\mathit{\boldsymbol{X}}}}_{j} ) $和外部扰动$ {{\delta}} _{{\rm x}j} $总和的上界估计参数,$ {{ \hat{\mathit{\boldsymbol{\beta}}}}} _{j} $$ {{\beta}} _{j} =\lambda_{j} {{{\mathit{\boldsymbol{I}}}}} $的估计,其中$ \lambda_{j} =\varepsilon_{j} +\bar{{\delta}} _{{\rm x}j} $$ ({{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T}) ^{+} $$ {{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} $的广义逆,令$ {{\mathit{\boldsymbol{z}}}}={{\mathit{\boldsymbol{e}}}}_{j2} $,满足如下条件:

$ \begin{equation} {{\mathit{\boldsymbol{z}}}}^{\rm T}({{\mathit{\boldsymbol{z}}}}^{\rm T})^{+}= \begin{cases} 0, &{{\mathit{\boldsymbol{z}}}}=\left[{0, 0, \cdots, 0} \right]^{\rm T} \\ 1, &{{\mathit{\boldsymbol{z}}}}\ne \left[{0, 0, \cdots, 0} \right]^{\rm T} \\ \end{cases} \end{equation} $ (21)

设计如下的更新律:

$ \begin{equation} \begin{cases} {{\dot{{\hat{\mathit{\boldsymbol{W}}}}}}}_{j} ={{\varLambda}} _{j} ({{ {{\mathit{\boldsymbol{S}}}}}({{\mathit{\boldsymbol{X}}}}_{j}) {{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} -\chi_{j} { {\hat{\mathit{\boldsymbol{W}}}}}_{j}} ) \\[5pt] {{\dot{{\hat{\mathit{\boldsymbol{\beta}}}}}}} _{j} ={{\varLambda}} _{\beta, j} \left({(\tanh \dfrac{{{\mathit{\boldsymbol{e}}}}_{j2}} {b_{j}}) {{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} -\chi_{\beta, j} {{\hat{\mathit{\boldsymbol{\beta}}}}} _{j}} \right) \\ \end{cases} \end{equation} $ (22)

式中,$ \chi_{j}, \chi_{\beta, j} $为正常数,$ {{\varLambda }}_{j} ={{\varLambda}} _{j}^{\rm T} $$ {{\varLambda}} _{\beta, j} ={{\varLambda}} _{\beta, j}^{\rm T} $为正对角阵,更新律中的系数$ \chi _{j/\beta, j} $使系统具有更强的鲁棒性[39]$ {{\tilde{\mathit{\boldsymbol{W}}}}}_{j} ={{\hat{\mathit{\boldsymbol{W}}}}}_{j} -{{{\mathit{\boldsymbol{W}}}}}_{j}^{\ast} $$ {{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j} ={{\hat{\mathit{\boldsymbol{\beta}}}}} _{j} -{{\beta}} _{j}^{\ast} $

3.4 稳定性分析

对误差变量$ {{\mathit{\boldsymbol{e}}}}_{j1} $求导可得:

$ \begin{equation} {{\dot{{\mathit{\boldsymbol{e}}}}}}_{j1} ={{\dot{{{\mathit{\boldsymbol{x}}}}}}}_{\eta 1} -{{\dot{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}} ={{\mathit{\boldsymbol{e}}}}_{j2} +{{\alpha}} _{j1} -{{\dot{{{\mathit{\boldsymbol{x}}}}}}}_{j}^{{\rm r}} \end{equation} $ (23)

为了确保系统输出满足控制目标,选取积分障碍李雅普诺夫函数$ V_{j1} $

$ \begin{equation} V_{j1} =\int_0^{{{\mathit{\boldsymbol{e}}}}_{j1}} {\frac{{{\sigma}} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)- ({{{\sigma }}+{{\mathit{\boldsymbol{x}}}}_{j}^{{\rm r}}} )^{2}}} {\rm d}{{\sigma}} \end{equation} $ (24)

由于$ | {{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}} (t)} |\leqslant X_{j} (t)<|{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)| $,可以得出$ V_{j1} $在定义域$ | {{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}} |<|{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)| $上单调递减、连续且可微,因此下列不等式成立:

$ \begin{align} \frac{1}{2}{{\mathit{\boldsymbol{e}}}}_{j1}^{\rm T}{{\mathit{\boldsymbol{e}}}}_{j1}&\leqslant\!V_{j1}\\ &\leqslant\!{{\mathit{\boldsymbol{e}}}}_{j1}^{2} \int_0^1 {\frac{\mu {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-\left({\mu {{\mathit{\boldsymbol{e}}}}_{j1} +{\rm{sgn}}({{{\mathit{\boldsymbol{e}}}}}_{j1}) X_{j} (t)} \right)^{2}}{\rm d}} \mu \end{align} $ (25)

式中,令$ {{\sigma}} =\mu {{\mathit{\boldsymbol{e}}}}_{j1} $,对$ V_{j1} $求导可得:

$ \begin{align} \dot{{V}}_{j1} &=\frac{{{\mathit{\boldsymbol{e}}}}_{j1} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} {{\dot{{\mathit{\boldsymbol{e}}}}}}_{j1}+\\ &\quad\; {{\dot{{{\mathit{\boldsymbol{x}}}}}}}_{j}^{{\rm r}} \int_0^{{{\mathit{\boldsymbol{e}}}}_{j1}} {\frac{\partial} {\partial {{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}}} \frac{{{\sigma}} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)- ({{ {\sigma}} +{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}} )^{2}}{\rm d}{{\sigma}}+\\ &\quad\; \dot{{{\mathit{\boldsymbol{k}}}}}_{{\rm c}_{1}} (t)\int_0^{{{\mathit{\boldsymbol{e}}}}_{j1}} {\frac{\partial} {\partial {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)}} \frac{{{\sigma }}{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)- ({{{\sigma}} +{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}} )^{2}}{\rm d}{{\sigma }} \end{align} $ (26)

式(26) 中,

$ \begin{align*} &\int_0^{{{\mathit{\boldsymbol{e}}}}_{j1}} {\frac{\partial} {\partial {{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}}} \frac{{{\sigma}} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)- ({{{\sigma}} +{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}} )^{2}}{\rm d}{{\sigma}} \notag\\ =&{{{\mathit{\boldsymbol{e}}}}}_{j1} \left({\frac{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} -\varpi_{j1}} \right)\\ &\int_0^{{{\mathit{\boldsymbol{e}}}}_{j1}} {\frac{\partial} {\partial {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)}} \frac{{{\sigma}} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1} }^{2} (t)- ({{{\sigma}} +{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}} )^{2}}{\rm d}{{\sigma}}\notag\\ =&{{\mathit{\boldsymbol{e}}}}_{j1} \left( {\frac{-{{\mathit{\boldsymbol{e}}}}_{j1} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} -\gamma_{j1}} \right) \end{align*} $

其中,

$ \begin{align*} \varpi_{j1} &=\frac{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)}{2{{\mathit{\boldsymbol{e}}}}_{j1}} \ln \frac{ \left({{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)+{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}} \right)\left( {{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)-{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}} \right)}{ \left({{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}} \right) \left({{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)+{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}} \right)}\\ \gamma_{j1}&=\frac{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)}{{{\mathit{\boldsymbol{e}}}}_{j1}} \ln {\frac{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2} }{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-({{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}) ^{2}}} +\\ &\quad\; \frac{{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}} {2{{\mathit{\boldsymbol{e}}}}_{j1}} \ln {\frac{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-({{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}} )^{2}}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}}} +\frac{-{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} \end{align*} $

根据文[31] 可得$ \varpi_{j1} $$ \gamma_{j1} $极限为

$ \begin{align} \lim\limits_{{{\mathit{\boldsymbol{e}}}}_{j1} \to 0} \varpi_{j1} &=\frac{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-({{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}) ^{2}} \end{align} $ (27)
$ \begin{align} \lim\limits_{{{\mathit{\boldsymbol{e}}}}_{j1} \to 0} \gamma_{j1} &=\frac{({{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}) ^{2}-3{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-({{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}) ^{2}} \end{align} $ (28)

将式(19)(27)(28) 代入式(26) 可得:

$ \begin{align} \dot{{V}}_{j1}&=-\frac{k_{j1} {{\mathit{\boldsymbol{e}}}}_{j1}^{2\xi_{j}} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2\xi_{j}} (t)}{ ({{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-{ {{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} )^{\xi_{j}}} -\frac{{{{\mathit{\boldsymbol{K}}}}}_{j1} { {{\mathit{\boldsymbol{e}}}}}_{j1}^{2} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} +\\ &\quad\; \frac{{{\mathit{\boldsymbol{e}}}}_{j1} {{\mathit{\boldsymbol{e}}}}_{j2} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1} }^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} \end{align} $ (29)

选取李雅普诺夫函数$ V_{j2} $

$ \begin{equation} V_{j2} =\frac{1}{2}{{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} {{{\mathit{\boldsymbol{M}}}}}_{{\rm x}j} {{\mathit{\boldsymbol{e}}}}_{j2} \end{equation} $ (30)

$ V_{j2} $求导可得

$ \begin{align} \dot{{V}}_{j2}&=\frac{1}{2}{{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} {{\dot{{{\mathit{\boldsymbol{M}}}}}}}_{{\rm x}j} {{\mathit{\boldsymbol{e}}}}_{j2} +{{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} {{{\mathit{\boldsymbol{M}}}}}_{{\rm x}j} \dot{{{\mathit{\boldsymbol{e}}}}}_{j2} \\ & = {{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} ({{{\mathit{\boldsymbol{u}}}}}_{{\rm x}j} +{{{\mathit{\boldsymbol{F}}}}}_{jν} -{{{\mathit{\boldsymbol{C}}}}}_{{\rm x}j} {{\alpha}} _{j1} -\\ &\quad\; {{{\mathit{\boldsymbol{g}}}}}_{{\rm x}j} -{{\mathit{\boldsymbol{f}}}}_{{\rm x}j}^{{\rm f}} -{{\dot{\mathit{\boldsymbol{M}}}}}_{{\rm x}j} {{\alpha}} _{j1} -{{\delta}} _{{\rm x}j}) \end{align} $ (31)

式中:$ f({{\mathit{\boldsymbol{X}}}}_{j}) =-{{{\mathit{\boldsymbol{C}}}}}_{{\rm x}j} {{\alpha }}_{j1} -{{{\mathit{\boldsymbol{g}}}}}_{{\rm x}j} -{{\mathit{\boldsymbol{f}}}}_{{\rm x}j}^{{\rm f}} -{ { \dot{\mathit{\boldsymbol{M}}}}}_{{\rm x}j} {{\alpha}} _{j1} $$ {{\mathit{\boldsymbol{X}}}}_{j} =[{{\dot{{\alpha}}}} _{j1}^{\rm T}, {{\alpha}} _{j1}^{\rm T}, {{\dot{{{\mathit{\boldsymbol{x}}}}}}}_{j}^{\rm T}, {{{\mathit{\boldsymbol{x}}}}}_{j}^{\rm T}] $,然而$ {{{\mathit{\boldsymbol{C}}}}}_{{\rm x}j}, {{{\mathit{\boldsymbol{M}}}}}_{{\rm x}j}, {{{\mathit{\boldsymbol{g}}}}}_{{\rm x}j}, {{\mathit{\boldsymbol{f}}}}_{{\rm x}j}^{{\rm f}} $均难以获取精确值。因此,利用神经网络$ {{\hat{\mathit{\boldsymbol{W}}}}}_{j}^{\rm T} {{{\mathit{\boldsymbol{S}}}}}({{\mathit{\boldsymbol{X}}}}_{j}) $来逼近未知非线性函数,利用鲁棒项$ {{\hat{\mathit{\boldsymbol{\beta}}}}} _{j} \tanh \dfrac{{{\mathit{\boldsymbol{e}}}}_{j2} }{b_{j}} $来消除神经网络的估计偏差和未知的外部扰动影响。

将式(20) 代入式(31) 可得:

$ \begin{align} \dot{{V}}_{j2} &=-\frac{{{\mathit{\boldsymbol{e}}}}_{j1} {{\mathit{\boldsymbol{e}}}}_{j2} k_{{\rm c}_{1}} ^{2} (t)}{k_{{\rm c}_{1}} ^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} -k_{j2} \left({{{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} {{\mathit{\boldsymbol{e}}}}_{j2}} \right)^{\xi_{j}} -{{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} {{{\mathit{\boldsymbol{K}}}}}_{j2} { {{\mathit{\boldsymbol{e}}}}}_{j2} -\\ &\quad\; {{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} \left({{{\delta}} _{{\rm x}j} +{{\hat{\mathit{\boldsymbol{\beta}}}}} _{j} \tanh \frac{{{\mathit{\boldsymbol{e}}}}_{j2} }{b_{j}} -{{\varepsilon}} ({{\mathit{\boldsymbol{X}}}}_{j}) } \right) \end{align} $ (32)

式中,$ {{\varepsilon}} ({{\mathit{\boldsymbol{X}}}}_{j}) $为神经网络的估计偏差。

考虑到$ {{\tilde{\mathit{\boldsymbol{W}}}}}_{j} $$ {{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j} $对系统稳定性的影响,选取李雅普诺夫函数$ V_{j3} $

$ \begin{equation} V_{j3} =\frac{1}{2}{\rm tr}({{\tilde{\mathit{\boldsymbol{W}}}}}_{j}^{\rm T} {{\varLambda}} _{j}^{-1} {{\tilde{\mathit{\boldsymbol{W}}}}}_{j}) +\frac{1}{2}{\rm tr}({ { \tilde{\mathit{\boldsymbol{\beta}}}}} _{j}^{\rm T} {{\varLambda}} _{\beta, j}^{-1} {{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j}) \end{equation} $ (33)

$ V_{j3} $求导,并将式(22) 代入可得:

$ \begin{align} \dot{{V}}_{j3} &={\rm tr}\:({{\tilde{\mathit{\boldsymbol{W}}}}}_{j}^{\rm T} {{\varLambda}} _{j}^{-1} {{\dot{{\tilde{\mathit{\boldsymbol{W}}}}}}}_{j}) +{\rm tr}\:({{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j}^{\rm T} {{\varLambda}} _{\beta, j}^{-1} { { \dot{{\tilde{\mathit{\boldsymbol{\beta}}}}}}} _{j}) \\ &={\rm tr}\: ({{{\tilde{\mathit{\boldsymbol{W}}}}}_{j}^{\rm T} ({{{\mathit{\boldsymbol{S}}}}}({{\mathit{\boldsymbol{X}}}}_{j}) {{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} -\chi_{j} {{\hat{\mathit{\boldsymbol{W}}}}}_{j}) })+ \\ &\quad\; {\rm tr}\: \left({{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j}^{\rm T} \left((\tanh \frac{{{\mathit{\boldsymbol{e}}}}_{j2}} {b_{j}}){{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} -\chi _{\beta, j} {{\hat{\mathit{\boldsymbol{\beta}}}}} _{j}\right)\right) \end{align} $ (34)

设计总的李雅普诺夫函数:

$ \begin{equation} V_{j} =V_{j1} +V_{j2} +V_{j3} \end{equation} $ (35)

$ V_{j} $求导,利用式(29)(32)(34) 及如下的等式和不等式:

$ \begin{align} &{{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} ({{\varepsilon}} ({{\mathit{\boldsymbol{X}}}}_{j} )-{{\delta}} _{{\rm x}j}) =\sum\limits_{i=1}^n {{{\mathit{\boldsymbol{e}}}}_{j2i}} \beta _{j, i} \leqslant \lambda_{\beta j} \sum\limits_{i=1}^n {\|{{\mathit{\boldsymbol{e}}}}_{j2i}} \| \end{align} $ (36)
$ \begin{align} &0\leqslant |x|-x\tanh \frac{x}{b}\leqslant 0.2785b, \quad \forall b>0, \; \; x\in {\rm R} \end{align} $ (37)
$ \begin{align} &\!\!\!\!\begin{cases} {-\chi_{j} {\rm tr}({{{\tilde{\mathit{\boldsymbol{W}}}}}_{j}^{\rm T} {{\hat{\mathit{\boldsymbol{W}}}}}_{j}} )\leqslant -\frac{\chi_{j}} {2}\|{{\tilde{\mathit{\boldsymbol{W}}}}}\|_{F}^{2} +\frac{\chi_{j}} {2}\|{{{\mathit{\boldsymbol{W}}}}}\|_{F}^{2}} \\[6pt] {-\chi_{\beta, j} {\rm tr}({{{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j}^{{\rm T}} {{\hat{\mathit{\boldsymbol{\beta}}}}} _{j}} )\leqslant -\frac{\chi_{\beta, j} }{2}\|{{\tilde{\mathit{\boldsymbol{\beta}}}}} \|_{F}^{2} +\frac{\chi_{\beta, j} }{2}\|{{\beta}} \|_{F}^{2}} \\ \end{cases}\!\!\!\! \end{align} $ (38)

可得

$ \begin{align} \dot{{V}}_{j} &\leqslant -\frac{{{{\mathit{\boldsymbol{K}}}}}_{j1} {{\mathit{\boldsymbol{e}}}}_{j1}^{2} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} -\frac{k_{j1} {{\mathit{\boldsymbol{e}}}}_{j1}^{2\xi_{j}} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2\xi_{j}} (t)}{ ({{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-{ {{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} )^{\xi_{j}}}-\\ &\quad\; {{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} {{{\mathit{\boldsymbol{K}}}}}_{j2} {{\mathit{\boldsymbol{e}}}}_{j2} -k_{j2} ({{{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} {{\mathit{\boldsymbol{e}}}}_{j2}} )^{\xi_{j}} +0.2785n\lambda_{\rm\beta m} b_{\rm m} + \\ &\quad\; \chi_{j} \bigg(-\frac{1}{4}\|{{\tilde{\mathit{\boldsymbol{W}}}}}_{j} \|_{F}^{2} -\frac{1}{4} ({\|{{{\mathit{\boldsymbol{W}}}}}_{j} \|_{F} -\sqrt{\|{{{\mathit{\boldsymbol{W}}}}}_{j} \|_{F}}} )^{2} +\\ &\quad\; \frac{1}{4}\|{{\tilde{\mathit{\boldsymbol{W}}}}}_{j} \|_{F} -\frac{1}{2}\|{ { \tilde{\mathit{\boldsymbol{W}}}}}_{j} \|_{F}^{\frac{3}{2}} +\frac{1}{2}\|{{{\mathit{\boldsymbol{W}}}}}_{j} \|_{F}^{2}\bigg)+\\ &\quad\; \chi_{\beta, j} \Bigg(-\frac{1}{4}\|{{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j} \|_{F}^{2} -\frac{1}{4} ({\|{{\beta}} _{j} \|_{F} -\sqrt{\|{ {\beta}} _{j} \|_{F}}} )^{2}+\\ &\quad\; \frac{1}{4}\|{{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j} \|_{F} -\frac{1}{2}\|{{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j} \|_{F}^{\frac{3}{2}} +\frac{1}{2}\|{{\beta}} _{j} \|_{F}^{2}\Bigg) \end{align} $ (39)

据文[27] 中的研究,如下不等式成立:

$ \begin{equation} -\dfrac{k_{j1} {{\mathit{\boldsymbol{e}}}}_{j1}^{2} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}}^{2} (t)-{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}^{2}} \leqslant -k_{j1} \int_0^{{ {{\mathit{\boldsymbol{e}}}}}_{j1}} \dfrac{{{\sigma}} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)- ({{{\sigma}} +{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}} )^{2}} {\rm d}{{\sigma}} \end{equation} $ (40)

再利用以下杨氏不等式:

$ \begin{equation} \begin{cases} {\dfrac{1}{4}\|{{\tilde{\mathit{\boldsymbol{W}}}}}_{j} \|_{F} \leqslant \frac{1}{8}\|{{\tilde{\mathit{\boldsymbol{W}}}}}_{j} \|_{F}^{2} +\frac{1}{8}} \\[6pt] {\dfrac{1}{4}\|{{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j} \|_{F} \leqslant \frac{1}{8}\|{ { \tilde{\mathit{\boldsymbol{\beta}}}}} _{j} \|_{F}^{2} +\frac{1}{8}} \\ \end{cases} \end{equation} $ (41)

将式(40)(41) 代入式(39) 可得:

$ \begin{align} \dot{{V}}_{j}&\leqslant -{{{\mathit{\boldsymbol{K}}}}}_{j1} \int_0^{{{\mathit{\boldsymbol{e}}}}_{j1}} {\frac{{{\sigma}} {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{{\rm 1}}} ^{2} (t)\!-\!({{{\sigma}}\!+\!{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}} )^{2}}} {\rm d}{{\sigma}}\! +\!0.2785n\lambda_{\beta j} b_{j}- \\ &\quad\; k_{j1} \left({\int_0^{{{\mathit{\boldsymbol{e}}}}_{j1}} {\frac{{{\sigma }}{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)}{{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} ^{2} (t)-( {{{\sigma}} +{{{\mathit{\boldsymbol{x}}}}}_{j}^{{\rm r}}} )^{2}}} {\rm d}{ {\sigma}}} \right)^{\xi_{j}} -\\ &\quad\; \frac{\chi_{\beta, j}} {8}\|{{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j} \|_{F}^{2} -{{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} {{{\mathit{\boldsymbol{K}}}}}_{j2} {{\mathit{\boldsymbol{e}}}}_{j2} -k_{j2} \left({{{\mathit{\boldsymbol{e}}}}_{j2}^{\rm T} {{\mathit{\boldsymbol{e}}}}_{j2}} \right)^{\xi_{j}} - \\ &\quad\; \frac{\chi_{j}} {8}\|{{\tilde{\mathit{\boldsymbol{W}}}}}_{j} \|_{F}^{2}-\frac{\chi_{j}} {2} ({\|{{\tilde{\mathit{\boldsymbol{W}}}}}_{j} \|_{F}^{2} } )^{\frac{3}{4}}-\frac{\chi_{\beta, j}} {2} ({\|{{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j} \|_{F}^{2}} )^{\frac{3}{4}}+ \\ &\quad\; \chi_{j} \left({\frac{1}{8}+\frac{1}{2}\left\|{{{\mathit{\boldsymbol{W}}}}}_{j} \right\|_{F}^{2}} \right)+\chi_{\beta, j} \left( {\frac{1}{8}+\frac{1}{2}\|{{\beta}} _{j} \|_{F}^{2}} \right) \\ &\leqslant -\iota_{j3}^{1} V_{j3} -\iota_{j3}^{2} V_{j3}^{\xi_{j}} +\varXi _{j3} \end{align} $ (42)

式中,

$ \begin{align*} &\iota_{j3}^{1} =\min \Bigg\{\lambda_{\min} ({{{\mathit{\boldsymbol{K}}}}}_{j1} ), \frac{2\lambda_{\min} ({{{\mathit{\boldsymbol{K}}}}}_{j2}) }{\lambda_{\max} ({{{\mathit{\boldsymbol{M}}}}}_{{\rm x}j}) }, \\ & \quad \frac{\chi_{j}} {4\lambda_{\max} ({{{\varLambda}} _{j}^{-1}} )}, \frac{\chi_{\beta, j}} {4\lambda_{\max} ({{{\varLambda}} _{\beta, j}^{-1}} )} \Bigg\}\\ &\iota_{j3}^{2}=\min \left\{{k_{j1}, \frac{(2)^{\xi_{j}} k_{j2} }{(\lambda^{\ast}) ^{\xi_{j}}}, \frac{2^{^{{-1}/4}}\chi_{j}} {\lambda _{\max} ^{3/4} ({{\varLambda}} _{j}^{-1}) }, \frac{2^{{-1}/4}\chi _{\beta, j}} {\lambda_{\max}^{3/4} ({{\varLambda}} _{\beta, j}^{-1} )}}\right\} \\ &\varXi_{j3} =\chi_{j} \left(\frac{1}{8}+\frac{1}{2}\|{{{\mathit{\boldsymbol{W}}}}}_{j} \|_{F}^{2} \right)+\chi_{\beta, j} \left(\frac{1}{8}+\frac{1}{2}\|{{\beta}} _{j} \|_{F}^{2}\right) +\\ & \quad 0.2785n\lambda_{\beta j} b_{j} \end{align*} $

定理1:针对非线性遥操作系统式(5),如果初始条件满足$ | {{{{\mathit{\boldsymbol{x}}}}}_{j} (0)} |<|{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (0)| $,且假设1~4成立,则通过式(19)(20)(22) 可得到系统是实用有限时间收敛的。误差信号$ { {{\mathit{\boldsymbol{e}}}}}_{j1}, {{\mathit{\boldsymbol{e}}}}_{j2} $$ {{\tilde{\mathit{\boldsymbol{W}}}}}_{j}, $ $ {{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j} $将会分别收敛到集合$ { \varDelta}_{{{\mathit{\boldsymbol{e}}}}_{j1}}, $ $ { \varDelta}_{{{\mathit{\boldsymbol{e}}}}_{j2}}, $ $ { \varDelta}_{{{\tilde{\mathit{\boldsymbol{W}}}}}_{j}}, $ $ { \varDelta}_{{{\tilde{ {\beta}}}} _{j}} $,系统的输出不会超出时变边界,即$ | {{{{\mathit{\boldsymbol{x}}}}}_{\eta 1}}|<|{{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)| $$ \forall t>0 $,且闭环系统的所有信号均有界。

$ \begin{align*} &{ \varDelta}_{{{\mathit{\boldsymbol{e}}}}_{j1}} =\{{{\mathit{\boldsymbol{e}}}}_{j1} \in {\rm R}^{3\times 1}\Big| \|{{\mathit{\boldsymbol{e}}}}_{j1} \|\leqslant \sqrt{2\varXi_{j}} \}\\ &{ \varDelta}_{{{\mathit{\boldsymbol{e}}}}_{j2}} =\Big\{{{\mathit{\boldsymbol{e}}}}_{j2} \in {\rm R}^{3\times 1}\Big| \|{{\mathit{\boldsymbol{e}}}}_{j2} \|\leqslant \sqrt{{2\varXi_{j} }/{\lambda_{\min} ({{{\mathit{\boldsymbol{M}}}}}_{{\rm x}j}) }} \Big\}\\ &{ \varDelta}_{{{\tilde{\mathit{\boldsymbol{W}}}}}_{j}} =\Big\{{\tilde{\mathit{\boldsymbol{W}}}}_{j} \in {\rm R}^{l\times n}\Big| \|{{\tilde{\mathit{\boldsymbol{W}}}}}_{j} \|\leq \sqrt{{2\varXi_{j}}/{\lambda_{\min} ({{\varLambda}} _{j}^{-1}) }} \Big\}\\ &{ \varDelta}_{{{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j}} =\Big\{{{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j} \in {\rm R}^{l\times n}\Big| \|{{\tilde{\mathit{\boldsymbol{\beta}}}}} _{j} \|\leqslant \sqrt{{2\varXi_{j}}/{\lambda_{\min} ({ {\varLambda}} _{\beta, j}^{-1}) }} \Big\} \end{align*} $

证明:根据不等式(25) 可得:

$ \begin{align*} \frac{1}{2}{{\mathit{\boldsymbol{e}}}}_{j1}^{\rm T}{{\mathit{\boldsymbol{e}}}}_{j1} \leqslant V_{j1} \end{align*} $

据引理1可得,当$ t\to T_{{\rm reach}} $

$ \begin{align*} V_{j} \leqslant \min \left\{{\frac{\varXi_{j3}} {(1-{\rlap{--} \lambda} )\iota_{j3}^{1}}, \left({\frac{\varXi_{j3} }{(1-{\rlap{--} \lambda}) \iota_{j3}^{2}}} \right)^{\frac{1}{\xi_{j}}}} \right\} \end{align*} $

再根据式(30)(33) 可得:

$ \begin{align*} \frac{1}{2}{{\mathit{\boldsymbol{e}}}}_{j1}^{\rm T}{{\mathit{\boldsymbol{e}}}}_{j1} \leqslant V_{jh} \leqslant \min \left\{{\frac{\varXi _{j3}} {(1-{\rlap{--} \lambda}) \iota_{j3}^{1}}, \left( {\frac{\varXi_{j3}} {(1-{\rlap{--} \lambda}) \iota_{j3}^{2}}} \right)^{\frac{1}{\xi_{j}}}} \right\} \end{align*} $

式中$ h=1, 2, 3 $,令

$ \begin{align*} \varXi_{j}=\min \{{{\varXi_{j3}}/({(1-{\rlap{--} \lambda} )\iota_{j3}^{1}}), ({{\varXi_{j3}}/({(1-\varXi_{j3}) \iota_{j3}^{2}})} )^{1/{\xi_{j}}}}\} \end{align*} $

则定理1得证。

注1:在从端,利用神经网络对环境参数进行估计;在主端,利用环境估计参数重建从端的环境力,从而实现主端的操作者对从端的环境力感知。

注2:针对非线性遥操作系统式(5),本文所提出的控制方法同文[31](时变约束)和文[30](常值约束)方法中$ \dot{{V}}\leq-kV+\varXi $形式相比,可以实现对参考轨迹的快速追踪;同文[26] 的方法相比,本文方法更直观,即直接对位置输出进行限制,而文[26] 方法是将位置约束问题转换为误差约束问题,而且本文方法的收敛速度较文[26] 方法更快;与文[32] 方法相比,本文的收敛形式为$ \dot{{V}}({{\varsigma}}) $ $ \leqslant $ $ -\iota_{1} V({{\varsigma}}) -\iota_{2} V^{\xi} ({{\varsigma}}) +\varXi $,而文[32] 中形式为$ \dot{{V}}({{\varsigma }}) $ $ \leqslant $ $ -\iota_{2} V^{\xi} ({{\varsigma}}) +\varXi $,较文[32] 具有更快的收敛速度;且本文针对的是时变输出约束问题,较文[32] 的方法更具有一定的实际意义。

4 仿真和实验验证(Simulation and experimental verification) 4.1 遥操作平台理论模型

为了从理论仿真角度验证算法的有效性,本研究采用一对3自由度的Phantom Omni机器人作为研究对象,其动力学参数设置见表 1,数学模型为[40]

$ \begin{align*} {{{\mathit{\boldsymbol{M}}}}}_{j} &= \begin{bmatrix} {m_{11}} & 0 & 0 \\ 0 & {m_{22}} & {m_{23}} \\ 0 & {m_{32}} & {m_{33}} \\ \end{bmatrix}, \; \; {{{\mathit{\boldsymbol{g}}}}}_{j} = \begin{bmatrix} 0 \\ {\theta_{5} gc_{2} +\theta_{6} gc_{23}} \\ {\theta_{6} gc_{23}} \\ \end{bmatrix}\\ {{{\mathit{\boldsymbol{C}}}}}_{j} &= \begin{bmatrix} {-a_{1} \dot{{q}}_{2}} & {-a_{1} \dot{{q}}_{1}} & {-a_{2} \dot{{q}}_{1}} \\ {a_{1} \dot{{q}}_{1}} & {-a_{3} \dot{{q}}_{3}} & {-a_{3} (\dot{{q}}_{2} +\dot{{q}}_{3}) } \\ {-a_{2} \dot{{q}}_{1}} & {a_{3} \dot{{q}}_{2}} & 0 \\ \end{bmatrix} \end{align*} $
表 1 Phantom Omni装置的动力学参数 Tab. 1 Dynamic parameters of the Phantom Omni device

式中:$ q_{2}, q_{3} $分别为机器人的关节角。

$ \begin{align*} &m_{11} =\theta_{1} +\theta_{2} c_{2}^{2} +\theta_{3} c_{23}^{2} +2\theta _{4} c_{2} c_{23}\\ &m_{22} =\theta_{2} +\theta_{3} +2\theta_{4} c_{3}, \; \; m_{23} =m_{32} =\theta_{3} +\theta_{4} c_{3}\\ &m_{33} =\theta_{3}, \; \; c_{2\times 23} =\cos (2q_{2} +q_{3}) \\ &a_{1} =\theta_{2} c_{2} s_{2} +\theta_{3} c_{23} s_{23} +\theta_{4} c_{2\times 23}\\ &a_{2} =\theta_{3} c_{23} s_{23} +\theta_{3} c_{2} s_{23} \\ &a_{3} =\theta_{4} s_{3}, \; \; s_{2} =\sin q_{2}, \; \; c_{2} =\cos q_{2}, \; \; s_{3} =\sin q_{3}\\ &c_{3} =\cos q_{3}, \; \; s_{23} =\sin (q_{2} +q_{3}), \; \; c_{23} =\cos (q_{2} +q_{3}) \end{align*} $

滤波器参数为:$ c_{1}^{\prime} =10 $$ c_{2}^{\prime} =c_{3}^{\prime} =100 $$ T_{{\rm f}} $$ T_{{\rm b}} $分别为前馈和反馈时延:

$ \begin{align*} &T_{{\rm f}} =0.5+0.001\sin (18t)+0.01\sin (16t)+\\ &\quad\quad0.015\sin (13t)s \\ &T_{{\rm b}} =0.35+0.008\sin (17t)+0.012\sin(12t)s\\ &{{\mathit{\boldsymbol{f}}}}_{j}^{{\rm f}} ({{\dot{{{\mathit{\boldsymbol{q}}}}}}}_{j}) =0.3\left({\tanh (0.6{\rm d}{{\mathit{\boldsymbol{q}}}}_{j}) -\tanh (0.1{\rm d}{{\mathit{\boldsymbol{q}}}}_{j}) } \right)+\\ & \quad 0.2\tanh (0.4{\rm d}{{\mathit{\boldsymbol{q}}}}_{j})+0.1{\rm d}{{\mathit{\boldsymbol{q}}}}_{j}\\ &{{\delta}} _{j} ({{{\mathit{\boldsymbol{q}}}}}_{j}, {{\dot{{{\mathit{\boldsymbol{q}}}}}}}_{j}, t)=\big[0.1q_{j1} dq_{j1} \sin t, \\ &\; 0.1q_{j2} dq_{j2} \sin t, \; 0.1q_{j3} dq_{j3} \sin t\big] \end{align*} $

分别为摩擦力和外部扰动,后续理论仿真环节将依据此模型展开。

4.2 理论仿真

在仿真阶段,设定操作力$ {{{\mathit{\boldsymbol{F}}}}}_{{\rm h}} $和环境力$ {{{\mathit{\boldsymbol{F}}}}}_{{\rm e}} $为:$ {{{\mathit{\boldsymbol{F}}}}}_{{\rm h}} =[0.14\sin t+0.1, \; 0.12\cos t+0.05, \; 0.07\sin t+0.04]^{\rm T} $$ {{{\mathit{\boldsymbol{F}}}}}_{{\rm e}} =[0.05\sin t, \; 0.04\cos t, \; 0.03\sin t]^{\rm T} $。主从端关节角速度初值均为0,主端的关节角初值为$ {{\mathit{\boldsymbol{q}}}}_{{\rm m}} (0)=[-17.19, \; 24.06, \; 15.47]^{\rm T} $,从端的关节角初值为$ {{\mathit{\boldsymbol{q}}}}_{{\rm s}} (0)=[{\rm 17.19, \; 28.65, \; -9.74}]^{\rm T} $,时变输出边界设为$ {{\mathit{\boldsymbol{k}}}}_{{\rm c}_{1}} (t)=[0.115+0.02\sin t $, $ 0.07+0.02\sin t $, $ 0.07+0.01 \cos t] $,主从端控制器的参数选取为

$ \begin{align*} k_{j1} &=0.45, \; k_{j2} =2.85, \; b_{j}=20, \; \; \chi_{j} =\chi_{\beta, j} =0.001\\ {{{\mathit{\boldsymbol{K}}}}}_{j1} &={\rm diag\:}(5, 5, 5), \; {{{\mathit{\boldsymbol{K}}}}}_{j2} ={\rm diag\:}(5, 5, 5), \; \xi_{j} =0.595\\ {{\varLambda}} _{\beta, j} &={\rm diag\:}(350, 400, 450), \; \; {{\varGamma }}_{{\rm e}} ={\rm diag\:}(50, 50, 50) \end{align*} $

$ {{\varLambda}} _{j} \in {\rm R}^{153\times 153} $为对角矩阵,其维数由神经网络的节点数决定,神经网络$ {{{\mathit{\boldsymbol{W}}}}}_{i}^{\rm T} {{{\mathit{\boldsymbol{S}}}}}_{i} ({{\mathit{\boldsymbol{X}}}}_{j}) $中的$ {{{\mathit{\boldsymbol{X}}}}}_{j} \in {\rm R}^{4} $包含节点数为$ 51 $,其中心均位于$ [-5, 5]\times [-5, 5]\times [-5, 5]\times [-5, 5] $中,宽度为$ 0.2 $。用于估计环境参数的神经网络$ {{{\mathit{\boldsymbol{W}}}}}_{{\rm e}}^{\rm T} {{{\mathit{\boldsymbol{S}}}}}_{{\rm e}} ({{\mathit{\boldsymbol{X}}}}_{{\rm e}}) $中的$ {{\mathit{\boldsymbol{X}}}}_{{\rm e}} \in {\rm R}^{2} $同样包含51个节点,其中心也位于$ [-5, 5]\times [-5, 5] $中,宽度也为0.2。

在从端,利用神经网络估计环境参数并将其传递到主端。假设从端能很好地跟踪主端的位置信息,因此,利用虚拟的环境参数和主端的运动信息可实现对环境力的重建。真实环境力和重建环境力轨迹如图 3所示,其重建效果良好,但是二者轨迹存在一定的相位差,这是由于从端的环境参数需要经$ T_{{\rm b}} $时延传递到主端。随后,基于操作者行为的目标阻抗模型,利用重建的环境力和主端施加的操作力,可产生主端的参考轨迹$ {{{\mathit{\boldsymbol{x}}}}}_{{\rm m}}^{{\rm r}} $

图 3 环境力重建和时变时延 Fig.3 Environment force reconstruction and time-varying delay

主从端机器人对参考轨迹的追踪效果见图 4图 5图 6为主从机器人相对于参考轨迹的跟踪误差,图 7为控制输入。由图 4~图 6可得:基于时变输出的有限时间控制器可以保证主从机器人对参考轨迹的有限时间追踪,其轨迹不会超出设定边界,追踪误差收敛在较小的域内,同时控制输入大小符合机器人的实际输出。在仿真初级阶段,从端的跟踪效果较主端差,这是因为在$ T_{{\rm f}} $之前,从端的参考轨迹一直为0,在$ T_{{\rm f}} $时刻突然增大;而在$ T_{{\rm f}} $之后,主从端对参考轨迹的追踪效果会越来越好。

图 4 仿真过程中x-y轴上的追踪效果 Fig.4 Tracking effect in the x-y axes during the simulation
图 5 仿真过程中z轴和3D空间的追踪效果 Fig.5 Tracking effect in the z axis and 3D space during the simulation
图 6 仿真过程中x-y-z轴上的追踪误差 Fig.6 Tracking deviation in the x-y-z axes during the simulation
图 7 仿真过程中本文方法的控制输入 Fig.7 Control input of the proposed method during the simulation

为验证本文控制器的可行性并凸显其优点,将此方法和其他研究成果进行对比,见表 2表 2中,文[30] 和文[31] 均采用直接法来处理约束问题,但文[31] 针对的是时变约束问题;对比文[26] 和文[32] 的方法,文[32] 采用直接法来处理约束问题,且收敛速度较文[26] 方法要快。本研究选取文[31] 和文[32] 的方法进行理论仿真对比。同时,为确保理论仿真结果的有效性,分别从2种情形分析:其一,在各种控制力矩相当的情况下,对比控制精度和收敛速度;其二,在控制精度及收敛速度相当的情况下,对比各控制器的力矩大小。在仿真阶段以上2种情形下机器人的初始位置和速度均相同,各种不确定性及外部干扰均相同。

表 2 方法对比 Tab. 2 The comparison of methods

情形1:文[31] 方法的主要控制参数为:$ {{{\mathit{\boldsymbol{K}}}}}_{j2} ={\rm diag\:} (15, 15, 15) $$ {{{\mathit{\boldsymbol{K}}}}}_{j2} = {\rm diag\:} (28, 28, 28) $,文[32] 的主要控制参数为:$ k_{j1} =0.45 $$ k_{j2} =3.5 $$ \xi_{j} =0.595 $。控制器中环境力和操作者力大小、控制器中神经网络项和鲁棒项的参数与本文控制器相同。文[31] 和文[32] 所采用方法的仿真结果见图 8~图 13

图 8 文[31] 方法在x-y轴上的追踪效果 Fig.8 Tracking effect in the x-y axes by the method in literature [31]
图 9 文[31] 方法在z轴和3D空间的追踪效果 Fig.9 Tracking effect in the z axis and 3D space by the method in literature [31]
图 10 文[32] 方法在x-y轴上的追踪效果 Fig.10 Tracking effect in the x-y axes by the method in literature [32]
图 11 文[32] 方法在z轴和3D空间的追踪效果 Fig.11 Tracking effect in the z axis and 3D space by the method in literature [32]
图 12 文[31] 方法在x-y-z轴上的追踪误差 Fig.12 Tracking deviation in the x-y-z axes by the method in literature [31]
图 13 文[32] 方法在x-y-z轴上的追踪误差 Fig.13 Tracking deviation in the x-y-z axes by the method in literature [32]

图 6图 12可得,与文[31] 方法相比,本文方法可确保主从端机器人在$ x $-$ y $-$ z $轴上的追踪误差均较小,且能在有限时间内实现对参考轨迹的追踪;文[31] 的方法虽然可以通过调节所使用的参数在一定程度上减小误差,但是其控制力矩在系统初始阶段很大,这点可从理论仿真与文[31] 的仿真结果得到验证;由图 6图 13可得,本文方法与文[32] 方法的稳态误差均较小,数量级相当且为$ 10^{-5}\;{\rm m} $,二者都能在有限时间内实现对参考轨迹的追踪;但本文方法在有限时间内的收敛形式为:$ \dot{{V}}({{\varsigma}}) \leqslant -\iota_{1} V({{\varsigma}}) -\iota_{2} V^{\xi} ({{\varsigma}}) +\varXi $,而文[32] 方法的收敛形式为$ \dot{{V}}({{\varsigma}})\leqslant -\iota_{2} V^{\xi} ({{\varsigma}}) +\varXi $,因此本文方法较文[32] 方法的收敛速度更快,同时,从图 4图 5图 10图 11的对比来看,该结论成立;文[32] 方法仅能处理常值输出约束问题,而本文方法可解决时变输出约束问题,常值约束问题仅为时变约束问题的特殊形式。综合以上对比分析,本文方法可以在保证系统稳定性的前提下,对系统的稳态性能和暂态性能有一定提升。因此,本文方法较对比方法具有更强的普适性和实际意义。

情形2:以本文控制精度为标准,文[31] 所采用方法的主要控制参数为:$ {{{\mathit{\boldsymbol{K}}}}}_{j2} ={\rm diag}\: (665, $ $ 665, $ $ 665) $$ {{{\mathit{\boldsymbol{K}}}}}_{j2} ={\rm diag\:}(278, 278, 278) $,由情形1仿真结果可得,文[32] 方法的控制精度与本文方法相当,其主要控制器参数同情形1。文[31] 和文[32] 方法的仿真结果见图 14图 15

图 14 文[31] 方法的控制输入 Fig.14 Control input of the method in literature [31]
图 15 文[32] 方法的控制输入 Fig.15 Control input of the method in literature [32]

图 14可得,在稳态误差相当的情况下,在系统稳定后,文[31] 方法的控制输入较为平滑且稳定在$ \pm $ 0.2 N$ \cdot $m,但是在系统稳定前,其数值高达1 500 N$ \cdot $m,远远超出了机器人的实际输出,尽管其收敛速度远远快于本文方法和文[32] 的方法,但失去了实际意义,故不可取;文[32] 方法的控制输入与本文方法相当,但是收敛速度较本文方法慢(见情形1)。

综合以上2种情形,本文方法较文[31] 和文[32] 的方法在稳态误差和收敛速度上均有一定程度的提升,即该方法在理论上具有一定的有效性。

4.3 实验结果

为了进一步验证该算法的可靠性,本研究利用2台Phantom Omni机器人搭建简易的地面遥操作实验平台,如图 16所示。主从机器人通过局域网连接,其采样频率均为1000 Hz, 采取Matlab软件中的可视化仿真工具Simulink和C语言联合编程的思想,具体思路如下:利用C语言调用机器人的应用程序接口(application programming interface,API)获取位置和速度等信息,在Simulink中搭建控制器,然后将控制器的输出施加在机器人关节角上,驱动其追踪参考轨迹,实验结果见图 17~图 20。由于Phantom Omni机器人末端没有力传感器,所以本文研究采取半实物仿真,即在Simulink中构建虚拟环境力,$ {{{\mathit{\boldsymbol{F}}}}}_{{\rm h}} $$ {{{\mathit{\boldsymbol{F}}}}}_{{\rm e}} $的大小同理论仿真相同,为了体现状态变量和约束间的关系$ k_{c1} =[0.125+0.02\sin t, 0.125+0.02\sin t, $ $ 0.09+0.01\times \cos t] $

图 16 遥操作系统实验平台 Fig.16 Experimental platform of the teleoperation system
图 17 本文方法在x-y轴的追踪效果 Fig.17 Tracking effect in the x-y axes by the proposed method
图 18 本文方法在z轴和3D空间的追踪效果 Fig.18 Tracking effect in the z axis and 3D space by the proposed method
图 19 本文方法在x-y-z轴上的追踪误差 Fig.19 Tracking deviation in the x-y-z axes by the proposed method
图 20 本文方法的控制输入 Fig.20 Control input of the proposed method

图 17图 18中可看出,在$ x $-$ y $-$ z $轴上,主从端机器人均可实现对参考轨迹的追踪,在3维空间的追踪效果如图 18所示。同主端相比,从端的运动轨迹存在相位差,这是时延$ T_{{\rm f}} $造成的。图 19为主从端机器人的追踪误差图,从图中可得$ x $-$ y $-$ z $轴上误差均较小。图 20为实验中关节角的控制输入,其中存在抖振现象,这是控制律式(20) 中第2项和第5项造成的,其中$ \xi_{j} $$ j\in \{{\rm m, s}\} $)减小时,收敛的误差减小,且收敛速度更快,但是控制输入的抖振现象会愈加明显;当$ \xi_{j} $$ j\in \{{\rm m, s}\} $)增大时,反之。因此,选取合适的$ \xi_{j} $对控制效果的好坏具有重要影响。最终,以上实验结果表明了该方法可确保主从机器人的稳定性,并保证其较好的追踪效果,且输出不会超出设定的时变边界。

5 结论(Conclusion)

针对空间遥操作系统中存在的操作时间和操作空间约束问题,本文提出了一种基于IBLF时变输出约束的有限时间控制方法,实现了主从端位置的有限时间同步追踪,且保证了系统的输出不会超出时变边界。本文研究与传统的BLF方法相比,更加直观,与常值约束相比,更加贴合实际。但是,本研究也存在一定的不足:其一,实验平台较真实的空间遥操作系统有一定差距;其二,由于时延的存在,主端无法实时感受到从端和环境之间的交互力。针对以上不足,未来的工作将尽可能地模拟空间微重力环境,研发空间飘浮基座的从端遥操作子系统,进一步验证该控制算法;同时,也将利用Unity3D平台构建从端的虚拟视景,进一步提高遥操作系统的可操作性和透明性。

参考文献(References)
[1]
Imaida T, Yokokohji Y, Doi T, et al. Ground-space bilateral teleoperation of ETS-ⅤⅡ robot arm by direct bilateral coupling under 7-s time delay condition[J]. IEEE Transactions on Robotics and Automation, 2004, 20(3): 499-511. DOI:10.1109/TRA.2004.825271
[2]
闫海江, 范庆玲, 康志宇, 等. DARPA地球静止轨道机器人项目综述[J]. 机器人, 2016, 38(5): 632-640.
Yan H J, Fan Q L, Kang Z Y, et al. Review of DARPA's geostationary earth orbit robotic programs[J]. Robot, 2016, 38(5): 632-640.
[3]
Chen H F, Huang P F, Liu Z X. Mode switching based symmetric predictive control mechanism for networked teleoperation space robot system[J]. IEEE/ASME Transactions on Mechatronics, 2019, 24(6): 2706-2717. DOI:10.1109/TMECH.2019.2946197
[4]
Wang Z, Lam H K, Xiao B, et al. Event-triggered prescribedtime fuzzy control for space teleoperation systems subject to multiple constraints and uncertainties[J]. IEEE Transactions on Fuzzy Systems, 2020, 29(9): 2785-2797.
[5]
Chen H, Liu Z. Time-delay prediction-based smith predictive control for space teleoperation[J]. Journal of Guidance, Control, and Dynamics, 2021, 44(4): 872-879. DOI:10.2514/1.G005714
[6]
王学谦, 梁斌, 徐文福, 等. 空间机器人遥操作地面验证技术研究[J]. 机器人, 2009, 31(1): 8-14.
Wang X Q, Liang B, Xu W F, et al. Ground-based verification technology for teleoperation of space robot[J]. Robot, 2009, 31(1): 8-14. DOI:10.3321/j.issn:1002-0446.2009.01.002
[7]
Kebria P M, Abdi H, Dalvand M M, et al. Control methods for Internet-based teleoperation systems: A review[J]. IEEE Transactions on Human-Machine Systems, 2018, 49(1): 32-46.
[8]
Lee D, Spong M W. Passive bilateral teleoperation with constant time delay[J]. IEEE Transactions on Robotics, 2006, 22(2): 269-281. DOI:10.1109/TRO.2005.862037
[9]
Zhang B, Kruszewski A, Richard J P. H robust control design for teleoperation systems[J]. IFAC Proceedings Volumes, 2012, 45(13): 666-671. DOI:10.3182/20120620-3-DK-2025.00057
[10]
Yang C G, Wang X J, Li Z J, et al. Teleoperation control based on combination of wave variable and neural networks[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2016, 47(8): 2125-2136.
[11]
Yang H J, Liu L, Wang Y J. Observer-based sliding mode control for bilateral teleoperation with time-varying delays[J]. Control Engineering Practice, 2019, 91. DOI:10.1016/j.conengprac.2019.07.015
[12]
Huang F, Zhang W, Chen Z, et al. RBFNN-based adaptive sliding mode control design for nonlinear bilateral teleoperation system under time-varying delays[J]. IEEE Access, 2019, 7: 11905-11912. DOI:10.1109/ACCESS.2019.2891887
[13]
Yang Y N, Hua C C, Guan X. Finite time control design for bilateral teleoperation system with position synchronization error constrained[J]. IEEE Transactions on Cybernetics, 2016, 46(3): 609-619. DOI:10.1109/TCYB.2015.2410785
[14]
Niemeyer G, Slotine J J E. Stable adaptive teleoperation[J]. IEEE Journal of Oceanic Engineering, 1991, 16(1): 152-162. DOI:10.1109/48.64895
[15]
He W, Amoateng D O, Yang C, et al. Adaptive neural network control of a robotic manipulator with unknown backlashlike hysteresis[J]. IET Control Theory and Applications, 2017, 11(4): 567-575. DOI:10.1049/iet-cta.2016.1058
[16]
Wang H Q, Liu P X P, Liu S C. Adaptive neural synchronization control for bilateral teleoperation systems with time delay and backlash-like hysteresis[J]. IEEE Transactions on Cybernetics, 2017, 47(10): 3018-3026. DOI:10.1109/TCYB.2016.2644656
[17]
Yang Y N, Hua C C, et al. Adaptive fuzzy finite-time coordination control for networked nonlinear bilateral teleoperation system[J]. IEEE Transactions on Fuzzy Systems, 2014, 22(3): 631-641. DOI:10.1109/TFUZZ.2013.2269694
[18]
Wang Z W, Tao X. Backstepping based robust control for space tele-robot systems with finite-time convergence[C]//IEEE International Conference on Robotics and Biomimetics. Piscataway, USA: IEEE, 2018: 1419-1424.
[19]
Zhang H C, Song A G, Li H J, et al. Novel adaptive finite-time control of teleoperation system with time-varying delays and input saturation[J]. IEEE Transactions on Cybernetics, 2021, 51(7): 3724-3737. DOI:10.1109/TCYB.2019.2924446
[20]
Zhai D H, Xia Y. Adaptive finite-time control for nonlinear teleoperation systems with asymmetric time-varying delays[J]. International Journal of Robust and Nonlinear Control, 2016, 26(12): 2586-2607. DOI:10.1002/rnc.3462
[21]
Shen H, Pan Y J. Improving tracking performance of nonlinear uncertain bilateral teleoperation systems with time-varying delays and disturbances[J]. IEEE/ASME Transactions on Mechatronics, 2020, 25(3): 1171-1181. DOI:10.1109/TMECH.2019.2962663
[22]
Yang Y, Hua C, Guan X. Synchronization control for bilateral teleoperation system with prescribed performance under asymmetric time delay[J]. Nonlinear Dynamics, 2015, 81(1): 481-493.
[23]
Ilchmann A, Schuster H. PI-funnel control for two mass systems[J]. IEEE Transactions on Automatic Control, 2009, 54(4): 918-923. DOI:10.1109/TAC.2009.2013013
[24]
Tee K P, Ren B, Ge S S. Control of nonlinear systems with timevarying output constraints[J]. Automatica, 2011, 47(11): 2511-2516. DOI:10.1016/j.automatica.2011.08.044
[25]
Tee K P, Ge S S, Tay E H. Barrier Lyapunov functions for the control of output-constrained nonlinear systems[J]. Automatica, 2009, 45(4): 918-927. DOI:10.1016/j.automatica.2008.11.017
[26]
Yu X B, Li Y N, Zhang S, et al. Estimation of human impedance and motion intention for constrained human-robot interaction[J]. Neurocomputing, 2020, 390: 268-279. DOI:10.1016/j.neucom.2019.07.104
[27]
Tee K P, Ge S S. Control of state-constrained nonlinear systems using integral barrier Lyapunov functionals[C]//51st IEEE Conference on Decision and Control. Piscataway, USA: IEEE, 2012: 3239-3244.
[28]
Tang Z L, Ge S S, Tee K P, et al. Robust adaptive neural tracking control for a class of perturbed uncertain nonlinear systems with state constraints[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2016, 46(12): 1618-1629. DOI:10.1109/TSMC.2015.2508962
[29]
Liu Y J, Tong S, Chen C L P, et al. Adaptive NN control using integral barrier Lyapunov functionals for uncertain nonlinear block-triangular constraint systems[J]. IEEE Transactions on Cybernetics, 2016, 47(11): 3747-3757.
[30]
He W, Xue C, Yu X, et al. Admittance-based controller design for physical human-robot interaction in the constrained task space[J]. IEEE Transactions on Automation Science and Engineering, 2020, 17(4): 1937-1949. DOI:10.1109/TASE.2020.2983225
[31]
Liu L, Gao T T, Liu Y J, et al. Time-varying IBLFs-based adaptive control of uncertain nonlinear systems with full state constraints[J]. Automatica, 2021, 129(4): 918-927.
[32]
Wei Y, Zhou P, Wang Y, et al. IBLF-based adaptive finite-time neural backstepping control of an autonomous airship with full state constraints[C]//IEEE 9th Data Driven Control and Learning Systems Conference. Piscataway, USA: IEEE, 2020: 162-166.
[33]
Makkar G, Hu W, Sawyer W G, et al. Lyapunov-based tracking control in the presence of uncertain nonlinear parameterizable friction[J]. IEEE Transactions on Automatic Control, 2007, 25(10): 1988-1994.
[34]
Chen Z, Pan Y J, Gu J. Integrated adaptive robust control for multilateral teleoperation systems under arbitrary time delays[J]. International Journal of Robust and Nonlinear Control, 2016, 26(12): 2708-2728. DOI:10.1002/rnc.3472
[35]
Silva J A, Ramirez R O A, Vega V P. PHANToM OMNI haptic device: Kinematic and manipulability[C]//Electronics, Robotics and Automotive Mechanics Conference. Piscataway, USA: IEEE, 2009: 193-198.
[36]
Spong M W, Hutchinson S, Vidyasagar M. Robot modeling and control[M]. New York, USA: Wiley, 2006.
[37]
Yu J, Shi P, Zhao L. Finite-time command filtered backstepping control for a class of nonlinear systems[J]. Automatica, 2018, 92: 173-180. DOI:10.1016/j.automatica.2018.03.033
[38]
Polushin I G, Liu P X, Lung C H. A control scheme for stable force-reflecting teleoperation over IP networks[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics, 2006, 36(4): 930-939. DOI:10.1109/TSMCB.2005.861878
[39]
He W, David A O, Yin Z, et al. Neural network control of a robotic manipulator with input deadzone and output constraint[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2015, 46(6): 759-770.
[40]
Ma Z Q, Liu Z X, Huang P F. Fractional-order control for uncertain teleoperated cyber-physical system with actuator fault[J]. IEEE/ASME Transactions on Mechatronics, 2021, 26(5): 2472-2482. DOI:10.1109/TMECH.2020.3039967