空间机器人最优能耗捕获目标的自适应跟踪控制

目录摘要全文 图/表

PDF

DOI：10.13973/j.cnki.robot.210236

引用本文

柳强, 金明河, 刘宏, 王滨. 空间机器人最优能耗捕获目标的自适应跟踪控制[J]. 机器人, 2022, 44(1): 77-89.

LIU Qiang, JIN Minghe, LIU Hong, WANG Bin. Adaptive Tracking Control for Space Robots with Optimal Energy-Consumptions to Capture a Target[J]. ROBOT, 2022, 44(1): 77-89.

空间机器人最优能耗捕获目标的自适应跟踪控制

柳强 , 金明河 , 刘宏 , 王滨

哈尔滨工业大学机器人技术与系统国家重点实验室, 黑龙江哈尔滨 150001

收稿日期：2021-05-31；录用日期：2021-10-28; 修回日期：2021-10-29

基金项目：国家自然科学基金创新研究群体科学基金（51521003）；机器人技术与系统国家重点实验室自主计划（SKLRS202014B）。

作者简介：柳强(1992-), 男, 博士, 讲师。研究领域: 空间机器人, 多体动力学, 轨迹规划, 机械臂控制;
金明河(1971-), 男, 博士, 教授。研究领域: 空间机器人, 底层开发, 机械臂控制, 太空遥操作;
刘宏(1966-), 男, 博士, 教授。研究领域: 空间机器人, 底层开发, 机械臂控制, 灵巧手, 太空维修。

通信作者：柳强, 14s008022@hit.edu.cn。

摘要：提出了一种能够引导末端执行器以期望速度跟踪目标的轨迹规划方法。该方法可以实现避障并满足关节限制要求。基于轨迹规划方法，设计了一种利用自由飘浮空间机器人跟踪与捕获章动自旋卫星的自适应控制策略。此外，该控制策略还考虑了最优能耗、测量误差和优化误差。首先，为了使执行器的跟踪误差和机械臂的能耗最小，将空间机器人的控制策略描述为一个关于关节速度、力矩和避障距离的不等式约束优化问题。然后，推导出一个系数为下三角矩阵的显式状态方程，并对目标函数进行解耦和线性化。设计了一种关节速度和力矩分段优化方法去代替传统的凸二次规划方法求解最优问题，这种方法具有较高的计算效率。最后，利用李雅普诺夫稳定性理论验证了所提控制方法的收敛性。

关键词：空间机器人最优自适应跟踪控制最优能耗动力学解耦与线性化

中图分类号：V416.6 文献标志码：A 文章编号：1002-0446(2022)-01-0107-22

Adaptive Tracking Control for Space Robots with Optimal Energy-Consumptions to Capture a Target

LIU Qiang , JIN Minghe , LIU Hong , WANG Bin

State Key Laboratory of Robotics and System, Harbin Institute of Technology, Harbin 150001, China

Abstract: A trajectory planning method is proposed to regulate the manipulator to track the target with the desired velocity. The proposed method can achieve the obstacle avoidance while satisfying joint limits. Based on the trajectory planning method, an adaptive control strategy is designed, by which the free-floating space robot can track and capture a nutational and rotational satellite. In addition, the optimal energy-consumption, measurement errors and optimization errors are considered in the control strategy. Firstly, in order to minimize the end-effector tracking error and manipulator energy-consumption, the space robot control strategy is described as an optimization problem with inequality constraints about the joint velocity, torques and the distance from the obstacles. Then, an explicit state equation with a lower triangular matrix is derived, and the objective function is decoupled and linearized. A piecewise optimization method for the joint velocity and torque is designed to replace the traditional convex quadratic programming method to solve the optimal problem, which demonstrates high computational efficiency. The convergence of the proposed control strategy is verified by Lyapunov stability theory.

Keywords: space robot optimal adaptive tracking control optimal energy-consumption dynamics decoupling and linearization

1 引言（Introduction）

空间机器人装有机械臂和末端执行器，可以完成空间救援、加油和飞船维修等复杂的空间任务。执行任务时，空间机器人需要具有自适应跟踪捕获目标的能力，而这种能力是空间操作的基础。当空间机器人开始捕获目标时，系统的喷气装置会关闭。在这种情况下，末端执行器的接近、跟踪运动将干扰不受控的基座^[1]。此外，动力学方程的耦合、非线性和参数变化也会导致末端执行器跟踪精度变差，这严重影响了空间机器人的精细操作^[2]。因此，在这些情况下，空间机器人实现末端执行器的高性能跟踪成为一个挑战性的课题。此外，空间机器人的机械臂能耗问题也被广泛关注。因此，在设计自适应跟踪控制器时，需要同时考虑以上这些问题。

空间机器人的控制具有2个难点。一个难点是空间机器人的动力学耦合问题。对于空间机器人动力学方程来说，飞行器和机械臂的运动既取决于动力学方程，也取决于运动学方程，这种互相关联、互相影响被称为动力学耦合^[3]。这种动力学耦合将导致机械臂与飞行器的运动不协调。为了解决这种不协调问题，可采用卡尔曼滤波器去预测目标的运动状态，利用预测结果来规划机械臂的轨迹^[4-5]。这种方法忽视了动力学建模，只规划末端执行器的运动轨迹。滑模控制和模型预测控制是处理耦合问题的常用方法，它们可以在一定程度上减少航天器姿态和机械臂运动之间的耦合带来的不利影响^[6]。然而，这些方法都需要一个精确的、解耦的动力学模型。为了分析和量化动力学耦合程度，一些文献提出了动态耦合因子、耦合椭球面和可操作度等指标^[7]。这些指标量化了动力学参数、连杆长度和关节变量对空间机器人耦合的影响，可用于机器人捕获目标的优化问题中。

另一个难点是空间机器人动力学模型的非线性。从动力学方程分析，这主要是关节力矩既存在于等号右边的输入项中，又存在于等号左边的偏置力项中，导致其无法成为独立项。对此，文[8]提出一种自适应变结构控制器来处理模型的这些非线性参数，但这种控制策略会产生抖振效应。采用最小二乘法估计了动力学回归方程的系数矩阵，把动力学方程近似为一组物理参数的线性方程。然而，这种方法对于复杂构形或多关节机器人来说，很难实现，复杂度极高^[9]。动力学方程线性化之所以重要，是因为它被用在状态方程中，包括扩展卡尔曼滤波器^[5]或神经网络中的状态估计器^[10]。然而，由于动力学方程的系数矩阵是时变的，状态估计器很难获得满意的精度，特别是在采样时间较长的情况下。以往大多数关于动力学非线性的研究都是基于运动学层面的控制，当考虑到电机扰动、关节摩擦的影响时，动力学的非线性将变得更强。为了解决这个问题，可采用自适应模糊系统将动力学方程非线性项近似为关节角、速度和力矩的函数。通过这种方式，也可以处理电机和关节的扰动^[11]。不幸的是，这种基于自适应模糊系统的控制器输出的转矩依然会导致抖振现象。这种抖振问题可以通过在切换表面周围引入边界层来缓解，但跟踪性能会恶化^[12]。还有方法将模型参数化为机械臂质量、惯量和长度的函数，但该方法存在严重的不确定性，无法应用于复杂条件和多关节机器人^[13]。

动力学不确定性也可能严重破坏基于模型的控制方案的跟踪精度，甚至导致闭环机器人系统的不稳定行为^[14]。这种不确定性的原因是多方面的，包括优化误差、测量误差带来的不确定性，此外还有外界未知扰动、本体参数变化等不确定性。总的来说，在动力学方程的线性化方面，以往的研究大多倾向于采用智能算法对一些关键参数进行学习、拟合和近似，或者研究可以直接导出符号公式的简单构形机器人。为了避免动力学方程的复杂推导，一些研究人员基于动量守恒和速度雅可比矩阵^[15-20]来研究动力学。这些方法难以应用于空间机器人和复杂构形机器人。许多研究者同样认为动力学模型的线性化和解耦对于现代控制理论是至关重要的^[9]。然而，关于空间机器人的显式线性解耦方程的研究成果却较少。

空间机器人控制策略除了考虑非线性、耦合和不确定性对跟踪精度造成的影响外，还需要同时考虑机械手的能耗问题。在太空中，航天器推进器储备的能量是有限的。驱动机械臂运动是需要消耗能量的。通过比较几种控制方法的能耗，得出飘浮飞行器比受控飞行器能耗低的结论^[21]。文[22]对机械臂的能耗优化进行了研究和分析。遗憾的是，在能源消耗方面，这只是基于最优积分滑模控制的一种改进方法，较少的能源消耗只是一个附属结论。此外，一些研究将机械臂能耗表述为约束最优控制问题，利用逆雅可比矩阵离线粗略计算输入关节力矩^[23-24]。这种离线粗略估计，会给系统带来不确定性和奇异性，导致跟踪误差较大。

针对上述问题，本文提出一种空间机器人自适应跟踪控制策略。该方法将空间机器人跟踪动力学方程线性化并解耦为显式方程，提高了控制方法的效率和精度。该控制器避免了加速度规划和速度测量，直接计算末端执行器的未来速度，具有工程意义。本文除了考虑控制器的跟踪精度外，还考虑了控制器的能耗。因此，还研究了自适应跟踪控制器设计中的能量效率问题。本文的主要贡献如下：

1) 将系统动力学线性化并解耦，得到显式状态方程。状态方程将关节力矩从动力学中解耦，并描述了力矩与末端执行器速度之间的线性相关关系。

2) 在耦合、非线性、不确定性和任务约束条件下，提出了一种自适应跟踪控制策略。该方法可以实现避碰，避免了对目标加速度和速度的测量，对实际工程项目具有一定的指导意义。用李雅普诺夫函数证明了该控制策略的收敛性。

3) 将空间机器人的能耗问题视为一个约束最优控制问题，提出了一种具有相同跟踪性能但能耗较少的最优控制器。

2 运动学与动力学模型（Kinematic and dynamic models）

目前，大部分空间机器人都装有简单构形的机械臂，如平面机械臂和少关节机械臂。对于这些机械臂，很容易建立数学模型并进行验证。对于复杂构形操作机，一般会采用迭代法推导出耦合和非线性的动力学模型。为了避免推导动力学模型，许多研究人员基于动量守恒和速度雅可比矩阵等方法推导了动力学模型，但误差的不确定性将导致控制器不准确。本文对动力学方程中包含的所有力矩项求导，然后将关节力矩解耦为独立项，并从动态方程中解耦出来，得到了末端执行器速度与关节力矩之间的动力学线性方程。

2.1 运动学

本文将研究一个具有7关节机械臂的空间机器人。飞行器基座、机械臂各主体和末端执行器依次连接。基座编号0，机械臂机构编号从1到$ N -1 $，末端执行器编号$ N $。关节也从1到$ N $ 编号，如图 1所示。基坐标系$ \{O_{0}\} $ 位于质心，$ \{O_{7}\} $ 被定义为末端执行器坐标系。根据改进的D-H（Denavit-Hartenberg）模型定义了以上机械臂的坐标系。

图 1 空间机器人的几何模型 Fig.1 The geometric model of the space robot

这里采用一种紧凑的符号来研究刚体运动学：

$ \begin{align} {\mathit{\boldsymbol{v}}} = \left[ {\begin{array}{*{20}{c}} \underline{\mathit{\boldsymbol{\omega}}}\\ \underline{\mathit{\boldsymbol{v}}} \end{array}} \right], \; \; \; {\mathit{\boldsymbol{f}}} = \left[ {\begin{array}{*{20}{c}} \underline{\mathit{\boldsymbol{n}}}\\ \underline{\mathit{\boldsymbol{f}}} \end{array}} \right], \; \; \; {\mathit{\boldsymbol{a}}} = \left[ {\begin{array}{*{20}{c}} \underline{\dot{\mathit{\boldsymbol{\omega}}}}\\ \underline{\dot{\mathit{\boldsymbol{v}}}} - \underline{\mathit{\boldsymbol{\omega}}} \underline{\times} \underline{\mathit{\boldsymbol{v}}} \end{array}} \right] \in \mathbb{R}^{6 \times 1} \end{align} $

(1)

其中$ \underline{\mathit{\boldsymbol{\omega}}}, \underline{\mathit{\boldsymbol{v}}}, \underline{\mathit{\boldsymbol{n}}}, \underline{\mathit{\boldsymbol{f}}} $ 分别是基坐标系$ \{O_{0}\} $ 下刚体的角速度、线速度、力矩和力，$ \underline\times $ 是笛卡儿叉乘算子。图 1中，$ \dot{\mathit{\boldsymbol{\theta}}}=[{\dot{\theta}_{1}, \cdots, \dot{\theta}_{i}}]^{\rm T} $ 表示关节角速度，末端相对于本体系$ \{O_{i}\} $ 的雅可比矩阵$ {\mathit{\boldsymbol{S}}}_{i\rm J} =[{}^{i}{\mathit{\boldsymbol{X}}}_{1} \cdot {\mathit{\boldsymbol{S}}}_{1}, \cdots, $ $ {}^{i}{\mathit{\boldsymbol{X}}}_{i-1} \cdot {\mathit{\boldsymbol{S}}}_{i-1}, {\mathit{\boldsymbol{S}}}_{i}] $，本体系$ \{O_{i}\} $ 下的速度$ {\mathit{\boldsymbol{v}}}_{i} ={\mathit{\boldsymbol{S}}}_{i\rm J} \dot{\mathit{\boldsymbol{\theta}}} $。$ {\mathit{\boldsymbol{v}}}_{0} $ 是基座速度，$ ^{i}{\mathit{\boldsymbol{X}}}_{j} $ 表示坐标系$ \{O_{j}\} $ 相对于坐标系$ \{O_{i}\} $ 的位姿矩阵。$ {\mathit{\boldsymbol{S}}} $ 是关节约束，其第$ i $ 列是$ {\mathit{\boldsymbol{S}}}_{i} =[{0, 0, 1, 0, 0, 0}]^{\rm T} $。本体系下加速度为$ {\mathit{\boldsymbol{a}}}_{i} $，$ {\mathit{\boldsymbol{c}}}_{i} ={\mathit{\boldsymbol{v}}}_{i} \times {\mathit{\boldsymbol{S}}}_{i} \dot{\theta}_{i} $ 是$ {\mathit{\boldsymbol{v}}}_{{\rm J}i} $ 的导数，称为偏置速度。此外，$ {\mathit{\boldsymbol{S}}}_{\rm 0J} $ 为相对于基坐标系的雅可比矩阵。

2.2 动力学的解耦与线性化

本文采用铰接体算法^[25]推导了空间机器人的动力学方程。这种方程可以保持欧拉方程形式：

$ \begin{align} {\mathit{\boldsymbol{f}}_i} = {\mathit{\boldsymbol{I}}}_i^{\rm A}{{\mathit{\boldsymbol{a}}}_i} + \mathit{\boldsymbol{p}}_i^{\rm A} \end{align} $

(2)

其中$ {\mathit{\boldsymbol{p}}}_{i}^{\rm A} $ 是偏置能量，与$ \mathit{\boldsymbol{p}}_{i} $ 有关；$ \mathit{\boldsymbol{I}}_{i} $ 为刚体惯量，那么，

$ \begin{align*} {\mathit{\boldsymbol{I}}}_{i}^{\rm A} =\;& {\mathit{\boldsymbol{I}}}_{i} +{}^{i}{\mathit{\boldsymbol{X}}}_{c(i)}^{*} ({{\mathit{\boldsymbol{I}}}_{c(i)}^{\rm A} -{\mathit{\boldsymbol{I}}}_{c(i)}^{\rm A} {\mathit{\boldsymbol{S}}}_{c(i)}} ({{\mathit{\boldsymbol{S}}}_{c(i)}^{\rm T} {\mathit{\boldsymbol{I}}}_{c(i)}^{\rm A} {\mathit{\boldsymbol{S}}}_{c(i)}})^{-1}\times \\ & {\mathit{\boldsymbol{S}}}_{c(i)}^{\rm T} {\mathit{\boldsymbol{I}}}_{c(i)}^{\rm A})^{c(i)}{\mathit{\boldsymbol{X}}}_{i} \\ {\mathit{\boldsymbol{p}}}_{i}^{\rm A} =\;& {\mathit{\boldsymbol{p}}}_{i} +{}^{i}{\mathit{\boldsymbol{X}}}_{c(i)}^{*} ({{\mathit{\boldsymbol{p}}}_{c(i)}^{\rm a} +{\mathit{\boldsymbol{I}}}_{c(i)}^{\rm A} {\mathit{\boldsymbol{S}}}_{c(i)}} ({{\mathit{\boldsymbol{S}}}_{c(i)}^{\rm T} {\mathit{\boldsymbol{I}}}_{c(i)}^{\rm A} {\mathit{\boldsymbol{S}}}_{c(i)}})^{-1} \times\\ & ({\tau_{i} -{\mathit{\boldsymbol{S}}}_{c(i)}^{\rm T} {\mathit{\boldsymbol{p}}}_{c(i)}^{\rm A}})) \\ {\mathit{\boldsymbol{p}}}_{i} =\;& {\mathit{\boldsymbol{v}}}_{i} \times^{*} {\mathit{\boldsymbol{I}}}_{i} {\mathit{\boldsymbol{v}}}_{i} \end{align*} $

$ ^{*} $ 是对偶运算，$ c(i) = i +1 $，$ {\mathit{\boldsymbol{p}}}_{c(i)}^{\rm a} ={\mathit{\boldsymbol{p}}}_{c(i)}^{\rm A} +({\mathit{\boldsymbol{I}}}_{c(i)}^{\rm A} - $ $ {\mathit{\boldsymbol{I}}}_{c(i)}^{\rm A} {\mathit{\boldsymbol{S}}}_{c(i)} ({{\mathit{\boldsymbol{S}}}_{c(i)}^{\rm T} {\mathit{\boldsymbol{I}}}_{c(i)}^{\rm A} {\mathit{\boldsymbol{S}}}_{c(i)}})^{-1} {{\mathit{\boldsymbol{S}}}_{c(i)}^{\rm T} {\mathit{\boldsymbol{I}}}_{c(i)}^{\rm A}}){\mathit{\boldsymbol{c}}}_{c(i)} $。相邻刚体在关节$ i $ 上产生传递力$ {\mathit{\boldsymbol{f}}}_{i} $ 作用在关节上，这个力与关节$ i $ 的驱动力矩的关系为

$ \begin{align} \tau _i = {\mathit{\boldsymbol{S}}}_i^{\rm T} {\mathit{\boldsymbol{f}}_i} \end{align} $

(3)

$ {\mathit{\boldsymbol{\tau}}} =[{\tau_{1} \cdots \tau_{i}}] $ 是关节力矩。基坐标系$ \{O_{0}\} $ 的加速度为$ {\mathit{\boldsymbol{a}}}_{0} =-({{\mathit{\boldsymbol{I}}}_{0}^{\rm A}})^{-1}{\mathit{\boldsymbol{p}}}_{0}^{\rm A} $。空间机器人动力学方程可改写为

$ \begin{align} \ddot{\mathit{\boldsymbol{\theta}}}= \mathit{\boldsymbol{M}}_{\tau} {\mathit{\boldsymbol{\tau}}} + ({\mathit{\boldsymbol{U}}_0} - {\mathit{\boldsymbol{M}}^{- 1}}\mathit{\boldsymbol{C}}\dot {\bm\theta}) \end{align} $

(4)

由式(2)(3) 可知，$ {\mathit{\boldsymbol{a}}}_{0} $ 是$ \tau $ 的函数，这样尽管已知$ \tau $，也无法直接获得角加速度。因此，$ \ddot{\bm\theta} $ 和$ {\mathit{\boldsymbol{\tau}}} $ 仍耦合在一起。这样，式(4) 只能用于计算正向动力学，不适用于计算反向动力学。主要原因是关节力矩耦合在偏置力项$ {\mathit{\boldsymbol{U}}}_{\rm g} $ 中。下面解决这个问题，进一步通过对$ \ddot{\bm\theta} $ 求偏导可以得到系数矩阵$ {\mathit{\boldsymbol{M}}}_{{\mathit{\boldsymbol{\tau}}}} $，即

$ \begin{align} \frac{\partial {\ddot{\theta}}}{\partial {\mathit{\boldsymbol{\tau}}}}= \frac{\partial} {{\partial {\mathit{\boldsymbol{\tau}}}}}{\mathit{\boldsymbol{M}}^{- 1}}({{\mathit{\boldsymbol{\tau}}} - {\mathit{\boldsymbol{U}}_{\rm g}} - \mathit{\boldsymbol{C}}\dot{\bm\theta}}) \end{align} $

(5)

将式(4) 代入式(5) 可得

$ \begin{align} \frac{{\partial {\mathit{\boldsymbol{M}}^{- 1}}}}{{\partial {\mathit{\boldsymbol{\tau}}}}}= {\mathit{\boldsymbol{0}}}, \quad \frac{\partial} {{\partial {\mathit{\boldsymbol{\tau}}}}}({{\mathit{\boldsymbol{C\dot \theta}}}})= {\mathit{\boldsymbol{0}}}, \quad \frac{{\partial {\mathit{\boldsymbol{\tau}}}}}{{\partial {\mathit{\boldsymbol{\tau}}}}}= {\mathit{\boldsymbol{E}}} \end{align} $

(6)

和

$ \begin{align} \frac{{\partial {\mathit{\boldsymbol{U}}_{\rm g}}}}{{\partial {\mathit{\boldsymbol{\tau}}}}}= {\mathit{\boldsymbol{I}}}_0^{\rm J}{({{\mathit{\boldsymbol{I}}}_0^{\rm A}})^{- 1}}\frac{{\partial \mathit{\boldsymbol{p}}_0^{\rm A}}}{{\partial {\mathit{\boldsymbol{\tau}}}}} + \frac{\partial} {{\partial {\mathit{\boldsymbol{\tau}}}}} [{\mathit{\boldsymbol{p}}_1^{\rm A} \cdots \mathit{\boldsymbol{p}}_N^{\rm A}}]^{\rm T} {{\mathit{\boldsymbol{S}}}_i} \end{align} $

(7)

其中$ {\mathit{\boldsymbol{I}}}_{0}^{\rm J} =[{{}^{1}{\mathit{\boldsymbol{I}}}_{0}^{\rm J} \cdots {}^{N}{\mathit{\boldsymbol{I}}}_{0}^{\rm J}}]^{\rm T} $，$ ^{i}{\mathit{\boldsymbol{I}}}_{j}^{\rm J} ={\mathit{\boldsymbol{S}}}_{i}^{\rm T} ({{\mathit{\boldsymbol{I}}}_{i}^{\rm A}})^{\rm T}{}^{i}{\mathit{\boldsymbol{X}}}_{j} $，$ {\mathit{\boldsymbol{c}}}_{i}^{\rm J} ={\mathit{\boldsymbol{v}}}_{i} \times {\mathit{\boldsymbol{S}}}_{i} $，$ i=1, \cdots, N $，$ j= 1, \cdots, i $，$ N $ 为关节的个数。由式(6) 可知$ {\mathit{\boldsymbol{I}}}_{i}, {\mathit{\boldsymbol{S}}}_{i}, {\mathit{\boldsymbol{p}}}_{i} $ 是常量矩阵，$ {\mathit{\boldsymbol{p}}}_{i}^{\rm A} $ 与$ {\mathit{\boldsymbol{I}}}_{c(i)}^{\rm A}, $ $ {\mathit{\boldsymbol{p}}}_{c(i)}^{\rm A}, $ $ {\mathit{\boldsymbol{c}}}_{c(i)}, $ $ {}^{i}{\mathit{\boldsymbol{X}}}_{p(i)}, $ $ \tau_{i} $ 有关。那么可以得到

$ \begin{align} \frac{{\partial \mathit{\boldsymbol{p}}_{p(i)}^{\rm A}}}{{\partial {\mathit{\boldsymbol{\tau}}}}}= {\mathit{\boldsymbol{F}}}_i^\tau + {\mathit{\boldsymbol{F}}}_i^{\mathit{\boldsymbol{p}}}\frac{{\partial \mathit{\boldsymbol{p}}_i^{\rm A}}}{{\partial {\mathit{\boldsymbol{\tau}}}}} \end{align} $

(8)

其中，$ {\mathit{\boldsymbol{F}}}_{i}^{\tau} ={}^{i}{\mathit{\boldsymbol{X}}}_{p(i)}^{*} {\mathit{\boldsymbol{I}}}_{i}^{\rm A} {\mathit{\boldsymbol{S}}}_{i} ({{\mathit{\boldsymbol{S}}}_{i}^{\rm T} {\mathit{\boldsymbol{I}}}_{i}^{\rm A} {\mathit{\boldsymbol{S}}}_{i}})^{-1} $，$ {\mathit{\boldsymbol{F}}}_{i}^{{\mathit{\boldsymbol{p}}}} ={}^{i}{\mathit{\boldsymbol{X}}}_{p(i)}^{*} (\mathit{\boldsymbol{E}}- $ $ {\mathit{\boldsymbol{I}}}_{i}^{\rm A}{\mathit{\boldsymbol{S}}}_{i} ({{\mathit{\boldsymbol{S}}}_{i}^{\rm T} {\mathit{\boldsymbol{I}}}_{i}^{\rm A} {\mathit{\boldsymbol{S}}}_{i}})^{-1}{\mathit{\boldsymbol{S}}}_{i}^{\rm T}) $。将式(8) 代入式(7) 可得

$ \begin{align} & \frac{{\partial \mathit{\boldsymbol{p}}_0^{\rm A}}}{\partial {\mathit{\boldsymbol{\tau}}}}= \left[{\mathit{\boldsymbol{F}}}_1^{\mathit{\boldsymbol{\tau}}}, {\mathit{\boldsymbol{F}}}_1^{\mathit{\boldsymbol{p}}}{\mathit{\boldsymbol{F}}}_2^{\mathit{\boldsymbol{\tau}}}, {\mathit{\boldsymbol{F}}}_1^{\mathit{\boldsymbol{p}}}{\mathit{\boldsymbol{F}}}_2^{\mathit{\boldsymbol{p}}}{\mathit{\boldsymbol{F}}}_3^{\mathit{\boldsymbol{\tau}}}, \cdots, \left({ \prod _{i = 1}^{N - 1} {\mathit{\boldsymbol{F}}}_i^{\mathit{\boldsymbol{p}}}}\right) \mathit{\boldsymbol{F}}_N^{\mathit{\boldsymbol{\tau}}} \right] \end{align} $

(9a)

$ \begin{align} & {\mathit{\boldsymbol{S}}}_F \triangleq \frac{\partial} {{\partial {\mathit{\boldsymbol{\tau}}}}}{[{\mathit{\boldsymbol{p}}_1^{\rm A} \cdots \mathit{\boldsymbol{p}}_N^{\rm A}}]^{\rm T}}{{\mathit{\boldsymbol{S}}}_i} \\ &= \left[ {\begin{array}{*{20}{c}} 0 & {{\mathit{\boldsymbol{S}}}_2^{\rm T}{\mathit{\boldsymbol{F}}}_2^{\mathit{\boldsymbol{\tau}}}} & {{\mathit{\boldsymbol{S}}}_2^{\rm T}{\mathit{\boldsymbol{F}}}_2^{\mathit{\boldsymbol{p}}}{\mathit{\boldsymbol{F}}}_3^{\mathit{\boldsymbol{\tau}}} \cdots} & {{\mathit{\boldsymbol{S}}}_2^{\rm T} \left({ \prod \limits_{i = 2}^{N - 1} {\mathit{\boldsymbol{F}}}_i^{\mathit{\boldsymbol{p}}}}\right) {\mathit{\boldsymbol{F}}}_N^{\mathit{\boldsymbol{\tau}}}}\\ 0 & 0 & {{\mathit{\boldsymbol{S}}}_3^{\rm T}{\mathit{\boldsymbol{F}}}_3^{\mathit{\boldsymbol{\tau}}} \cdots} & {{\mathit{\boldsymbol{S}}}_3^{\rm T} \left({ \prod \limits_{i = 3}^{N - 1} {\mathit{\boldsymbol{F}}}_i^{\mathit{\boldsymbol{p}}}}\right) {\mathit{\boldsymbol{F}}}_N^{\mathit{\boldsymbol{\tau}}}}\\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & {\mathit{\boldsymbol{S}}_N^{\rm T}{\mathit{\boldsymbol{F}}}_N^{\mathit{\boldsymbol{\tau}}}}\\ 0 & 0 & \cdots & 0 \end{array}} \right] \end{align} $

(9b)

式(9b) 中$ \triangleq $ 表示记作。将式(5)(6)(7)(9) 代入式(4) 可得

$ \begin{align} {\mathit{\boldsymbol{M}}_{\mathit{\boldsymbol{\tau}}}}= {\mathit{\boldsymbol{M}}^{- 1}} - {\mathit{\boldsymbol{M}}^{- 1}}{\mathit{\boldsymbol{M}}_0} \end{align} $

(10)

其中$ {\mathit{\boldsymbol{M}}}_{0} ={\mathit{\boldsymbol{I}}}_{0}^{\rm J} ({{\mathit{\boldsymbol{I}}}_{0}^{\rm A}})^{-1} \left[{{\mathit{\boldsymbol{F}}}_{1}^{{\mathit{\boldsymbol{\tau}}}}} \; \; {{\mathit{\boldsymbol{F}}}_{1}^{{\mathit{\boldsymbol{p}}}} {\mathit{\boldsymbol{F}}}_{2}^{{\mathit{\boldsymbol{\tau}}}} \cdots \left({\prod\limits _{i=1}^{N-1} {\mathit{\boldsymbol{F}}}_{i}^{{\mathit{\boldsymbol{p}}}}}\right){\mathit{\boldsymbol{F}}}_{N}^{{\mathit{\boldsymbol{\tau}}}}} \right]+{\mathit{\boldsymbol{S}}}_{F} $。由式(4)(5)(10) 可知

$ \begin{align} {\mathit{\boldsymbol{U}}_0}= {\mathit{\boldsymbol{M}}^{- 1}}{\mathit{\boldsymbol{M}}_0}{\mathit{\boldsymbol{\tau}}} - {\mathit{\boldsymbol{M}}^{- 1}}{\mathit{\boldsymbol{U}}_{\rm g}} \end{align} $

(11)

上式中与$ {\mathit{\boldsymbol{\tau}}} $ 相关项可以互相抵消。将式(10)(11) 代入式(4) 得到解耦动力学方程的显式表达式。$ \mathit{\boldsymbol{M}}_{\tau} $ 是满秩矩阵，这使得解耦动力学方程(4) 不仅可以计算正动力学，也可以计算逆动力学：

$ \begin{align} {\mathit{\boldsymbol{\tau}}}= \mathit{\boldsymbol{M}}_{\tau}^{- 1}({{\ddot{\theta}} - {\mathit{\boldsymbol{U}}_0} + {\mathit{\boldsymbol{M}}^{- 1}} \mathit{\boldsymbol{C}}\dot{\theta}}) \end{align} $

(12)

这样，力矩就从动力学方程解耦，并得到关节加速度和力矩的线性方程。采用线性时变系统状态方程离散化方法，得到一个动态的离散状态方程。离散时间状态方程采用系统输入和输出信号的当前和过去值来更新状态。离散时间状态方程可离散为

$ \begin{align} \dot{\mathit{\boldsymbol{\theta}}}_{k + 1} = {\mathit{\boldsymbol{A}}}{{\dot{\theta}}_k} + {\mathit{\boldsymbol{B}}}{\mathit{\boldsymbol{\tau}}_k} + {\mathit{\boldsymbol{w}}} \end{align} $

(13)

其中$ {\mathit{\boldsymbol{A}}}={\mathit{\boldsymbol{E}}}-{\mathit{\boldsymbol{M}}}^{-1}{\mathit{\boldsymbol{C}}} \delta t $，$ {\mathit{\boldsymbol{B}}} = {\mathit{\boldsymbol{M}}}_{\tau} \delta t $，$ {\mathit{\boldsymbol{w}}}={\mathit{\boldsymbol{U}}}_{0}\delta t $，$ \delta t $ 是采样时间，$ k $ 是时序。式(13) 的输入与式(4) 相同，但输出不同。它们之间的关系式为

$ \begin{align} \ddot{\mathit{\boldsymbol{\theta}}}_k\delta t = \dot{\mathit{\boldsymbol{\theta}}}_{k+1}-\dot{\mathit{\boldsymbol{\theta}}}_k \end{align} $

(14)

动力学离散状态方程直接给出了关节扭矩和关节速度之间的关系。$ {\mathit{\boldsymbol{A}}} $、$ {\mathit{\boldsymbol{B}}} $ 仍然是下三角矩阵，在求逆运算中具有很高的计算效率。另外，由于$ \mathit{\boldsymbol{B}} $ 的可逆性，动力学方程(13) 仍然是可逆的。不同于传统的逆迭代牛顿－欧拉方程只能计算逆动力学，不能计算正动力学，利用式(13) 可以同时计算正、逆动力学。

3 控制器模型（Controller model） 3.1 自适应控制策略

控制器的目的是驱动末端执行器从初始构形开始执行期望的轨迹。基于速度的控制方案在协调操作^[23]、避碰^[24]、预测控制^[9]和轨迹规划^[25]中得到了广泛的应用。如图 2所示，本文研究的空间机器人系统由自由飘浮飞行器基座与SSRMS型机械臂组成。文中假设基座和机械臂都是刚体。

图 2 自由飘浮空间机器人捕获目标的原理图 Fig.2 Schematic of the free-floating space robot capturing a target

在操作场景中，目标在惯性空间中不受外力并已失效。末端执行器坐标系$ \{E\} $ 以速度$ {\mathit{\boldsymbol{v}}}_{E} (t) $ 走过轨迹$ {\mathit{\boldsymbol{p}}}_{E} (t) $，同时抓捕点所在坐标系$ \{T\} $ 以速度$ {\mathit{\boldsymbol{v}}}_{T} (t) $ 走过轨迹$ {\mathit{\boldsymbol{p}}}_{T} (t) $，以上参数均相对于基坐标系$ \{O_{0} \} $。希望末端执行器和捕获点以相同的速度同时到达会合点。因此，跟踪策略是将末端执行器从初始位置带至捕获位置：

$ \begin{align} {\mathit{\boldsymbol{p}}_E}({{t_{\rm f}}})= {\mathit{\boldsymbol{p}}_T}({{t_{\rm f}}}) \end{align} $

(15)

假设由耦合扰动引起的基座飘移不会使捕获点逃离机械手工作空间。位姿误差为

$ \begin{align} {\mathit{\boldsymbol{e}}} = {\mathit{\boldsymbol{p}}_T} - {\mathit{\boldsymbol{p}}_E} \end{align} $

(16)

其中$ {\mathit{\boldsymbol{p}}}_{T} =[\underline{\mathit{\boldsymbol{\varPsi}}}_{T}, \underline{\mathit{\boldsymbol{p}}}_{T}] $，$ {\mathit{\boldsymbol{p}}}_{E} =[\underline{\mathit{\boldsymbol{\varPsi}}}_{E}, \underline{\mathit{\boldsymbol{p}}}_{E}] $，$ {\mathit{\boldsymbol{e}}}(0)\ne \mathit{\boldsymbol{0}} $。末端执行器的期望速度设计为

$ \begin{align} {\mathit{\boldsymbol{v}}_{\rm d}}= [ \dot{\underline{\mathit{\boldsymbol{\varPsi}}}}_{\rm d}, \underline{\mathit{\boldsymbol{v}}}_{\rm d}]^{\rm T} = \mathit{\boldsymbol{v}}_{\rm e} + {\hat{{\mathit{\boldsymbol{v}}}}}_T \end{align} $

(17)

其中$ \underline{\mathit{\boldsymbol{\omega}}}_{\rm d} ={\mathit{\boldsymbol{\varOmega}}} (\underline{\mathit{\boldsymbol{\varPsi}}}_{\rm d})\underline{\dot{\mathit{\boldsymbol{\varPsi}}}}_{\rm d} $，$ \hat{\mathit{\boldsymbol{v}}}_{T} $ 是抓捕点的估计速度，$ {\mathit{\boldsymbol{v}}}_{\rm e} $ 是末端执行器向捕获点移动时的接近速度：

$ \begin{align} \mathit{\boldsymbol{v}}_{\rm e} = k(t){\mathit{\boldsymbol{e}}} \end{align} $

(18)

估计速度的自适应速率为

$ \begin{align} \dot{\hat{{\mathit{\boldsymbol{v}}}}}_T = {\mathit{\boldsymbol{K}}_{\rm e}} {\mathit{\boldsymbol{e}}} + {\mathit{\boldsymbol{K}}_{\rm B}} {\tilde{\mathit{\boldsymbol{v}}}_T} \end{align} $

(19)

其中$ k(t) > 0 $，$ {\mathit{\boldsymbol{K}}}_{\rm e}, {\mathit{\boldsymbol{K}}}_{\rm e}^{-1}, {\mathit{\boldsymbol{K}}}_{\rm B} $ 是正定常矩阵，并且

$ \begin{align} {{\tilde{{\mathit{\boldsymbol{v}}}}}_T}= {\mathit{\boldsymbol{v}}_T} - {\hat{{\mathit{\boldsymbol{v}}}}}_T \end{align} $

(20)

关节限速$ \dot{\mathit{\boldsymbol{\theta}}}_{\lim} $，由此可得末端执行器的速度被限制为$ {\mathit{\boldsymbol{v}}}_\rm{emax} ={\mathit{\boldsymbol{S}}}_{\rm 0J} \dot{\mathit{\boldsymbol{\theta}}}_{\lim} $，那么设计$ k(t) $ 为

$ \begin{align} k(t) = \begin{cases} \dfrac{{| {{\mathit{\boldsymbol{v}}_{\rm{elim}}}} |}}{{| {\mathit{\boldsymbol{e}}} |}}, & \dfrac{| {{\mathit{\boldsymbol{v}}_{\rm{elim}}}} |}{| {\mathit{\boldsymbol{e}}} |} < k_0\\ k_0, & \dfrac{{| {{\mathit{\boldsymbol{v}}_{\rm{elim}}}} |}}{{| {\mathit{\boldsymbol{e}}} |}} \geqslant k_0 \end{cases} \end{align} $

(21)

其中$ k_0 $ 是常数。因为$ {\mathit{\boldsymbol{v}}}_{T} $ 不可测，但$ {\mathit{\boldsymbol{p}}}_{T} $ 可以测量，估计速度为

$ \begin{align} {{\hat{{\mathit{\boldsymbol{v}}}}}_T} = \int_0^{t} {\mathit{\boldsymbol{K}}_{\rm e}} {\mathit{\boldsymbol{e}}}{\rm d}t + {\mathit{\boldsymbol{K}}_{\rm B}} \left({{\mathit{\boldsymbol{p}}_T} - {\mathit{\boldsymbol{p}}_{T0}} - \int_0^{t} \hat{{\mathit{\boldsymbol{v}}}}_T {\rm d}t}\right) \end{align} $

(22)

其中$ {\mathit{\boldsymbol{p}}}_{T0} $ 是机械臂执行器的初始位姿。在给定末端执行器期望跟踪轨迹的情况下，设计以最小能耗为优化目标的最优关节力矩控制器。使空间机器人末端执行器在$ k $ 时刻以关节驱动力矩$ {\mathit{\boldsymbol{\tau}}}_{k} $ 跟踪目标的控制器可以建模为如下优化问题：

$ \begin{align} & \min \limits_{\mathit{\boldsymbol{\tau}}} \; {\mathit{\boldsymbol{\varGamma}}}({{{\left\| {{\varGamma_{{\rm v}}} ({{\mathit{\boldsymbol{v}}_E} - {\mathit{\boldsymbol{v}}_{\rm d}}})} \right\|}^2} + {{\left\| {{\varGamma _{\rm p}}{\dot{\theta} \bm\tau}} \right\|}^2}}) \\ & {\rm{s.t.}}\; {\mathit{\boldsymbol{v}}_E}({{t_{{\rm f}}}})= {\mathit{\boldsymbol{v}}_{T}}({{t_{{\rm f}}}}), \quad {\mathit{\boldsymbol{v}}_E}({{t_0}}) = 0 \\ & \phantom{{\rm{s.t.}}\; }\mathit{\boldsymbol{p}}_E ({{t_{{\rm f}}}})= {\mathit{\boldsymbol{p}}_{T}}({{t_{{\rm f}}}}), \quad {\mathit{\boldsymbol{p}}_E}({{t_0}})= {\mathit{\boldsymbol{p}}_{E0}} \end{align} $

(23)

其中$ \varGamma_{\rm v}, \varGamma_{\rm p} $ 是正数权重，$ {\mathit{\boldsymbol{v}}}_{\rm d} $ 是末端执行器期望速度。将式(13) 代入式(23)，令

$ \begin{align} \rho = \mathit{\boldsymbol{\varPsi}}_{\tau}^{\rm T} \bm\tau + {\mathit{\boldsymbol{b}}} \end{align} $

(24)

其中

$ \begin{align*} {\mathit{\boldsymbol{\varPsi}}}_{\tau} =\left[ {\begin{array}{*{20}{c}} {-\varGamma_{\rm v} {\mathit{\boldsymbol{S}}}_{\rm 0J} {\mathit{\boldsymbol{B}}}} \\ {\varGamma_{\rm p} \dot{\mathit{\boldsymbol{\theta}}}} \end{array}} \right], \quad {\mathit{\boldsymbol{b}}} =\left[ {\begin{array}{*{20}{c}} {\varGamma_{\rm v} ({{\mathit{\boldsymbol{v}}}_{E} -{\mathit{\boldsymbol{S}}}_{\rm 0J} \mathit{\boldsymbol{A\dot{\theta}}}-{\mathit{\boldsymbol{S}}}_{\rm 0J} {\mathit{\boldsymbol{w}}}})} \\ 0 \end{array}} \right] \end{align*} $

那么，优化目标函数可以表达成

$ \begin{align} \min\limits_{\mathit{\boldsymbol{\tau}}} {\mathit{\boldsymbol{\varGamma}}}= \min \limits_{\mathit{\boldsymbol{\tau}}} {\rho^{\rm T}} \rho \end{align} $

(25)

式(25) 的极值条件是

$ \begin{align} \frac{{{\rm d}{\rho^{\rm T}} \rho}}{{{\rm d}{\mathit{\boldsymbol{\tau}}}}}{\rm{= 2}}\frac{{{\rm d}{\rho^{\rm T}}}}{{{\rm d}{\mathit{\boldsymbol{\tau}}}}}\rho = 2\mathit{\boldsymbol{\varPsi}}_{\tau}^{\rm T} \rho = 0 \end{align} $

(26)

在初始条件约束下，可以得到式(23) 的最优控制力矩

$ \begin{align} {\mathit{\boldsymbol{\tau}}}= ({\mathit{\boldsymbol{\varPsi}}_{\tau}^{\rm T} {\mathit{\boldsymbol{\varPsi}}_{\tau}}})^{- 1} \mathit{\boldsymbol{\varPsi}}_{\tau}^{\rm T} {\mathit{\boldsymbol{b}}} \end{align} $

(27)

控制器不仅需要跟踪期望轨迹，还需要满足避障、关节限制等一系列约束条件，同时优化误差和速度不可测带来的不确定性，也会影响控制器精度。因此在考虑以上约束与补偿后，控制模型变成了非线性、非凸的优化问题。

3.2 不确定性

真实的在轨任务中，通过视觉传感器精确测量抓捕点速度$ {\mathit{\boldsymbol{v}}}_{T} $ 具有很大难度，其加速度$ \dot{\mathit{\boldsymbol{v}}}_{T} $ 就更难测量。但在进行目标捕获前会对其消旋，保证速度和加速度总是有界的：

$ \begin{align} | {{\mathit{\boldsymbol{v}}_T}} | \leqslant {\rho_{\rm a1}} , \quad | {{{{\dot{{\mathit{\boldsymbol{v}}}}}}_T}} | \leqslant {\rho_{\rm a2}} \end{align} $

(28)

其中$ \rho_{\rm{a1}} $ 和$ \rho_{\rm a2} $ 是很小的常数。考虑到能耗优化，得到的最优力矩会导致末端执行器速度$ {\mathit{\boldsymbol{v}}}_{E} $ 和期望速度$ {\mathit{\boldsymbol{v}}}_{\rm d} $ 存在控制偏差$ {\mathit{\boldsymbol{\varDelta}}}_{\rm p} $。为了保证执行器的跟踪效果，末端执行器速度需要满足另一个约束条件：

$ \begin{align} | {{\mathit{\boldsymbol{\varDelta}}_{\rm p}}} |= | {{\mathit{\boldsymbol{v}}_E} - {\mathit{\boldsymbol{v}}_{\rm d}}} | \leqslant {\rho _{\rm p}} \end{align} $

(29)

$ \rho_{\rm p} $ 是常数。那么末端执行器的实际速度是

$ \begin{align} {\mathit{\boldsymbol{v}}_E}= {\mathit{\boldsymbol{v}}_{\rm d}} + {\mathit{\boldsymbol{\varDelta}}_{\rm p}} \end{align} $

(30)

$ {\mathit{\boldsymbol{\varDelta}}}_{\rm p} $ 是优化产生的不确定项。为了解决不确定项带来的影响并提高精度和收敛性，对末端执行器的期望速度进行了重新设计：

$ \begin{align} {\mathit{\boldsymbol{v}}_{\rm d}} = {\mathit{\boldsymbol{v}}_{\rm e}} + {{\hat{{\mathit{\boldsymbol{v}}}}}_T} - \int_0^{t} {\rm{sgn}} \overset\frown{\boldsymbol{v}} _{T} \left({{\rho_{\rm a}} + \frac{{2{\rho_{\rm p}}}}{{\delta t}}}\right){\rm d}t \end{align} $

(31)

其中$ \overset\frown{\boldsymbol{v}} _{T} =\hat{\mathit{\boldsymbol{v}}}_{T} -\int_0^{t} {\rm{sgn}} \overset\frown{\boldsymbol{v}} _{T} ({\rho_{\rm a} +\dfrac{2\rho_{\rm p}} {\delta t}}){\rm d}t +{\mathit{\boldsymbol{\varDelta}}}_{\rm p} $，$ \rho_{\rm a} =\rho_{\rm a2} $。估计误差为

$ \begin{align} {{\tilde{{\mathit{\boldsymbol{v}}}}}_T}= {\mathit{\boldsymbol{v}}_T} - \overset\frown{\boldsymbol{v}} _{T} \end{align} $

(32)

3.3 避障

图 2中展示了SSRMS机械臂，不难发现碰撞总是发生在肘关节$ \theta_{4} $ 和相邻连杆上，因此本文将肘关节和相邻连杆视为避障对象。由于连杆体和障碍物轮廓复杂，本文采用了最小体积封闭方法，可以有效地实现避障。对于障碍物，采用Lowner-John椭球法将障碍物模型表述为凸优化问题^[26]。为简化障碍模型，将Lowner-John椭球的3个主轴约束为相同长度，椭球退化为一个球，记为

$ \begin{align} \varepsilon ^3 ({{\mathit{\boldsymbol{p}}}^{{\rm b}}}, \bm\varUpsilon) \end{align} $

(33)

其中$ {\mathit{\boldsymbol{p}}}^{\rm b} $ 是球心位置，$ \mathit{\boldsymbol{\varUpsilon}} $ 是主轴长度对角阵。对于机械臂，采用臂平面表示避障对象，如图 3所示。臂平面垂直于$ \theta_{4} $ 回转轴，并经过连杆$ O_{4}' O_{4} $ 的中点。该模型避免了迭代过程中求解反余弦函数的问题，提高了算法的实时性。将障碍物和机械臂简化为规则几何体。避障要求臂平面与第$ i $ 个障碍物的距离$ d_{i} $ 大于安全距离$ d_{\rm s} =\xi_{0} +\xi $，如图 4所示。这里引入一个中间优化变量——方位角$ \varphi $，来建立$ d_{i} $、$ \bm\theta $ 与其三者之间的联系。那么就可以添加以下约束到最优控制器式(23)：

$ \begin{align} {\mathit{\boldsymbol{d}}}({\bm\theta (\varphi)}) \geqslant {\mathit{\boldsymbol{d}}_{\rm s}}, \quad {\dot{{\mathit{\boldsymbol{d}}}}}({\dot {\bm\theta} (\varphi)}) \leqslant {\overline{\mathit{\boldsymbol{d}}}_{\rm s}} \end{align} $

(34)

图 3 避碰中机械臂简化模型与臂平面 Fig.3 The arm plane and the simplified manipulator model in collision avoidance

图 4 机械臂避障模型 Fig.4 Obstacle avoidance model of the manipulator

$ {\mathit{\boldsymbol{d}}}({\bm\theta (\varphi)})=[{d_{1} ({\bm\theta (\varphi)}), \cdots, d_{i} ({\bm\theta (\varphi)})}] $，$ {\mathit{\boldsymbol{d}}}_{\rm s} =[d_{\rm{s1}}, \cdots, $ $ d_{{\rm s}i}] $。文[26]给出了更具体的避障情况下的机械臂轨迹规划分析方法。

3.4 关节约束

关节不仅有角度和速度限制，而且有扭矩限制。机械臂关节需要满足

$ \begin{gather} \underline{\mathit{\boldsymbol{\tau}}} \leqslant {\mathit{\boldsymbol{\tau}}} \leqslant {\overline{\tau}} \end{gather} $

(35)

$ \begin{gather} \underline{\mathit{\boldsymbol{\theta}}} \leqslant \bm\theta (\varphi) \leqslant \overline{\theta}, \quad \underline{\dot{\theta}} \leqslant \dot{\theta} (\varphi) \leqslant \overline{\dot{\bm\theta}} \end{gather} $

(36)

3.5 控制器

综上所述，空间机器人跟踪目标的最优控制问题可以表述为带有线性等式和不等式约束的二次规划问题，其在$ k $ 时刻的离散化表达式为

$ \begin{align} & \min \limits_{{\mathit{\boldsymbol{\tau}}_k}} {\mathit{\boldsymbol{\varGamma}}} \left({{{\left\| {{\varGamma_{{\rm v}}} ({{\mathit{\boldsymbol{v}}_{Ek}} - {\mathit{\boldsymbol{v}}_{{{\rm d}} k}}})} \right\|}^2} + {{\left\| {{\varGamma_{\rm p}} {{{\dot{\theta}}}_k}{\mathit{\boldsymbol{\tau}}_k}} \right\|}^2}}\right) \\ & {\rm{s.t. }} {\mathit{\boldsymbol{v}}_{{{\rm d}} k}}= {\mathit{\boldsymbol{v}}_{{\rm e} k}} + {\hat{{\mathit{\boldsymbol{v}}}}_{Tk}} - \sum\limits_{i = 0}^k {\rm{sgn}} \overset\frown{\boldsymbol{v}} _{Tk} \left({{\rho_{\rm a}} + \frac{{2{\rho_{\rm p}}}}{{\delta t}}}\right) \delta t \\ & \phantom{{\rm{s.t. }}} {\mathit{\boldsymbol{v}}_E}({{k_{{\rm f}}}})= {\mathit{\boldsymbol{v}}_T}({{k_{{\rm f}}}}), \; \; {\mathit{\boldsymbol{v}}_E}(0)= 0 \\ & \phantom{{\rm{s.t. }}} {\mathit{\boldsymbol{p}}_E}({{k_{{\rm f}}}})= {\mathit{\boldsymbol{p}}_T}({{k_{{\rm f}}}}), \; \; {\mathit{\boldsymbol{p}}_E}(0)= {\mathit{\boldsymbol{p}}_{E0}} \\ & \phantom{{\rm{s.t. }}} {\mathit{\boldsymbol{d}}}({\bm\theta ({{\varphi _k}})}) \geqslant {\mathit{\boldsymbol{d}}_{\rm s}}, \; \; {\dot{{\mathit{\boldsymbol{d}}}}}({\dot {\bm\theta} ({{\varphi _k}})}) \leqslant {{{\overline{{\mathit{\boldsymbol{d}}}}}}_{\rm s}} \\ & \phantom{{\rm{s.t. }}} \underline{\theta} \leqslant \mathit{\boldsymbol{\theta}}_k \leqslant \overline{\theta}, \; \; \dot{\underline{\theta}} \leqslant {{\dot {\bm\theta}} _k} \leqslant \overline{\dot{\theta}} \\ & \phantom{{\rm{s.t. }}} | {{\mathit{\boldsymbol{v}}_{Ek}} - {\mathit{\boldsymbol{v}}_{{\rm d} k}}} | \leqslant {\rho _\rho} \\ & \phantom{{\rm{s.t. }}} \underline{\mathit{\boldsymbol{\tau}}} \leqslant \mathit{\boldsymbol{\tau}}_k \leqslant \overline{\tau} \end{align} $

(37)

序列凸规划法在对式(37) 最优控制的解算中取得了一定的成功。但是，这种方法每次迭代都要计算代价函数，在复杂约束条件下寻求最优解，计算效率较低。为了克服这一点，本文提出一种新的分段优化方法。

第1阶段优化主要是对运动学进行优化，实现避障、关节运动限制和末端执行器速度要求，其分别对应式(34)(36)(30)。这部分优化可以得到一些中间变量，例如$ \bm\theta, \varphi $ 等，其最终产物是$ {\mathit{\boldsymbol{S}}}_{\rm 0J} $。这样就可以利用式(27) 计算最优力矩，进入第2阶段优化。初始状态保证$ \dot{\mathit{\boldsymbol{\theta}}}(0)=0 $ 和$ {\mathit{\boldsymbol{v}}}_{E} (0)=0 $。不难发现，当$ \varGamma_{\rm p} \to 0 $，$ | {{\mathit{\boldsymbol{v}}}_{Ek} -{\mathit{\boldsymbol{v}}}_{{\rm d}k}} |\to 0 $。因此可通过选择合适的$ \varGamma_{\rm v}, \varGamma_{\rm p} $ 保证$ | {{\mathit{\boldsymbol{v}}}_{Ek} -{\mathit{\boldsymbol{v}}}_{{\rm d}k}} |\leqslant \rho_{\rho} $。下一节将会证明末端执行器跟踪终态$ {\mathit{\boldsymbol{p}}}_{E} ({k_{\rm f}}), {\mathit{\boldsymbol{v}}}_{E} ({k_{\rm f}} $) 收敛于$ {\mathit{\boldsymbol{p}}}_{T} ({k_{\rm f}}), {\mathit{\boldsymbol{v}}}_{T} ({k_{\rm f}} $)，即总有一时刻$ k_{\rm f} $ 满足$ {\mathit{\boldsymbol{p}}}_{E} ({k_{\rm f}})= {\mathit{\boldsymbol{p}}}_{T} ({k_{\rm f}}) $，$ {\mathit{\boldsymbol{v}}}_{E} ({k_{\rm f}})={\mathit{\boldsymbol{v}}}_{T} ({k_{\rm f}} $)。这样第2阶段优化问题重新整理为

$ \begin{align} & \min \limits_{{\mathit{\boldsymbol{\tau}}_k}} {\mathit{\boldsymbol{\varGamma}}}({{{\left\| {{\varGamma_{{\rm v}}} ({{\mathit{\boldsymbol{v}}_{Ek}} - {\mathit{\boldsymbol{v}}_{{{\rm d}} k}}})} \right\|}_2} + {{\left\| {{\varGamma_{\rm p}} {{{\dot{\theta}}}_k}{\mathit{\boldsymbol{\tau}}_k}} \right\|}_2}}) \\ & {\rm{s.t. }}\; \underline{\tau} \leqslant {\mathit{\boldsymbol{\tau}}_k} \leqslant {\overline{\tau}} \end{align} $

(38)

这样只有当式(27) 中求得的$ \tau $ 不满足约束要求$ \underline{\mathit{\boldsymbol{\tau}}}\leqslant $ $ {\mathit{\boldsymbol{\tau}}} \leqslant $ $ \overline{\mathit{\boldsymbol{\tau}}} $ 时，再采用新数值优化方法，通过遍历$ \varphi_{k} $，找到最优的$ {\mathit{\boldsymbol{\tau}}}_{k} $。这样可大大提高计算效率。最优能耗下捕获目标的自适应跟踪控制策略如图 5所示。

图 5 在最优能耗条件下实现目标捕获的自适应跟踪控制策略图 Fig.5 Block diagram of the adaptive control strategy for target capturing with optimal energy-consumption

3.6 稳定性分析

空间机器人动力学线性化的贡献在于用同一个解析表达式同时实现了对正、逆动力学的解算，具有准确的模型，不会对收敛性、稳定性产生影响。空间机器人跟踪目标的稳定性和收敛性取决于在一定约束条件下的最优问题式(37)。现给出了控制器的候选李雅普诺夫函数：

$ \begin{align} V = \frac{1}{2}{\mathit{\boldsymbol{e}}^{\rm T}} {\mathit{\boldsymbol{e}}} + \frac{1}{2}{\tilde{{\mathit{\boldsymbol{v}}}}}_{{\rm f}}^{{\rm T}} {\mathit{\boldsymbol{K}}}_{{\rm e}}^{- 1} {{\tilde{{\mathit{\boldsymbol{v}}}}}_{{\rm f}}} \end{align} $

(39)

显然$ V\geqslant 0 $。对其求导可得

$ \begin{align} \dot V = {\mathit{\boldsymbol{e}}^{\rm T}} {\dot{{\mathit{\boldsymbol{e}}}}} + {\tilde{{\mathit{\boldsymbol{v}}}}}_T^{{\rm T}} {\mathit{\boldsymbol{K}}}_{{\rm e}}^{- 1}{\dot{\tilde{{\mathit{\boldsymbol{v}}}}}_T} \end{align} $

(40)

根据式(19)(31)，末端执行器的最优速度为

$ \begin{align} {{\mathit{\boldsymbol{v}}}_E} = k(t){\mathit{\boldsymbol{e}}} + \overset\frown{\boldsymbol{v}} _T \end{align} $

(41)

位姿误差导数和速度估计偏差导数分别为

$ \begin{align} {\dot{{\mathit{\boldsymbol{e}}}}} &= {\mathit{\boldsymbol{v}}_T} - k(t){\mathit{\boldsymbol{e}}} - \overset\frown{\boldsymbol{v}} _{T} \end{align} $

(42a)

$ \begin{align} {\dot{\tilde{{\mathit{\boldsymbol{v}}}}}_T} &= {{\dot{{\mathit{\boldsymbol{v}}}}}_T} - {{\dot{\hat{{\mathit{\boldsymbol{v}}}}}}_T} + {\rm{sgn}} \overset\frown{\boldsymbol{v}} _{T} \left({{\rho_{\rm a}} + \frac{{2{\rho_{\rm p}}}}{{\delta t}}}\right) - {\dot{\varDelta}_{\rm p}} \end{align} $

(42b)

将式(42) 代入式(40) 可得

$ \begin{align} \dot V =\;& {\mathit{\boldsymbol{e}}^{\rm T}} ({{\mathit{\boldsymbol{v}}_T} - k(t){\mathit{\boldsymbol{e}}} - \overset\frown{\boldsymbol{v}} _{T}}) + \\ & {\tilde{{\mathit{\boldsymbol{v}}}}}_T^{\rm T} \mathit{\boldsymbol{K}}_{\rm e}^{- 1} \left[{{{{\dot{{\mathit{\boldsymbol{v}}}}}}_T} - {\dot{\hat{{\mathit{\boldsymbol{v}}}}}}_T+ {\rm{sgn}} \overset\frown{\boldsymbol{v}} _{T} \left({{\rho_{\rm a}} + \frac{{2{\rho_{\rm p}}}}{{\delta t}}}\right) - {{{\dot{\varDelta}}}_{\rm p}}}\right] \\ =\;& - k(t){\mathit{\boldsymbol{e}}^{\rm T}} {\mathit{\boldsymbol{e}}} - {\tilde{{\mathit{\boldsymbol{v}}}}}_T^{\rm T} \mathit{\boldsymbol{K}}_{\rm e}^{- 1}{\mathit{\boldsymbol{K}}_{\rm B}} {{{\tilde{{\mathit{\boldsymbol{v}}}}}}_T}+ \\ & {\tilde{{\mathit{\boldsymbol{v}}}}}_T^{\rm T} \mathit{\boldsymbol{K}}_{\rm e}^{- 1} \left[{{{{\dot{{\mathit{\boldsymbol{v}}}}}}_T} - {{{\dot{\varDelta}}}_{\rm p}} + {\rm{sgn}} \overset\frown{\boldsymbol{v}} _{T} \left({{\rho_{\rm a}} + \frac{{2{\rho_{\rm p}}}}{{\delta t}}}\right)}\right] \end{align} $

(43)

根据式(29)，可得

$ \begin{align} | {{\dot{\varDelta}_{\rm p}}} |= \frac{{{\rm d}| {{\mathit{\boldsymbol{v}}_E} - {\mathit{\boldsymbol{v}}_{\rm d}}} |}}{{{\rm d}t}} \leqslant \frac{{2{\rho_{\rm p}}}}{{\delta t}} \end{align} $

(44)

显然，

$ \begin{align} \overset\frown{\boldsymbol{v}} _{T}^{\rm T} ({{\dot{{\mathit{\boldsymbol{v}}}}_T} + {\rm{sgn}} \overset\frown{\boldsymbol{v}} _{T}{\rho_{\rm a}}}) & = | { \overset\frown{\boldsymbol{v}} _{T}^{\rm T}} || {{{{\dot{{\mathit{\boldsymbol{v}}}}}}_T} + {\rm{sgn}} \overset\frown{\boldsymbol{v}} _{T}{\rho_{\rm a}}} | \end{align} $

(45)

$ \begin{align} \overset\frown{\boldsymbol{v}} _{T}^{\rm T} \left({{\rm{sgn}} \overset\frown{\boldsymbol{v}} _{T}\frac{{2{\rho_{\rm p}}}}{{\delta t}} - {\dot{\varDelta}_{\rm p}}}\right) & = | { \overset\frown{\boldsymbol{v}} _{T}^{\rm T}} | \left| {\rm{sgn}} \overset\frown{\boldsymbol{v}} _{T}\frac{{2{\rho_{\rm p}}}}{{\delta t}} - {{{\dot{\varDelta}}}_{\rm p}} \right| \end{align} $

(46)

将式(45)(46) 代入式(43) 可得

$ \begin{align} \dot V=& - k(t){\mathit{\boldsymbol{e}}^{\rm T}} {\mathit{\boldsymbol{e}}} - {\tilde{{\mathit{\boldsymbol{v}}}}}_T^{\rm T} \mathit{\boldsymbol{K}}_{\rm e}^{- 1}{\mathit{\boldsymbol{K}}_{\rm B}} {{{\tilde{{\mathit{\boldsymbol{v}}}}}}_T}- \\ & | { \overset\frown{\boldsymbol{v}} _{T}^{\rm T}} |\mathit{\boldsymbol{K}}_{\rm e}^{- 1} \left| - {{{\dot{\varDelta}}}_{\rm p}} + {\rm{sgn}} \overset\frown{\boldsymbol{v}} _{T}\frac{{2{\rho_{\rm p}}}}{{\delta t}} \right| - \\ & | { \overset\frown{\boldsymbol{v}} _{T}^{\rm T}} |\mathit{\boldsymbol{K}}_{\rm e}^{- 1}| {{{{\dot{{\mathit{\boldsymbol{v}}}}}}_T}+ {\rm{sgn}} \overset\frown{\boldsymbol{v}} _{T}{\rho_{\rm a}}} | + o({\mathit{\boldsymbol{v}}_T}) \end{align} $

(47)

其中$ o({{\mathit{\boldsymbol{v}}}_{T}})={\mathit{\boldsymbol{v}}}_{T} {\mathit{\boldsymbol{K}}}_{\rm e}^{-1} \left[{\dot{\mathit{\boldsymbol{v}}}_{T} -\dot{\mathit{\boldsymbol{\varDelta}}}_{\rm p} +{\rm{sgn}} \overset\frown{\boldsymbol{v}} _{T} \left({\rho_{\rm a} +\dfrac{2\rho_{\rm p}} {\delta t}}\right)} \right] $。若目标静止，$ {\mathit{\boldsymbol{v}}}_{T} = $ 0，$ o({{\mathit{\boldsymbol{v}}}_{T}})= 0 $，那么$ \dot{V}\leqslant 0 $，其中$ \dot{V}=0 $ 当且仅当$ t\to \infty $，$ \overset\frown{\boldsymbol{v}} _{T} \to 0 $，$ {\mathit{\boldsymbol{e}}}\to 0 $。当目标仍带有残余速度，$ o({{\mathit{\boldsymbol{v}}}_{T}} $) 有界，且$ \dot{V}({t=0})\ll 0 $ 保证了终态时$ \dot{V}\approx 0 $。由此可见，末端执行器可以在一个可忽略的误差内跟踪期望点，保证了该自适应控制器的渐近稳定性和收敛性。

4 仿真（Simulations）

本研究旨在控制机械臂在各种约束条件下以最小的能耗、最小的误差跟踪期望轨迹，实现对目标的捕获。本文从精度、效率和能耗等方面分析了该控制器的性能，通过数值仿真研究了利用带有SSRMS型机械臂的空间机器人捕获失效目标时的控制器性能。所有的案例研究均采用软件进行，采样周期为0.1 s。在如下3种假设下进行仿真：1) 有外部干扰（如重力梯度）；2) 机械臂与底座均为刚体；3) 末端执行器捕获目标后机械臂无碰撞地连接目标。假设目标的姿态可以通过手眼视觉系统获得。图 6展示了空间机器人和目标在接近阶段的初始状态。

图 6 空间机器人捕获失效目标时的初始状态 Fig.6 state of the space robot capturing a defunct target

空间机器人飞行器坐标系$ \{O_{o}\} $ 与目标星坐标系$ \{T\} $ 相距3.5 m。机械臂的初始角度是$ {\mathit{\boldsymbol{\theta}}} (0) $ $ = $ $ [13,90,37, -138,10, -76, 25]^{\circ} $。机械臂的具体参数及初始条件如表 1所示，其他相关参数及条件如下：$ \varGamma_{\rm v} =1 $，$ \varGamma_{\rm p} = $ 0.01，$ \rho_{\rm p} = $ 0.1 rad，$ \xi_{0} = $ 0.05 m，$ \xi $ $ = $ $ {a_{4}} /2 $，$ \overline{d}_{\rm s} = $ 0.002 m/s，$ \overline{\mathit{\boldsymbol{\tau}}}=-\underline{\mathit{\boldsymbol{\tau}}}= [120, 120, 120, 100, $ $ 80, 80, 80] $ N/m，$ \overline{\mathit{\boldsymbol{\theta}}}=-\mathit{\boldsymbol{\theta}}\!=\! [90, 180, 120, 120, 120, 100, 180]^{\circ} $，$ \overline{\dot{\mathit{\boldsymbol{\theta}}}}=-\underline{\dot{\mathit{\boldsymbol{\theta}}}}= [30, 30, 30, 30, 30, 30, 30]^{\circ} $/s。机械臂的末端初始运动状态为$ {\mathit{\boldsymbol{p}}}_{E} (0)= $ $ [$0.60 m$, $ 0.42 m$, $ $ - $1.7 m$, $ $ - $2.02 rad$, $ 0$, $ 3.14 rad$] $。

表 1 空间机器人的运动学和动力学参数 Tab. 1 Kinematic and dynamic parameters of the space robot

刚体编号	0	1	2	3	4	5	6	7
$ a_{i-1} $ /m	–	0	0	0	2	2	0	0
$\alpha_{i-1} $ /($^{\circ}$)	–	$-$90	90	$-$90	0	0	$-$90	$-$90
$ d_{i} $ /m	–	0.17	0.175	0.175	0.18	0.175	0.175	0.4
质量/kg	200	1.735	2.079	3.01	5.475	5.078	3.01	3.705
$\underline{I}_{xx}^{i} $ /(kg$\cdot $mm$^{2}$)	830.3	834.3	4514.4	7464.5	1486.4	744.2	7342.9	2626.3
$\underline{I}_{yy}^{i}$ /(kg$\cdot $mm$^{2}$)	1309.7	659.4	3148.4	4331.0	26816.2	4495.94	387.3	3666.4
$\underline{I}_{zz}^{i} $ /(kg$\cdot $mm$^{2}$)	1339.6	658.6	3337.7	5827.4	26819.3	605.5	545.8	1651.36
$\underline{I}_{xy}^{i} $ /(kg$\cdot $mm$^{2}$)	9.913	$-$2.97	0.384	$-$6.943	240.4	20.3	$-$2.09	$-$2.31
$\underline{I}_{xz}^{i} $ /(kg$\cdot $mm$^{2}$)	$-$0.717	0.717	$-$0.564	$-$1.323	$-$54.14	1.69	$-$1.31	1.7493
$\underline{I}_{yz}^{i} $ /(kg$\cdot $mm$^{2}$)	4.319	$-$1.32	15.16	$-$3.91	6.613	3.30	$-$6.37	$-$18.0
$\mathit{\boldsymbol{r}}_{c}^{i} $ /mm	${[0, 57.2, 0]}$	${[0, -28.2, -58.4]}$	${[-4.87, 55.67, -29.9]}$	${[608.3, 0, -1.48]}$	${[100.4, 0.109, 1.07]}$	${[6.44, -57.5, -26.6]}$	${[0, 58.4, -28.1]}$	${[0, -16.6, 158.1]}$

表 1 空间机器人的运动学和动力学参数 Tab. 1 Kinematic and dynamic parameters of the space robot

式(21) 参数选定为

$ \begin{align} {\mathit{\boldsymbol{k}}_v}(t)& = [{{k_v}(t)} \; \; {{k_\omega}(t)}]\\ {k_v}(t) & = \begin{cases} \dfrac{{| {{\underline{\mathit{\boldsymbol{v}}}_{{{\rm e}} v}}} |}}{{| {\mathit{\boldsymbol{e}}} |}}, & \dfrac{{| {{\underline{\mathit{\boldsymbol{v}}}_{{{\rm e}} v}}} |}}{{| {\mathit{\boldsymbol{e}}} |}} < \dfrac{{{r_{\rm e}}}}{{| {\mathit{\boldsymbol{e}}} |}}\\ 0.6, & \dfrac{{| {{\underline{\mathit{\boldsymbol{v}}}_{{{\rm e}} v}}} |}}{{| {\mathit{\boldsymbol{e}}} |}} \geqslant \dfrac{{{r_{\rm e}}}}{{| {\mathit{\boldsymbol{e}}} |}} \end{cases} \\ {k_\omega} (t) & = \begin{cases} \dfrac{{| {{\underline{\mathit{\boldsymbol{v}}}_{{{\rm e}} \omega}}} |}}{{| {\mathit{\boldsymbol{e}}} |}}, & \dfrac{{| {{\underline{\mathit{\boldsymbol{v}}}_{{{\rm e}} \omega}}} |}}{{| {\mathit{\boldsymbol{e}}} |}} < \dfrac{{{\theta_{\rm e}}}}{{| {\mathit{\boldsymbol{e}}} |}} \\ 0.5, & \dfrac{{| {{\underline{\mathit{\boldsymbol{v}}}_{{{\rm e}} \omega}}} |}}{{| {\mathit{\boldsymbol{e}}} |}} \geqslant \dfrac{{{r_{\rm e}}}}{{| {\mathit{\boldsymbol{e}}} |}} \end{cases} \end{align} $

(48)

其中$ | {\underline{\mathit{\boldsymbol{v}}}_{{\rm e}v}} |=| {\mathit{\boldsymbol{e}}_{\rm v} (0)} |/t_{\rm f} $，$ | {\underline{\mathit{\boldsymbol{v}}}_{\rm e\omega}} |=| {\mathit{\boldsymbol{e}}_{\omega} (0)} |/t_{\rm f} $，$ t_{\rm f} =10 $ s。本节模拟了2种工况：1) 空间机器人跟踪并捕获完全消旋并保持静止的目标星；2) 空间机器人跟踪并捕获不完全消旋并保持残余速度$ \mathit{\boldsymbol{\omega}}_{T} = $ [0.1$, $ 0.1$, $ 1.5]$ ^{\circ} $/s的自旋目标星。

4.1 精度分析

工况1的抵达时间$ t_{\rm f} = $ 10 s。图 7给出了目标捕获点与末端执行器位姿之间的跟踪误差。可以看出，位置误差和姿态误差收敛到0。关节角度和关节速度的变化过程如图 8所示，其中关节轨迹是平滑的，速度是稳定的。图 9比较了控制策略优化后的末端执行器速度$ {\mathit{\boldsymbol{\nu}}}_{E} $ 与期望速度$ {\mathit{\boldsymbol{\nu}}}_{\rm d} $。不难发现，末端速度$ {\mathit{\boldsymbol{\nu}}}_{E} $ 是期望速度经过控制器优化后的结果，对跟踪收敛精度没有影响。微调幅度取决于优化系数$ \varGamma_{\rm p} $。若$ \varGamma_{\rm p} $ 太大，收敛速度则会很慢。图 10表明关节力矩是合理的，且在约束范围内。

图 7 工况1：末端执行器与目标静态捕获点之间的跟踪误差 Fig.7 Case 1: the tracking error between the end-effector and the static capturing point of the target

图 8 工况1：关节角度和速度的时间历程 Fig.8 Case 1: time histories of the joint angles and velocities

图 9 工况1：经本文控制器调节后末端执行器速度的时间历程和期望速度 Fig.9 Case 1: time histories of the end-effector velocity regulated by the proposed controller and the desired velocity

图 10 工况1：控制器优化后的关节力矩 Fig.10 Case 1: joint torques optimized by the controller

工况2的抵达时间$ t_{\rm f} = $ 10 s。图 11展示了捕获点和末端执行器之间的动态跟踪误差。位置和姿态误差在开始10 s内迅速收敛，并接近于0。末端执行器在接下来30 s的跟踪阶段继续跟踪。跟踪阶段的平均误差为$ e_{px} = $ 3 mm，$ e_{py} = $ 18 mm，$ e_{pz} = $ 27 mm，$ e_{\varPsi x} = $ 1.5$ ^{\circ} $，$ e_{\varPsi y} = $ 6.5$ ^{\circ} $ 和$ e_{\varPsi z} = $ 3$ ^{\circ} $，均满足容差要求。

图 11 工况2：末端执行器与目标动态捕获点之间的跟踪误差 Fig.11 Case 2: the tracking error between the end-effector and the dynamic capturing point of the target

关节角度和关节速度变化过程如图 12所示，关节轨迹平滑，关节速度稳定。图 13对比了末端执行器速度$ {\mathit{\boldsymbol{\nu}}}_{E} $ 与期望速度$ {\mathit{\boldsymbol{\nu}}}_{\rm d} $。在接近阶段，末端执行器速度被轻微修改以达到最优效果。此外，在跟踪阶段，末端执行器的速度跟踪期望效果较好，特别是在$ {\mathit{\boldsymbol{v}}}_{x} $, $ {\mathit{\boldsymbol{v}}}_{z} $, $ \dot{\mathit{\boldsymbol{\varPsi}}}_{x} $, $ \dot{\mathit{\boldsymbol{\varPsi}}}_{z} $ 四个方向上。图 14表明关节力矩是合理的，并且在约束范围内。

图 12 工况2：关节角度和速度的变化历程 Fig.12 Case 2: time histories of the joint angles and velocities

图 13 工况2：末端执行器速度的时间历程和期望速度 Fig.13 Case 2: time histories of the end-effector velocity and the desired velocity

图 14 工况2：最优关节力矩 Fig.14 Case 2: optimal joint torques

从这些图中可以看出，规划轨迹和约束都得以实现。图 15给出了采用所设计的控制策略后机械臂在避障和接近动态抓捕点的过程中每一个时刻的构形。它直观地说明了空间机器人末端执行器可到达捕获点并避免碰撞。图 15(b)隐藏了飞行器和目标，以便清晰地展示接近和跟踪阶段的构形。

图 15 工况2的接近和跟踪阶段 Fig.15 The approaching and tracking phases for Case 2

4.2 效率

工况1的计算代码是在Win10操作系统上执行的，系统采用主频为2.30 GHz的Intel^® Core$ ^{\rm{TM}} $ i5-6300HQ四核CPU。在此平台上，该算法的计算时间为5.3 ms，由Windows API函数测量。这个时间足够将所提出的算法集成到实时系统中。

为了验证该控制器在控制器优化问题中的求解效率优势，将该方法与2个方法进行了比较，分别是文[27]提出的基于凸优化的轨迹规划方案（COTP）和文[22]提出的改进的最优积分滑模控制（OISMC）。COTP方法使用关节速度作为决策变量，产生的轨迹规划问题用凸二次规划法求解。OISMC方法是一种能耗效率高、计算复杂度低的控制方法。在捕获阶段，控制器执行400次优化，平均每次优化计算时间为14.1 ms。表 2比较了上述3种方法在每次优化迭代中的计算效率。以上分析通过比较各优化算法的平均解算时间来说明各控制算法的计算复杂度。

表 2 3种方法的计算效率对比 Tab. 2 Computation time of the three methods

4.3 能耗

采用能耗模型直观地反映了其优化的效果。这里提出一个测量能耗的方法：

$ \begin{align} f= \int_0^{{t_{\rm f}}} \dot{\theta}{}^{\rm T} \mathit{\boldsymbol{\tau}} {\rm d}t \end{align} $

(49)

以工况1为例，其能耗结果如图 16所示。结果表明，在未进行优化的情况下，所提控制策略的能耗要小于采用相同控制策略但不优化能耗的方法，能量效率提高75%。

图 16 对工况1进行能耗优化和不进行能耗优化情况下所设计控制器的能耗 Fig.16 Energy consumption of the proposed controller with and without energy optimization for Case 1

4.4 实验验证

实验中空间机器人基座固定在平台上，机械臂和目标星模拟器均位于气浮台上，抓捕运动、目标星模拟器运动均处于同一平面，通过零重力气浮装置支撑在气浮台上，保证实现空间无重力情况的等效模拟。机械臂关节3、关节4、关节5可以运动。目标星的运动模拟了空间章动在气浮台平面的投影轨迹，进行了抓捕的等效实验。空间机器人在最优能耗条件下进行目标捕获的地面等效实验的布局如图 17所示。目标星做摆动角为12$ ^{\circ} $、周期为80 s的正弦摆动。

图 17 空间机器人在最优能耗条件下进行目标捕获的地面等效实验 Fig.17 Ground equivalent experiment of the space robot capturing the target with optimal energy-consumption

利用本文提出的控制策略，空间机器人能够以最优的能耗有效地跟踪目标，如图 18所示。前70 s是接近跟踪过程，之后机械臂与目标星发生接触、形成复合体，产生了力矩的波动。从图 19~图 21可以看出，在接近跟踪过程，即前70 s，本文方法的跟踪精度可以达到0.75$ ^{\circ} $，平均跟踪误差为0.34$ ^{\circ} $，可以有效地跟踪目标运动。根据式(49) 可以计算出，使用本文控制方法时能耗为64 J，不使用能耗优化控制器时能耗为89 J，两相比较，能耗降低了39.06%。受空气阻力、手臂部分关节锁定等因素的影响，实验结果与仿真结果相比会存在一些差距。

图 18 基于最优能耗的自适应跟踪控制策略下关节3~5的角度跟踪误差 Fig.18 Angle tracking errors of the 3rd$\sim $5th joints in the adaptive tracking control strategy based on optimal energy-consumption

图 19 基于最优能耗的自适应跟踪控制策略下关节3~5的力矩 Fig.19 Torques of the 3rd$\sim $5th joints in the adaptive tracking control strategy based on optimal energy-consumption

图 20 自适应跟踪控制策略下关节3~5的角度跟踪误差 Fig.20 Angle tracking errors of the 3rd$\sim $5th joints in the adaptive tracking control strategy

图 21 自适应跟踪控制策略下关节3~5的力矩 Fig.21 Torques of the 3rd~5th joints in the adaptive tracking control strategy

5 结论（Conclusion）

提出了一种可以优化能耗的自适应跟踪控制器，可以在耦合、非线性、不确定性、障碍和一系列关节限制等约束下实现目标跟踪和捕获。该控制方法在关节空间中转化为具有线性等式和不等式约束的二次规划问题。引入了方位角$ \varphi $ 作为中间变量，将优化问题转化为对方位角$ \varphi $ 的优化，并且满足力矩约束条件。尽管存在各种不确定性和约束条件，但本文控制方法仍能保持机械臂期望的运动性能并实现避障，关节跟踪精度可以达到1$ ^{\circ} $ 以内。采用末端执行器优化与转矩优化相结合的优化方法对控制所需的能量进行了优化，能耗降低39% 以上。能耗优化控制方法可以在不降低跟踪性能的情况下减少能耗。本文的控制策略可避免因目标速度的测量和测不准而造成的误差。该方法将机械臂动力学方程转化为具有下三角矩阵的显式状态方程，在优化机械臂力矩方面具有效率优势，可以在5.31 ms内完成计算。本文设计的控制器对实际工程具有重要意义。

参考文献（References）

[1]	Shan M H, Guo J, Gill E. Review and comparison of active space debris capturing and removal methods[J]. Progress in Aerospace Sciences, 2016, 80: 18-32. DOI:10.1016/j.paerosci.2015.11.001
[2]	May G, Barletta I, Stahl B, et al. Energy management in production: A novel method to develop key performance indicators for improving energy efficiency[J]. Applied Energy, 2015, 149: 46-61. DOI:10.1016/j.apenergy.2015.03.065
[3]	Zhou Y Q, Luo J J, Wang M M. Dynamic coupling analysis of multi-arm space robot[J]. Acta Astronautica, 2019, 160: 583-593. DOI:10.1016/j.actaastro.2019.02.017
[4]	Aghili F, Parsa K. An adaptive vision system for guidance of a robotic manipulator to capture a tumbling satellite with unknown dynamics[C]//IEEE/RSJ International Conference on Intelligent Robots and Systems. Piscataway, USA: IEEE, 2008: 3064-3071.
[5]	Aghili F, Parsa K. An adaptive Kalman filter for motion esitmation/prediction of a free-falling space object using laser-vision data with uncertain inertial and noise characteristics[C]//AIAA Guidance, Navigation and Control Conference and Exhibit. Reston, USA: AIAA, 2008. DOI: 10.2514/6.2008-7317.
[6]	Shi L L, Kayastha S, Katupitiya J. Robust coordinated control of a dual-arm space robot[J]. Acta Astronautica, 2017, 138: 475-489. DOI:10.1016/j.actaastro.2017.06.009
[7]	Zhang B, Liang B, Wang X, et al. Manipulability measure of dual-arm space robot and its application to design an optimal configuration[J]. Acta Astronautica, 2016, 128: 322-329. DOI:10.1016/j.actaastro.2016.07.040
[8]	Shi L L, Jayakody H, Katupitiya J, et al. Coordinated control of a dual-arm space robot: Novel models and simulations for robotic control methods[J]. IEEE Robotics & Automation Magazine, 2018, 25(4): 86-95.
[9]	Wang H L, Xie Y C. Prediction error based adaptive Jacobian tracking for free-floating space manipulators[J]. IEEE Transactions on Aerospace and Electronic Systems, 2012, 48(4): 3207-3221. DOI:10.1109/TAES.2012.6324694
[10]	Talebi H A, Khorasani K, Tafazoli S. A recurrent neuralnetwork-based sensor and actuator fault detection and isolation for nonlinear systems with application to the satellite's attitude control subsystem[J]. IEEE Transactions on Neural Networks, 2009, 20(1): 45-60. DOI:10.1109/TNN.2008.2004373
[11]	Zhang Y Y, Chen S Y, Li S, et al. Adaptive projection neural network for kinematic control of redundant manipulators with unknown physical parameters[J]. IEEE Transactions on Industrial Electronics, 2018, 65(6): 4909-4920. DOI:10.1109/TIE.2017.2774720
[12]	Zhou Z-G, Zhang Y-A, Zhou D. Robust prescribed performance tracking control for free-floating space manipulators with kinematic and dynamic uncertainty[J]. Aerospace Science and Technology, 2017, 71: 568-579. DOI:10.1016/j.ast.2017.10.013
[13]	Wang H S, Guo D J, Xu H, et al. Eye-in-hand tracking control of a free-floating space manipulator[J]. IEEE Transactions on Aerospace and Electronic Systems, 2017, 53(4): 1855-1865. DOI:10.1109/TAES.2017.2674218
[14]	董楸煌, 陈力. 柔性空间机械臂捕获卫星过程的鲁棒镇定与自适应抑振复合控制[J]. 机器人, 2014, 36(3): 342-348. Dong Q H, Chen L. Composite control of robust stabilization and adaptive vibration suppression of flexible space manipulator capturing a satellite[J]. Robot, 2014, 36(3): 342-348.
[15]	张博, 梁斌, 王学谦, 等. 双臂空间机器人可操作度分析及其构型优化[J]. 宇航学报, 2016, 37(10): 1207-1214. Zhang B, Liang B, Wang X Q, et al. Manipulability measure of a dual-arm space robot and its application to configuration optimization[J]. Journal of Astronautics, 2016, 37(10): 1207-1214. DOI:10.3873/j.issn.1000-1328.2016.10.008
[16]	Giordano A M, Ott C, Albu-Schaffer A. Coordinated control of spacecraft's attitude and end-effector for space robots[J]. IEEE Robotics and Automation Letters, 2019, 4(2): 2108-2115. DOI:10.1109/LRA.2019.2899433
[17]	Nanos K, Papadopoulos E. Avoiding dynamic singularities in Cartesian motions of free-floating manipulators[J]. IEEE Transactions on Aerospace and Electronic Systems, 2015, 51(3): 2305-2318. DOI:10.1109/TAES.2015.140343
[18]	Leigsnering M, Ahmad F, Amin M G, et al. Parametric dictionary learning for sparsity-based TWRI in multipath environ ments[J]. IEEE Transactions on Aerospace and Electronic Systems, 2016, 52(2): 532-547.
[19]	Pisculli A, Felicetti L, Gasoverlineri P, et al. A reaction-null/Jacobian transpose control strategy with gravity gradient compensation for on-orbit space manipulators[J]. Aerospace Science and Technology, 2014, 38: 30-40. DOI:10.1016/j.ast.2014.07.012
[20]	Peng J Q, Xu W F, Pan E Z, et al. Dual-arm coordinated capturing of an unknown tumbling target based on efficient parameters estimation[J]. Acta Astronautica, 2019, 162: 589-607.
[21]	Zhang B, Liang B, Wang Z W, et al. Coordinated stabilization for space robot after capturing a noncooperative target with large inertia[J]. Acta Astronautica, 2017, 134: 75-84.
[22]	Norsahperi N M H, Danapalasingam K A. An improved optimal integral sliding mode control for uncertain robotic manipulators with reduced tracking error, chattering, and energy consumption[J]. Mechanical Systems and Signal Processing, 2020, 142. DOI:10.1016/j.ymssp.2020.106747
[23]	de Stefano M, Mishra H, Balachandran R, et al. Multi-rate tracking control for a space robot on a controlled satellite: A passivity-based strategy[J]. IEEE Robotics and Automation Letters, 2019, 4(2): 1319-1326.
[24]	Jin M H, Liu Q, Wang B, et al. An efficient and accurate inverse kinematics for 7-DOF redundant manipulators based on a hybrid of analytical and numerical method[J]. IEEE Access, 2020, 8: 16316-16330.
[25]	Jia Y H, Misra A K. Robust trajectory tracking control of a dualarm space robot actuated by control moment gyroscopes[J]. Acta Astronautica, 2017, 137: 287-301.
[26]	Rimon E, Boyd S P. Obstacle collision detection using best ellipsoid fit[J]. Journal of Intelligent and Robotic Systems, 1997, 18(2): 105-126.
[27]	Yang S J, Wen H, Jin D P. Trajectory planning of dual-arm space robots for target capturing and base manoeuvring[J]. Acta Astronautica, 2019, 164: 142-151.