自动化学报  2017, Vol. 43 Issue (7): 1169-1177   PDF    
非完整性约束的平面多智能体位置时变一致性控制
赵俊1, 刘国平1     
1. 哈尔滨工业大学控制理论与制导技术研究中心 哈尔滨 150080
摘要: 多智能体的通用一致性协议被广泛用于智能体的编队控制问题中.在实际工程中,多智能体系统为了完成期望的协作控制,智能体之间的位置关系通常是时变的.目前,在多智能体编队控制问题中,尽管已有研究成果能够解决多智能体某些特殊类型的时变编队控制,但对一般性的时变编队还没有成熟的研究成果.本文以受非完整性约束的平面多智能体为研究对象,提出了平面非完整性多智能体的位置时变一致性协议.实验结果表明:本文提出的位置时变一致性协议能够有效解决平面非完整性多智能体系统一般性的时变编队问题.
关键词: 多Agent系统     多机器人运动协作     非完整性系统     时变编队    
Position Time-varying Consensus Control for Multiple Planar Agents with Non-holonomic Constraint
ZHAO Jun1, LIU Guo-Ping1     
1. Research Center of Control Center and Guidance Technology, Harbin Institute of Technology, Harbin 150080
Manuscript received : August 25, 2016, accepted: November 23, 2016.
Foundation Item: Supported by National Natural Science Foundation of China (61333003, 61690212)
Author brief: LIU Guo-Ping  Professor at the Harbin Institute of Techonology, IEEE Fellow. His research interest covers networked control systems, multi-agent systems, identify and control of non-liner systems, and multi-object optimization
Corresponding author. ZHAO Jun  Ph. D. candidates at the School of Astronautics, Harbin Instititue of Technology. He received his master degree from South West University of Science and Technology in 2011. His research interest covers formation control of networked control systems and time-variant formation of multi-agnet systems. Corresponding author of this paper. E-mail:zjlzl1031@icloud.com
Recommended by Associate Editor LV Jin-Hu
Abstract: The general consensus protocol is widely used to solve multi-agent formation problems. In engineering applications, to achieve a desired coordination, the position relationship between agents is time-varying. Recently, various research results have been obtained on some special types of time-varying formations. However, solutions to a general time-variant formation problem are very few. Therefore, a position time-variant consensus protocol of planar multi-agent systems with non-holonomic constraints is presented. Experimental results show that the proposed position time-varying consensus protocol is able to effectively solve the general time-variant formation of planar multi-agent systems with non-holonomic constraints.
Key words: Multi-agent systems     mulit-robot motion coordination     non-holonomic systems     time-variant formation    

非完整性约束系统是一种典型的运动系统, 因受到非完整性约束, 是一种欠驱动系统, 在工程中因具有结构简单等优点而被广泛应用[1-2].近年来随着多智能体一致性理论和机器人协同控制技术的发展, 非完整性约束系统的编队控制逐渐成为研究热点[3].文献[4-5]提出了离散时间轮式机器人的同步问题, 通过将相邻机器人的跟踪误差进行耦合并将每个机器人设计成一个跟踪系统的方式, 实现了多个轮式机器人基于虚结构的编队控制, 然而文献采用了一种集中控制方式, 这使得当机器人的数量大量增加时, 集中控制器的性能将迎来巨大挑战.文献[6]提出了一种基于主从结构的编队控制方式, 将每个跟随者都设计成一个跟踪控制系统, 跟踪领航者体坐标系内的一个固定坐标, 从而在领航者的体坐标系下保持一个固定的队形.文献[7-8]分别利用一致性理论和自适应控制策略, 对非完整性智能体的编队控制进行讨论, 但研究结果没有经过实际实验验证, 其工程实用性有待进一步考证.

在多智能体的协调控制中, 所期望的智能体的队形通常是时变的.对于时变队形, 目前研究较少.文献[9]提出了一种适用于UAV (Unmanned aerial vehicles)的时变编队控制.文献[9]提出的多智能体的编队协议有效解决了一类能够描述成"一个运动的坐标系"以及"坐标系内的时不变编队''的时变编队控制问题.文献[10-11]在文献[9]的基础上将这一类的时变编队控制推广到二阶和高阶线性系统中.文献[12]中讨论的时变编队控制是多个时不变队形的切换, 文献[13]是利用同步的方法, 解决了和文献[9]描述的相同的问题, 相对于一个运动的坐标系的时不变编队.

对于多智能体一般性的时变编队控制, 目前文献中没有成熟的解决方案.为了解决这个问题, 本文针对受非完整性约束的平面多智能体系统, 提出了适用于一般性时变编队的位置时变一致性协议.

本文的后续部分主要由以下5部分构成, 其中在第1节中给出了受非完整性约束的平面智能体的运动学方程, 以及位置时变一致性协议对通信拓扑结构的要求; 第2节中给出了平面非完整性多智能体的位置一致性问题描述、位置时变一致性的定义以及相关假设; 文章的第3节给出了平面非完整性多智能体系统的位置一致性协议的设计以及稳定性分析; 第4节为本文所提出方法的实验验证; 最后一节为本文的结论部分.

1 预备知识 1.1 平面非完整性多智能体系统

平面非完整性智能体是指受到非完整性约束的平面运动的智能体[14].一般而言, 在研究中, 选取智能体的旋转中心在世界坐标系下的位置作为智能体的位置, 选取智能体的体坐标系与世界坐标系的夹角作为智能体在世界坐标系下的方向, 平面非完整性智能体的运动学模型可以描述为

$\begin{align}\dot{\pmb{x}}(t)=\pmb{S}(\varphi(t))\pmb{u}(t)\label{original_kinematic}\end{align}$ (1)

其中, $\pmb{x}(t)=\left[x(t)~~y(t)~~\varphi(t)\right]^{\rm T}$为智能体的广义坐标, $\left(x(t), y(t)\right)$为智能体在世界坐标系的坐标, $\varphi(t)$为智能体的方向.$\pmb{u}(t)=\left[v(t)~~\omega(t)\right]^{\rm T}$为智能体的控制输入, 其中$v(t)$为线速度, $\omega(t)$为角速度,

$\begin{align}\pmb{S}(t)=\left[\begin{array}{cc}\cos\varphi(t)&0 \\\sin\varphi(t)&0 \\ 0&1 \end{array} \right] \label{origin_s}\end{align}$ (2)

从式(1) 和(2) 可以看出, 智能体受到如式(3) 描述的约束, 是一种非完整性约束.

$\begin{align}\dot{x}(t)\sin\varphi(t) = \dot{y}(t)\cos\varphi(t)\label{constraint}\end{align}$ (3)

注意到, 在用智能体的旋转中心在世界坐标系下的位置代表智能体的位置时, 控制输入$\pmb{u}(t)$在形式上不能直接作用于位置输出$\pmb{y}(t)$, 因此, 在文献中常使用线性化方法[15-16]、Backstepping方法[17]、Cascade策略[18]等方法进行控制.在本文中, 我们通过选取智能体$i$上某一特殊点$\mathcal{P}_i$代替智能体的旋转中心, 用$\mathcal{P}_i$在世界坐标系下的坐标描述智能体位置的方式将受非完整性约束的平面智能体的控制问题转化为无约束的智能体的控制问题.$\mathcal{P}_i$的选择方法如下:如图 1所示, 以平面非完整性智能体的旋转中心为原点, 以线速度的方向为$X$轴的方向, 以世界坐标系的$Z$轴方向为$Z$轴方向, 按右手准则建立智能体的体坐标系; 特征点$\mathcal{P}_i$在智能体$i$的体坐标系下的坐标为$\left(l_i, 0\right)$, $l_i \neq 0 $.重复使用式(1) 中的符号$\pmb{x}$描述智能体在世界坐标系下的位姿, 以特征点相对于世界坐标系的的位置作为智能体的位置, 则由$n+1$个平面非完整性智能体组成的多智能体的运动学模型描述为

图 1 平面非完整性智能体运动学模型示意图 Figure 1 Kinematic model diagram of planar non-holonomic systems
$\begin{align}\dot{\pmb{x}}_i(t)=& \left[\begin{array}{ccc} \dot{x}_{pi}(t) &\dot{y}_{pi}(t)&\dot{\varphi}_i(t)\end{array} \right]^{\rm T}=\notag \\&\left[\begin{array}{cc} \cos\varphi_i(t) &-l \sin\varphi_i(t) \\\sin\varphi_i(t)&l\cos\varphi_i(t) \\ 0&1 \end{array}\right]\pmb{u}_i(t) \label{continuous_kinematic}\end{align}$ (4)

$\pmb{u}_i(t)$$T$为周期零阶保持, 可以得到式(4) 的精确离散化模型如下:

$\begin{align}\pmb{x}_i(t+1) = \pmb{x}_i(t) + \Psi_i(t)\pmb{u}_i(t)\label{discrete_kinematic}\end{align}$ (5)

其中

$\begin{align}&\Psi_i(t) = \left[\begin{array}{c}\mathcal{R}_i(t) \\ 0 ~~~~~~T\end{array} \right]_{3×2}\notag \\&\mathcal{R}_i(t) = \left\{\begin{array}{ll}2\dfrac{\sin\left(\frac{T}{2}\omega_i(t)\right)}{\omega_i(t)}λ_i(t),&\omega_i(t) \neq 0 \\Tλ_i(t),&\mbox{其他}\end{array}\right.\notag \\& λ_i(t)=\left[\begin{array}{cc} \cos\gamma_i(t) &-l\sin\gamma_i(t) \\ \sin\gamma_i(t)&l\cos\gamma_i(t)\end{array}\right] \notag \\&\gamma_i(t) = \varphi_i(t) +\frac{2}{T}\omega_i(t) \notag\end{align}$

注意到, 当$\omega_i(t) = 0$时, 根据精确离散化过程, 容易得到由式(5) 描述的离散时间模型在$\omega_i(t) = 0$处是连续的.

1.2 通信拓扑结构和智能体编号

本文中使用有向图$ {_{o}}{\mathcal{G}}=\left\{ {_o}{\mathcal{V}}, {_o}{\mathcal{E}}, {_o}{\mathcal{A}}\right\}$描述网络化平面非完整性多智能体的通信拓扑结构, 其中$ {_o}{\mathcal{V}}=\left\{ {_o}{v}_0, {_o}{v}_1, \cdots, {_o}{v}_n \right\}$是一个非空有限的节点集合, $\mathcal{E} \subset \mathcal{V} × \mathcal{V}$为边集, ${_o}{\mathcal{A}}=\left[{_o}a_{ij}\right]$为邻接矩阵.如果$\left({_o}v_i, {_o}v_i\right) \in {_o}{\mathcal{E}}$, 那么${_o}a_{ij}> 0$; 反之, $ {_o}a_{ij} = 0$.

为了能够实现通用的时变位置一致性控制策略, 本文采用比例-微分形式的一致性协议, 即智能体不仅考虑相邻智能体的位置信息, 还考虑相邻智能体的控制输入.为了消除智能体之间的双向耦合, 对多智能体系统的通信拓扑结构做如下要求:1) 多智能体系统的网络拓扑结果包含一个以领航者为根节点的有向生成树$\mathcal{T}$.2) 对智能体按如下规则编号:记有向生成树$\mathcal{T}$的根节点(领航者)为智能体$0$; 记$\mathcal{T}$中智能体$0$的第一个子节点为智能体$1$; 按照广度优先的原则遍历[19]$\mathcal{T}$并对剩余的所有智能体逐个编号.将编号以后的通信拓扑结构记为$ {_n}{\mathcal{G}}=\left\{ {_n}{\mathcal{V}}, {_n}{\mathcal{E}}, {_n}{\mathcal{A}} \right\}$.4) 定义: $\mathcal{V}= {_n}{\mathcal{V}}$, $\mathcal{E}={_n}{\mathcal{E}} \bigcap \left\{\left(v_j, v_i\right)|j<i\right\}$, $\mathcal{A}= {_n}{\mathcal{A}} \circ\mathcal{H}$; 其中$\circ$为Hadamard乘,

$\begin{align}\mathcal{H}=\left[h_{ij}\right], \quad h_{ij}=\left\{\begin{array}{ll} 1,&i\leq j \\ 0,&i > j\end{array} \right.\end{align}$ (6)

5) 定义$d_i=\sum_{k=0}^{i-1}a_{ik}$为Agent-$i$的入度.本文提出的位置一致性控制策略基于通信拓扑结构$\mathcal{G}=\left\{\mathcal{V}, \mathcal{E}, \mathcal{A}\right\}$进行设计.特别地, 当$(v_j, v_i) \in \mathcal{E}$时, 取$a_{ij} = 1$; 反之, 取$a_{ij}=0$.

2 问题的提出

在当前多智能体的一致性问题中, 一般要求当多智能体系统达到一致时, 各个智能体的状态趋于相同或相差一个常数.然而, 在多智能体的协调控制中, 为了完成复杂工作, 多智能体之间的位置关系通常需要随时间变化.因此多智能体一致性理论在解决一般性时变编队和复杂的运动协调控制时, 遇到了瓶颈.

本文中, 我们关注于平面非完整性智能体的位置输出

$\begin{align}\pmb{y}_i(t) = \left[x_i(t)~y_i(t)\right]^{\rm T}, \quad i=0, \cdots, n\end{align}$ (7)

沿用"一致性"的概念, 定义平面非完整性多智能体系统的位置(输出)时变一致性误差:

$\begin{align}\delta_i(t) = \pmb{y}_i(t) - \pmb{y}_0(t) - \rho_{0i}(t)\label{error_define}\end{align}$ (8)

其中, $\rho_{ij}(t)$为光滑的二维时变向量, 用于描述多智能体达到时变一致时, 期望的智能体$j$与智能体$i$$t$时刻的位置(输出)的差, 特别地, $\forall i=0, \cdots, n, ~~\rho_{ii}(t) = 0$.不同于传统的"一致性"问题中智能体间的相互关系趋于一个静止的稳态, 在时变一致性问题中, 智能体之间保持一个期望的, 随时间变化的关系.本文中, 我们假设智能体多智能体系统期望达到的时变一致关系是全局已知的.

定义1. 当任意的智能体$i$, $i=1, \cdots, n$, 的一致性误差$\delta_i(t)$满足:

$\begin{align}\lim\limits_{t \rightarrow +\infty}\left\|\delta_i(t)\right\| \leq\epsilon \label{error_converg}\end{align}$ (9)

时, 称如式(5) 描述的平面非完整性多智能体系统的位置(输出)时变一致性是可以达到的, 其中$\epsilon$是稳态误差.

本文中, 主要研究智能体$i$, $i=1, \cdots, n$, 与智能体$0$保持位置(输出)时变一致.关于单个智能体$0$的控制问题, 不再赘述.在本文的实验部分, 智能体$0$采用文献[20]中描述的跟踪控制率跟踪一个期望的参考轨迹.

为了方便进行稳定性分析, 我们做如下三点假设:1) 智能体$0$是在一个采样周期内运动的范围是有界的, 即$\left\|\pmb{y}_0(t+1) -{\pmb y}_0(t)\right\|$有界; 2) 智能体之间期望维持的时变关系是已知的, 即$\forall 0\leq i < j\leq n, t\in {\bf R}^+, \rho_{ij}(t)$已知; 3) 智能体在每个采样周期都按照通信拓扑结构将自己的当前位置和当前采样周期内的控制输入发送给相邻智能体.

3 位置时变一致性协议

从式(5) 可以看出, 平面非完整性系统的运动学模型类似于一阶积分器系统, 但是因为$\mathcal{R}_i(t)$中包含了一项控制输入------角速度$\omega_i(t)$, 使得直接设计$\pmb{u}_i(t) = \left[v_i(t)~\omega_i(t)\right]^{\rm T}$变得困难.我们首先定义变换$\eta_i(t) = f(\pmb{u}_i(t))$如下:

$\begin{align}\eta_i(t) &= \left[\begin{array}{ll}\eta_{ix}(t) \\\eta_{iy}(t)\end{array}\right]= f(\pmb{u}_i(t))= \notag \\& \left\{\begin{array}{ll}\dfrac{T}{2}\pmb{u}_i(t),&\omega_i(t) = 0 \\\dfrac{\sin\left(\dfrac{T}{2}\omega_i(t)\right)}{\omega_i(t)}\pmb{u}_i(t),&\omega_i(t)\neq 0\end{array}\right.\label{u_transform}\end{align}$ (10)

对应的

$\begin{array}{l} {\mathit{\boldsymbol{u}}_i}(t) = \left[ {\begin{array}{*{20}{c}} {{v_i}(t)}\\ {{\omega _i}(t)} \end{array}} \right] = {f^{ - 1}}\left( {{\eta _i}(t)} \right) = \\ \left\{ {\begin{array}{*{20}{l}} {{{\left[ {\frac{2}{T}{\eta _{ix}}(t)\quad 0} \right]}^{\rm{T}}},} & {{\eta _{iy}} = 0}\\ {\left[ {\begin{array}{*{20}{l}} {\frac{{2{\eta _{ix}}(t)}}{{T{\eta _{iy}}(t)}}\arcsin ({\eta _{iy}}(t))}\\ {\frac{2}{T}\arcsin ({\eta _{iy}}(t))} \end{array}} \right],} & {{\eta _{iy}} \ne 0} \end{array}} \right. \end{array}$ (11)

把式(10) 描述的变换代入式(5), 可以得到:

$\begin{align}\pmb{y}_i(t+1) = \pmb{y}_i(t)+λ_i(t)\eta_i(t)\label{after_transformation}\end{align}$ (12)

注意到$λ_i(t)$是一个坐标旋转变化矩阵.对于大部分运动智能体而言, 智能体的执行机构固定在刚体坐标系下, 同时, 在智能体一致性问题中, 智能体的位姿又统一在世界坐标系中描述, 这使得$\pmb{u}_i(t)$的系数中包含智能体的刚体坐标系到世界坐标系的旋转矩阵, 这也是$\mathcal{R}_i(t)$存在的物理意义.因为智能体受到非完整性约束, 所以在设计$\pmb{u}_i(t)$时, $\gamma_i(t) = \varphi_i(t)+\frac{T}{2}\omega_i(t)$是未知的.

图 2描述了我们在处理$λ_i(t)$时的主要思路:把$\omega_i(t-1) $作为$\omega_i(t)$的近似值, 进一步得到$λ_i(t)$的近似$\widetilde{λ}_i(t)$(定义见下文).我们在近似的坐标旋转变换下设计$\pmb{u}_i(t)$.如图 2所示, 当$λ_i(t)$与计算的近似值$\widetilde{λ}_i(t)$接近时, 设计的$\pmb{u}_i(t)$的主要分量能够作用到期望的坐标变换下, 因$λ_i(t)$$\widetilde{λ}_i(t)$的差异而产生的期望以外的控制效果可以当做扰动处理.在工程应用中, 一般要求受非完整性约束的智能体的运动轨迹是光滑的, 因此, 在系统的采样频率满足要求时, $\omega_i(t)$$\omega_i(t-1) $是非常接近的.

图 2 $λ_i(t)$$\widetilde{λ}_i(t)$近似关系示意图 Figure 2 Diagram of approximate relationship between $λ_i(t)$ and $\widetilde{λ}_i(t)$

给出:

$\begin{align}\eta_i(t)&=\frac{1}{2}\widetilde{λ}_i^{-1}(t)\frac{1}{d_{i}}\sum\limits_{j=0}^{i-1}\Bigg(a_{ij}\Big(\big(\pmb{K}-\pmb{I}\big)\big(\pmb{y}_i(t)-\nonumber\\&{\pmb{y}}_j(t) \label{designed_u}-\rho_{ji}(t)\big)+\Delta\rho_{ji}(t) + \mathcal{R}_j(t){\pmb{u}}_j(t) \Big)\Bigg)\end{align}$ (13)

其中, $\Delta\rho_{ji}(t) = \rho_{ji}(t+1) -\rho_{ji}(t)$, $\pmb{K}=\text{diag}\left\{k_1, k_2\right\}$, $k_1 \in (0, 1), k_2\in (0, 1) $, 且$k_1$, $k_2$为可调常参数.

定理1. 对于如式(4) 所描述的平面非完整性多智能体系统, 只要多智能体系统的通信拓扑结构包含一个有向生成树, 智能体按照广度优先的遍历规则进行编号, 智能体按照$\mathcal{A}$描述的邻接关系在每个采样周期将自身位姿和控制输入发送给相邻智能体, 且满足条件:

$\begin{align}\left\|\pmb{K}\right\| +\left\|\max\left(\Theta_i(t)\right)\right\|\left\|\pmb{K} - I\right\| < 1\end{align}$ (14)

在如式(11) 和(13) 描述的控制率的的作用下, 平面非完整性多智能体系统可以实现任意给定的, 由一组光滑的时变向量$\rho_{ij}(t)$, $i, j=1, \cdots, n, t\in\left[0, +\infty\right)$, 描述的时变一致关系且各个智能体的一致性误差$\delta_i(t)$指数收敛于原点的邻域内, 其中

$\begin{align}&\widetilde{λ}_i(t) = \left[\begin{array}{cc}\cos\widetilde{\gamma}_i(t) &-l\sin\widetilde{\gamma}_i(t) \\\sin \widetilde{\gamma}_i(t)&l\cos \widetilde{\gamma}_i(t)\end{array} \right] \notag \\&\widetilde{\gamma} = \varphi_i(t) +\frac{T}{2}\omega_i(t-1) \notag \\&\Theta_i(t) = I - λ_i(t)\widetilde{λ}^{-1}_i(t)= \notag \\&~~~~~~~~~\left[\begin{array}{rl}\sin^2\left(\frac{T}{4}\Delta\omega_i(t)\right) &\sin\left(\frac{T}{2}\Delta\omega_i(t)\right) \\-\sin\left(\frac{T}{2}\Delta\omega_i(t)\right)&\sin^2\left(\frac{T}{4}\Delta\omega_i(t)\right)\end{array}\right] \notag\\&\Delta\omega_i(t)= \omega_i(t)-\omega_i(t-1) \notag\end{align}$

证明.

将式(12) 代入式(8) 得到:

$\begin{align}\delta_i(t+&1) \label{delta_t_+1}= \pmb{y}_i(t) +λ_i(t)\eta_i(t) - \pmb{y}_0(t+1) -\notag\\& \rho_{0i}(t+1) = \pmb{y}_i(t) + \left(I -\Theta_i(t)\right)×\notag \\& \frac{1}{d_i}\sum\limits_{j=0}^{i-1}\Bigg(a_{ij}\Big(\big(\pmb{K}-\pmb{I}\big)\big(\pmb{y}_i(t)-{\pmb{y}}_j(t)-\notag \\&\rho_{ji}(t)\big)+\Delta\rho_{ji}(t)+\mathcal{R}_j(t){\pmb{u}}_j(t)\Big)\Bigg) -\notag \\& \pmb{y}_0(t+1) - \rho_{0i}(t+1) \end{align}$ (15)

注意到

$\begin{align}&\rho_{ji}(t) = \rho_{0i}(t) - \rho_{0j}(t)\end{align}$ (16)

因此, 可以得到:

$\begin{align}\delta_i(t+&1) =\frac{1}{d_i}\sum\limits_{j=0}^{i-1}\Bigg(a_{ij}\Bigg(\pmb{K}\big(\delta_i(t)-\delta_j(t)\big)+\notag \\&\delta_j(t+1) -\Theta_i(t)\Big( \big(\pmb{K}-\pmb{I}\big)\big(\delta_i(t) - \notag \\&\delta_j(t) \big)+\Delta\rho_{ji}(t)+\mathcal{R}_j(t)\pmb{u}_j(t) \Big) \Bigg) \Bigg)\label{delta_i+1_2}\end{align}$ (17)

根据$\Theta_i(t)$的定义, 容易得到:

$\begin{align}\left\|\Theta_i(t)\right\| \leq c_1\end{align}$ (18)

因为$\rho_{ij}(t)$是光滑的, 因此, 容易保证:

$\begin{align}\left\|\Delta\rho_{ji}(t)\right\|=\left\|\rho_{ji}(t+1) -\rho_{ji}(t)\right\|\leq c_2\end{align}$ (19)

下面, 我们通过数学归纳法分析多智能体系统的稳定性:

注意到, $\delta_0(t) = \pmb{y}_0(t) - \pmb{y}_0(t) = 0$.同时, 根据假设(1) 可以得到$\left\|\pmb{y}_0(t+1) -\pmb{y}_0(t)\right\|$是有界的, 即: $\left\|\mathcal{R}_0(t)\pmb{u}_0(t)\right\| < c_3$, 所以, 对于智能体$1$可以得到:

$\begin{align}&\left\|\delta_1(t+1) \right\|\leq \notag \\&\qquad \left(\left\|\pmb{K}\right\|+c_1\left\|\pmb{K}-\pmb{I}\right\|\right)\left\|\delta_1(t)\right\| + c_1c_2+c_1c_3 \leq \notag \\&\qquad\left(\left\|\pmb{K}\right\|+c_1\left\|\pmb{K}-\pmb{I}\right\|\right)^2\left\|\delta_1(t-1) \right\| + \notag \\&\qquad \left(c_1c_2+c_1c_3\right)\left(\left\|\pmb{K}\right\|+c_1\left\|\pmb{K}-\pmb{I}\right\|\right) \leq \cdots \leq\notag \\&\qquad \left(\left\|\pmb{K}\right\|+c_1\left\|\pmb{K}-\pmb{I}\right\|\right)^t\left\|\delta_1(0) \right\| + \notag \\&\qquad\left(c_1c_2+c_1c_3\right)\sum\limits_{m=0}^{t-1}\left(\left\|\pmb{K}\right\|+c_1\left\|\pmb{K}-\pmb{I}\right\|\right)^m\end{align}$ (20)

根据式(14) 可以得到:

$\begin{align} \lim\limits_{t \rightarrow +\infty}\left\|\delta_1(t)\right\| \leq \frac{c_1c_2+c_1c_3}{1-\left(\left\|\mathbf{K}\right\|+c_1\left\|\mathbf{K}-\mathbf{I}\right\|\right)}\end{align}$ (21)

对于任意的智能体$i$, $i = 2, \cdots, n$, 我们假设:

$\begin{align} \forall m=1, \cdots, i-1, \lim\limits_{t \rightarrow +\infty}\left\|\delta_m(t)\right\| \leq \epsilon \label{assumption_bounded}\end{align}$ (22)

结合假设(1)、假设(3) 和式(22) 可以得到:

$\begin{align}\forall m=1, \cdots, i-1, \left\|\mathcal{R}_m\pmb{u}_m(t)\right\|\leq c_3\notag\end{align}$

进一步, 可以得到:

$\begin{align}&\left\|\delta_i(t+1) \right\| \leq\notag \\&\qquad\|\pmb{K}\|\left\|\delta_i(t)\right\|+\left\|\delta_k(t+1) -\pmb{K}\delta_k(t)\right\|+\notag \\&\qquad c_1c_2+c_1c_3+c_1\left\|\pmb{K}-\pmb{I}\right\|\left\|\delta_i(t)\right\|+\notag \\&\qquad c_1\left\|\pmb{K}-\pmb{I}\right\|\left\|\delta_k(t)\right\| \leq\notag \\&\qquad(\left\|\pmb{K}\right\|+c_1\left\|\pmb{K}-\pmb{I}\right\|)\left\|\delta_i(t)\right\|+\notag \\&\qquad c_4+c_5+c_1c_2+c_1c_3\notag\end{align}$

其中, $k \in Z, k < i$,

$\begin{align}&c_4 = \max(\left\|\delta_k(t+1) - \pmb{K}\delta_k(t)\right\|)\end{align}$ (23)
$\begin{align}&c_5 =\max(c_1\left\|\pmb{K}-\pmb{I}\right\|\left\|\delta_k(t)\right\|)\end{align}$ (24)

最终, 可以得到:

$\begin{align}\lim\limits_{t \rightarrow +\infty}\left\|\delta_i(t)\right\| \leq\frac{c_1c_2+c_1c_3+c_4+c_5}{1-\left(\left\|\mathbf{K}\right\|+c_1\left\|\mathbf{K}-\mathbf{I}\right\|\right)}\end{align}$ (25)

首先, $\left\|\delta_1(t)\right\|$指数收敛于原点的邻域内, 其次, 在假设对于任意的$k=1, \cdots, i-1$, $\left\|\delta_k(t)\right\|$指数收敛于原点的邻域内时, 可以得到$\left\|\delta_i(t)\right\|$指数收敛于原点的邻域内.所以, 通过数学归纳法, 可以得到, 在式(11) 和(13) 描述的位置一致性协议下, 任意的智能体Agent-$i, i=1, \cdots, n$, 的位置一致性误差$\delta_i(t)$指数收敛于原点的邻域内.

注1. 在定理2中, 给出了一个保守的条件(14) 和稳定性证明.在工程运用中, 只要控制器的采样频率够高, $\omega_i(t)$$\omega_i(t-1) $是基本相等的, $\left\|\Theta_i(t)\right\|$接近于0.所以在工程应用中, 一般只要满足参数$k_1$$k_2$为小于1的正常数.}

注2. 在定理2的证明过程中, 通过一致性误差的范数的极限小于正的常数, 说明一致性误差收敛于原点的邻域.在证明过程中需要保持范数的形式保持一致, 但不限于某一种特定的形式.当取二范数运算时, 表达的物理意义是一致性误差在距离上指数收敛于0点的邻域内.

4 实验验证 4.1 实验平台

本文的实验部分, 以差分驱动轮式机器人为实验对象.轮式机器人采用步进电机驱动, 实验过程中机器人的控制输入(线速度、角速度)在电机额定矩频特性范围内, 因此电机的响应速度和丢步可基本忽略.机器人的两个驱动轮的转速与控制输入$\pmb{u}_i(t)$有如下线性关系:

$\begin{align}\left[\begin{array}{c} \dot{\theta}_{il}(t) \\\dot{\theta}_{ir}(t)\end{array}\right]= \frac{1}{r} \left[\begin{array}{cc} 1&b \\ 1 &-b\end{array}\right]\left[\begin{array}{c} v_i(t) \\ \omega_i(t)\end{array}\right]\end{align}$ (26)

其中, $2b$为机器人驱动轮的轮距, $r$为驱动轮的半径, $\dot{\theta}_{il}$$\dot{\theta}_{ir}$分别为第$i$个机器人的左侧和右侧驱动轮的角速度.

各机器人的控制器基于ARM+LINUX实现, 控制算法基于Simulink快速原型开发技术生成.控制器(ARM)通过RS-232接口与TMS320F2812系列DSP通信产生方波信号控制步进电机驱动模块.机器人的位姿通过VICON系统测量.机器人之间以及机器人与定位系统之间通过无线局域网通信, 通信协议基于TCP协议实现.在局域网环境下, 通信延时可基本忽略.实验用的机器人如图 3所示, 且参数如下: $l=0.11$m, $b=0.2$m, $r =0.032$m.实验用的机器人参数通过普通米尺测量(精度为0.001m).

图 3 实验用差分驱动轮式机器人照片 Figure 3 A photo of experimental differentially driven wheeled mobile robots
4.2 相对于领航者的三角形

目前, 基于领航者体坐标系的编队是文献[6]中方法的典型例子.利用本文所提出的位置时变一致性协议同样可以有效解决.以三角形编队为例, 智能体$0$跟踪一个如式(27) 描述的四叶草轨迹,

$\begin{align}\pmb{r}(t) = \left[\begin{array}{c}1.5\sin(0.2t)~~~~\cos(0.1t) \\1.5\sin(0.2t)~~~~\sin(0.1t)\end{array}\right]\label{four_leaf}\end{align}$ (27)

智能体$1$和智能体$2$在智能体$0$的体坐标系下, 与智能体$0$保持一个由原点(0, 0), 点(--0.5, --0.5) 和点(--0.5, 0.5) 构成的三角形.通过坐标变换关系, 可以得到:

$\begin{align}&\rho_{01}(t)= _{0}^w\!T\left[\begin{array}{c}-0.5 \\-0.5\end{array}\right], \quad\rho_{01}(t)= _{0}^w\!T\left[\begin{array}{c}-0.5 \\ 0.5\end{array}\right]\notag \\&\rho_{12}(t)= _{0}^w\!T\left[\begin{array}{c} 0 \\ 1\end{array}\right]\notag \\ &_{0}^wT = \left[\begin{array}{cc}\cos\varphi_i(t) &-\sin\varphi_i(t) \\ \sin\varphi_i(t) &\cos\varphi_i(t)\end{array}\right]\notag\end{align}$

实验过程中, 三个智能体的轨迹如图 4所示, 其中$Z$轴为时间, $X$$Y$轴为智能体的坐标.带端点的三角形为智能体保持的队形.各智能体对期望队形的跟踪效果如图 5所示.

图 4 三角形编队实验中各智能体的运动轨迹 Figure 4 Trajectories of agents in experiments presented in triangle formation
图 5 三角形编队实验中智能体$1$和智能体$2$对期望队形的跟踪效果 Figure 5 Tracking performance of Agent $1$ and Agent $2$ in triangle formation experiment
4.3 相对于领航者环绕编队

在环绕编队中, 智能体$0$跟踪一个参考轨迹, 智能体$1$与智能体$2$以智能体$0$为圆心, 以0.75m为半径, 环绕智能体$0$运动.为了直观表现实验效果, 选择如式(28) 描述的椭圆轨迹作为智能体$0$的参考输入.

$\begin{align}{\pmb r}(t) = \left[\sin(0.1t)~~~2\cos(0.1t)\right]^{\rm T}\label{ellipse}\end{align}$ (28)

环绕编队是一种对控制率收敛速度和稳态误差要求很高的编队形式.因为在编队过程中, 如果智能体不能有效跟踪期望的位置, 非常容易发生智能体相撞的事故.

实验中, 期望队形描述为如下形式:

$\begin{align}&\rho_{01} = \left[\begin{array}{c} 0.75\sin(0.3t)\\0.75\cos(0.3t)\end{array}\right]\notag \\&\rho_{02} = \left[\begin{array}{c}-0.75\sin(0.3t)\\-0.75\cos(0.3t)\end{array}\right]\notag \\&\rho_{12} = 2(\pmb{y}_{0}(t)-\pmb{y}_{1}(t)) \notag\end{align}$

实验中, 各个智能体的轨迹如图 6所示, 其中带端点的线段为智能体在同一时刻保持的队形.环绕编队中, 各智能体对期望的时变队形的跟踪性能如图 7所示.

图 6 环绕编队中各智能体的轨迹 Figure 6 Trajectories of agents in the surrounding formation experiment
图 7 环绕编队中各智能体对期望的队形的跟踪性能 Figure 7 Tracking performance of agents on desired formation in the surrounding formation experiment

为了检验本文中方法文献[6]描述的时变编队以外的一般性的时变编队的有效性, 令智能体$0$跟踪一个如式(29) 所示的椭圆轨迹, 同时令智能体$1$与智能体$2$$(x_0(t), y_0(t)+2) $为圆心, 做环绕运动.

$\begin{align}\pmb{r}(t) = \left[\begin{array}{c}-1.2\cos(0.1t) \\ 0.5\sin(t)\end{array}\right]\label{ellipse_2}\end{align}$ (29)

这样期望的队形描述如下:

$\begin{align}&\rho_{01} = \left[\begin{array}{c}0.75\sin(0.3t)\\2+0.75\cos(0.3t)\end{array}\right]\notag \end{align}$
$\begin{align}&\rho_{02} = \left[\begin{array}{c}-0.75\sin(0.3t)\\2-0.75\cos(0.3t)\end{array}\right]\notag \\&\rho_{12} = 2(\pmb{y}_{0}(t)-\pmb{y}_{1}(t))+4 \notag\end{align}$

且不能用一个运动的坐标系及相对于这个坐标系的时不变编队描述.实验中各智能体对时变队形的跟踪性能如图 8所示.

图 8 经过偏移后的环绕编队中各智能体的跟踪性能 Figure 8 Tracking performance of agents on desired formation in the transferred surrounding formation experiment

通过实验结果, 可以看出, 本文所提出的位置一致性协议可以适用于平面非完整性多智能体的一般的时变编队控制.在本文所提出的编队协议下, 对于时变的编队控制, 每个智能体的位置一致性误差指数收敛于原点的邻域内.环绕编队的结果显示, 位置一致性误差的收敛速度能够满足一般时变编队要求.

5 结论

本文针对受非完整性约束的平面多智能体系统, 提出了适用于平面非完整性多智能体系统一般时变编队的位置时变一致性协议.与文献中现有方法相比, 本文所提出的位置一致性协议适用于一般性的时变编队控制而不再仅限于多智能体在某个运动坐标系中保持位置不变的情况.在本文提出的时变一致性协议的基础上, 对于平面非完整性多智能体的复杂的运动协调控制, 只需要设计合适的时变队形$\rho_{ij}(t)$即可.

本文所提出的方法, 以差分驱动轮式机器人为实验对象, 经过3种不同的编队实验验证.实验结果显示, 本文所提出的位置一致性协议对一般性的平面多智能体时变编队控制有效.同时, 环绕编队控制实验结果显示, 在本文所提出的位置一致性协议下, 编队误差收敛速度能够满足一般时变编队控制需求.

参考文献
1
Zhang Xiao-Ping, Ruan Xiao-Gang, Xiao Yao, Zhu Xiao-Qing. Establishment of a two-wheeled robot's sensorimotor system with mechanism of intrinsic motivation. Acta Automatica Sinica, 2016, 42(8): 1175-1184.
( 张晓平, 阮晓钢, 肖尧, 朱晓庆. 两轮机器人具有内发动机机制的感知运动系统的建立. 自动化学报, 2016, 42(8): 1175-1184.)
2
Dong Wen-Jie, Huo Wei. Tracking control of mobile robots with nonholonomic constraint. Acta Automatica Sinica, 2000, 26(1): 1-6.
( 董文杰, 霍伟. 受非完整约束移动机器人的跟踪控制. 自动化学报, 2000, 26(1): 1-6.)
3
Min Hai-Bo, Liu Yuan, Wang Shi-Cheng, Sun Fu-Chun. An overview on coordination control problem of multi-agent system. Acta Automatica Sinica, 2012, 38(10): 1557-1570.
( 闵海波, 刘源, 王仕成, 孙富春. 多个体协调控制问题综述. 自动化学报, 2012, 38(10): 1557-1570.)
4
Velasco-Villa M, Castro-Linares R, Rosales-Hernández F, del Muro-Cuéllar B, Hernández-Pérez M A. Discrete-time synchronization strategy for input time-delay mobile robots. Journal of the Franklin Institute, 2013, 350(10): 2911-2935. DOI:10.1016/j.jfranklin.2013.05.029
5
Rosales-Hernández F, Velasco-Villa M, Castro-Linares R, del Muro-Cuéllar B, Hernández-Pérez M Á. Synchronization strategy for differentially driven mobile robots:discrete-time approach. International Journal of Robotics and Automation, 2015, 30(1): 50-59.
6
Dong W J, Djapic V. Leader-following control of multiple nonholonomic systems over directed communication graphs. International Journal of Systems Science, 2016, 47(8): 1877-1890. DOI:10.1080/00207721.2014.955553
7
Peng Z X, Yang S C, Wen G G, Rahmani A, Yu Y G. Adaptive distributed formation control for multiple nonholonomic wheeled mobile robots. Neurocomputing, 2016, 173(P3): 1485-1494.
8
Cepeda-Gomez R, Perico L F. Formation control of nonholonomic vehicles under time delayed communications. IEEE Transactions on Automation Science and Engineering, 2015, 12(3): 819-826. DOI:10.1109/TASE.2015.2424252
9
Dong X W, Zhou Y, Ren Z, Zhong Y S. Time-varying formation control for unmanned aerial vehicles with switching interaction topologies. Control Engineering Practice, 2016, 46: 26-36. DOI:10.1016/j.conengprac.2015.10.001
10
Wang R, Dong X W, Li Q D, Ren Z. Distributed adaptive time-varying formation for multi-agent systems with general high-order linear time-invariant dynamics. Journal of the Franklin Institute, 2016, 353(10): 2290-2304. DOI:10.1016/j.jfranklin.2016.03.016
11
Bai J, Wen G G, Rahmani A, Chu X, Yu Y G. Consensus with a reference state for fractional-order multi-agent systems. International Journal of Systems Science, 2016, 47(1): 222-234. DOI:10.1080/00207721.2015.1056273
12
Wang C, Sun D. A synchronous controller for multiple mobile robots in time-varied formations. In:Proceedings of the 2008 IEEE/RSJ International Conference on Intelligent Robots and Systems. Nice, France:IEEE, 2008. 2765-2770
13
Brinon-Arranz L, Seuret A, Canudas-de-Wit C. Cooperative control design for time-varying formations of multi-agent systems. IEEE Transactions on Automatic Control, 2014, 59(8): 2283-2288. DOI:10.1109/TAC.2014.2303213
14
Ferrers N M. Extension of Lagrange's equations. Journal of Pure and Applied Mathematics, 1872, 12(45): 1-5.
15
Khooban M H. Design an intelligent proportional-derivative (PD) feedback linearization control for nonholonomic-wheeled mobile robot. Journal of Intelligent & Fuzzy Systems, 2014, 26(4): 1833-1843.
16
Oriolo G, De Luca A, Vendittelli M. WMR control via dynamic feedback linearization:design, implementation, and experimental validation. IEEE Transactions on Control Systems Technology, 2002, 10(6): 835-852. DOI:10.1109/TCST.2002.804116
17
Rudra S, Barai R K, Maitra M. Design and implementation of a block-backstepping based tracking control for nonholonomic wheeled mobile robot. International Journal of Robust and Nonlinear Control, 2016, 26(14): 3018-3035. DOI:10.1002/rnc.3485
18
Velazquez M, Cruz D, Garcia S, Bandala M. Velocity and motion control of a self-balancing vehicle based on a cascade control strategy. International Journal of Advanced Robotic Systems, 2016, 13(3): Article No.1061.
19
Wikipedia. Breadth-first/search[Online], available:https://en.wikipedia.org/wiki/Breadth-first_search, November 10, 2016.
20
Zhao J, Liu G P. Model-based remote control of nonholonomic wheeled robot with time delay and packet loss in forward channel. In:Proceedings of the 2015 Chinese Automation Congress. Wuhan, China:IEEE, 2015. 1669-1704