多智能体系统协调控制是近几年迅速发展起来的复杂系统控制科学研究领域的热点问题,它在无线传感器网络、移动机器人编队控制、集群航天器深空探测等领域有广泛的应用,受到许多研究学者的关注。
一致性问题是分布式协同控制的一个重要研究方向[1-3],多智能体系统通过系统中各智能体之间的信息交流达到各个智能体特定状态的一致。包容控制是一种具有多领航者的类一致性问题,通过设计跟随者的控制协议使得跟随者最终收敛到领航者组成的目标区域内 (领航者围成的凸包) 完成群体运动[4-9]。文献[4]研究了一阶系统的包容控制问题,并证明了当网络拓扑连通时系统可以实现包容控制,但并未讨论网络拓扑在联合联通条件下的包容控制问题。文献[5]研究了有向网络中固定拓扑和切换拓扑两种情况下一阶系统的包容控制问题,并给出了系统收敛的充要条件,但未对二阶系统进行说明。文献[6]对动态领航者的二阶系统进行研究,分别提出了连续渐近包容控制算法和离散渐近包容控制算法。文献[7]研究了随机切换拓扑下二阶系统的包容控制问题,提出一种基于不可约马尔可夫链信息拓扑的包容控制算法。文献[8]研究了二阶系统的分布式包容控制问题,并给出了系统收敛的充分必要条件。从以上文献研究可知,虽然均能实现系统的包容控制要求,但是实现时间是不确定的。
在工业应用中,仅实现各个智能体特定状态的渐近一致还不足以满足工业生产需要,还需要系统在有限时间内达到收敛。在航天器编队控制和机器人编队对抗中,有限时间定理得到广泛应用,由于连续有限时间控制的优点明显,有限时间控制问题受到越来越多的关注。文献[10]对有限时间控制问题进行了综述,介绍了有限时间稳定性的常用判据和几类典型系统的有限时间控制。文献[9]研究了有限时间收敛和参数不确定性有向系统的姿态包容控制问题。文献[11-14]指出,连续有限时间控制系统的验证方法主要包括:齐次性方法和有限时间李雅普诺夫稳定性定理。
本文研究了静态拓扑和动态拓扑下的二阶多智能体系统能在有限时间内实现包容控制的问题,本文的创新点在于提出了动态联合连通条件下具有多领航者的有限时间的包容控制算法,应用现代控制理论及矩阵论等理论工具研究了算法的有限时间收敛,在静态拓扑和动态拓扑下均能达到有限时间收敛。
1 代数图论设G=(V, E, A) 是n个节点的权重无向图,V={1,2, …, n}为一个顶点 (或节点) 集合,E⊆V×V为一个边的集合,A=[aij] ∈ Rn×n为权重邻接矩阵。对于∀i∈V, aii=0;对于∀i, j∈V,i≠j,若 (i, j)∈ω,则aij>0,否则,aij=0。节点i的邻居集合定义为Ni={j∈V|(i, j)∈E}。定义D=diag (d1, d2, …, dn)∈Rn×n为图xL(t) 的度矩阵,其中
定义1[5] 设集合X={x1, x2, …, xm}为实向量空间V⊆Rp的子集,X的凸包定义为:CO (X)=
定义2[15] 设拓扑图G1, G2, …, Gm具有相同的顶点集V,其并集记为G1-m,它的节点集是V,边集是所有图G1, G2, …, Gm的边的并集,它的第i个节点和第j个节点间的链接权重是图第i个节点和第j个节点间所有的链接权重之和。如果它们的联合图G1-m是连通的,称G1, G2, …, Gm为联合连通。
定义3[13] 考虑如下连续非线性系统:
引理1[14] 设系统
假设二阶多自主体系统由n个跟随者和m个领航者组成,其动力学模型描述为
(1) |
式中:xi(t)∈R表示第i个智能体在t时刻的位置,vi(t)∈R表示速度,ui(t)∈R表示控制输入。跟随者集合与领航者集合分别记为F={1, 2, …, n}和L={n+1, n+2, …, n+m},本文考虑静态领航者的情况,即vi(t)=0,i∈L。
本文的研究目标是设计一种控制器,使得系统能在有限时间内实现包容控制。考虑如下控制器:
(2) |
式中:aij(t) 表示智能体i与j在t时刻的连接权值,Ni表示智能体i的邻域,假设φl(x)=[φl(x1) φl(x2) … φl(xn)],且φl是一个连续的奇函数满足xiφl(xi)>0(∀xi≠0)。假设sgn (x)α=[sgn (x1)α sgn (x2)α … sgn (xn)α],sgn (xi)α=∣xi∣αsign (xi),sign (·) 表示符号函数。并且α1,α2为常值,0 < α1 < 1,α2=
设跟随者之间通信拓扑图为GF,由于跟随者之间是双向交流信息,所以GF为无向图。具有领航者的多自主体系统的通信拓扑图为G,系统的Laplacian矩阵如下:
(3) |
式中:LF为n阶方阵,是跟随者的Laplacian矩阵;LFL为n×m阶矩阵。
假设1 对任意一个跟随者i,至少存在一个领航者j,使得从j到i存在一条通信路径。
引理2[9] 若假设1成立且跟随者之间构成无向连通图,则LF为正定阵,-LF-1LFL为非负矩阵且每行元素和为1。
令领航者的位置集合为xL(t)=[xn+1(t) … xn+m(t)]T,领航者的速度集合为Γ={1, 2, …, N},由定义1和引理2,t位于领航者围成的凸包内。下面给出包容控制的定义。
定理1 令跟随者的位置集合为xF(t)=[x1(t) … xn(t)]T,跟随者的速度集合为vF(t)=[v1(t) … vn(t)]T,控制器满足李雅普诺夫第二定理,并且若在控制器的作用下有xF(t)→-LF-1LFLxL(t),vF(t)→0,表示跟随者位于领航者围成的凸包内,则控制器可以实现包容控制。
证明 由系统动力学模型和控制器得:
(4) |
令跟踪方程:
(5) |
根据跟踪方程得:
(6) |
令
(7) |
所以方程 (6) 可表示为
(8) |
构造李雅普诺夫函数V(t)=V1(t)+V2(t),式中:
式中:
得到:
注意到
由定义3和引理1推出,设扩张系数
假设原动力学方程可写为
(9) |
则有
由已知得:εr1α1=εr2α2=εk+r2,所以上式可写为
此多智能体系统与带有扩张
本节讨论多自主体系统在运动过程,出现通信拓扑不连通的情况。系统动力学模型和控制器不变,动力学模型为式 (1),控制器为式 (2)。在联合连通条件下分析此系统。
考虑一组无穷有序的有界连续时间段[tr, tr+1),r=1, 2, …,且t1=0,tr+1-tr≤T1,T1>0。假设每个时间段[tr, tr+1) 中存在一组非重叠的有限子序列[tr, j, tr, j+1),j=1, 2, …,mr,且系统拓扑在[tr, j, tr, j+1) 内保持不变,其中tr, 1=tr,tr, mr+1=tr+1,tr, j+1-tr, j≥T2,T2>0。令σ(t):[0, +∞)→Γ,Γ={1, 2, …, N}为一个分段切换常函数,N为总拓扑数。系统在t时刻的信息拓扑图记为Gσ(t),相应的Laplacian矩阵记为Lσ(t)。其中,由n个跟随者构成的信息拓扑图记为GFσ(t),相应的Laplacian矩阵记为LFσ(t)。
假设2 由n个跟随者和m个领航者构成的网络化系统拓扑在非重叠时间区间[tr, tr+1),r=1, 2, …内为联合连通的。
假设3 非重叠时间区间[tr, j, tr, j+1)⊂[tr, tr+1),j=1, 2, …,mr内,网络化系统存在一连通子集。连通子集中任意一个跟随者i,至少与一个领航者j之间存在一条路径。
假设系统通信拓扑图Gσ在时间段[tr, j, tr, j+1) 内有nσ≥1个连通部分,且连通成分的子拓扑图记为Gσi,i=1, 2, …,nσ。图Gσi内有dσi≥1个节点,其中领航者dLσi个,跟随者dFσi个,满足dσi=dLσi+dFσi。矩阵块Lσi为拓扑图Gσi相对应的Laplacian矩阵。
根据Lσ的定义,存在一个正交矩阵Eσ∈Rn×n,使:
(10) |
(11) |
(12) |
式中:
(13) |
(14) |
在动态切换拓扑下网络化系统的Laplacian矩阵为
(15) |
令
在每个时间段[tr, j, tr, j+1) 内此多智能体系统可以被分成nσ个子系统,在每个时间段内的Laplacian矩阵为
(16) |
由系统动力学模型和控制器得,在时间段[tr, j, tr, j+1) 内:
(17) |
令跟踪方程:
(18) |
根据跟踪方程得出:
(19) |
根据假设3、引理2、定理1得出,此二阶多智能体系统在联合连通条件下可以实现包容控制。
下面证明多智能体系统在联合连通条件下可以实现有限时间收敛。令:
(20) |
所以
(21) |
构造李雅普诺夫函数
式中:
上述李雅普诺夫函数沿着方程 (19) 的导数:
注意到
由于在每个时间段[tr, j, tr, j+1) 内此多智能体系统被分为nσ个子系统,由定义3和引理1分析知此多智能体系统与带有扩张
设系统中有5个跟随者,跟随者集合为F={1, 2, 3, 4, 5},要将这5个跟随者控制到三角形区域内,假设系统信息拓扑图如图 1所示,取如下系统矩阵:
令拓扑图每个边的权重均相等,假设为1。选取α1=0.8,α2=2α1/(α1+1),φ1(x)=3x,φ2(x)=3x。目标区域的3个顶点位置为:ξ6=[8 10]T,ξ7=[10 8]T,ξ8=[10 10]T,各跟随者的初始位置为:ξ1(0)=[2 0]T,ξ2(0)=[4 0]T,ξ3(0)=[0 2]T,ξ4(0)=[0 4]T,ξ5(0)=[3 1]T。各跟随者的初速度为:v1(0)=[2 6]T,v2(0)=[3 8]T,v3(0)=[4 6]T,v4(0)=[5 5]T,v5(0)=[6 3]T。
基于图 1的拓扑图以及上述初始条件,分别应用本文设计的控制器
应用控制器1与控制器2的各个智能体的位置、速度与时间的关系如图 2~5。
分析图 2和图 3,跟随者由最初的分散的状态,在控制器1和控制器2的作用下,均在有限的时间内均收敛到领航者所围成的区域内,但是可以明显看出在控制器 (1) 的控制下,系统更快地实现了包容控制。
分析图 4和图 5,在控制器 (1) 的作用下跟随者的速度在时间到达7 s的时候速度全趋于0,表示智能体已经达到稳定状态,表示跟随者均收敛到领航者所围成的区域内;在控制器2的作用下跟随者的速度在时间到达17 s的时候速度全趋于0;明显地看出控制器1比控制器2更优。
由图 6可直观地看出跟随者的运动轨迹,5个跟随者在控制器1的作用下,最终全都在有限时间内收敛到目标区域内。
传统的控制策略虽然可以达到有限时间收敛,但是用时要比本文设计的控制器更长,综上,本文设计的控制器能使系统更快地达到收敛,所以更有优势。
4.2 动态拓扑仿真设系统中有5个跟随者,跟随者集合为F={1, 2, 3, 4, 5},要将这5个跟随者控制到三角形区域内,假定系统互连拓扑图在时刻,k=0, 1, …,在拓扑图G1~G3中随机切换,取0.5 s,令拓扑图每个边的权重均相等,假设为1。
目标区域的3个顶点位置为:p6=[8 10]T,p7=[10 8]T,p8=[10 10]T。各跟随者的初始位置为:p1(0)=[2 0]T,p2(0)=[4 0]T,p3(0)=[0 2]T,p4(0)=[0 4]T,p5(0)=[3 1]T。各跟随者的初速度为:q1(0)=[2 6]T,q2(0)=[3 8]T,q3(0)=[4 6]T,q4(0)=[5 5]T,q5(0)=[6 3]T。选取α1=0.8,α2=2α1/(α1+1),φ1(x)=2.1x,φ2(x)=2.1x。
基于图 7的拓扑图以及上述初始条件,分别应用本文设计的控制器1,
和一种控制器2
进行仿真实验。
应用控制器1和控制器2的各个智能体的位置、速度与时间的关系图见图 8~12。
由此可知,传统的控制策略虽然可以达到有限时间收敛,但是用时要比本文设计的控制器更长,并且运动轨迹和速度曲线不如本文设计的控制器的曲线平稳,综上,本文设计的控制器比传统策略更有优势。
5 结论1) 本文分别针对静态拓扑和动态拓扑的二阶多自主体系统提出一般性的包容控制算法,并运用现代控制理论及矩阵论等理论工具分析了该算法的有限时间收敛问题,给出了二阶系统在动态联合连通拓扑条件下的有限时间收敛条件,并给予仿真验证。
2) 本文研究的是连续条件下的有限时间收敛问题,为了贴近实际应用,下一步将继续研究离散条件下的有限时间收敛问题。
3) 通过本文设计的包容控制算法,可以使网络化系统快速达到收敛,大大减少收敛时间,提高了系统收敛效率。
[1] |
杨洪勇, 郭雷, 张玉玲, 等. 复杂分数阶多自主体系统的运动一致性[J].
自动化学报, 2014, 40(3): 489-496.
YANG Hongyong, GUO Lei, ZHANG Yuling, et al. Movement consensus of complex fractional-order multi-agent systems[J]. Acta automatica sinica, 2014, 40(3): 489-496. |
[2] |
王祥科, 李迅, 郑志强. 多智能体系统编队控制相关问题研究综述[J].
控制与决策, 2013, 28(11): 1601-1613.
WANG Xiangke, LI Xun, ZHENG Zhiqiang. Survey of developments on multi-agent formation control related problems[J]. Control and decision, 2013, 28(11): 1601-1613. |
[3] |
朱旭, 闫建国, 屈耀红. 高阶多智能体系统的一致性分析[J].
电子学报, 2012, 40(12): 2466-2471.
ZHU Xu, YAN Jianguo, QU Yaohong. Consensus analysis for high-order multi-agent systems[J]. Acta electronica sinica, 2012, 40(12): 2466-2471. |
[4] | 夏红. 多智能体系统群一致性与编队控制研究[D]. 成都: 电子科技大学, 2014. XIA Hong. Research on group consensus and formation control of multi-agent systems[D]. Chengdu: University of Electronic Science and Technology of China, 2014. |
[5] | CAO Yongcan, REN Wei. Containment control with multiple stationary or dynamic leaders under a directed interaction graph[C]//Proceedings of the 48th IEEE Conference on Decision and Control. Shanghai: IEEE, 2009: 3014-3019. |
[6] | LIU Huiyang, XIE Guangming, WANG Long. Necessary and sufficient conditions for containment control of networked multi-agent systems[J]. Automatica, 2012, 48(7): 1415-1422. DOI:10.1016/j.automatica.2012.05.010. |
[7] | LOU Youcheng, HONG Yiguang. Target containment control of multi-agent systems with random switching interconnection topologies[J]. Automatica, 2012, 48(5): 879-885. DOI:10.1016/j.automatica.2012.02.032. |
[8] |
张安慧, 陈健, 孔宪仁, 等. 二阶系统包容控制算法及其收敛速度分析[J].
哈尔滨工业大学学报, 2014, 46(9): 1-8. .
ZHANG Anhui, CHEN Jian, KONG Xianren, et al. Containment control protocol and its convergence speed analysis for double-integrator dynamics systems[J]. Journal of Harbin institute of technology, 2014, 46(9): 1-8. DOI:10.11918/hitxb20140901. |
[9] | MENG Ziyang, REN Wei, YOU Zheng. Distributed finite-time attitude containment control for multiple rigid bodies[J]. Automatica, 2010, 46(12): 2092-2099. DOI:10.1016/j.automatica.2010.09.005. |
[10] |
丁世宏, 李世华. 有限时间控制问题综述[J].
控制与决策, 2011, 26(2): 161-169.
DING Shihong, LI Shihua. A survey for finite-time control problems[J]. Control and decision, 2011, 26(2): 161-169. |
[11] |
王付永, 杨洪勇, 韩辅君. 多领航者网络化系统的动态群集运动[J].
电子学报, 2016, 44(7): 1751-1756.
WANG Fuyong, YANG Hongyong, HAN Fujun. Flocking motion of dynamic networked systems with multiple leaders[J]. Acta electronica sinica, 2016, 44(7): 1751-1756. |
[12] | XIAO Feng, WANG Long, CHEN Jie, et al. Finite-time formation control for multi-agent systems[J]. Automatica, 2009, 45(11): 2605-2611. DOI:10.1016/j.automatica.2009.07.012. |
[13] | 肖秋云. 多智能体系统有限时间一致性若干问题研究[D]. 无锡: 江南大学, 2015. |
[14] |
王付永, 杨洪勇, 翁灿. 复杂多智能体系统的最大一致性[J].
计算机仿真, 2015, 32(6): 403-406.
WANG Fuyong, YANG Hongyong, WENG Can. Maximum consistence of complex multi-agent systems[J]. Computer simulation, 2015, 32(6): 403-406. |
[15] | LIN Peng, JIA Yingmin. Consensus of a class of second-order multi-agent systems with time-delay and jointly-connected topologies[J]. IEEE transactions on automatic control, 2010, 55(3): 778-784. DOI:10.1109/TAC.2010.2040500. |