广东工业大学学报  2024, Vol. 41Issue (4): 1-13.  DOI: 10.12052/gdutxb.240085.
0

引用本文 

任鸿儒, 刘庆海, 周琪, 鲁仁全. 无人自主系统分布式协同控制研究综述[J]. 广东工业大学学报, 2024, 41(4): 1-13. DOI: 10.12052/gdutxb.240085.
Ren Hong-ru, Liu Qing-hai, Zhou Qi, Lu Ren-quan. A Review of Distributed Cooperative Control Research on Unmanned Autonomous Systems[J]. JOURNAL OF GUANGDONG UNIVERSITY OF TECHNOLOGY, 2024, 41(4): 1-13. DOI: 10.12052/gdutxb.240085.

基金项目:

国家自然科学基金资助项目 (62121004, 62033003, U23A20341);广东省基础与应用基础研究基金资助项目 (2023A1515011527, 2022A1515011506, 2023B1515120010)

作者简介:

任鸿儒(1991–),男,副教授,主要研究方向为无人自主系统、智能控制、协同控制,E-mail:renhongru2019@gdut.edu.cn

文章历史

收稿日期:2024-06-17
无人自主系统分布式协同控制研究综述
任鸿儒1,2,3, 刘庆海1,2,3, 周琪1,2,3, 鲁仁全1,2,3    
1. 广东工业大学 自动化学院, 广东 广州 510006;
2. 广东工业大学 粤港智能决策与协同控制联合实验室, 广东 广州 510006;
3. 广东工业大学 广东省智能决策与协同控制重点实验室, 广东 广州 510006
摘要: 随着信息技术、人工智能和机器人技术的飞速发展,无人自主系统在军事、航空航天、海洋探索、灾难救援以及智能交通等领域展现出巨大的应用潜力。分布式协同控制作为实现多无人自主系统高效、灵活协作的关键技术,已成为研究的热点。本文综述了无人自主系统分布式协同控制的研究进展。首先探讨了在一致性问题、编队控制和分布式优化三个方面的核心理论,然后结合当前多无人自主系统的实际应用,给出了无人机、无人车、无人水面舰艇、无人潜航器和多模态协同控制的最新研究成果介绍,最后探讨了该领域的未来挑战和发展方向。
关键词: 无人自主系统    分布式策略    协同控制    
A Review of Distributed Cooperative Control Research on Unmanned Autonomous Systems
Ren Hong-ru1,2,3, Liu Qing-hai1,2,3, Zhou Qi1,2,3, Lu Ren-quan1,2,3    
1. School of Automation, Guangdong University of Technology, Guangzhou 510006, China;
2. Guangdong-Hong Kong Joint Laboratory for Intelligent Decision and Cooperative Control, Guangdong University of Technology, Guangzhou 510006, China;
3. Guangdong Provincial Key Laboratory for Intelligent Decision and Cooperative Control, Guangdong University of Technology, Guangzhou 510006, China
Abstract: With the rapid development of information technology, artificial intelligence, and robotics, unmanned autonomous systems have demonstrated tremendous application potential in fields such as military, aerospace, marine exploration, disaster rescue, and intelligent transportation. Distributed cooperative control, as a key technology for achieving efficient and flexible collaboration among multiple unmanned autonomous systems, has become a research focus. A review is conducted on the research progress in distributed cooperative control of unmanned autonomous systems. Firstly, it discusses the core theories in the aspects of consensus problems, formation control, and distributed optimization. Then, combining the practical applications of current multiple unmanned autonomous systems, it presents the latest research achievements in unmanned aerial vehicles, unmanned ground vehicles, unmanned surface vessels, unmanned underwater vehicles, and multi-modal cooperative control. Finally, it explores the future challenges and development in this field.
Key words: unmanned autonomous systems    distributed strategy    cooperative control    

无人自主系统,包括无人机、无人车、无人水面舰艇、无人潜航器等,是具备集成感知、决策和执行能力的一类系统,能够在没有直接人工操控的情况下自主完成特定任务[1-5]。它们在诸如搜救侦察、安全监控、环境与交通监测、电力线与管道巡查、建筑物检查、地理测绘、隧道检测、影视制作、物流配送以及工业生产等多个领域发挥着至关重要的作用。

随着无人自主系统应用领域的不断拓展,其所面临的环境复杂性也在逐渐增加,致使高精度地完成控制目标变得越来越艰巨。相较于单独运作的无人自主系统,多无人自主系统的协同控制在多个方面展现出了其优越性。例如,多无人自主系统能够对分布式任务进行处理,大大提升了任务执行的效率与覆盖面。其次,原本由单一无人系统承担的复杂任务,现在可以通过多个无人系统分工合作,各自执行更为简单的任务来完成,这不仅降低了任务执行难度,还增强了系统的灵活性和适应性[6]。因此,多无人系统的协同控制技术受到了业界和学术界的广泛关注与深入研究。

多无人自主系统可以看作是一种多自主体系统,每个子系统可视为相应的自主体。多自主体系统协同控制的核心在于各个自主体间通过信息交换、任务分配和协同规划,使整个系统能够实现群体智能,从而完成复杂的分布式任务。现有协同控制方法主要分为两类,集中式协同控制和分布式协同控制。集中式协同控制是一种基于中央控制单元或中心节点负责处理所有决策和任务分配的控制策略。中央控制单元收集来自各个子系统的信息,根据这些信息制定全局策略,然后向各个子系统发送指令并控制它们的行为。然而这种控制策略对中央控制单元的性能和通信网络的带宽有着很高的要求。一旦中央控制单元出现计算过载或故障等状况将对整个系统的性能造成直接影响,甚至造成系统瘫痪。相较于依赖中央控制单元的集中式协同控制而言,分布式协同控制不需要中央控制单元,它为每个子系统设计分布式控制器,通过与相邻系统进行局部信息交换,进而控制自身状态和行为以实现全局目标。分布式协同控制虽然在结构和组织上更加复杂,但在实现协同控制方面具有许多独特的优点,特别是在鲁棒性高、适应性强、可扩展性灵活等方面,所以分布式策略相较于集中式策略更受到关注。本文就无人自主系统的分布式协同控制的一些研究成果进行简要概述,分别从一致性问题、编队控制、分布式优化以及在无人自主系统中的典型应用等方面进行展开讨论。

1 预备知识

考虑拓扑图$ G = (V,E) $,其中$V = \{ 1,2, \cdots ,N\} $代表顶点集,$E \subseteq V \times V$为拓扑图边集。如果边$(i,j) \in E$,则代表节点i可以直接将信息发送给节点j,节点j称为节点i的外邻,节点i称为节点j的内邻。节点i的内邻集合定义为${N_i} = \{ j \in V,(j,i) \in E\} $。定义拓扑图G的邻接矩阵为${\boldsymbol{A}} = [{a_{ij}}] \in {{\bf{R}}^{N \times N}}$,当$(i,j) \in E$${a_{ij}} > 0$,反之,${a_{ij}} = 0$。不考虑自环通信,即${a_{ii}} = 0$。拓扑图G的拉普拉斯矩阵${\boldsymbol{L}} = [{l_{ij}}] \in {{\bf{R}}^{N \times N}}$定义为

$ {l_{ij}} = \left\{ {\begin{array}{*{20}{c}} { - {a_{ij}}},&{i \ne j} \\ {\displaystyle\sum\limits_{j = 1,j \ne i}^N {{a_{ij}}} },&{i = j} \end{array}} \right. $

对于任意的节点i和节点j,如果${a_{ij}} = {a_{ji}}$,则称拓扑图为无向图,否则为有向图。假设有向图G中至少存在一条从节点i到达任意节点j的有向路径,则图G至少包含一个有向生成树。

考虑切换拓扑图为$G(t) = (V,E(t) ) $,其中邻接矩阵为$ {\boldsymbol{A}}(t) = [{a_{ij}}(t) ] \in {{\bf{R}}^{N \times N}} $。如果$G(t) $随时间的变化是由一个随机过程驱动的,则称拓扑图为随机切换拓扑。

2 一致性问题研究

在多无人自主系统中,有效的协调和合作至关重要,而一致性问题是分布式协同控制的一个基本问题。分布式一致性控制解决的主要问题是如何在没有集中控制器的情况下,通过局部信息的交互,确保整个系统协调一致。通过实现一致性,系统中的各个自主体能够在一定时间内达成某一变量(如位置、速度、方向等)的一致,有利于确保系统的稳定性和可靠性。

对于多无人自主系统,其第i个自主体的系统动力学为

$ {\dot x_i}(t) = {\boldsymbol{A}}{x_i}(t) + {\boldsymbol{B}}{u_i}(t) $ (1)

式中:$ {x}_{i}\left(t\right) $$ {u}_{i}\left(t\right) $分别表示第i个自主体的状态和输出,$i = 1,2, \cdots ,N$。系统动力学(1)是线性自主体系统的一般形式,一阶、二阶线性自主体系统[7-9]和高阶线性自主体系统[10]的动力学都是式(1)的一种特殊情况。根据多自主体系统是否具有领导者,一致性问题可分别表述为在无领导者的情况下,各自主体的状态趋向于一致,即

$ \mathop {\lim }\limits_{t \to \infty } \| {{x_i}(t) - {x_j}(t) } \| = 0 $

而系统存在领导者时,跟随者通过跟踪领导者的状态来实现一致性,即

$ \mathop {\lim }\limits_{t \to \infty } \left\| {{x_i}(t) - {x_0}(t) } \right\| = 0 $

根据上述一致性目标,可以设计出如下的分布式控制律:

$ {u_i}(t) = \mu {\boldsymbol{K}}\sum\limits_{j \in {N_i}} {{a_{ij}}(t) \left[ {{x_j}(t) - {x_i}(t) } \right]} $ (2)

式中:K为控制增益矩阵,$ \mu $为耦合权重。控制律(2)的核心设计原理是确保每个自主体的状态能够逐渐趋近于其相邻自主体状态的加权平均值,从而在整个系统中实现状态的一致性。这一控制策略的有效性依赖于系统的通信拓扑结构。

定理[11] 假设多自主体系统(1)具有一个有向生成树,如果存在控制增益K使得$ {\boldsymbol{A}}+{\lambda }_{i}\mu {\boldsymbol{BK}} $是赫尔维茨矩阵,则系统(1)可在控制律(2)下达成一致性。

进一步研究表明,在时变的通信拓扑中,若其并集含有一个有向生成树,则控制律(2)也能有效地推动系统(1)达到一致状态[12]。另外,针对非线性多自主系统,文献[13]给出了系统在无向联通切换拓扑下实现一致性的充分条件。在实际应用中,系统达成一致性不可避免地受到物理器件和环境的限制。例如,信号传输过程中存在的时延、网络拓扑的随机变化以及数据通信的量化限制等,这些因素都会对一致性控制产生负面影响,增加系统达到一致性的难度。因此,面对这些挑战,研究者们已经开展了进一步的研究。

2.1 随机网络拓扑

文献[11-13]研究了在确定性通信网络框架下处理一致性问题的方法,通过设计分布式一致性控制器使多自主体的状态达成一致。然而,通信故障、数据丢包以及物理信道内在不稳定性等影响,使通信网络的拓扑结构随时间变化。因此,研究随机通信网络拓扑下一致性控制具有重要意义。构建随机拓扑$G(t) $,它会在不同$G(t) \in \left\{ {{G_1},{G_2}, \cdots ,{G_s}} \right\}$进行随机切换,当且仅当随机切换变量$\sigma (t) = i$时,$G(t) = {G_i}$。这种切换过程$\left\{ {\sigma (t) ,t \geqslant 0} \right\}$由一个齐次马尔可夫过程控制,即

$ {{P}}\left\{ {\sigma (t + \Delta t) = r|\sigma (t) = h} \right\} = \left\{ {\begin{array}{*{20}{l}} {{\pi _{hr}}\Delta t + o(\Delta t) },&{r \ne h} \\ {1 + {\pi _{hh}}\Delta t + o(\Delta t) },&{r = h} \end{array}} \right. $

式中:${\pi _{hr}}$为转移概率,$ {\pi }_{hh}=-{\displaystyle\sum }_{r\ne h}{\pi }_{hr} $。在此条件下,分布式控制律可以设计为

$ {u_i}(t) = \mu {{\boldsymbol{K}}^{\sigma (t) }}\sum\limits_{j \in {N_i}} {a_{ij}^{\sigma (t) }\left[ {{x_j}(t) - {x_i}(t) } \right]} $ (3)

文献[14]给出了系统在控制律(3)下达成一致性的充分必要条件。并且系统可控时,控制律(3)可使系统以任意速度实现一致收敛。文献[15]进一步研究了更一般的切换拓扑情况,其中每个拓扑结构的停留时间由固定停留时间和随机停留时间组成。文献[15]提出并分析了3种一致性策略,并给出了可求解形式的控制器。除了上述分析实现一致性的网络拓扑要求外,也可通过设计特殊类型的分布式算法来探究随机网络拓扑下的一致性。文献[16]运用了一种随机Gossip算法来实现一致性,其中每个子系统依次随机选择邻居进行通信,显著增强了对拓扑结构的随机变化的鲁棒性。在时变有向随机网络拓扑下,文献[17]设计了一种基于中值的新分布式策略,实现了多自主系统的弹性一致性控制。

2.2 时间延迟

在实际应用中,由于信息的交换、数据的采集与处理以及控制指令生成与执行过程需要消耗时间,所以多无人自主系统通常面临时间延迟问题。时延会降低系统的性能,甚至破坏其稳定性。在一致性研究中,需要考虑两种重要的时延情况:输入时延和通信时延。输入时延由计算控制算法和传递控制指令所需要的时间构成,即存在输入时延$ {T}_{1} $使得第i个子系统的控制律为

$ {u_i}(t) = \mu {\boldsymbol{K}}\sum\limits_{j \in {N_i}} {{a_{ij}}(t) \left[ {{x_j}(t - {T_1}) - {x_i}(t - {T_1}) } \right]} $

而通信时延是子系统之间进行信息交换的时间延迟,即第j个子系统向第i个子系统传递信息存在时间$ {T}_{2} $,子系统只能运用相邻子系统延迟状态信息$ {x}_{j}(t-{T}_{2}) $进行控制律的设计。此时控制律为

$ {u_i}(t) = \mu {\boldsymbol{K}}\sum\limits_{j \in {N_i}} {{a_{ij}}(t) \left[ {{x_j}(t - {T_2}) - {x_i}(t) } \right]} $

值得注意的是,数据丢包也是影响系统稳定性的重要因素[18],但数据丢包可以在分布式协同控制中被视为通信时延的一种特殊情况,因为丢失的数据包可以被重新发送,这可以看作在数据传输通道中引入了时间延迟。

在研究具有时延的一致性问题时,主要关注时延对系统收敛性能的影响。针对具有输入时延的多自主体系统,文献[19]提出了在固定无向通信拓扑下实现一致性的充分条件,只要时延不超过假设上限,系统的稳定性就能得到保证。文献[20]研究了时变多自主系统在通信时延下的一致性,将其转化成一个鲁棒$ {H}_{\infty } $控制问题,采用线性矩阵不等式的方法给出了系统鲁棒一致性收敛的充分条件。此外,不同动力学系统在时延下的一致性问题也有广泛研究,包括异构线性系统[21]、高阶线性系统[22]和非线性系统[23]

2.3 数据采样与量化

自主体通常存在于连续的物理世界中,它们的状态或输出本质上是模拟信号,而大多数控制算法都是通过数字计算机上的软件实现的,这就需要在数据采集、通信、计算和控制执行过程中使用模数转换器和数模转换器,即相邻自主体之间的信息交换会以采样数据的形式进行。在这种工程实践下,就引出了在数据采样下的一致性问题。文献[24]研究了二阶多自主体系统在数据采样下的一致性问题,给出了达成一致性的充分条件。文献[25]研究了一般线性时变多自主体系统的数据采样一致性问题,通过使用解耦方法,证明了数据采样条件下系统的一致性问题等同于系统的稳定性问题,并利用李雅普诺夫稳定性理论分析了系统的全局渐近一致性。对于具有切换网络拓扑的数据采样一致性问题,文献[26]构建一种时变李雅普诺夫函数来描述自主体的状态特征,放宽系统矩阵具有正实部特征值的限制。在异步数据采样下,文献[27]研究了一种具有约束时变拓扑的一致性算法,实现一致性的同时降低控制器的复杂性。为节省系统资源,文献[28]设计了一种基于脉冲观测器的控制策略,实现了领导跟随多自主体系统的一致性并减少了系统的采样次数。

由于通信带宽的限制,子系统所接收到的数据不仅要进行采样,还要在传输前进行量化。文献[29]提出了一种量化Gossip算法,并证明了在与通信网络规模有关的时间界内,系统达成一致收敛。文献[30]通过Gossip算法研究了随机通信拓扑下的量化一致性,根据拉普拉斯矩阵的主子式推导出预期收敛时间的上下界。在线性连续系统中,文献[31]通过应用输入到状态稳定的李雅普诺夫方程设计分布式控制律,使系统达成量化一致性。文献[32]进一步研究了非线性系统的量化一致性,并通过事件触发策略降低了通信负载。在具有通信约束的一致性问题中,数据采样和数据量化常常相互依存。基于数据采样,文献[33]研究了一般线性多自主体系统的量化一致性问题,并给出了实现均方意义下一致跟踪的充要条件。在数据量化、通信时延等通信约束存在并具有竞争关系的多自主体系统中,文献[34]研究了其双边一致性问题,通过设计基于量化器的分布式控制律使系统状态收敛至可控区间内,并给出了误差收敛的界限。

近些年来,随着多无人自主系统应用场景的不断拓展,一致性问题作为分布式协同控制的基础,在多个方面取得了显著研究进展。例如,在实现重复运行的多无人自主系统的一致性[35]、应对欺骗攻击的安全一致性研究[36]以及具有干扰抑制的固定时间一致性跟踪[37]等方面都取得了重要突破。

3 编队控制研究

相较于所有自主体最终状态统一的一致性问题,编队控制策略下的自主体最终状态展现出了更为多样化的特性,使得多自主体系统能够根据不同的任务需求,展现出更加灵活和协同的集体行为。这种策略在编队飞行、协同运输、传感器网络构建以及军事ISR任务等多个领域都有着广泛的应用场景。早期编队控制实践主要建立在集中式策略基础之上,但此模式在容错和可靠性方面存在局限。而分布式策略下,自主体可以对环境实时感知并和相邻自主体交互合作,具有更强的适应性。在集中式通信失效或不稳定场景下,分布式策略下的编队控制展现了更高的竞争力。目前,对分布式编队控制的研究可大致归纳为四类:基于位置、基于位移、基于距离和仿射编队控制。

3.1 基于位置的编队控制

基于位置的编队控制依赖于全局坐标系,其中每个子系统在全局坐标系中感知自身的位置,并自主调整运行状态,实现预期的编队队形。由于每个自主体能获得自身期望目标的绝对位置$p_i^*$,理想状态下可以不通过自主体之间的相互协同与通信达成最终的编队布局,即基于位置的编队控制律为

$ {u_i} = {k_p}(p_i^* - {p_i}) $

式中:${p_i}$为自主体位置。但对于额外的任务挑战,例如维持队形的几何形态不变,需要自主体之间的协同来完成。文献[38]针对具有双积分器的多自主体系统,提出了一种基于位置的编队控制律,使多个自主体能够从初始位置移动到期望位置,同时在移动过程中保持期望队形。除此之外,文献[39]在自主体驱动能力受限的情况下,通过自主体间的协同合作有效地提升编队控制的位置精度。

3.2 基于位移的编队控制

基于位移的编队控制是基于位置的编队控制的扩展,进一步考虑了自主体间的平行运动,其中每个自主体拥有与全局坐标系同向的局部坐标系。尽管自主体无法直接感知整个编队的全局坐标系的原点位置,但由于坐标系对齐,局部坐标系下的相对位置信息与全局坐标系下的相对位置信息是相同的。自主体的控制目标进而转化为

$ {p_i} - {p_j} = p_i^* - p_j^* $

通过控制自主体间的相对位置,达成期望编队。分布式控制律为

$ {u_i} = {k_p}\sum\limits_{j \in {N_i}} {{a_{ij}}({p_j} - {p_i} + p_i^* - p_j^*) } $

自主体通过通信网络实时搜集相邻自主体的位移信息,并据此调整自身的位移,以此协同实现目标编队。文献[40]通过精准的位移控制机制,有效地完成了多自主体系统的编队任务,并稳定保持设定的队形结构。针对自主体间的朝向不一致问题,文献[41]所提出的基于位移的编队控制策略,进一步确保了全体自主体仍能迅速且稳定地收敛至预定的编队形态。

3.3 基于距离的编队控制

基于距离的编队控制在基于位移编队控制的基础上考虑了自主体的旋转,因此不再要求局部坐标系必须同向,并且摆脱了对全局坐标系的依赖。这种控制策略是自主体在自身局部坐标系下感知相邻自主体的距离,通过控制期望的相对距离,达成理想编队。控制目标可以表述如下

$ \| {{p_i} - {p_j}} \| = {d_{ij}} $

式中:$ {d}_{ij} $为期望距离。梯度下降法已被广泛用于基于距离的编队控制中。对于第i个自主体,定义其势能函数为

$ {\phi _i} = {k_p}\sum\limits_{j \in {N_i}} {{\gamma _{ij}}( {\| {{p_i} - {p_j}} \|} ) } $

式中:$ {\gamma }_{ij}\ge 0 $是关于自主体ij间距离的函数,当且仅当$ \| {{p_i} - {p_j}} \| = {d_{ij}} $时,${\gamma _{ij}}( {{d_{ij}}} ) = 0$。根据势能函数,分布式控制律可以设计为

$ {u_i} = - {\nabla _{{p_i}}}{\phi _i} $ (4)

式中:$ {\nabla }_{{p}_{i}} $为梯度算子。由于基于距离的编队控制需要对自主体间的距离进行主动调控,所以要求自主体间的通信拓扑是强连通或持续稳定的[42]。通过采用势能函数为自主体生成分布式局部控制器(4),可确保自主体间达到预设的距离关系。这种控制方法的核心在于设计合适的势能函数,该函数通常随着自主体间相对距离偏离理想值而增加,促使系统通过最小化整体势能来收敛到目标编队形状[43]。文献[44]运用自主体间距离的动态特性设计编队控制策略,直接控制自主体之间的距离,实现无穷小刚性编队的局部渐近稳定和三角形无限小刚性编队的全局渐近稳定。文献[45]研究了具有单积分器和双积分器多自主体的无向编队的局部渐近稳定性问题,通过设计梯度控制律和类梯度控制律,分别实现了具有单积分器和双积分器多自主体系统在n维无向拓扑下无向编队的局部渐近稳定性。文献[46]针对复杂通信环境下编队跟踪控制问题,提出了基于刚性拓扑框架下的编队路径跟踪控制,其中引入距离误差实现期望的编队控制。基于位置、位移和距离的编队控制特点如表1所示。

表 1 基于位置、位移和距离的编队控制特点 Table 1 Features of formation control based on position, displacement and distance
3.4 仿射编队控制

虽然上述3种基本的编队控制策略得到了广泛的研究和应用,但它们需要通过约束位置、位移和距离来实现期望编队,这极大地限制了编队控制的灵活性,使平移、旋转或缩放等这些仿射变换操作变得困难。为了解决这一问题,仿射编队控制策略得到了发展。针对于二阶系统,文献[47-48]在复域上提出了基于拉普拉斯矩阵的编队控制策略,实现了编队的平移、旋转和缩放。对于高阶系统,基于应力矩阵的编队控制策略得到进一步的研究,对于一个多无人自主系统编队,边$ \left(i,j\right) $上的应力为${\{ {{\omega _{ij}}} \}_{\left( {i,j} \right) \in E}}$,并且${\omega _{ij}} = {\omega _{ji}}$。应力矩阵结构由拓扑图确定,矩阵元素的值由编队队形确定,其平衡应力满足

$ \sum\limits_{j \in {N_i}} {{\omega _{ij}}({p_j} - {p_i}) = 0} ,i \in V $

对于编队的任何仿射变换,其应力矩阵保持不变。应力矩阵与拉普拉斯矩阵具有相似的性质,但应力矩阵的权值可以是正、负或零。在基于应力矩阵的编队控制中,刚度起着重要的作用,编队的全局刚度保证了编队在整个空间中的唯一性,也是应力矩阵建立的前提[49]。文献[50]基于应力矩阵提出了一种仿射编队控制方法,通过自主体之间的连续通信和实时感知,能够跟踪随时间仿射变换的期望队形,并且所提出的控制律使系统在全局范围内稳定。文献[51]利用应力矩阵和正交投影设计了一种新的分布式控制律,只需一对自主体共享编队缩放信息,就能实现整个编队在高维空间的缩放仿射变换。文献[52]在复杂环境下研究了基于应力矩阵的编队控制策略,通过一种可抑制外部干扰控制方法,实现了编队的稳定变换。

4 分布式优化

随着大数据和人工智能的发展,优化策略已成为解决大规模问题不可或缺的工具。在多无人自主系统中,很多控制问题都可以归为优化问题[53]。由于多自主体系统的分布特性,传统的集中式优化策略不适合解决这些优化问题。相比于集中式框架,分布式框架具有诸多优势,包括更高的鲁棒性而无需复杂的故障检测、更低的通信带宽需求和计算负载,以及更强的可扩展性。分布式算法在优化问题的处理中得到了广泛应用[54-56]

在分布式优化方法中,每个自主体都有一个动态状态,作为优化决策变量的估计值。每个自主体通过底层通信网络,根据其相邻自主体的局部信息,交互并更新其估计值。考虑N个自主体组成的网络系统中,每个自主体具有一个局部凸目标函数$ {f}_{i}\left(x\right) $,其中x是优化变量,分布式优化的目标是使所有自主体的局部目标函数之和的全局目标函数最小化,即

$ \mathop {\min }\limits_x \sum\limits_{i = 1}^N {{f_i}\left( x \right) } $ (5)
4.1 无向通信网络

在无向通信网路下,对于一个离散系统,基于一致性理论和梯度法的一阶算法由于其简单、易于实现而受到广泛关注。现有的一阶离散时间分布式优化算法根据步长的减小或固定分为两类。对于步长逐渐减小的离散分布式优化算法,文献[57]开创性地提出了一种简单的一阶分布式梯度下降(Distributed Gradient Descent, DGD)算法,即

$ {x_i}(k + 1) = \sum\limits_{j \in {N_i}} {{a_{ij}}(k) {x_j}(k + 1) } - \alpha \nabla {f_i}\left( {{x_i}(k) } \right) $

在该算法中,每个自主体沿着其凸目标函数的梯度方向运行,当固定无向拓扑图连通或时变无向拓扑图一致联合强连通时,分布式梯度下降算法渐近收敛到最优解之一。DGD算法适用于非光滑凸函数,广泛应用于实际场景。但步长逐步减小会导致DGD算法收敛速度相当慢。对于局部目标函数平滑的情况,文献[58]开发了一种基于Nesterov梯度法的快速分布式优化算法。Nesterov梯度法与DGD算法相比,该算法的收敛速度更快,但仍比集中式梯度下降算法慢。为了实现与集中梯度下降算法匹配的收敛速度并减少通信传输,在局部目标函数强凸光滑的情况下考虑固定步长的分布式加速算法得到了发展。文献[59]提出一种精确一阶算法,该算法中系统执行如下更新。

$ \begin{split} {x_i}(k + 2) =& {x_i}(k + 1) + \sum\limits_{j \in {N_i}} {{a_{ij}}{x_j}(k + 1) - } \sum\limits_{j \in {N_i}} {{{\tilde a}_{ij}}{x_j}(k) } - \\ & \alpha \left( {\nabla {f_i}\left( {{x_i}(k + 1) } \right) - \nabla {f_i}\left( {{x_i}(k) } \right) } \right) \end{split} $

与DGD算法只使用前一次迭代中最优解和梯度的估计相比,精确一阶算法使用前两次迭代中最优解和梯度的估计,显著提高了收敛速度。对于无向连通网络,当全局目标函数的全局极小点是强凸的,并且局部凸目标函数是光滑的时,可证明精确一阶算法在固定步长小于某个临界值时是线性收敛的。另一类具有固定步长的分布式梯度跟踪法将基于分布式不精确梯度方法和梯度跟踪技术的相结合[60],在局部目标函数是强凸和光滑的情况下,通过合适地选择固定步长,实现无向通信网络下线性收敛[61]。文献[62]提出一种分布式随机梯度跟踪算法,并证明了当步长不超过一定上界时,算法线性收敛于全局最优解。

4.2 有向通信网络

由于通信能力的不均匀,信息交换可能是单向的,进而网络拓扑结构是有向的。所以针对有向网络提出了各种离散时间和连续时间的分布式优化算法。

现有有向通信网络下的离散时间分布式优化算法可以分为两类。第一类是基于Push-Sum法的分布式优化算法,它将无向拓扑下的分布式优化算法中对双随机混合矩阵的要求放宽到列随机矩阵。文献[63]和文献[64]分别给出了针对强连通的固定有向拓扑和时变有向拓扑的基于Push-Sum的分布式优化算法。第二类是基于Push-Pull的方法,通过将自主体有关最优点估计的信息推送到相邻自主体,并从相邻自主体提取关于梯度的信息来实现优化[65]。相较于Push-Sum法,Push-Pull法需要更少的计算和通信。文献[66]提出了一个基于积分二次约束的统一框架,用于分析基于Push-Pull算法的线性收敛性,即当局部目标函数强凸光滑且有向图强连通时,可给出分布式Push-Pull算法的线性收敛速度的上界。为了实现基于Push-Sum和基于Push-Pull的分布式算法,每个自主体都需要知道其出度,才能构造列随机矩阵,这在基于广播的通信应用中存在困难。考虑到每个自主体都可以将边的权值分配给它的内邻,因此构造一个行随机矩阵要容易得多。对此,文献[67]开发了一种只使用行随机矩阵的分布式算法,每个自主体通过附加一个变量,该变量收敛于随机矩阵特征值为1所对应的特征向量,以抵消仅使用行随机矩阵引起的不平衡,在强连通有向图中,步长小于一定值时算法线性收敛。文献[68]提出了一种新的有向分布式Nesterov类梯度跟踪算法,并采用非均匀步长,如果最大步长是正的且足够小,算法可线性收敛到最优解。

对于连续时间下处理有向通信网络的方法,在假设强连通和局部凸目标函数光滑的条件下,文献[69]提出了一种分布式算法。适当选择增益参数可以渐近收敛到全局极小值。通常情况下增益参数依赖于一些全局信息,如通信网络的强连通性。为了放宽这个要求,文献[70]提出了一种自适应算法,通过引入动态耦合增益并利用系统状态信息更新耦合增益,同时解决了局部目标函数的非凸性、未知网络连通性以及局部利普希兹梯度引起的不确定动态问题。文献[71]提出了一种新的有向拓扑下分布式有限时间优化算法,该算法通过一个分布式估计器,使得局部代价函数的梯度在有限时间内被估计,并在强连通拓扑下,算法能够从任意的初始条件在有限时间内收敛到最优解。

4.3 受约束的优化问题

在实际应用中,存在各种约束。针对分布式优化问题,可分为局部约束和全局约束,而全局约束又可分为等式约束和不等式约束。

4.3.1 局部约束

对于局部约束的优化问题,可以归为如下形式。

$ \begin{gathered} \mathop {\min }\limits_x \sum\limits_{i = 1}^N {{f_i}\left( x \right) } \\ {\text{s}}{\text{.t}}{\text{. }}x \in \bigcap\limits_{i = 1}^N {{\varOmega _i}} \\ \end{gathered} $

式中:$ {{\varOmega }}_{{i}} $是第i个自主体的局部约束集,并假设它是一个闭凸集。早期的研究集中在约束集相同的特殊情况下,每个自主体的约束集是相同的。文献[72]提出了一种步长减小的分布式投影梯度算法,其中根据公共约束集选择合适的步长,使自主体状态估计收敛到相同的最优解。文献[73]考虑了连续时间分布式最优一致性问题,在时变一致联合连通通信网络下,可以实现有共同约束集自主体的最优一致性。对于约束集不同的情况下,文献[74]提出了一个次梯度投影算法,当通信拓扑在确定的时间界内的并集是强连通的,并且邻接矩阵是双重随机矩阵时,次梯度投影算法可实现分布式优化目标。

虽然上述优化算法适用于时变通信拓扑,但由于需要逐渐减少步长,其收敛速度较慢。为了加快收敛速度,针对固定步长开发了一些分布式优化算法。在离散时间下,文献[75]提出了一种具有固定步长的分布式原对偶算法,通过适当地选择固定的步长,所有自主体的局部估计渐近收敛至最优解。在连续时间下,文献[76]提出了一种新的分布式投影算法,证明了算法中的所有自主体都能找到相同的最优解,并且在寻找最优解的过程中保持状态有界。上述两种算法适用于非光滑局部凸目标函数,并建立在连通无向图上。在有向拓扑下,文献[77]提出了一种基于积分控制策略和投影法的分布式算法,选择合适的参数,可以实现算法的指数收敛。

4.3.2 全局约束

分布式优化算法除了存在局部约束,还存在全局约束的情形。对于全局不等式约束优化算法,可以归纳如下形式。

$ \begin{gathered} \mathop {\min }\limits_x \sum\limits_{i = 1}^N {{f_i}\left( x \right) } \\ {\text{s}}{\text{.t}}{\text{. }}\left\{ \begin{array}{l} x \in \displaystyle\bigcap\limits_{i = 1}^N {{\varOmega _i}} \\ {\text{ }}g(x) \leqslant {{\bf{0}}_m} \end{array} \right. \end{gathered} $

式中:$ {\text{ }}g(x) \leqslant {{\bf{0}}_m} $是一个全局不等式约束。在假设全局不等式约束已知的条件下,文献[78]基于增广拉格朗日函数鞍点的特征,开发了一种步长逐渐减少的原对偶投影次梯度算法,并证明了该算法在时变有向图下渐近收敛于最优解。当局部约束集合相同时,文献[79]针对无向图提出了一种固定步长分布式原对偶次梯度算法,并证明该算法能收敛至最优点。上述两种算法要求自主体每次迭代时都将原对偶估计投影到凸集上,这导致了较高的计算成本。为了节省计算资源,文献[80]在没有局部约束的情况下,为时变一致联合强连通的有向图设计了一种具有固定步长的分布式正则化原对偶次梯度算法,仅需在最后一次迭代进行投影即可达到优化要求。文献[81]针对时变不等式约束提出了一种滑模一致性和基于Hessian优化组成的分布式控制算法,该算法能保证渐近跟踪最优解,且跟踪误差为零。

对于全局等式约束情况,优化问题可表达为

$ \begin{gathered} \mathop {\min }\limits_x \sum\limits_{i = 1}^N {{f_i}\left( x \right) } \\ {\text{s}}{\text{.t}}{\text{. }}\left\{ \begin{array}{l}x \in \displaystyle\bigcap\limits_{i = 1}^N {{\varOmega _i}} \\ h(x) = {{\bf{0}}_p} \end{array} \right. \end{gathered} $

式中:$ h(x) = {{\bf{0}}_p} $是一个全局等式约束。在局部约束集相同的情况下,针对全局等式约束,文献[74]提出了一种步长减小的分布式惩罚原对偶次梯度算法,并证明了该算法在一致联合强连通和权值平衡的时变有向图中总是渐近收敛于最优解。对于局部约束集不同的情况,文献[82]开发了一种具有固定步长的离散时间分布式优化算法,证明了当无向连通图的步长小于一个可估计的上界时,算法能够渐近收敛于全局极小值。在连续时间背景下,一些学者分别提出了基于比例积分控制[83]和次梯度法[84]的分布式算法,并利用非光滑分析和李雅普诺夫稳定性理论,证明了这些算法在无向连通图中的渐近收敛性。

综上所述,大多数分布式约束优化的离散时间和连续时间算法只适用于无向图或权重平衡的有向图。针对不平衡有向图,文献[85]研究了一类具有局部不等式约束的分布式优化问题,并利用约束优化的Epigrah形式提出了一个步长减小的离散时间分布算法。结果表明,即使对于一致联合强连通的时变不平衡有向图,该算法也能渐近收敛于公共最优点。

5 分布式协同控制应用

近年来,分布式协同控制在无人自主系统中已经得到了广泛的应用,涵盖了无人机、无人车辆、无人水面舰艇及无人潜航器等多个领域。以下简要介绍无人自主系统中分布式协同控制的典型应用。

5.1 无人机

无人机作为一种利用无线电遥控设备和自备的程序控制装置操纵的不载人飞行器,具有测绘、侦察、负载和扩展通信等多种能力。无人机在交通监测、农业播种、灌溉、航空摄影以及军事上得到了广泛应用[86]。现有无人机主要分为固定翼和多旋翼无人机。固定翼无人机具有耐力好、速度快的特点,可以远距离飞行,通常用于户外环境中的巡逻、监视或数据收集,其完成任务的一个关键特征是目标跟踪。通过部署多无人机的通信网络,无人机协同合作可以大大提升跟踪性能。文献[87]提出了一种基于多无人机通信噪声下信息一致性的协同目标跟踪算法,将无人机之间的通信建模为信噪比模型。引入通信噪声使无人机在目标跟踪过程中更加专注于与其他无人机保持良好的通信,提高了协同目标跟踪的精度。多旋翼无人机因其能够悬停和垂直起降的特性,常常被用于封闭和人口密集的区域,例如室内空间和城市地带。在这些环境中,无人机的避障和抗干扰能力显得尤为重要。文献[88]为多无人机系统设计了分布式编队控制器和分布式避障控制器,编队控制器引导处于无序状态的多架无人机快速到达预定编队,避障控制器使无人机可以避开未知的障碍物。文献[89]针对四旋翼无人机设计了一个扰动观测器并修正相应标称系统的代价函数,有效地抑制了扰动。除了研究不同类型的无人机协同控制外,文献[90]结合数字孪生、5G、云平台和虚拟现实开发了DTUAV系统,用于实现多无人机的集群控制。

5.2 无人车

无人车代表一种在陆地上运行、无需人类驾驶员的机器人或车辆,可自主或远程控制执行多种任务,例如指定路径跟踪[18]。无人车已经广泛应用于农业、交通和军事等多个领域[91]。为应对日益拥挤的交通环境,车辆列队控制公认为是处理当前道路交通拥挤问题的一种有效的协同控制技术。车辆列队控制可以使多个车辆紧密地在一起安全行驶,减少了高速公路上的使用的空间。每个车辆在队列中行驶的车辆只需知道自己和前面车辆的位置信息,便可在零初始间距误差下运行在期望轨迹上[92]。文献[93]提出了一种分布式自适应滑模控制方法。通过修正的恒定时间间隔策略,消除初始间距和速度误差为零的假设,同时有效减少车间间距,提高了交通密度。对于互联车辆系统,文献[94]提出了一种基于耦合滑模控制的车辆列队控制策略,提高了双向列队控制的性能和稳定性。文献[95]研究了多车辆协同换道问题,利用分布式协同控制算法,实现了车辆在保持安全距离的前提下稳定行驶,并能够精准地换道到目标车道。

5.3 无人水面舰艇和无人潜航器

无人水面舰艇已广泛用于海洋探索、环境监测和国防安全等领域。多无人水面舰艇也因其在复杂海洋环境下效率高、覆盖范围广、抗干扰能力强的特点得到了进一步研究[96]

文献[97]基于李雅普诺夫理论和反步法为海洋载荷的船舶设计了一种分布式控制器,完成无碰撞同步运动跟踪的任务。借助模糊估计器,文献[98]提出了一种受约束的分布式控制律,用于引导多无人自主水面舰艇跟随沿参数化路径移动的虚拟领导者。针对有限通信下欠驱动无人水面舰艇的编队控制和避障问题,文献[99]提出了一种新的非线性变换编队误差,并利用该误差设计分布式控制器以实现初始连通性保持、避障和分布式编队跟踪三个目标。

由于系统的不确定性和耦合动力学、鱼群或洋流引起的环境干扰和水下通信的影响,无人潜航器的分布式协同控制比其他无人自主系统更具挑战性。对于模型不确定性和海流干扰的情况,文献[100]提出了一种交叉耦合的同步控制、非奇异终端滑模控制和自适应控制结合的分布式编队控制策略。该策略通过重新定义交叉耦合误差,增强了系统的鲁棒性,并设计自适应非奇异终端滑模控制,保证了跟踪误差在有限时间内从任意初始值收敛到零,同时消除了抖振问题。对水下目标的捕获、包围、护送或监视是无人潜航器的重要应用之一。文献[101]就水下目标的绕航问题,提出了一种基于位移的编队控制策略,同时在没有全局坐标系的情况下,控制器通过局部相对位置的测量,可以实现目标周围的一个理想的环绕编队。文献[102]提出了一种分布式预定性能控制方法,编队误差能够在预定时间内达到并保持在容许范围内。

5.4 多模态协同控制

多模态协同控制是指通过多种感知和控制模式之间的协调与协作,实现更高效和智能化的系统控制,在无人自主系统应用中得到广泛研究。多模态协同控制技术是通过融合来自各异传感器及数据源的信息,对环境特征进行全面且精确理解,进而做出更加准确的控制决策,有效地操控无人自主系统。文献[103]针对人与无人机集群交互式协同感知问题,构建了基于语音和手势双模型自主识别集群编队协同控制的交互框架,并提出了一种基于双通道切换的通道融合机制,从而实现多模态交互, 有效控制无人机集群形成编队。文献[104]对于车辆自主列队行驶设计了一种多模态混合控制器,它能适应不同的驾驶模式,如巡航、跟随、并车、分流和变道等,并为处理编队的多模式转换(如突然加速变化、紧急制动),建立了一种自适应决策机制。文献[105]为应对大规模复杂的水上任务,构建了基于多模态网络拓扑下的可扩展多无人水面舰艇协同控制系统,并提出了多边分布式控制协议,增强系统对多样化任务的适应性和效率,并最大限度地节约能源。随着任务和工作环境通过跨领域的技术融合,无人系统正朝着更加智能化、协同化和多模态的方向发展。

6 总结与未来展望

本文介绍了无人自主系统分布式协同控制的相关研究,从一致性问题、编队控制和分布式优化三个方面进行理论探讨,并介绍了无人自主系统分布式协同控制的典型应用。对于无人自主系统的分布式协同控制的研究,未来将面临如下挑战和机遇:(1) 增强智能化和自适应性:随着人工智能和机器学习技术的快速发展,将其融入无人自主系统中,可显著提高系统的智能化和自适应能力。未来研究需重点开发在线学习和适应环境变化的分布式控制算法,提高在动态和不确定环境中自主调整策略和决策的能力。(2) 多模态协同与异构系统集成:在未来,无人机、无人车、无人水面舰艇和无人潜航器等异构系统的协同作业和任务执行将成为一个重要方向。未来研究需致力于解决异构系统之间的通信和协调问题,开发能够跨平台操作和协同的分布式控制框架,实现不同类型自主系统的无缝集成与协同。(3) 分布式优化与资源管理:未来的研究需进一步提升分布式优化算法的性能和效率,特别是在大规模自主系统中的应用。优化资源分配、能量管理和通信带宽利用,将是提高系统整体效能的关键。此外,还需研究在资源受限条件下的鲁棒性和容错能力,以确保系统的可靠性和稳定性。(4) 安全性与隐私保护:随着无人自主系统在各个领域的广泛应用,系统的安全性和隐私保护将变得愈加重要。未来的研究需关注并开发分布式控制算法的安全协议,防止恶意攻击和数据泄露。此外,还需研究分布式系统中的隐私保护机制,确保任务执行过程中的数据安全。(5) 人机协同与决策支持:目前,人机协同的研究需进一步深化。自主系统不仅需要独立执行任务,还需与人类操作员有效互动,共享信息和协同决策。未来研究将致力于开发直观的人机交互界面和决策支持系统,提升人类操作员对复杂任务的掌控和干预能力。(6) 应用扩展与多领域融合:随着技术的进步,无人自主系统的应用领域将不断扩展,涵盖从农业、物流到城市管理和灾害应急等多个方面。未来的研究需聚焦于这些新兴应用领域的需求,开发适应特定应用场景的分布式协同控制算法,并推动各领域间的技术融合与创新。

无人自主系统的分布式协同控制有着广阔的发展空间。通过持续的技术创新和跨学科合作,分布式协同控制技术将进一步推动无人自主系统在科学研究、工程实践和社会服务中的应用,创造更安全、高效和智能的未来。

参考文献
[1]
陈杰, 辛斌. 有人/无人系统自主协同的关键科学问题[J]. 中国科学: 信息科学, 2018, 48(9): 1270-1274.
CHEN J, XIN B. Key scientific problems in the autonomous cooperation of manned-unmanned systems[J]. Scientia Sinica Informationis, 2018, 48(9): 1270-1274. DOI: 10.1360/N112018-00092.
[2]
MA H, ZHOU Q, LI H, et al. Adaptive prescribed performance control of a flexible-joint robotic manipulator with dynamic uncertainties[J]. IEEE Transactions on Cybernetics, 2021, 52(12): 12905-12915.
[3]
TAO J, XIAO Z, CHEN J, et al. Event-triggered control for Markov jump systems subject to mismatched modes and strict dissipativity[J]. IEEE Transactions on Cybernetics, 2021, 53(3): 1537-1546.
[4]
ZHOU Q, LI H Y, WANG L J, et al. Prescribed performance observer-based adaptive fuzzy control for nonstrict-feedback stochastic nonlinear systems[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2017, 48(10): 1747-1758.
[5]
邱俊豪, 程志键, 林国怀, 等. 具有执行器故障的非线性系统指定性能控制[J]. 广东工业大学学报, 2023, 40(2): 55-63.
QIU J H, CHENG Z J, LIN G H, et al. Prescribed performance control for a class of nonlinear pure-feedback systems with actuator faults[J]. Journal of Guangdong University of Technology, 2023, 40(2): 55-63. DOI: 10.12052/gdutxb.210110.
[6]
CAO Y C, YU W W, REN W, et al. An overview of recent progress in the study of distributed multi-agent coordination[J]. IEEE Transactions on Industrial informatics, 2012, 9(1): 427-438.
[7]
LI T, FU M Y, XIE L H, et al. Distributed consensus with limited communication data rate[J]. IEEE Transactions on Automatic Control, 2010, 56(2): 279-292.
[8]
GAO S, WEN G G, ZHAI X Q, et al. Finite-/fixed-time bipartite consensus for first-order multi-agent systems via impulsive control[J]. Applied Mathematics and Computation, 2023, 442: 127740.
[9]
SUN H, LIU Y G, LI F Z. Optimal consensus via distributed protocol for second-order multiagent systems[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2021, 51(10): 6218-6228. DOI: 10.1109/TSMC.2019.2959394.
[10]
JIANG X, XIA G, FENG Z. Output consensus of high‐order linear multi‐agent systems with time‐varying delays[J]. IET Control Theory & Applications, 2019, 13(8): 1084-1094.
[11]
LI Z K, DUAN Z S, CHEN G R, et al. Consensus of multiagent systems and synchronization of complex networks: a unified viewpoint[J]. IEEE Transactions on Circuits and Systems I: Regular Papers, 2009, 57(1): 213-224.
[12]
WANG G. Consensus control in heterogeneous nonlinear multiagent systems with position feedback and switching topologies[J]. IEEE Transactions on Network Science and Engineering, 2022, 9(5): 3546-3557. DOI: 10.1109/TNSE.2022.3159783.
[13]
张振华, 彭世国. 二阶多智能体系统拓扑切换下的领导跟随一致性[J]. 广东工业大学学报, 2018, 35(2): 75-80.
ZHANG Z H, PENG S G. Leader-following consensus of second-order multi-agent systems with switching topology[J]. Journal of Guangdong University of Technology, 2018, 35(2): 75-80. DOI: 10.12052/gdutxb.170125.
[14]
YOU K Y, LI Z K, XIE L H. Consensus condition for linear multi-agent systems over randomly switching topologies[J]. Automatica, 2013, 49(10): 3125-3132. DOI: 10.1016/j.automatica.2013.07.024.
[15]
WANG G L, SUN Y Y. Consensus of multiagent systems with random switching topologies and its application[J]. International Journal of Robust and Nonlinear Control, 2020, 30(5): 2079-2096. DOI: 10.1002/rnc.4866.
[16]
HADDOCK J, JARMAN B, YAP C. Paving the way for consensus: convergence of block gossip algorithms[J]. IEEE Transactions on Information Theory, 2022, 68(11): 7515-7527. DOI: 10.1109/TIT.2022.3202733.
[17]
SHANG Y L. Median-based resilient consensus over time-varying random networks[J]. IEEE Transactions on Circuits and Systems II: Express Briefs, 2021, 69(3): 1203-1207.
[18]
LU R Q, XU Y, ZHANG R D. A new design of model predictive tracking control for networked control system under random packet loss and uncertainties[J]. IEEE Transactions on Industrial Electronics, 2016, 63(11): 6999-7007. DOI: 10.1109/TIE.2016.2585543.
[19]
OLFATI-SABER R, MURRAY R M. Consensus problems in networks of agents with switching topology and time-delays[J]. IEEE Transactions on Automatic Control, 2004, 49(9): 1520-1533. DOI: 10.1109/TAC.2004.834113.
[20]
朱婧丽, 金朝永, 郭红萍. 具有参考时变状态的多智能体的H∞一致性[J]. 广东工业大学学报, 2011, 28(3): 83-86.
ZHU J L, JIN C Y, GUO H P. H∞ consensus of multi-agent network with a time-varying reference state[J]. Journal of Guangdong University of Technology, 2011, 28(3): 83-86. DOI: 10.3969/j.issn.1007-7162.2011.03.024.
[21]
DENG C, CHE W W, WU Z G. A dynamic periodic event-triggered approach to consensus of heterogeneous linear multiagent systems with time-varying communication delays[J]. IEEE Transactions on Cybernetics, 2020, 51(4): 1812-1821.
[22]
徐君, 张国良, 曾静, 等. 具有时延和切换拓扑的高阶离散时间多智能体系统鲁棒保性能一致性[J]. 自动化学报, 2019, 45(2): 360-373.
XU J, ZHANG G L, ZENG J, et al. Robust guaranteed cost consensus for high-order discrete-time multi-agent systems with switching topologies and time delays[J]. Acta Automatica Sinica, 2019, 45(2): 360-373.
[23]
LI Z Q, WANG Y J, SONG Y D, et al. Global consensus tracking control for high-order nonlinear multiagent systems with prescribed performance[J]. IEEE Transactions on Cybernetics, 2022, 53(10): 6529-6537.
[24]
MA Q, XU S Y, LEWIS F L. Second-order consensus for directed multi-agent systems with sampled data[J]. International Journal of Robust and Nonlinear Control, 2014, 24(16): 2560-2573. DOI: 10.1002/rnc.3010.
[25]
ZHANG W B, TANG Y, HAN Q L, et al. Sampled-data consensus of linear time-varying multiagent networks with time-varying topologies[J]. IEEE Transactions on Cybernetics, 2020, 52(1): 128-137.
[26]
SUN J, WANG Z S, RONG N N. Sampled-data consensus of multiagent systems with switching jointly connected topologies via time-varying Lyapunov function approach[J]. International Journal of Robust and Nonlinear Control, 2020, 30(14): 5369-5385. DOI: 10.1002/rnc.5087.
[27]
BARKAI G, MIRKIN L, ZELAZO D. On sampled-data consensus: divide and concur[J]. IEEE Control Systems Letters, 2021, 6: 343-348.
[28]
胡然, 彭世国. 基于脉冲观测器的多智能体系统的领导跟随一致性[J]. 广东工业大学学报, 2023, 40(5): 88-93.
HU R, PENG S G. Impulsive observer-based leader-following consensus for multi-agent systems[J]. Journal of Guangdong University of Technology, 2023, 40(5): 88-93. DOI: 10.12052/gdutxb.220155.
[29]
KASHYAP A, BAŞAR T, SRIKANT R. Quantized consensus[J]. Automatica, 2007, 43(7): 1192-1203. DOI: 10.1016/j.automatica.2007.01.002.
[30]
LAVAEI J, MURRAY R M. Quantized consensus by means of gossip algorithm[J]. IEEE Transactions on Automatic Control, 2011, 57(1): 19-32.
[31]
MA J, JI H B, SUN D, et al. An approach to quantized consensus of continuous-time linear multi-agent systems[J]. Automatica, 2018, 91: 98-104. DOI: 10.1016/j.automatica.2018.01.028.
[32]
ZHANG Z Q, ZHANG L, HAO F, et al. Leader-following consensus for linear and Lipschitz nonlinear multiagent systems with quantized communication[J]. IEEE Transactions on Cybernetics, 2016, 47(8): 1970-1982.
[33]
LI X X, CHEN M Z Q, SU H S. Quantized consensus of multi-agent networks with sampled data and Markovian interaction links[J]. IEEE Transactions on Cybernetics, 2018, 49(5): 1816-1825.
[34]
陈世明, 姜根兰, 张正. 通信受限的多智能体系统二分实用一致性[J]. 自动化学报, 2022, 48(5): 1318-1326.
CHEN S M, JIANG G L, ZHANG Z. Bipartite practical consensus control of multi-agent systems with communication constraints[J]. Acta Automatica Sinica, 2022, 48(5): 1318-1326.
[35]
LI H Y, LUO J H, MA H, et al. Observer-based event-triggered iterative learning consensus for locally lipschitz nonlinear MASs[J]. IEEE Transactions on Cognitive and Developmental Systems, 2024, 16(1): 46-56. DOI: 10.1109/TCDS.2023.3274794.
[36]
REN H R, CHENG Z J, QIN J, et al. Deception attacks on event-triggered distributed consensus estimation for nonlinear systems[J]. Automatica, 2023, 154: 111100. DOI: 10.1016/j.automatica.2023.111100.
[37]
XU Y, YAO Z Z, LU R, et al. A novel fixed-time protocol for first-order consensus tracking with disturbance rejection[J]. IEEE Transactions on Automatic Control, 2021, 67(11): 6180-6186.
[38]
REN W, ATKINS E. Distributed multi-vehicle coordinated control via local information exchange[J]. International Journal of Robust and Nonlinear Control: IFAC‐Affiliated Journal, 2007, 17(10‐11): 1002-1033.
[39]
BUCKLEY I, EGERSTEDT M. Infinitesimally shape-similar motions using relative angle measurements[C]//2017 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) . Vancouver, BC, Canada: IEEE, 2017: 1077-1082.
[40]
WANG X M, ZERR B, THOMAS H, et al. Pattern formation of multi-AUV systems with the optical sensor based on displacement-based formation control[J]. International Journal of Systems Science, 2020, 51(2): 348-367. DOI: 10.1080/00207721.2020.1716096.
[41]
LI Z, TANG Y, FAN Y Q, et al. Formation control of multi-agent systems with constrained mismatched compasses[J]. IEEE Transactions on Network Science and Engineering, 2022, 9(4): 2224-2236. DOI: 10.1109/TNSE.2022.3159173.
[42]
ZHAO S Y, ZELAZO D. Bearing rigidity and almost global bearing-only formation stabilization[J]. IEEE Transactions on Automatic Control, 2015, 61(5): 1255-1268.
[43]
KRICK L, BROUCKE M E, FRANCIS B A. Stabilisation of infinitesimally rigid formations of multi-robot networks[J]. International Journal of control, 2009, 82(3): 423-439. DOI: 10.1080/00207170802108441.
[44]
OH K K, AHN H S. Formation control of mobile agents based on inter-agent distance dynamics[J]. Automatica, 2011, 47(10): 2306-2312. DOI: 10.1016/j.automatica.2011.08.019.
[45]
OH K K, AHN H S. Distance-based undirected formations of single-integrator and double-integrator modeled agents in n-dimensional space[J]. International Journal of Robust and Nonlinear Control, 2014, 24(12): 1809-1820. DOI: 10.1002/rnc.2967.
[46]
刘树光, 王欢, 刘荣华. 基于距离的无人机编队路径跟踪控制[J]. 飞行力学, 2023, 41(1): 27-33.
LIU S G, WANG H, LIU R H. Distance-based control for UAVs formation path tracking[J]. Flight Dynamics, 2023, 41(1): 27-33.
[47]
LIN Z Y, WANG L L, HAN Z M, et al. Distributed formation control of multi-agent systems using complex Laplacian[J]. IEEE Transactions on Automatic Control, 2014, 59(7): 1765-1777. DOI: 10.1109/TAC.2014.2309031.
[48]
HAN Z M, WANG L L, LIN Z Y, et al. Formation control with size scaling via a complex Laplacian-based approach[J]. IEEE Transactions on Cybernetics, 2015, 46(10): 2348-2359.
[49]
CONNELLY R. Generic global rigidity[J]. Discrete & Computational Geometry, 2005, 33: 549-563.
[50]
XU Y, ZHAO S Y, LUO D L, et al. Affine formation maneuver control of multi-agent systems with directed interaction graphs[C]//2018 37th Chinese Control Conference (CCC) . Wuhan, China: IEEE, 2018: 4563-4568.
[51]
YANG Q K, CAO M, SUN Z Y, et al. Formation scaling control using the stress matrix[C]//2017 IEEE 56th Annual Conference on Decision and Control (CDC) . Melbourne, VIC, Australia: IEEE, 2017: 3449-3454.
[52]
李欣, 蔡光斌, 吴彤, 等. 一种基于应力矩阵的无人机集群队形变换控制方法[J]. 控制与决策, 2024, 39(7): 2195-2204.
LI X, CAI G B, WU T, et al. Formation transformation control of UAV swarm based on stress matrix[J]. Control and Decision, 2024, 39(7): 2195-2204.
[53]
辛斌, 陈杰, 彭志红. 智能优化控制: 概述与展望[J]. 自动化学报, 2013, 39(11): 1831-1848.
XIN B, CHEN J, PENG Z H. Intelligent optimized control: overview and prospect[J]. Acta Automatica Sinica, 2013, 39(11): 1831-1848.
[54]
WANG H W, LIAO X F, HUANG T W, et al. Cooperative distributed optimization in multiagent networks with delays[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2014, 45(2): 363-369.
[55]
洪奕光, 翟超. 多智能体系统动态协调与分布式控制设计[J]. 控制理论与应用, 2011, 28(10): 1506-1512.
HONG Y G, ZHAI C. Dynamic coordination and distributed control design of multi-agent systems[J]. Control Theory and Technology, 2011, 28(10): 1506-1512.
[56]
杨涛, 柴天佑. 分布式协同优化的研究现状与展望[J]. 中国科学(技术科学), 2020, 50(11): 1414-1425.
YANG T, CAI T Y. Research status and prospects of distributed collaborative optimization[J]. Scientia Sinica Technologica, 2020, 50(11): 1414-1425. DOI: 10.1360/SST-2020-0040.
[57]
NEDIC A, OZDAGLAR A. Distributed subgradient methods for multi-agent optimization[J]. IEEE Transactions on Automatic Control, 2009, 54(1): 48-61. DOI: 10.1109/TAC.2008.2009515.
[58]
JAKOVETIĆ D, XAVIER J, MOURA J M F. Fast distributed gradient methods[J]. IEEE Transactions on Automatic Control, 2014, 59(5): 1131-1146. DOI: 10.1109/TAC.2014.2298712.
[59]
SHI W, LING Q, WU G, et al. Extra: an exact first-order algorithm for decentralized consensus optimization[J]. SIAM Journal on Optimization, 2015, 25(2): 944-966. DOI: 10.1137/14096668X.
[60]
NEDIC A, OLSHEVSKY A, SHI W. Achieving geometric convergence for distributed optimization over time-varying graphs[J]. SIAM Journal on Optimization, 2017, 27(4): 2597-2633. DOI: 10.1137/16M1084316.
[61]
QU G N, LI N. Harnessing smoothness to accelerate distributed optimization[J]. IEEE Transactions on Control of Network Systems, 2017, 5(3): 1245-1260.
[62]
LI H Q, ZHENG L F, WANG Z, et al. S-DIGing: a stochastic gradient tracking algorithm for distributed optimization[J]. IEEE Transactions on Emerging Topics in Computational Intelligence, 2022, 6(1): 53-65. DOI: 10.1109/TETCI.2020.3017242.
[63]
TSIANOS K I, LAWLOR S, RABBAT M G. Push-sum distributed dual averaging for convex optimization[C]//2012 IEEE 51st IEEE Conference on Decision and Control (cdc). Hawall: IEEE, 2012: 5453-5458.
[64]
NEDIĆ A, OLSHEVSKY A. Distributed optimization over time-varying directed graphs[J]. IEEE Transactions on Automatic Control, 2014, 60(3): 601-615.
[65]
PU S, SHI W, XU J M, et al. Push-pull gradient methods for distributed optimization in networks[J]. IEEE Transactions on Automatic Control, 2020, 66(1): 1-16.
[66]
ZHANG S J, YI X L, GEORGE J, et al. Computational convergence analysis of distributed optimization algorithms for directed graphs[C]//2019 IEEE 15th International Conference on Control and Automation (ICCA) . Edinburgh, UK: IEEE, 2019: 1096-1101.
[67]
XI C G, MAI V S, XIN R, et al. Linear convergence in optimization over directed graphs with row-stochastic matrices[J]. IEEE Transactions on Automatic Control, 2018, 63(10): 3558-3565. DOI: 10.1109/TAC.2018.2797164.
[68]
LU Q G, LIAO X F, Li H Q, et al. A Nesterov-like gradient tracking algorithm for distributed optimization over directed networks[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2021, 51(10): 6258-6270. DOI: 10.1109/TSMC.2019.2960770.
[69]
GHARESIFARD B, CORTÉS J. Distributed continuous-time convex optimization on weight-balanced digraphs[J]. IEEE Transactions on Automatic Control, 2013, 59(3): 781-786.
[70]
LI Z H, DING Z T, SUN J Y, et al. Distributed adaptive convex optimization on directed graphs via continuous-time algorithms[J]. IEEE Transactions on Automatic Control, 2017, 63(5): 1434-1441.
[71]
WANG Q L, WU W Q. A distributed finite-time optimization algorithm for directed networks of continuous‐time agents[J]. International Journal of Robust and Nonlinear Control, 2024, 34(6): 4032-4050. DOI: 10.1002/rnc.7176.
[72]
NEDIC A, OZDAGLAR A, PARRILO P A. Constrained consensus and optimization in multi-agent networks[J]. IEEE Transactions on Automatic Control, 2010, 55(4): 922-938. DOI: 10.1109/TAC.2010.2041686.
[73]
QIU Z R, LIU S, XIE L H. Distributed constrained optimal consensus of multi-agent systems[J]. Automatica, 2016, 68: 209-215. DOI: 10.1016/j.automatica.2016.01.055.
[74]
LIN P, REN W, SONG Y D. Distributed multi-agent optimization subject to nonidentical constraints and communication delays[J]. Automatica, 2016, 65: 120-131. DOI: 10.1016/j.automatica.2015.11.014.
[75]
LEI J L, CHEN H F, FANG H T. Primal-dual algorithm for distributed constrained optimization[J]. Systems & Control Letters, 2016, 96: 110-117.
[76]
ZENG J S, YIN W T. Extrapush for convex smooth decentralized optimization over directed networks[J]. Journal of Computational Mathematics, 2017: 383-396.
[77]
WANG Z, WANG D, SUN J Z, et al. Exponential convergence rate of distributed optimisation for multi‐agent systems with constraints set over a directed graph[J]. IET Control Theory & Applications, 2018, 12(9): 1201-1207.
[78]
ZHU M H, MARTINEZ S. On distributed convex optimization under inequality and equality constraints[J]. IEEE Transactions on Automatic Control, 2011, 57(1): 151-164.
[79]
YUAN D M, XU S Y, ZHAO H Y. Distributed primal-dual subgradient method for multiagent optimization via consensus algorithms[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), 2011, 41(6): 1715-1724. DOI: 10.1109/TSMCB.2011.2160394.
[80]
YUAN D M, HO D W C, XU S Y. Regularized primal-dual subgradient method for distributed constrained optimization[J]. IEEE Transactions on Cybernetics, 2015, 46(9): 2109-2118.
[81]
SUN S, XU J, REN W. Distributed continuous-time algorithms for time-varying constrained convex optimization[J]. IEEE Transactions on Automatic Control, 2023, 68(7): 3931-3946.
[82]
LIU Q S, YANG S F, HONG Y G. Constrained consensus algorithms with fixed step size for distributed convex optimization over multiagent networks[J]. IEEE Transactions on Automatic Control, 2017, 62(8): 4259-4265. DOI: 10.1109/TAC.2017.2681200.
[83]
YANG S F, LIU Q S, WANG J. A multi-agent system with a proportional-integral protocol for distributed constrained optimization[J]. IEEE Transactions on Automatic Control, 2016, 62(7): 3461-3467.
[84]
ZHU Y N, YU W W, WEN G H, et al. Continuous-time distributed subgradient algorithm for convex optimization with general constraints[J]. IEEE Transactions on Automatic Control, 2018, 64(4): 1694-1701.
[85]
XIE P, YOU K Y, TEMPO R, et al. Distributed convex optimization with inequality constraints over time-varying unbalanced digraphs[J]. IEEE Transactions on Automatic Control, 2018, 63(12): 4331-4337. DOI: 10.1109/TAC.2018.2816104.
[86]
姜霞, 曾宪琳, 孙健, 等. 多飞行器的分布式优化研究现状与展望 [J]. 航空学报, 2021, 42(4): 524551-524551.
JIANG X, ZENG X L, SUN J, et al. Research status and prospect of distributed optimization for multiple aircraft[J]. Acta Aeronauticaet Astronautica Sinica, 2021, 42(4): 524551.
[87]
FU X, LIU K, GAO X. Multi-UAVs communication-aware cooperative target tracking[J]. Applied Sciences, 2018, 8(6): 870. DOI: 10.3390/app8060870.
[88]
WU J, LUO C, LUO Y, et al. Distributed UAV swarm formation and collision avoidance strategies over fixed and switching topologies[J]. IEEE Transactions on Cybernetics, 2021, 52(10): 10969-10979.
[89]
GUO Z J, LI H Y, MA H, et al. Distributed optimal attitude synchronization control of multiple QUAVs via adaptive dynamic programming[J]. IEEE Transactions on Neural Networks and Learning Systems, 2024, 35(6): 8053-8063. DOI: 10.1109/TNNLS.2022.3224029.
[90]
MENG W, YANG Y L, ZANG J Y, et al. DTUAV: a novel cloud-based digital twin system for unmanned aerial vehicles[J]. Simulation, 2023, 99(1): 69-87. DOI: 10.1177/00375497221109575.
[91]
孙健, 邓方, 陈杰. 陆用运动体控制系统发展现状与趋势[J]. 自动化学报, 2018, 44(11): 1985-1999.
SUN J, DENG F, CHEN J. Control system of ground-based moving platforms: state of the art and future trends. Acta Automatica Sinica, 2018, 44(11): 1985-1999.
[92]
LIU Y G, GAO H L, XU B G, et al. Autonomous coordinated control of a platoon of vehicles with multiple disturbances[J]. IET Control Theory & Applications, 2014, 8(18): 2325-2335.
[93]
GUO X G, WANG J L, LIAO F, et al. Distributed adaptive sliding mode control strategy for vehicle-following systems with nonlinear acceleration uncertainties[J]. IEEE Transactions on Vehicular Technology, 2016, 66(2): 981-991.
[94]
KWON J W, CHWA D. Adaptive bidirectional platoon control using a coupled sliding mode control method[J]. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(5): 2040-2048. DOI: 10.1109/TITS.2014.2308535.
[95]
谢光强, 赵俊伟, 李杨, 等. 基于多集群系统的车辆协同换道控制[J]. 广东工业大学学报, 2021, 38(5): 1-9.
XIE G Q, ZHAO J W, LI Y, et al. Cooperative lane-changing based on multi-cluster system[J]. Journal of Guangdong University of Technology, 2021, 38(5): 1-9. DOI: 10.12052/gdutxb.210050.
[96]
张卫东, 刘笑成, 韩鹏. 水上无人系统研究进展及其面临的挑战[J]. 自动化学报, 2020, 46(5): 847-857.
ZHANG W D, LIU X C, HAN P. Progress and challenges of overwater unmanned systems[J]. Acta Automatica Sinica, 2020, 46(5): 847-857.
[97]
DO K D. Synchronization motion tracking control of multiple underactuated ships with collision avoidance[J]. IEEE Transactions on Industrial Electronics, 2016, 63(5): 2976-2989. DOI: 10.1109/TIE.2016.2523453.
[98]
PENG Z, WANG J, WANG D. Distributed maneuvering of autonomous surface vehicles based on neurodynamic optimization and fuzzy approximation[J]. IEEE Transactions on Control Systems Technology, 2017, 26(3): 1083-1090.
[99]
PARK B S, YOO S J. An error transformation approach for connectivity-preserving and collision-avoiding formation tracking of networked uncertain underactuated surface vessels[J]. IEEE Transactions on Cybernetics, 2018, 49(8): 2955-2966.
[100]
MENG C C, ZHANG X Y. Distributed leaderless formation control for multiple autonomous underwater vehicles based on adaptive nonsingular terminal sliding mode[J]. Applied Ocean Research, 2021, 115: 102781. DOI: 10.1016/j.apor.2021.102781.
[101]
SHI L L, ZHENG R H, LIU M Q, et al. Distributed circumnavigation control of autonomous underwater vehicles based on local information[J]. Systems & Control Letters, 2021, 148: 104873.
[102]
LI J, DU J L, LEWIS F L. Distributed three‐dimension time‐varying formation control with prescribed performance for multiple underactuated autonomous underwater vehicles[J]. International Journal of Robust and Nonlinear Control, 2021, 31(13): 6272-6287. DOI: 10.1002/rnc.5611.
[103]
苏翎菲, 化永朝, 董希旺, 等. 人与无人机集群多模态智能交互方法[J]. 航空学报, 2022, 43(S1): 727001.
SU L F, HUA Y Z , DONG X W, et al. Human-UAV swarm multi-modal intelligent interaction methods[J]. Acta Aeronauticaet Astronautica Sinica, 2022, 43(S1): 727001.
[104]
MA Y L, LI Z X, MALEKIAN R, et al. A novel multimode hybrid control method for cooperative driving of an automated vehicle platoon[J]. IEEE Internet of Things Journal, 2020, 8(7): 5822-5838.
[105]
LU Y Z, SHAN Q H, XIAO G Y, et al. Green polymorphic cooperative formation strategy of low-carbon unmanned surface vessels[J]. Frontiers in Energy Research, 2022, 10: 953485. DOI: 10.3389/fenrg.2022.953485.