舰船科学技术  2022, Vol. 44 Issue (1): 104-107    DOI: 10.3404/j.issn.1672-7649.2022.01.020   PDF    
融合拓扑交互与信息耦合度的群集式AUV分群控制算法
吴函1,2,3, 徐红丽4, 谭东旭1,2,5, 唐磊生1,2,6     
1. 中国科学院 沈阳自动化研究所 机器人学国家重点实验室,辽宁 沈阳 110016;
2. 中国科学院机器人与智能制造创新研究院,辽宁 沈阳 110169;
3. 中国科学院大学,北京 100049;
4. 东北大学 机器人科学与工程学院,辽宁 沈阳 110819;
5. 沈阳理工大学 自动化与电气工程学院,辽宁 沈阳 110159;
6. 沈阳建筑大学 信息与控制工程学院,辽宁 沈阳 110000
摘要: 在无协商、指派及中心控制的自主水下航行器(AUV)集群控制中,AUV群集在进行避碰、多目标追踪等行为时群集分裂的现象不可避免,如果分裂不可控,易出现AUV丢失或分裂后的子群规模差距过大等问题。为了面对外部刺激时群集能进行可控分群,提出一种融合拓扑交互和信息耦合度的分群控制算法,该算法使用信息耦合度作为评判指标衡量个体间的影响作用,并根据AUV在水下通信难、感知难的特点,引入了拓扑交互机制,减少群集组群和分群所需要的信息,提升AUV组群和分群的效果。仿真实验验证该算法的可行性和有效性。
关键词: 自主水下航行器     分群控制     拓扑交互     信息耦合度    
Swarm of AUVs fission control algorithm combining topological interaction and information coupling degree
WU Han1,2,3, XU Hong-li4, TAN Dong-xu1,2,5, TANG Lei-sheng1,2,6     
1. State Key Laboratory of Robotics, Shenyang Institute of Automation, Chinese Academy of Sciences, Shenyang 110016, China;
2. Institutes for Robotics and Intelligent Manufacturing, Chinese Academy of Sciences, Shenyang 110169, China;
3. University of Chinese Academy of Sciences, Beijing 110049, China;
4. Faculty of Robot Science and Engineering, Northeastern University , Shenyang 110819, China;
5. School of Automation and Electrical Engineering, Shenyang Ligong University, Shenyang 110159, China;
6. Information and Control Engineering Faculty, Shenyang Jianzhu University, Shenyang 110000, China
Abstract: In the AUV cluster control without negotiation, assignment and central control, the phenomenon of swarm splitting is inevitable when AUV swarm performs collision avoidance, multi-target tracking and other behaviors. If the splitting is uncontrollable, problems such as loss of AUV or large gap of subgroup size after splitting are likely to occur. In order to face the external stimulation can cluster the controlled group, this paper proposes a fission control algorithm combining topological interaction and ICD, The algorithm uses the degree of information coupling as a judgment index to measure the influence of individuals, and according to the characteristics of the AUV underwater communication, perception, introduced the topology interaction mechanism, reduce the cluster group and group the information they need to improve the AUV group and the effect of clustering. Simulation results show the feasibility and effectiveness of the proposed algorithm.
Key words: utonomous underwater vehicle     fission control     topologicalInteraction     (ICD) information coupling degree    
0 引 言

由于海底环境恶劣及水下通信受限,自主水下航行器(AUV)群集的协同控制算法仍是当前AUV的重点研究方向[1]。AUV群集特点是由大量地位相等的小型AUV组成,每个个体能力有限,仅通过邻居之间的局部交互即可完成复杂任务。目前,群集的协同控制分为组群和分群两部分,组群控制要求一定范围内散乱分布的AUV能以局部交互方式自发组成一个群体并进行编队协同运动。分群则是处于组群状态下的AUV群集进行避障或多目标跟踪等任务而自动分裂完成任务的行为。AUV群集可以通过分群避障、分群搜索、分群围捕等方式增强自身的生存能力和作业效率。

目前大多数AUV群集的协同控制研究都是针对组群运动,受组群规则的影响,AUV群集很难在受到外部刺激时自发分群执行任务。对分群控制方面的研究则相对较少。文献[2]借助指派的方式让每个个体跟踪特定目标实现分群,文献[3]根据机器人尺寸的差异实现机器人的分离运动,文献[4]依赖全局通信完成分群行为。刘明雍等[57]基于无中心控制方式,分别提出了基于邻域跟随、信息耦合度、自组织结对的方法完成分群。

之前关于无中心控制方面的研究都是选取固定范围内的邻居进行交互,从而完成自组织分群。但最新的研究[8]显示,在自组织的群集中,拓扑交互方式对群集的自组织有较大影响。本文针对AUV群集在分群时需要大量数据的问题,提出一种融合拓扑交互与信息耦合度的AUV分群算法。该方法以拓扑方式选择邻居进行信息交互,然后利用融合了拓扑交互的信息耦合度函数表征个体间的关系强度,从而使AUV在外部刺激下能够根据信息耦合强度主动进行分群运动。最后仿真验证了分群控制算法的可行性和有效性。

1 数学模型

包含N个地位平等且无明显差异AUV的群集系统,它们运行于二维无障碍平面时, ${\rm{AUV}}_i$ 的位置向量为 $ p_i^t \in {R^2} $ ,速度向量为 $ v_i^t \in {R^2} $ ,则动力学模型可以描述为:

$ \left\{ {\begin{array}{*{20}{l}} {\dot p_i^t = v_i^t} ,\\ {\dot v_i^t = u_i^t,\quad i = 1,2, \cdots ,N} 。\end{array}} \right. $ (1)

式中: $ u_i^t \in {R^2} $ 为模型的输入向量,表示 $t$ 时刻AUV $i$ 的加速度。下面对本文需要用的概念进行说明并根据实际情况做出假设(下文公式中均省略时间 $t$ ):

1)AUV间不能直接进行通信。

2)每个AUV仅能在有限范围内进行感知,感知范围内的所有AUV称为邻居,被 ${\rm{AUV}}_i$ 选中作为信息交互的个体称为拓扑邻居。

在邻居选择时,避碰选取的邻居为距离最近的邻居,拓扑交互时的邻居为一定范围内固定的邻居。有研究[9]指出在三维空间中个体会选择一定距离内的6~7个个体进行拓扑交互,而在二维空间中会选择3~5个个体进行拓扑交互。因此对于本文的二维空间群集系统,将根据情况选取3~5个邻居组成拓扑结构进行交互。

3)综合考虑邻居的位置、速度和数量信息,体现AUV个体与其邻居相互关联的程度,信息耦合度可以设计为:

$ {c_{ij}} = \left( {\frac{{10}}{{{{\left( {1{\text{ + }}d_{ij}^2} \right)}^\alpha }}} + {\mu _{ij}}{{\left( {{v_i} - {v_j}} \right)}^{\rm{T}}}\varGamma \left( {{v_i} - {v_j}} \right)} \right) \times {\eta _{ij}} 。$ (2)

其中: ${d_{ij}} = \left\| {{p_i} - {p_j}} \right\|$ 表示AUV $i$ $j$ 之间的欧式距离; $\alpha $ =0.4, $ {\mu _{ij}} $ =0.05为固定参数; $\varGamma = {\rm{diag}}\left\{ {1,1, \cdots ,1} \right\}$ n维正定对角矩阵。 ${\eta _{ij}}$ 与拓扑邻居数量有关,拓扑邻居数量为0时, ${\eta _{ij}}$ =0,否则 ${\eta _{ij}} = 0.5/{\left| {{N_i}} \right|^2}$ ${N_i}$ ${\rm{AUV}}_i$ 的拓扑邻居数量。

本文的目的是为上述AUV群集设计一种仅基于局部范围内固定数量邻居信息的协同算法。在无中心控制和协商的情况下,该算法不仅可以进行组群运动,还可以在受到多个外部刺激时自动进行分群运动。

2 融合拓扑交互行为的个体运动协同算法 2.1 个体的运动控制率

基于拓扑交互行为的协同控制率可写为:

$ {u_i} = f_i^p + f_i^v + f_i^s + f_i^n 。$ (3)

式中: $f_i^p$ 为位置协同项,采用人工势场实现避碰及AUV间位置协调功能。具体形式为:

$ {f}_{i}^{p}\text={\displaystyle \sum _{j\in {N}_{i}^{t}}A·\left(\frac{1}{{d}_{ij}}-\frac{{d}_{\text{0}}^{\text{2}}}{{d}_{ij}^{3}}\right)·{\widehat{p}}_{ij}},$ (4)

其中: $A$ 为人工势场强度系数; $ {\hat p_{ij}} = ({p_j} - {p_i})/||{p_j} - {p_i}|| $ 表示 $i$ 指向 $j$ 的方向; ${d_0}$ 为个体距离控制系数。

$ f_i^v $ 为速度协同项,采用“min-max”速度协同机制[6]使AUV同时对群集有序运动和刺激信息的异常运动保持敏感。满足群集组群和应激分群的需求。具体形式为:

$ f_i^v = \underbrace {({v_i} - {{\bar v}_{\min }})}_{{V_{\text{1}}}}\underbrace { + \beta ({v_i} - {{\bar v}_{\max }})}_{{V_{\text{2}}}} 。$ (5)

其中: $\, \beta $ >0为异常速度调节常数; ${V_1}$ 对应有序组群运动负反馈调节; ${V_2}$ 对应应激分群运动负反馈调节; $ {\bar v_{\min }} $ 为拓扑交互目标中耦合度最大的AUV对应的速度; $ {\bar v_{\max }} $ 为拓扑交互目标中耦合度最小的AUV对应的速度。更新规则如下:

$ \left\{ {\begin{array}{*{20}{l}} {{{\bar v}_{\min }} = {v_a},\quad a = \arg \mathop {\min }\limits_{j \in {N_i}} {C_j}} ;\\ {{{\bar v}_{\max }} = {v_b},\quad b = \arg \mathop {\max }\limits_{j \in {N_i}} {C_j},\quad {\text{if}}\;\mathop {\min }\limits_{j \in {N_i}} {C_j} = 0} 。\end{array}} \right. $ (6)

其中: ${C_j}$ ${\rm{AUV}}_i$ 的邻居 $j$ 的信息耦合度。因为 $ {\bar v_{\min }} $ 对应的是有序组群运动,所以需要实时更新, $ {\bar v_{\max }} $ 对应的是应激分群运动,只需要在最小的邻居耦合度为0时进行更新,即可保证AUV检测到受刺激个体时,能跟随受刺激个体完成分群运动。

$ f_i^s $ 为分群控制项,通过信息耦合度的强弱差异,使AUV能够在运动行为一致性与群集分裂行为之间进行选择,达成AUV群集受刺激分群的目的。具体形式为:

$ f_i^s = \frac{1}{{|{N_i}|}}\sum\limits_{j \in {N_i}} {{c_{ij}}[({p_i} - {p_j}) + ({v_i} - {v_j})]} 。$ (7)

$ f_i^n $ 为导航项,具体形式为:

$ f_i^n = e - {g_i}k{v}_i^e 。$ (8)

其中: $ {e} $ 为群集的期望速度, ${g_i} \in \{ 0,1\} $ 为外部刺激控制系数,用于对指定个体施加刺激信号。 $k$ 为刺激信号增益系数, $k$ 取足够大( $k{\text{ = 100}}$ )时,AUV可以忽略交互作用力,仅在外部刺激作用下运动。 $ {v}_i^e $ 为外部刺激作用力产生的参考速度。

2.2 拓扑交互目标更新

从文献[9]可知,对于二维空间中的群集系统,个体间进行拓扑交互的数量为3~5个,考虑到多数AUV上安装的声呐传感器采用四面环绕式布局,对于本文的二维平面AUV群集系统,每个AUV选择4个拓扑邻居进行交互,每个拓扑邻居都从对应的声呐传感器感知范围内选出[10]。如图1(a)所示,假设每个传感器的有效感知角度为90°,感知半径为 ${R_{comm}}$ ,则每个AUV周围可平均分为4片区域,每片区域对应一个传感器的感知范围,若感知范围内AUV数量为0,则此传感器不会产生拓扑邻居,若AUV数量大于0,则此传感器产生的拓扑邻居数量为1。

图 1 拓扑交互目标选择示意图 Fig. 1 Schematic diagram of selecting topological interaction target

若每个传感器感知范围内有多个AUV,拓扑邻居的选择方式如图1(b)所示。初始时传感器产生的拓扑邻居数量为0,此时会将检测到的最近AUV产生为拓扑邻居,后续的计算中,拓扑邻居会一直锁定此AUV,直至发生遮挡现象或超出感知区域。超出感知区域时,拓扑邻居数量归零,重新选择最近的AUV作为拓扑邻居,发生遮挡现象时,由遮挡者取代被遮挡者作为拓扑邻居。遮挡现象可定义为邻居 $j$ 的外包络线上一点与 $ {\rm{AUV}}_i$ 之间的连线相交于拓扑邻居的外包络线,外包络线与邻居 $j$ 之间的距离为 ${d_0}$

3 仿真验证 3.1 实验设置

采用Matlab对算法进行仿真验证。仿真中,30台AUV初始位置随机分布在一个可以确保初始连通的圆形区域内。初始速度为0,仿真步长为0.01 s,感知半径 ${R_{comm}}$ =4 m,其他参数分别为: $A$ =10, ${d_0}$ =1.5。

实验开始时,AUV群集开始以 $e$ =[2 0]Tm/s的速度进行组群运动,在组群运动完成后,在群体的两侧边缘选择2个AUV施加外部刺激信号(即 $ {g_i} $ =1),令这2个AUV的参考速度 $ {v}_i^e $ 分别为[1 1]T m/s和[1 -1]T m/s。由于刺激信号增益系数 $k$ 足够大,可以保证受到外部刺激信号的AUV能忽略组群内部的交互作用,仅在刺激信号作用下运动。为了保证仿真的合理性,限定AUV的最大速度为5 m/s,限定AUV的最大角速度为0.5 rad/s。

3.2 实验结果与分析

30台AUV进行分群的仿真结果如图2所示。其中*和 $ \circ $ 分别代表AUV的初始位置和结束位置,细线代表AUV的运动轨迹,粗线代表受到外部刺激作用的2个AUV运动轨迹。仿真持续15 s,在0~5 s为组群运动,第5 s时开始受外部刺激作用进行群集分裂,每个子群包含15个AUV,5~15 s进行分群运动,2个子群无相互作用力,独立进行运动。

图 2 AUV群集分群运动轨迹 Fig. 2 Spliting motion trajectories of swarm of AUVs

由于本文的融合拓扑交互与信息耦合度的群集控制算法(SAC-TICD)是在信息耦合度群集控制算法(SAC-ICD)基础上进行优化的,所以在组群和分群效率对比方面使用了与SAC-ICD群集相同的评价指标。组群效率使用组群耗时进行评价,即群集从初始的散乱状态到群集稳定编队过程耗费的时间,并对100次仿真结果的均值和标准差进行比较。

不同组群规模下SAC-TICD群集和SAC-ICD群集的组群耗时结果如表1所示。可以看出,优化后的SAC-TICD群集组群效率比SAC-TICD群集提升了约8%。SAC-TICD群集组群效率的提升主要是由于拓扑交互的影响,在SAC-ICD群集中的邻居是选取一定范围内所有AUV作为交互目标,每个AUV耦合目标越多,AUV间耦合作用力稳定需要的时间就越多,所以SAC-TICD群集选择固定数量邻居组成拓扑结构进行交互的方式能够减小耦合数量,缩短状态稳定所需要的时间。

表 1 SAC-ICD群集和SAC-TICD群集的组群耗时对比 Tab.1 Comparison of group time between SAC-ICD and SAC-TICD clusters

分群评价指标使用了子群规模分布指标 ${P_{{\text{fiss}}}}$ ${P_{{\text{fiss}}}}$ 可以用分群后规模最小的子群AUV数量除以规模最大的子群中AUV数量进行计算,可知 $ {P}_{\text{fiss}}\in \left[\text{1/}(N-1),\text{1}\right] $ ${P_{{\text{fiss}}}}$ 越大则分群效果越好。

图3为100个AUV分别使用SAC-TICD和SAC-ICD分群算法各执行100次的子群规模分布对比图。可以看出,SAC-TICD 分群算法比SAC-ICD算法分群准确度提高了约4%,即SAC-TICD算法将4% 的“非对称”分群( ${P_{{\text{fiss}}}}$ ≤0.1)调整为“等规模”分群( ${P_{{\text{fiss}}}}$ ≥0.8)。这是由于每个AUV都与关键邻居组成拓扑连接,这种情况下即便受刺激个体距离较远,拓扑连接也能保证AUV实时监控到受刺激个体的变化,不会被更近距离的未受刺激个体影响到分群结果。

图 3 子群规模分布对比图 Fig. 3 Comparison diagram of subgroup size distribution

由此可见,本文基于拓扑交互的SAC-TICD分群算法比基于普通信息耦合度的SAC-ICD分群算法分群准确度更高,组群速度也更快。整体效率优势显著。

4 结 语

在水下环境中,AUV通信受到限制,感知方法较少,所以群算法中需要获取的数据越少,实际应用的难度就越小。本文在使用信息耦合度综合评价个体特征的基础上,提出拓扑交互的信息交互方式,减少AUV需要感知的邻居信息。仿真结果表明,使用拓扑交互的群集系统能够完成组群分群等群集运动,同时加强了个体间的联系和信息获取速度,相对于普通交互模式,本文提出的算法具有更加优良的组群和分群性能,更能适应水下环境。针对水下感知准确率低的特性优化算法并应用到实际水下环境将是后续研究的重点。

参考文献
[1]
黄琰, 李岩, 俞建成, 等. AUV智能化现状与发展趋势[J]. 机器人, 2020, 42(2): 215−231.
[2]
刘宗春, 田彦涛, 李成凤. 动态阻尼环境下多领导者群体机器人系统协同跟踪控制[J]. 机器人, 2011(4): 3-11.
[3]
CHEN J, GAUCI M, PRICE M J, et al. Segregation in swarms of e-puck robots based on the brazil nut effect[C]//Proceedings of the 11th International Conference on Autonomous Agents and Multiagent Systems-Volume 1. 2012: 163−170.
[4]
MORGAN D S, SCHWARTZ I B. Dynamic coordinated control laws in multiple agent models[J]. Physics Letters A, 2005, 340(1-4): 121-131. DOI:10.1016/j.physleta.2005.03.074
[5]
刘明雍, 雷小康, 彭星光. 融合邻域自适应跟随的群集系统分群控制方法研究[J]. 西北工业大学学报, 2013, 31(2): 250-254. DOI:10.3969/j.issn.1000-2758.2013.02.017
[6]
刘明雍, 雷小康, 杨盼盼, 等. 基于信息耦合度的群集系统自组织分群方法[J]. 控制与决策, 2015, 30(2): 271-276.
[7]
杨盼盼, 刘明雍, 雷小康, 等. 基于自组织结对行为的群集机器人分群控制方法[J]. 西北工业大学学报, 2015, 33(1): 147-152. DOI:10.3969/j.issn.1000-2758.2015.01.031
[8]
TURGUT A E, BOZ İ C, OKAY İ E, et al. Interaction network effects on position-and velocity-based models of collective motion[J]. Journal of the Royal Society Interface, 2020, 17(169): 20200165. DOI:10.1098/rsif.2020.0165
[9]
BALLERINI M, CABIBBO N, CANDELIER R, et al. Interaction ruling animal collective behavior depends on topological rather than metric distance: Evidence from a field study[J]. Proceedings of the National Academy of Sciences, 2008, 105(4): 1232-1237. DOI:10.1073/pnas.0711437105
[10]
于月平, 段海滨, 范彦铭, 等. 仿欧椋鸟大规模超机动行为的无人机集群转弯控制[J]. 机器人, 2020, 42(4): 385−393.