随着集群式AUV在海洋环境监测、资源勘探、搜索救援、侦察监视等民用和军用领域得到了日益广泛的应用,作为AUV集群关键技术之一的协同控制已成为研究热点[1-3]。通常,AUV集群的协同行为分为:1)组群,随机分布于一定范围内的AUV能无碰聚集并以编队形式执行任务;2)分群,AUV集群在各类分群诱因下分裂为若干个子群的行为[4]。在AUV集群实际分群应用中,只有可控的分群行为才能满足多目标跟踪、自动避险/避障等分群任务要求,否则集群易陷入无序分裂或无法分裂等非期望不可控状态,因此,分群可控性是分群控制研究中最值得深入研究的问题之一[5]。分群可控性是指集群能在分群控制算法作用下分裂成多个子群,且各子群中所有个体行为均可达到期望状态(如期望速度、位置以及子群数量和规模等)[6]。
文献[7-9]研究了基于C-S模型的分群控制方法,但所实现的分群是速度方向相反、大小相同的二分群集。文献[4,10-11]提出了基于信息耦合度的自组织分群控制方法,但该类方法要求个体具有一定记忆能力,实现了对称外界刺激下的等规模分群行为,子群数量、规模和速度不可控。文献[12]设计了基于个体异构特性和多个虚拟领导者的分群控制算法,但子群规模的可控是事先按异构特性通过集中分配实现的。文献[13]通过对两类异构智能体分别设计控制律实现分群,但需事先为I型个体分配所跟踪的II型个体,即子群需事先集中分配。文献[14]提出融合注意力机制和改进拟态物理法的分群控制律,实现多目标环境下分群行为。但注意力机制的引入要求个体具备识别能力,而且子群的规模和速度均不可控。文献[15-16]基于多个虚拟领导者实现了子群数量、规模、速度可控的多分群,但仅限于期望速度恒定的情况。此外,文献[15]中的分群策略不仅需要智能体与领导者的距离、领导者对应的子群规模,还需获得全局个体的子群选择信息,即个体与虚拟领导者之间需要具备双向通信能力。文献[16]则是需要虚拟领导者到智能体的单向通信和邻居智能体之间的双向通信进行分群,且由于分群决策时未考虑个体所在位置,导致过多打乱了已稳定的集群结构,进而使得集群结构调整和速度振荡较大,各个子群形成稳定群集所需时间较长。
本文针对无集中分配且仅有单向通信的AUV集群协同分群可控性问题,提出一种基于蚁群算法的分群控制算法。利用群目标到AUV单向通信的期望子群规模和AUV与群目标的相对距离信息,设计基于蚁群算法的分群策略;基于该策略设计了一种分布式协同分群控制算法,在多个速度时变的群目标导航作用下使AUV运动行为产生分化,从而使AUV集群产生结构调整和速度振荡较小且可控的分群行为。最后,利用仿真实验验证了所提算法的分群可控性。
1 问题描述 1.1 图论基础若将AUV看成顶点,则集群中个体间相互作用可用无向拓扑图
考虑
$ \left\{ \begin{gathered} {{{\boldsymbol{\dot p}}}_i}{\kern 1pt} ={\kern 1pt} {\kern 1pt} {{\boldsymbol{v}}_i} \\ {{{\boldsymbol{\dot v}}}_i}{\kern 1pt} ={\kern 1pt} {{\boldsymbol{u}}_{\boldsymbol{i}}} \\ \end{gathered} \right.,{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} i = 1,2,\cdots,N。$ | (1) |
假设所有AUV通过自身配备的相同传感器获得周围邻居的速度和位置信息,故AUV
$ {N_i} = \left\{ {j:\left\| {{{\boldsymbol{p}}_j} - {{\boldsymbol{p}}_i}} \right\| < R,j \ne i,j = 1,2,\cdots,N} \right\} 。$ | (2) |
其中,
假设AUV集群中有
$ \left\{ \begin{gathered} {{{\boldsymbol{\dot p}}}_{{{t}}k}}{\kern 1pt} {\text{ = }}{\kern 1pt} {\kern 1pt} {{\boldsymbol{v}}_{{{t}}k}} \\ {{{\boldsymbol{\dot v}}}_{{{t}}k}}{\kern 1pt} {\text{ = }}{\kern 1pt} {{\boldsymbol{f}}_{{{t}}k}} \\ \end{gathered} \right.,{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} k = 1,2,\cdots,K\left( t \right) 。$ | (3) |
分群时有多个群目标要跟踪,按AUV选择的群目标是否相同,邻居集可写为:
$ {N}_{i}=\Bigg\{\begin{array}{l}{N}_{i}^{\text{s}}=\left\{j|j\in {N}_{i}且与i群目标相同\right\},\\ {N}_{i}^{\text{d}}=\left\{j|j\in {N}_{i}且与i群目标不同\right\}。\end{array} $ | (4) |
在无集中分配且不额外增加个体通信能力情况下,通过建立基于蚁群算法的分群策略实现自主就近分群决策,以在满足目标任务需求前提下减少集群结构调整和速度振荡,并设计具有多个速度时变群目标的分群控制算法,实现AUV集群的可控分群运动。
2 基于蚁群算法的协同分群控制算法 2.1 基于经典蚁群算法的就近分群策略蚂蚁m在节点
$ {P}_{ij}^{m}=\left\{\begin{array}{ll}\frac{{\left({\tau }_{ij}\left(t\right)\right)}^{\alpha }{\left({\eta }_{ij}\left(t\right)\right)}^{\beta }}{{\displaystyle {\sum }_{s\in {J}_{m}\left(i\right)}{\left({\tau }_{is}\left(t\right)\right)}^{\alpha }{\left({\eta }_{is}\left(t\right)\right)}^{\beta }}},&j\in {J}_{m}\left(i\right),\\ 0\text{,} &j\notin {J}_{m}\left(i\right)。\end{array}\right. $ | (5) |
其中:ηij(t)=1/dij表示蚂蚁从节点i转移j的期望程度,dij为两节点距离;
$ {P_{i,k}} = \frac{{{{\left( {{\tau _k}} \right)}^\alpha }{{\left( {{\eta _{i,k}}} \right)}^\beta }}}{{\displaystyle\sum\nolimits_{k = 1}^{K\left( t \right)} {{{\left( {{\tau _k}} \right)}^\alpha }{{\left( {{\eta _{i,k}}} \right)}^\beta }} }} 。$ | (6) |
其中:τk为群目标k对应的期望子群规模,该项保证分裂的子群规模满足任务需求;ηi,k=1/di,k,di,k为个体i与群目标k的距离,此项保证在基本满足子群规模需求条件下尽量实现按与群目标的距离进行就近分群;α和β与式(5)中相应参数含义相同。AUV i按式(6)计算选择概率并用轮盘赌选择法来确定跟踪的群目标,分群决策流程为①
基于蚁群算法协同分群策略设计分群控制器:
$ {{\boldsymbol{u}}_i} = {\boldsymbol{u}}_i^{{p}} + {\boldsymbol{u}}_i^{{v}} + {\boldsymbol{u}}_i^{{t}}。$ | (7) |
式中:
$ {f}_{ji}=\left\{ \begin{array}{l}{f}_{{r}}\left(\Vert {p}_{ji}\Vert \right),j\in {N}_{i}^{\text{s}}且\Vert {p}_{ji}\Vert < {d}_{{e}},\\ 0,j\in {N}_{i}^{{s}}且\Vert {p}_{ji}\Vert ={d}_{{e}},\\ {f}_{{a}}\left(\Vert {p}_{ji}\Vert \right),j\in {N}_{i}^{{s}}且{d}_{{e}} < \Vert {p}_{ji}\Vert \leqslant R,\\ {f}_{{r}}{}^{\prime }\left(\Vert {p}_{ji}\Vert \right),j\in {N}_{i}^{{d}}。\end{array} \right.$ | (8) |
其中:
对于子群k,选择能量函数为:
$ {Q_k} = \frac{1}{2}\sum\limits_{i = 1}^{{\tau _k}} {{F_i}} + \frac{1}{2}\sum\limits_{i = 1}^{{\tau _k}} {{c_1}{{{\boldsymbol{\tilde p}}}_{ki}}^{\text{T}}{{{\boldsymbol{\tilde p}}}_{ki}}} + \frac{1}{2}\sum\limits_{i = 1}^{{\tau _k}} {{{{\boldsymbol{\tilde v}}}_{ki}}^{\text{T}}{{{\boldsymbol{\tilde v}}}_{ki}}}。$ | (9) |
对式(9)求时间的导数得
$ {\dot Q_k}{\boldsymbol{ = }}\frac{{\text{1}}}{{\text{2}}}\sum\limits_{i = 1}^{{\tau _k}} {{{\dot F}_{\boldsymbol{i}}}} {\boldsymbol{ + }}\sum\limits_{i = 1}^{{\tau _k}} {{c_1}{{{\boldsymbol{\tilde p}}}_{k{\boldsymbol{i}}}}^{\text{T}}{{{\boldsymbol{\tilde v}}}_{k{\boldsymbol{i}}}}} {\boldsymbol{ + }}\sum\limits_{i = 1}^{{\tau _k}} {{{{\boldsymbol{\tilde v}}}_{k{\boldsymbol{i}}}}^{\text{T}}{{{\boldsymbol{\dot {\tilde v}}}}_{k{\boldsymbol{i}}}}}。$ | (10) |
因
$ \frac{1}{2}\sum\limits_{i = 1}^{{\tau _k}} {{{\dot F}_i}} = \sum\limits_{i = 1}^{{\tau _k}} {{{{\boldsymbol{\tilde v}}}_{ki}}^{\text{T}}{\nabla _{{{{\boldsymbol{\tilde p}}}_{ki}}}}{F_i}} 。$ | (11) |
又
$\begin{aligned}[b] {{\dot Q}_k} =& \sum\limits_{i = 1}^{{\tau _k}} {{{{\boldsymbol{\tilde v}}}_{ki}}^{\text{T}}{\nabla _{{{{\boldsymbol{\tilde p}}}_{ki}}}}{F_i}} + \sum\limits_{i = 1}^{{\tau _k}} {{c_1}{{{\boldsymbol{\tilde p}}}_{ki}}^{\text{T}}{{{\boldsymbol{\tilde v}}}_{ki}}}+ \sum\limits_{i = 1}^{{\tau _k}} {{{{\boldsymbol{\tilde v}}}_{ki}}^{\text{T}}\left( {{{\boldsymbol{u}}_i} - {{\boldsymbol{f}}_{{\text{t}}k}}} \right)} = \\ & -{{{\boldsymbol{\tilde v}}}^{\text{T}}}\left[ {\left( {{\boldsymbol{L}} + {c_2}{{\boldsymbol{I}}_{{\tau _k}}}} \right) \otimes {{\boldsymbol{I}}_2}} \right]{\boldsymbol{\tilde v}} 。\end{aligned} $ | (12) |
其中:
因此,集合
$ \varOmega = \left\{ {\left( {{{{\boldsymbol{\tilde p}}}^{\text{T}}},{{{\boldsymbol{\tilde v}}}^{\text{T}}}} \right)\left| {{Q_k}\left( t \right) \leqslant {Q_k}\left( 0 \right)} \right.} \right\} 。$ | (13) |
是紧集。根据LaSalle不变性原理可确定子群中所有AUV起始于
$ {\boldsymbol{S}} = \left\{ {\left( {{{{\boldsymbol{\tilde p}}}^{\text{T}}},{{{\boldsymbol{\tilde v}}}^{\text{T}}}} \right)\left| {{{\dot Q}_k}\left( t \right) = 0} \right.} \right\}。$ | (14) |
由公式(12)可得
$ {\dot Q_k} = - {{\boldsymbol{\tilde v}}^{\text{T}}}\left[ {{\boldsymbol{L}} \otimes {{\boldsymbol{I}}_2}} \right]{\boldsymbol{\tilde v}} - {c_2}{{\boldsymbol{\tilde v}}^{\text{T}}}{\boldsymbol{\tilde v}} 。$ | (15) |
其中
为验证所设计的可控分群控制方法有效性,设计50个AUV组成的集群在Matlab下的仿真实验。参考文献[16]设定个体i和j之间相互作用力函数为:
$ {f}_{ji}=\left\{\begin{array}{l}\dfrac{5{k}_{1}{d}_{ji}}{\sqrt{1+{d}_{ji}{}^{2}}}{\rho }_{h}\left(\frac{{\Vert {p}_{ji}\Vert }_{\sigma }}{R}\right)\text{,}j\in {N}_{i}^{{s}},\\ \dfrac{5{k}_{2}{R}_{ji}}{\sqrt{1+{d}_{ji}{}^{2}}}{\rho }_{h}\left(\frac{{\Vert {p}_{ji}\Vert }_{\sigma }}{R}\right)\text{,}j\in {N}_{i}^{{d}}。\end{array}\right. $ | (16) |
其中:
$ {\rho _h}(z) = \left\{ {\begin{array}{*{20}{c}} {1,\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{\rm{if}}\;z \in [0,h)},\\ {0.5\left[ {1 + \cos \left( {\text{π} \dfrac{{z - h}}{{1 - h}}} \right)} \right],\;{\rm{if}}\;z \in [h,1]},\\ {0,\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{\rm{otherwise}}}。\end{array}} \right. $ |
每个AUV的初始位置在40×40 m2范围内随机给定,初始速度在0~1 m/s内随机给定。组群时,集群中只有1个群目标1,其初始位置在40×40 m2内随机给定,分群时,原群目标消失,出现3个新的群目标。在保证速度方向发生不交叉和位置不重合的前提下,3个群目标的初始位置在距离原群目标当前位置40 m内随机给定,
AUV集群和群目标的运行轨迹和速度曲线分别如图1和图2所示。图1中,“*”、“○”、“◇”和“☆”分别为AUV集群和3个群目标的终点,可见,集群在最初一个群目标导航作用下完成了组群,并在出现3个群目标后完成了协同分群。由图2可知,无论组群还是分群运动,各子群速度均与对应的群目标速度趋于一致,且分群时集群速度振荡较小。
子群规模变化如图3所示。可见,3个子群分别有12,23,15个个体,与相对应的期望子群规模12,22,16基本吻合。
图4为分群过程中AUV集群结构变化。图4中小“○”为AUV位置,大“○”、“◇”和“☆”分别为群目标位置。可见,14 s时AUV集群已处于一个群目标作用下的稳定结构,并出现3个群目标;14.8 s时有部分个体分离,15.6 s时大部分个体完成了分离,16.4 s时分化成3个子群。可见,在所设计的分群控制算法作用下,AUV集群实现了按AUV与群目标距离的就近分群,且未打乱已稳定的邻居结构。
为进一步判断AUV集群是否形成稳定结构及分群过程中的结构调整大小,构造结构势能函数:
$ E = \frac{1}{N}\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^{j \in {N_i}} {{{\left( {\left\| {{{\boldsymbol{p}}_j}_i} \right\| - {d_{\text{e}}}} \right)}^2}} }。$ | (17) |
可知,当个体间距达到期望距离时,此结构势能E最小。
AUV集群结构势能曲线如图5所示。可见,在分群过程中结构能量并没有出现大幅度增加现象,结构能量趋于稳定状态,这进一步表明所设计的就近分群策略可避免分群过程中过大的结构调整,使各个子群形成期望的稳定结构。
针对AUV集群在协同分群过程中出现的子群数量、规模、速度不可控问题,提出一种基于蚁群算法的可控分群控制算法。在无集中分配且仅具备单向通信能力的条件下,利用期望子群规模和AUV与群目标的相对距离,设计基于蚁群算法的分群策略,并在此基础上设计一种分布式协同分群控制算法,在多个速度时变的群目标导航作用下使AUV集群产生结构调整和速度振荡较小的可控分群行为。最后,利用理论分析和仿真实验验证了所提算法的有效性。未来将进一步探索适用于存在阻尼、障碍物等复杂环境下的分群控制算法。
[1] |
张伟, 王乃新, 魏世琳, 等. 水下无人潜航器集群发展现状及关键技术综述[J]. 哈尔滨工程大学学报, 2019, 41(2): 289-297. |
[2] |
曹少华, 张春晓, 王广洲, 等. 智能水下机器人的发展现状及在军事上的应用[J]. 船舶工程, 2019, 41(2): 79-84+89. |
[3] |
HADI B, KHOSRAVI A, SARHADI P. A Review of the path planning and formation control for multiple autonomous underwater vehicles[J/OL]. Journal of Intelligent & Robotic Systems, 2021, 1–67[2021-03-18].https://doi.org/10.1007/s10846-021-01330-4.
|
[4] |
刘明雍, 杨盼盼, 雷小康, 等. 基于信息耦合度的群集式AUV分群控制算法[J]. 西北工业大学学报, 2014, 32(4): 581-585. DOI:10.3969/j.issn.1000-2758.2014.04.022 |
[5] |
杨盼盼, 刘明雍, 雷小康, 等. 群集系统分群行为建模与控制研究进展[J]. 控制与决策, 2016, 31(2): 193-206. |
[6] |
LIU Y, SLOTINE J, BARABA´si A. Controllability of complex networks[J]. Nature, 2011, 473(7346): 167-173. DOI:10.1038/nature10011 |
[7] |
FAN M C, ZHANG H T, WANG M. Bipartite flocking for multi-agent systems[J]. Communications in Nonlinear Science & Numerical Simulation, 2014, 19(9): 3313-3322. |
[8] |
XIAO Q, LIU H, WANG X, et al. A note on the fixed-time bipartite flocking for nonlinear multi-agent systems[J]. Applied Mathematics Letters, 2020, 99: 105973. DOI:10.1016/j.aml.2019.07.004 |
[9] |
YU J J, YU S H. An improved fixed-time bipartite flocking protocol for nonlinear multi-agent systems[J]. International Journal of Control, 2020(1): 1-6. |
[10] |
杨盼盼, 张瑾琪, 刘家毓. 水声通信时延下集群式AUV分群控制算法[J]. 兵器装备工程学报, 2018, 39(12): 113-117. DOI:10.11809/bqzbgcxb2018.12.023 |
[11] |
YANG P P, LIU M Y, et al. A novel control algorithm for the self-organized fission behavior of flocking system with time delay[J]. International Journal of Control, Automation and Systems, 2016, 14(4): 986-997. DOI:10.1007/s12555-014-0518-1 |
[12] |
WEI H, CHEN X B. Flocking for multiple subgroups of multi-agents with different social distancing[J]. IEEE Access, 2020, 8: 164705-164716. DOI:10.1109/ACCESS.2020.3022395 |
[13] |
王帅磊, 张金春, 曹彪, 等. 双类型多智能体蜂拥控制目标跟踪算法[J]. 控制工程, 2019, 26(5): 935-940. |
[14] |
高振龙, 丁勇, 何金. 注意力跟随机制与IAP法相结合的多智能体运动控制[J]. 电光与控制, 2020, 27(3): 58-64. DOI:10.3969/j.issn.1671-637X.2020.03.011 |
[15] |
LUO X Y, LI S B, GUAN X P. Flocking algorithm with multi-target tracking for multi-agent systems[J]. Pattern Recognition Letters, 2010, 31(9): 800-805. DOI:10.1016/j.patrec.2010.01.014 |
[16] |
刘宗春, 田彦涛, 李成凤. 动态阻尼环境下多领导者群体机器人系统协同跟踪控制[J]. 机器人, 2011, 33(4): 385-393. |