2. 北京理工大学 信息与电子学院,北京 100081;
3. 中国人民解放军 92578部队,北京 100071
2. School of Information and Electronics, Beijing Institute of Technology, Beijing 100081, China;
3. No.92578 Unit of PLA, Beijing 100071, China
近年来随着科学技术的飞速发展和对海洋认识的不断深化,水下空间已成为国际竞争的新焦点[1 − 3]。未来海洋竞争将是系统与系统、体系与体系之间的对抗,逐步向信息化、网络化、智能化、自主化方向发展[4 − 5]。水下无人航行器(UUV)作为一种海上力量倍增器,在水下侦察、水下通信和反潜、反水雷作战、信息作战等领域的应用得到空前发展[6],成为了海洋探索与水下作业的重要工具[7 − 11]。通过构建多UUV编队集群,实施编队协同任务,并借助于水下网络共享信息,可克服单UUV探测、捕获目标能力有限、完成任务效能不高的弱点。
当前的大多数UUV集群搜索方法实在全局环境或局部环境已知的情况下进行的,但当UUV集群在陌生海域执行搜索任务时,由于水下环境造成的探通能力下降致使对目标信息的获取十分困难,UUV自身之间的通信因为水下环境导致信息传输不准确有延时,且UUV能力相较于目标存在较大的差距,这些方法的搜索效率就会降低,同时缺乏动态应变能力,Yang等[12 − 13]提出一种在水下环境已知条件下的寻找最优路径的UUV路径规划方法,但这种方法只是找到满足低能耗的局部搜索最优路径;为提高全局搜索的效率与最优的全局搜索航迹,Cai等[14 − 15]提出基于路径规划与目标搜索的PSO算法,Yang等[16]将机器人系统的协作规则应用到势场函数中,并作为PSO的适应度函数应用于机器人协作搜索,Dadgar等[17 − 18]提出一种基于PSO的分布式算法,在全局机制下达到整体最优的目的。但面对未知环境这些方法效率偏低,集群的灵活性大打折扣,面对突发状况无法及时应对。
本文基于弱联通条件,考虑UUV集群的动态目标搜索方法,基于累积概率最优规划UUV集群的搜索路径,通过对目标初始位置进行概率分布估计,建立初始概率地图,选取路线使目标出现累积概率最大化,并基于后验信息对目标分布进行更新,最后通过仿真确定方法的有效性。本文就UUV集群在不同信息条件下,进行了不同的目标初始概率分布估计,在此基础上根据搜索路线的概率最优为UUV集群中每个个体分配做为高效的搜索路线,具体流程图如图1所示。
![]() |
图 1 UUV集群搜索流程图 Fig. 1 UUV cluster search flowchart |
由于考虑到UUV搜索目标的初始位置未知,为了引导UUV集群以最优的轨迹快速搜索到目标,首先需要建立搜索目标初始状态的概率分布模型,包括对目标的位置、航速与航向的初始概率分布估计。根据有无先验搜索信息,可以将目标初始位置概率分布估计分为无先验信息下的位置概率估计和有先验信息下的位置概率估计2种模式。
1.1 无先验信息目标初始位置概率分布估计在无先验信息的情况下,UUV集群无法获得关于目标的任何信息。在此情况下,目标出现在搜索区域的任何位置的概率都相同,因此目标的初始位置概率服从二维均匀分布。定义目标初始可能出现的区域为
P(1,i)=fi(x,y)={1ab,(x,y)∈D,0,其他。 | (1) |
式中:
在UUV集群已知目标初始位置的先验信息条件下,由于探测误差和通信时延等干扰影响,UUV集群获取的目标初始位置也具有不确定性。根据中心极限定理,假设目标初始位置服从二维正态分布
f(x,y)=12πσ20exp{−12[(x−x0)2+(y−y0)2σ20]}。 | (2) |
将直角坐标换为极坐标,目标初始位置概率分布函数表示为:
φ(x,y)=f(rcosθ,rsinθ)|∂(x,y)∂(r,θ)|=12πσ20exp(−12((rcosθ−x0)2+(rsinθ−y0)2σ20))。 | (3) |
为方便后续计算,设目标初始位置为(0,0),
P(1,i)=φi(r,θ)=f(rcosθ,rsinθ)|∂(x,y)∂(r,θ)|=12πσ20exp(−r22σ20)。 | (4) |
{φR(r)=∫2π0φ(r,θ)dθ=rσ20exp(−r22σ20),φθ(r)=∫+∞0φ(r,θ)dθ=12π。 | (5) |
根据式(6)与式(7)可得
在确立目标初始位置后,由于在我方UUV集群进行搜索任务的时间间隔期间,目标UUV同样在进行移动,因此需要在已知目标航向航速的情况下,对目标的初始位置概率分布进行修正:
假设目标初始位置散布服从
P(1,i)=φ(r,θ)=φr(r)φθ(θ)={r−ltσ20exp(−(r−lt)22σ20)⋅1√2πσθexp(−θ22σ2θ),r⩾lt,0,r⩽lt。 | (6) |
按照有无目标先验信息对目标航速航向进行概率分布估计。
无信息条件下,目标航向在
在已知目标移速
{P_{{\mathrm{course}}}}(c) = \left\{ {\begin{array}{*{20}{c}} {\dfrac{{2 \times (c - {a_1})}}{{({a_2} - {a_1}) \times ({C_1} - {a_1})}}},& {{a_1} \leqslant c \leqslant {C_1}},\\ {\dfrac{{2 \times ({a_2} - c)}}{{({a_2} - {a_1}) \times ({a_2} - {C_1})}}},& {{C_1} \leqslant c \leqslant {a_2}} 。\end{array}} \right. | (7) |
{P_{{\mathrm{speed}}}}(v) = \left\{ {\begin{aligned} &{\dfrac{{2 \times v}}{{{V_{\max }} \times {V_1}}}},{0 \leqslant v \leqslant {V_1}} ,\\ &{\dfrac{{2 \times ({V_{\max }} - v)}}{{{V_{\max }} \times ({V_{\max }} - {V_1})}}},{{V_1} < v < {V_{\max }}} 。\end{aligned}} \right. | (8) |
对搜索区域进行网格划分,根据UUV探测能力分配搜索任务,设UUV集群节点数量为
{s_i} = S{C_i}/\sum\nolimits_{i = 1}^n {{C_i}}。 | (9) |
式中:
UUV集群中每个UUV的路径规划独立运行,根据UUV任务区域每个栅格的目标探测概率,以及UUV搜索速度,在搜索时间间隔
{L_{\max }} = \max (\sum\nolimits_{i = 1}^n {{k_i} \times {p_i}} ) , | (10) |
\sum\nolimits_{i = 1}^n {{p_i} \leqslant 1} , | (11) |
n = \left[\left(\dfrac{{\displaystyle\sum\nolimits_{i = 1}^n {{v_i}} }}{n} \times t\right)/l\right] , | (12) |
{k_i} = f(d) = \left\{ {\begin{aligned} &{\dfrac{{{d_i}}}{l}},{\dfrac{d_i}{l} < 1},\\ &1,{\dfrac{{{d_i}}}{l} \geqslant 1} 。\end{aligned}} \right. | (13) |
式中:
{d_i} = \left\{ {\begin{aligned} &{{w_1} \times {v_i} + {b_1}},{v \in [0,{s_1}]},\\ &{{w_2} \times {v_i} + {b_2}},{v \in [{s_1},0.8 \times {v_{\max }}]} 。\end{aligned}} \right. | (14) |
式中:
式(14)反映了UUV探测半径与速度的线性关系,
在UUV集群执行完一个任务时间间隔
若任务时间间隔内UUV未在栅格内发现目标,则下一任务时间间隔内该栅格目标出现的概率应当下降,因此在单个时间间隔任务结束后,需要对任务区域目标探测概率进行修正。
已知
第
P(j,i) = {K_i} \times {P_{{\mathrm{before}}}}(j,i)。 | (15) |
式中:
设任务海域共有
P(j,i) = {K_i} \times {P_{{\mathrm{before}}}}(j,i) + \frac{{\sum\nolimits_{k \in D} {(1 - {K_k}) \times {P_{{\mathrm{before}}}}(j,k)} }}{{n - m}} 。 | (16) |
式中:
UUV集群在进行航路重规划及概率修正时,仅考虑上一时段的目标状态,符合马尔科夫运动的特性,因此基于马尔科夫进行下一时间间隔目标位置的概率分布估计。
在无目标先验信息的情况下,每隔一个时间间隔可得到一次搜索结果,因此每次目标位置分布更新可根据目标修正的位置分布与航速航向分布进行计算。
在有目标先验信息的情况下,目标在
{t_{j + 1}}(m,n) = {P_{{\mathrm{speed}}}}({v_0}) \times {P_{{\mathrm{course}}}}({c_0})。 | (17) |
式中:
目标在栅格
{P_{{\mathrm{out}}}}(j,m) = \sum\nolimits_{n = 1}^{N \times M} {P(j,m) \times {t_{j + 1}}(m,n)}。 | (18) |
目标到达
{P_{in}}(j,m) = \sum\nolimits_{n = 1}^{N \times M} {P(j,m) \times {t_{j + 1}}(m,n)}。 | (19) |
目标在
P(j + 1,m) = {P_{in}}(j,m) + P(j,m) - {P_{{\mathrm{out}}}}(j,m)。 | (20) |
设
P(j + 1,i) = {f_{j \to j + 1}} \times P(j,i) 。 | (21) |
由此完成对目标的位置概率分布更新,从而修改我方UUV集群的搜索路径,重复以上方法直到搜索任务结束。
4 实验仿真按照有先验信息及无先验信息2种情况进行仿真分析,验证本文提出方法的有效性和可行性。设定任务区域为13 n mile×25 n mile,作业UUV集群节点数量为6艘,目标UUV数量为1艘,概率更新时间间隔为10 min,沿纵轴正方向运动0°,沿横轴正方向运动90°,仿真实验总时长为60 min,以作业UUV追逐到目标UUV或者仿真时长等于仿真实验总时长判定仿真实验结束。
4.1 无目标先验信息当目标UUV的信息未知时,目标UUV在栅格上的出现概率服从均匀分布,航向范围为
假设目标UUV初始运动方向为135°,当目标UUV探测到作业UUV时,按照目标UUV与距离最近的作业UUV连线的反方向逃逸,当作业UUV探测到目标UUV时,以
单次实验后,作业UUV集群各任务阶段的航速与航向如表1所示,仿真结果如图2所示。
![]() |
表 1 UUV集群航向航速表 Tab.1 UUV cluster heading and speedometer |
图中,以红色代表作业UUV集群,蓝色代表目标UUV,右下角为作业UUV移动方向栅格进行标注,如图2所示。由于目标UUV探测距离远大于作业UUV集群,且作业UUV不具备速度优势,所以作业UUV集群极难搜索到目标,但依旧阻挡了目标UUV的行动,使目标UUV后退逃逸,其中5号作业UUV能够大致围绕目标UUV进行移动,对其位置进行较为精准的预测。
![]() |
图 2 无先验信息搜索仿真图 Fig. 2 Search simulation diagram without prior information |
目标UUV初始位置与航向已知,航向225°,预估会在225°左右45°浮动,当前航速
![]() |
表 2 UUV集群航速航向表 Tab.2 UUV cluster heading and speedometer |
根据图3,在拥有先验信息的条件下,作业UUV集群能够在最初排除掉大量栅格,直接对目标进行追逐,相比无先验信息的情况,在有先验信息的条件下,能够较为精确的跟随目标UUV移动的作业UUV为4号、5号、6号,但在第2个时段的路径规划中,由于1号与2号作业UUV前方路径被5号与6号作业UUV走过,所以不在向前前进,开始向其他方向进行搜索,在0~50 min任务时间内,由于目标总是处于逃逸状态,速度长时间为
![]() |
图 3 已知初始位置航速航向搜索仿真图 Fig. 3 Simulation diagram of known initial position, speed, and heading search |
在无先验信息、有先验信息2种情况下,利用随机搜索方法与本文提出的概率最优搜索方法进行对比实验分析,验证本方法在区域搜素方面的优势,选择不同方法中UUV集群与目标间的平均距离作为衡量指标。
由图4可知,概率最优的搜索方法在作业UUV集群与目标的平均距离方面提升较大,作业UUV集群能够不断接近目标UUV,在搜索过程中,即使在无目标先验信息的情况下作业UUV集群也可以在较短时间内确定目标UUV所在的大致区域,在有目标先验信息的情况下,作业UUV集群能够更快速接近目标,同时半包围目标附近区域,搜索效率显著提升。
![]() |
图 4 距离对照折线图 Fig. 4 Distance comparison line chart |
本文设计了在弱联通环境下,UUV集群在有无先验信息的不同条件里对目标的搜索方法,通过估计目标位置信息,确定目标出现的概率分布图,对UUV集群中的每个个体实时确定一条发现目标概率累计最大的路径,最后通过仿真实验确定了方法的可行性,具有一定科研意义。
[1] |
KITTINGER J N, KOEHN J Z, LE CORNU E, et al. A practical approach for putting people in ecosystem-based ocean planning[J]. Frontiers in Ecology and the Environment, 2014, 12(8): 448-456. DOI:10.1890/130267 |
[2] |
冯景祥, 谢飞跃, 张平, 等. 美海上分布式作战研究现状及发展趋势[C]//中国指挥与控制学会. 第九届中国指挥控制大会论文集. 兵器工业出版社, 2021.
|
[3] |
冯景祥, 姚尧, 潘峰, 等. 国外水下无人装备研究现状及发展趋势[J]. 舰船科学技术, 2021, 43(23): 1-8. FENG J X, YAO Y, PAN F, et al. Research status and development trends of underwater unmanned equipment abroad[J]. Ship Science and Technology, 2021, 43(23): 1-8. DOI:10.3404/j.issn.1672-7649.2021.12.001 |
[4] |
陈玮, 吴泽伟, 吴晓锋. UUV协同探测的现状与发展前景[J]. 舰船电子工程, 2009, 29(2): 6-8+87.
|
[5] |
张卫东, 刘笑成, 韩鹏. 水上无人系统研究进展及其面临的挑战[J]. 自动化学报, 2020, 46(5): 847−857.
|
[6] |
刘应状, 朱耀庭, 朱光喜, 等. 机载激光水下目标探测的协同搜索及其仿真[J]. 光电子·激光, 2000(5): 511−513+517.
|
[7] |
郝冠捷, 姚尧, 常鹏, 等. 基于深度强化学习的分布式UUV集群任务分配算法[J]. 指挥控制与仿真, 2023, 45(3): 25−33.
|
[8] |
封锡盛, 李一平. 海洋机器人30年[J]. 科学通报, 2013, 58(S2): 2−7.
|
[9] |
李亚哲, 姚尧, 冯景祥, 等. 基于有限状态机的UUV集群围捕策略研究[J]. 舰船电子对抗, 2022, 45(1): 22−27.
|
[10] |
李大光. “第三次抵消战略”保持美军优势的关键技术[J]. 中国军转民, 2016, (9): 77−79.
|
[11] |
马爱民, 高倩, 申淼. 新技术或将彻底改变未来水下战[J]. 防务视点, 2015(4): 4−6.
|
[12] |
YANG M, LI C. Path planing and tracking for multi-robot system based on improved PSO algorithm[C]//2011 International Conference on Mechatronic Science, Electric Engineering and Computer (MEC). IEEE, 2011.
|
[13] |
MASEHIAN E, NEJAD A H. A hierarchical decoupled approach for multi robot motion planning on trees[C]//2010 IEEE International Conference on Robotics and Automation. IEEE, 2010.
|
[14] |
CAI Y, YANG S X, MITTAL G S. A PSO-based approach to cooperative foraging multi-robots in unknown environments[C]//2013 6th IEEE Conference on Robotics, Automation and Mechatronics (RAM). IEEE, 2013.
|
[15] |
CAI Y, YANG S X. A PSO-based approach with fuzzy obstacle avoidance for cooperative multi-robots in unknown environments[J]. International Journal of Computational Intelligence and Applications, 2016, 15(1): 1650001. DOI:10.1142/S1469026816500012 |
[16] |
CAI Y, YANG S X. An improved PSO-based approach with dynamic parameter tuning for cooperative multi-robot target searching in complex unknown environments[J]. International Journal of Control, 2013, 86(10): 1720-1732. DOI:10.1080/00207179.2013.794920 |
[17] |
DADGAR M, JAFARI S, HAMZEH A. A PSO-based multi-robot cooperation method for target searching in unknown environments[J]. Neurocomputing, 2016, 177: 62-74. DOI:10.1016/j.neucom.2015.11.007 |
[18] |
ZHU Q, LIANG A, GUAN H. A PSO-inspired multi-robot search algorithm independent of global information[C]//2011 IEEE symposium on swarm intelligence. IEEE, 2011.
|