2. 中国船舶集团有限公司第七〇五研究所昆明分部,云南 昆明 650118;
3. 大连海事大学 人工智能学院,辽宁 大连 116026;
4. 大连海事大学 船舶与海洋工程学院,辽宁 大连 116026
2. Kunming Branch of the705 Research Institute of CSSC, Kunming 650118, China;
3. College of Artificial Intelligence, Dalian Maritime University, Dalian 116026, China;
4. Naval Architecture and Ocean Engineering College, Dalian Maritime University, Dalian 116026, China
近年来,随着海洋工程与人工智能技术的协同发展,水下作战模式正加速向智能化和网络化方向演进。无人水下航行器(Unmanned Underwater Vehicle, UUV)凭借其自主化、智能化的技术特征,展现出显著的技术优势和应用潜力[1 − 3],UUV集群作战领域的研究也取得了重要突破。在此背景下,如何提升UUV集群的环境适应性和任务灵活性以实现高效协同作业,已成为该领域的研究热点问题。尤其是在海洋军事作战中,如何在复杂环境下进行高效任务分配和饱和式打击成为一个重要研究方向。
在任务分配方面,常用的传统解决集群任务规划的方法有匈牙利算法、基于集中式的线性规划法等。近年来,随着生物群体智能与深度学习研究的不断深入,学者们开始将这些理论应用于集群任务分配领域的研究[4 − 10]。例如,杨芳等[4]将灰狼算法应用于UUV集群任务分配问题,针对传统灰狼算法未考虑全局与局部搜索的协调配合以及未考虑位置更新的权重问题进行改进。结果表明,改进的算法优化后的算法能够提升资源利用率并增强分配性能。考虑水下通信条件的限制和环境的动态变化,Yu等[6]提出DCBBA-TICC算法来解决UUV集群之间的动态任务分配问题,通过采用通信中继来促进不同UUV群之间搜索资源的共享。最后,通过仿真验证了所提出的动态任务分配方法的有效性。郝冠捷等[7]在《指挥控制与仿真》中提出一种基于深度强化学习(DRL)的分布式UUV任务分配算法,该算法通过局部信息交互实现全局目标优化,有效解决了水下通信延迟导致的决策滞后问题。Li等[9]提出了一种多目标双层任务规划策略,用于解决 UUV集群分配到不同目标的问题。此外,为了适应变化的洋流,UUV 控制策略被纳入路径规划过程。通过大量数值模拟证明了提出方法的有效性。徐健等[10]针对浅海环境声呐干扰问题,提出仿生观测启发的声呐滤波算法,通过模拟细胞膜电位变化机制,有效提高算法效率。张思杰[11]提出深度强化学习与拍卖机制结合的多UUV协同决策模型,通过多智能体Q-learning优化任务竞标策略,有效提高了任务分配效率。
在饱和打击研究方面,目前关于机器人和无人机等无人系统集群的研究思路可为UUV集群饱和打击行为规划提供参考。例如,Wu等[12]分析无人机集群在城市中战斗应用模式的一些打击策略,包括饱和式攻击、精确打击和分布式打击,以此来完成各种战斗任务。Sun等[13]引入阿波罗尼奥斯圆作为打击模式的最终形态,并且考虑避让障碍物。Qian等[14]提出一种基于深度强化学习的方法进行无人机群饱和攻击任务分配,并且将无人机群饱打击的任务分配问题视为一种马尔可夫决策过程,并且提出基于策略梯度的训练算法,以提高学习速度。2024年乌克兰黑海作战案例显示,8艘无人艇通过分布式协同实现区域拒止,其中4艘采用“间接接近-作战战术”成功重创俄军登陆舰。这种攻击模式与Qian等[14]提出的无人机饱和攻击模型高度吻合,验证了基于马尔可夫决策过程的策略梯度训练算法在实战中的有效性。Zhang等[15]解决无人机集群饱和攻击问题,研究了其自主机动策略,基于分布式部分可观测马尔可夫决策过程构建了自主决策模型,并利用递归多智能体深度确定性策略梯度进行学习。通过设计全局和局部2种奖励函数,以优化自杀饱和攻击效果。
受到以上启发,本文提出将改进的哈里斯鹰智能算法引入到UUV集群任务分配问题,并设计一种最优匹配算法结合基于贝塞尔曲线的动态路径控制方法完成对目标的饱和式打击。
1 多UUV集群任务分配 1.1 任务场景描述本文主要以复杂的海洋环境为背景,聚焦于海上UUV集群的任务分配和饱和式打击作战的任务场景和目的。
如图1所示,在指定区域内,我方存在M艘UUV,N艘目标UUV。目标UUV会出现在海域的某些位置,通过对目标聚集程度进行合理划分区域,从而形成不同价值的α区域和目标β区域。我方UUV集群则在发现目标区域后会迅速组成编队,通过任务分配对目标区域进行饱和式打击。为增加打击任务的挑战性,场景中还设置多个水下障碍物(不可达区域)。为确保饱和式打击任务的高效进行,我方UUV集群部署在敌方的两侧。这种部署方式的优势在于我方UUV可以从敌方两侧逼近,迅速对目标区域形成包围圈,提升打击任务成功的概率,有利于提升打击的安全性与灵活性。
|
图 1 UUV集群饱和打击场景示意图 Fig. 1 Schematic diagram of UUVs saturation strike scenario |
为准确描述UUV集群的任务分配问题,本文选取五元组{P,U,T,F,I}来进行任务分配问题进行建模。其中,P为目标区域集合;U为我方UUV集合;T为约束条件;F为目标函数集合;I为海洋环境。
设定对某一目标区域,我方分配的UUV集合为
| $ \sum\limits_j^N {{P_j}} = {W_i},$ | (1) |
| $ \sum\limits_i^N {num\left( {{W_i}} \right)} = M,$ | (2) |
| $ \sum\limits_{i = 1}^N {{U_i} \leqslant 1},$ | (3) |
| $ \left\{ \begin{gathered} num\left( {{W_i}} \right) \geqslant {S_{\min}}\left( W \right),\\ num\left( {{W_i}} \right) \leqslant {S_{\max}}\left( W \right),\\ \end{gathered} \right. $ | (4) |
| $ dList = \left\{ {{W_i} \in W,{P_j} \in P|{W_i} \to {P_j}} \right\}。$ | (5) |
式中:
在目标收益函数中我方第i艘UUV分配到目的j收益总和可表示为:
| $ \left\{ \begin{gathered} benefit_i^j = {k_d} \times den{s_j} + {k_{val}} \times va{l_j} + {k_o} \times loa{d_i} ,\\ {k_d} + {k_{val}} + {k_o} = 1 。\\ \end{gathered} \right. $ | (6) |
式中:
在UUV的任务分配中,我方UUV在执行分配给目标区域时,面临的损失主要可分为航程损失和攻击损失,具体代价公式以及约束条件可表示为:
| $ \left\{ \begin{aligned} & {\rm cos}{t_i} = {k_{dis}}f(di{s_{i,j}}) + {k_s}f(damage),\\ & f\left( {dis_i^j} \right) = \sqrt {{{(x_i^{usv} - x_i^P)}^2} + {{(y_i^{usv} - y_j^P)}^2}},\\ & {k_{dis}} + {k_s} = 1 。\end{aligned} \right. $ | (7) |
式中:
最后,面向饱和攻击的多UUV集群任务分配模型目标函数可以定义为:
| $ f = \sum\limits_{i = 1}^U {\sum\limits_{j = 1}^P {\left( {benefit_i^j - {\rm cos}{t_i}} \right)} } 。$ | (8) |
式中:
哈里斯鹰优化算法(Harris Hawks Optimization, HHO)是一种受自然界中哈里斯鹰群体智能捕猎行为启发的元启发式优化算法[16]。该算法的核心思想是通过数学建模鹰群在追踪、包围和攻击猎物过程中表现出的协同狩猎策略,以解决高维非线性优化问题。该算法主要分为探索、过渡和开发3个阶段:在探索阶段,算法模拟鹰群通过莱维飞行(Levy)随机搜索机制对解空间进行全局勘探;过渡阶段通过猎物能量的动态衰减机制实现从全局搜索到局部开发的渐进转换;开发阶段则采用4种精细策略(软包围、硬包围、渐进式快速俯冲和伪随机俯冲)模拟鹰群根据猎物逃逸能量实施的差异化围攻行为,其中策略选择通过逃逸能量阈值和随机概率进行动态切换。猎物逃逸能量定义为:
| $ E = 2{E_0}\left(1 - \frac{t}{{{T_{_{\max }}}}}\right)。$ | (9) |
式中:
然而,传统的哈里斯鹰优化算法在初始化和迭代阶段依赖均匀随机分布生成参数,会导致以下问题:1)初始化不均,随机数生成可能使初始种群聚集于解空间的局部区域,遗漏潜在全局最优解;2)搜索震荡,迭代中随机参数的不可预测性易引发搜索轨迹震荡,降低收敛稳定性;3)重复遍历,传统随机数的周期性或概率分布不均可能导致无效重复搜索。
为解决上述问题,本文提出一种双阶段混沌映射机制,通过Logistic混沌映射的遍历性(Ergodicity)和非重复性(Non-repetitiveness),从初始化和迭代2个阶段系统性优化算法,具体地,在初始化阶段,利用混沌序列生成初始种群,确保解空间均匀覆盖;在迭代阶段,以混沌序列动态替代HHO的随机参数,增强搜索方向性与稳定性,Logistic混沌映射公式如下:
| $ lr(t+1)=\mu \cdot lr(t)\cdot(1-lr(t))。$ | (10) |
式中:
此外,针对传统哈里斯鹰优化算法在多模态任务分配问题中全局探索能力不足、局部开发易陷入局部最优的缺陷,本文提出一种差分进化(DE)策略与缩放型Levy变异的协同优化机制。该机制通过分阶段动态调整搜索策略,平衡全局探索的广度与局部开发的深度。在搜索阶段,使用突变算子来代替方程中的原始位置更新策略。则原始算法更新策略为:
| $ {Y(t + 1)=\left\{\begin{aligned}&{Y}_{\text{rand }}(t) + F({Y}_{\text{rabbit }} (t)- {Y}_{\text{r1 }}(t) + F({Y}_{\text{r2 }}(t)- {Y}_{\text{r3 }}(t))) ,q\geqslant 0.5, \\ &({Y}_{\text{rabbit }}(t)-{Y}_{\text{m}}(t))-{r}_{4}({B}_{\text{L}}+{r}_{5}({B}_{\text{U}}-{B}_{\text{L}})),q \lt 0.5。\end{aligned} \right.}$ | (11) |
式中:Yr1、Yr2、Yr3均为随机选择的非重复个体,来保障种群多样性。
| $ F(t)=F_0-(F_0-F\mathrm{_{end}})\cdot\frac{t}{T\mathrm{_{max}}}。$ | (12) |
在开发阶段,定义范围在(0,1)的Sp为猎物逃逸概率,根据猎物逃逸能量和逃逸概率来选择狩猎策略。当
渐进式快速俯冲和伪随机俯冲过程中,传统Levy飞行因固定步长易导致局部搜索震荡。本文提出缩放型Levy变异,通过动态调整步长,在局部邻域内生成多样化扰动,具体为:
| $ {X(t + 1) = \left\{ \begin{gathered} Y = X_p (t) - E\left| {J X_p (t) - X(t)} \right|,{\rm{if}}\; F(Y) \lt F(X(t)),\\ Z = Y + Y \times Levy(D),{\rm{if}}\;F(Z) \lt F(X(t)) 。\\ \end{gathered} \right.}$ | (13) |
式中:t为当前迭代的次数;
基于我方UUV集群任务分配结果后,进行饱和式打击任务,目标是通过已经进行过合理的任务分配方案然后,通过协同控制我方UUV能够同时协同地到达各自目标区域形成包围圈,最终对各自目标区域进行充分打击。本文提出基于最优匹配分配算法以及贝塞尔(Bezier)曲线的动态控制方法,通过对我方UUV精确的路径控制和位置调整,使其中能够准确到达预定的部署点达到饱和式打击效果。
由图2可知,在实现多UUV饱和式打击任务中,为了有效地对目标UUV形成包围圈,我方每个UUV需要到达各自预定的部署点,从而实现打击策略。每个部署点在笛卡尔坐标系下的位置
|
图 2 UUV集群饱和打击示意图 Fig. 2 Schematic diagram of UUVs saturation attack |
| $ {\theta _i} = \frac{{2{\text{π}} (i - 1)}}{n},i = 1,2,...,n,$ | (14) |
| $ \left\{ \begin{gathered} x_i^{\left( \delta \right)} = {R_m}\cos \left( {{\theta _i}} \right) + x_c^{\left( \delta \right)} ,\\ y_i^{\left( \delta \right)} = {R_m}\sin \left( {{\theta _i}} \right) + y_c^{\left( \delta \right)} ,\\ \end{gathered} \right. $ | (15) |
| $ {U_i}(t) \geqslant {R_m}。$ | (16) |
式中:n为针对某一目标区域打击时我方分配的UUV数量;
部署点确定后,如何将这些部署点有效地分配给我方各UUV成为一个关键问题。为此,本文设计了最优匹配算法来实现高效的部署点分配,具体算法流程如表1所示。
|
|
表 1 最优匹配算法 Tab.1 Optimal matching algorithm |
本文通过贝塞尔曲线来动态控制我方UUV在复杂环境中实现平滑路径运动,从而更快、更安全地到达目标部署点进而进行饱和式打击。贝塞尔曲线是一种参数曲线,通常通过一组控制点来定义。假设给定控制点
| $ B\left( t \right) = \sum\limits_{k = 0}^n {{P_k}} \cdot \left( {\begin{array}{*{20}{c}} n \\ k \end{array}} \right){\left( {1 - t} \right)^{n - k}}{t^k},t \in [0,1]。$ | (17) |
式中:
| $ \left\{ \begin{split} &\theta = a\tan 2\left( {B_y}\left( t_j \right) - {B_y}\left( t_{j - 1} \right),{B_x}\left( t_j \right) - {B_x}\left( t_{j - 1} \right) \right),\\ &\omega = {k_2}\frac{\theta }{\Delta t},\Delta t = {t_j} - {t_{j - 1}},\\ &v = {k_3} \cdot \frac{{B\left( {{t_j}} \right) - B\left( {{t_{j - 1}}} \right)}}{{\Delta t}},{\text{ }}\Delta t = {t_j} - {t_{j - 1}} 。\end{split} \right. $ | (18) |
式中:k1和k2均为调整速度和角速度的比例系数。
3 仿真实验 3.1 实验环境设置为了验证算法的可行性和优越性,本文设计了一组仿真实验,以UUV集群为仿真对象,选取
本文分别采用标准哈里斯鹰优化算法、灰狼优化算法和改进哈里斯鹰优化算法进行仿真实验,各个算法适应度曲线如图3所示,结合本文背景,本文以最小代价为最后目标函数,因此本文将目标函数可直接作为适应度使用,最优适应度分别为461.12、461.5和441.93。
|
图 3 适应度结果图 Fig. 3 Fitness result graph |
分配结果如表2所示。α区域具有的总价值为8,β区域具有的总价值为4.5,在HHO结果下我方编号为1、3、5、7的UUV被分配至α区域,其余被分配至β区域;在IHHO结果下我方编号为1、3、5、2、4的UUV被分配至α区域,其余被分配至β区域,如表3所示。在考虑敌方杀伤能力情况下,对于高价值目标区域分配我方UUV较多,分配低价值区域UUV数量较少,IHHO分配结果符合预期目标。
|
|
表 2 实验参数设置 Tab.2 Experimental parameter settings |
|
|
表 3 UUV集群目标分配情况表 Tab.3 UUVs target allocation |
此外,为更公平地对比结果,进行了10次仿真统计比较3种算法得到的最优解,10次结果以及平均最优适应度如表4所示。为保证仿真实验准确性,每一次仿真实验初始化种群数量为100,迭代次数为
|
|
表 4 任务分配适应度值对比 Tab.4 Comparison of fitness values for task allocation |
图4为我方UUV集群饱和打击过程示意图,考虑到动态打击过程是连续变化的过程,本文展示了t=0、43、81、100 s的UUV行为示意图。在UUV航行过程中,UUV根据当前位置和贝塞尔曲线参考路径之间的相对位置关系,调整自身的速度和转向角度。例如,当UUV偏离参考路径时,通过增加或减小转向角度,使UUV逐渐靠近部署点。同时,调整UUV的航行速度,以确保航行的平稳性和安全性。可以看到,在t=43 s时,我方UUV开始按照任务分配好的结果奔向自己的目标区域;在t=81 s时,我方UUV继续按照规划好的路径奔向目标区域,并躲避了障碍物等不可达区域;最后,我方UUV集群同时且均匀角度地到达了目标区域周围,形成了饱和打击态势。仿真结果表明,采用贝塞尔路径控制方法显著提高了路径的平滑性,降低了无人艇的路径导向误差。通过这种路径控制策略,我方UUV的运动将更加协调,有助于实现更高效的饱和打击效果。
|
图 4 饱和打击过程示意图 Fig. 4 Schematic diagram of the saturation attack process |
面向UUV智能化军事作战场景,本文提出了基于智能化算法的任务分配和饱和打击目标的策略,首先基于我方和目标UUV集群价值、航程损失等因素,建立模型约束条件,为我方UUV合理分配打击任务,采用改进的哈里斯鹰算法解决任务分配问题。采用双阶段混沌映射机制,利用 Logistic 逻辑混沌序列生成初始种群,通过混沌的遍历性与非重复性来增强搜索过程稳定性,加速全局收敛,避免传统随机初始化导致的种群聚集问题,有助于控制开发机制。提出一种融合差分进化(DE)策略与缩放型Levy变异的协同优化机制。该机制通过分阶段动态调整搜索策略,兼顾全局探索的广度与局部开发的深度,可以帮助个体轻松逃离局部最优。最后,引入最优匹配算法和贝塞尔曲线动态路径控制的结合策略,为UUV合理分配部署点,并在运动中产生平滑轨迹,确保在执行打击任务时路径平稳。最后仿真实验表明,我方UUV集群经过合理的任务分配和规划能高效完成对目标的饱和式打击任务,实现在复杂环境中UUV集群的高效协同作业。
然而,贝塞尔曲线控制策略在动态避障中仍存在显著局限性,复杂环境对UUV路径规划的影响也亟待优化,具体表现为动态避障响应滞后、多约束环境下轨迹优化不足、环境参数敏感性高。未来将通过构建自适应动态避障模块、开发多目标协同优化算法以及设计鲁棒性轨迹生成模型,研究突破贝塞尔曲线在动态复杂环境中的应用平静,构建兼具平滑性、实时性与鲁棒性的 UUV 路径规划体系,为多 UUV 集群饱和式打击提供更可靠的行为规划支撑。同时本文工作也将进一步改进和加强,引入强化学习等人机器学习方法来进一步提高UUV的打击策略,通过与环境实时交互来调整自身策略,可进一步增强UUV的灵活性和智能化水平。
| [1] |
李厚全, 刘宏杰, 毛科建, 等. 水下无人航行器隐蔽导航方法研究[J]. 舰船科学技术, 2022, 44(12): 83-87. LI H Q, LIU H J, MAO K J, et al. The research of method about secret navigation underwater of UUV[J]. Ship Science and technology, 2022, 44(12): 83-87. DOI:10.3404/j.issn.1672-7649.2022.12.016 |
| [2] |
刘佳, 郎继超. 深海着陆器无动力下潜技术发展现状[J]. 舰船科学技术, 2022, 44(24): 107-113. LIU J, LANG J C. Development status of unpowered diving motion of deep-sea lander[J]. Ship Science and technology, 2022, 44(24): 107-113. DOI:10.3404/j.issn.1672-7649.2022.24.022 |
| [3] |
YAN Z, LI Y. Data collection optimization of ocean observation network based on AUV path planning and communication[J]. Ocean Engineering, 2023, 282: 114912. DOI:10.1016/j.oceaneng.2023.114912 |
| [4] |
杨芳, 陈彦勇, 张云佳, 等. 基于改进灰狼算法的UUV集群任务分配研究[J]. 舰船科学技术, 2022, 44(22): 69-75. YANG F, CHEN Y Y, ZHANG Y J, et al. Research on task allocation of multi-UUV based on improved grey wolf optimizer[J]. Ship Science and technology, 2022, 44(22): 69-75. DOI:10.3404/j.issn.1672-7649.2022.22.013 |
| [5] |
WU X, GAO Z, YUAN S, et al. A dynamic task allocation algorithm for heterogeneous UUV swarms[J]. Sensors, 2022, 22(6): 2122. DOI:10.3390/s22062122 |
| [6] |
YU H, MA Y. A cooperative mission planning method considering environmental factors for UUV swarm to search multiple underwater targets[J]. Ocean Engineering, 2024, 308: 118228. DOI:10.1016/j.oceaneng.2024.118228 |
| [7] |
郝冠捷, 姚 尧, 常 鹏, 等. 基于深度强化学习的分布式 UUV 集群任务分配算法[J]. Command Control & Simulation / Zhihui Kongzhi yu Fangzhen, 2023, 45(3):1−7. HAO G J, YAO Y, CHANG P, et al. Distributed UUV cluster task allocation algorithm based on deep reinforcement learning [J]. Command Control & Simulation / Zhihui Kongzhi yu Fangzhen, 2023, 45(3):1−7. |
| [8] |
ZHU D, YANG S X. Current effect-eliminated optimal target assignment and motion planning for a multi-UUV system[J]. IEEE Transactions on Intelligent Transportation Systems, 2024, 25(8): 8419-8428. DOI:10.1109/TITS.2024.3351442 |
| [9] |
LI T, SUN S, WANG P, et al. A multi-objective bi-level task planning strategy for UUV target visitation in ocean environment[J]. Ocean Engineering, 2023, 288: 116022. DOI:10.1016/j.oceaneng.2023.116022 |
| [10] |
徐健, 朱慧龙, 陈涛, 等. 受人观测启发的UUV前视声纳滤波方法[J]. 仪器仪表学报, 2016, 17(5): 1094-1100. XU J, ZHU H L, CHEN T, et al. A filtering method for UUV forward-looking sonar inspired by human observation[J]. Journal of Instrumentation, 2016, 17(5): 1094-1100. DOI:10.3969/j.issn.0254-3087.2016.05.017 |
| [11] |
张思杰. 基于深度强化学习的多UUV协同任务决策方法研究[D]. 大连: 大连海事大学, 2024.
|
| [12] |
WU H, WU K, YANG X, et al. Analysis on the operation mode of UAV swarm in urban combat[C]//International Conference on Autonomous Unmanned Systems. Singapore: Springer Nature Singapore, 2022.
|
| [13] |
SUN Z, SUN H, LI P, et al. Cooperative strategy for pursuit-evasion problem in the presence of static and dynamic obstacles[J]. Ocean Engineering, 2023, 279: 114476. DOI:10.1016/j.oceaneng.2023.114476 |
| [14] |
QIAN F, SU K, LIANG X, et al. Task assignment for UAV swarm saturation attack: A deep reinforcement learning approach[J]. Electronics, 2023, 12(6): 1292. DOI:10.3390/electronics12061292 |
| [15] |
ZHANG T, ZUO Y, ZHANG D, et al. Research on Autonomous Maneuvering Strategies of UAV Swarm for Saturation Attack[C]//2022 IEEE International Conference on Unmanned Systems (ICUS). IEEE, 2022.
|
| [16] |
HEIDARI A A, MIRJALILI S, FARIS H, et al. Harris hawks optimization: Algorithm and applications[J]. Future generation computer systems, 2019, 97: 849-872. DOI:10.1016/j.future.2019.02.028 |
2026, Vol. 48
