基于改进粒子群算法的UUV集群回收任务规划

引用本文

曹亚浩, 吕云飞, 陈源宝, 张向鹏. 基于改进粒子群算法的UUV集群回收任务规划. 舰船科学技术, 2025, 47(23): 92-97 复制到剪切板

CAO Yahao, LV Yunfei, CHEN Yuanbao, ZHANG Xiangpeng. UUV swarm recovery task planning based on improved particle swarm optimization algorithm. Ship Science and Technology, 2025, 47(23): 92-97 复制到剪切板

基于改进粒子群算法的UUV集群回收任务规划

曹亚浩, 吕云飞, 陈源宝, 张向鹏

武汉第二船舶设计研究所，湖北武汉 430205

收稿日期: 2025-02-08.

基金项目: 国防科工局基础科研资助项目（JCKY2021206B086）

作者简介: 曹亚浩（1997 – ），男，硕士研究生，研究方向为水下有人无人协同

摘要: 由于水下无人潜航器（Unmanned Underwater Vehicle, UUV）电池容量的限制，UUV集群难以满足某些大范围、长航时的任务需求，利用动基座回收技术，使用运载平台对UUV集群进行回收再布放可有效延长UUV的作业时间。针对运载平台对UUV集群的回收问题，建立UUV集群回收任务规划模型，提出一种改进的粒子群算法对UUV集群回收路线进行规划，使UUV集群整体回收时间最短。仿真结果表明，所提方法可有效解决UUV集群回收任务规划问题。

关键词: UUV集群粒子群算法任务规划

UUV swarm recovery task planning based on improved particle swarm optimization algorithm

CAO Yahao, LV Yunfei, CHEN Yuanbao, ZHANG Xiangpeng

Wuhan Second Ship Design and Research Institute, Wuhan 430205, China

Abstract: Due to the limited battery capacity of UUV, UUV swarms are difficult to meet the task requirements of large-scale and long-duration missions. By using the dynamic base recovery technology, the deployment and recovery of UUVs can be achieved using a carrier platform, effectively extending the operational time of UUVs. This paper addresses the problem of retrieving UUVs in a swarm for a carrier platform, and established a task planning model for retrieving the UUV swarm. It used an improved Particle Swarm Optimization (PSO) algorithm to plan the retrieval locations of the UUV swarm, aiming to minimize the overall retrieval time of the UUV swarm. Simulation results show that the method proposed in this paper can effectively solve the task planning problem of retrieving the UUV swarm.

Key words: UUV swarm particle swarm optimization task planning

0 引　言

近年来，水下无人潜航器（Unmanned Underwater Vehicle, UUV）以其成本低、灵活性高、隐蔽性强等优势，成为各国在无人领域的研究重点。与单艘UUV相比，多UUV的协同作业范围更广，效率更高，可在复杂环境中完成单艘UUV无法完成的任务，在海底地形勘探、海洋资源调查、水下目标搜索等领域有着广泛的应用^[1−2]。然而，由于当前UUV电池容量的限制，UUV难以满足一些大范围，长航时的任务需求。而使用水面无人艇等平台作为UUV的运载和支持平台，借助于动基座回收技术^{[3 − 4]}对UUV进行回收、充电、数据下载等操作后再次布放，可有效扩大UUV的作业范围和作业时长。因此，合理规划UUV集群的回收方案对UUV集群持续作业至关重要。

目前，在UUV回收任务领域相关研究主要集中在回收路径规划、近端回收导引和运动控制方面。赵鹏程等^[5]提出一种基于复合自适应遗传算法的UUV水下回收路径规划算法，使回收路线更平滑且长度更短；廉成斌等^[6]将回收任务分为远端回归阶段和近端回收阶段，分别采用遗传算法和Dubins曲线路径法进行规划，得到UUV水下回收任务全过程的回收路径；陈秋莲等^[7]基于神经网络对粒子群算法进行改进，得到具有避障能力的实时动态路径规划方法；YANG等^[8]将基于模型的强化学习算法引入无人机路径规划问题中，采用并行架构将数据收集和策略更新解耦，有效提升了求解效率和鲁棒性；胡守一^[9]针对UUV水下叉柱式回收特点，设计UUV回收自抗扰控制器，并利用神经网络对控制器进行优化补偿，实现了对回收过程中干扰的有效抑制；滕延斌^[10]针对动基座回收问题，采用分层鲁棒模型预测控制控制算法设计对接控制器，并在水下回收水池试验中验证了控制器的有效性。Liu等^[11]针对无人机空基回收问题，提出基于航迹评估和遗传算法的回收任务调度方法，运载机在固定航线执行空基回收任务，预测无人机时间窗口并对具备回收条件的无人机进行回收。综上，UUV回收路径规划常用方法可分为3类：1）以遗传算法、蚁群算法等为代表的智能优化算法, 这类算法性能受参数设置影响较大，调优复杂，且极易陷入局部最优，导致得到次优解；2）以神经网络、强化学习为代表的深度学习算法，这类算法的训练时间长，动态环境适应性有限；3）以Dubins曲线、A*算法为代表的传统路径规划算法，这类算法求解复杂，且难以应对高度复杂的环境。然而，上述算法均针对单一UUV的回收路径规划问题，对分布于不同位置且相距较远的UUV集群回收任务，单一UUV的回收路径规划可能并不适用，需要建立新的数学模型并设计算法对其进行求解。

本文以UUV集群回收位置规划为研究对象，以UUV回收时间窗口作为约束条件，构建UUV集群回收任务规划模型，并采用群智能算法寻找满足约束条件并使回收时间最短的解，为UUV集群自主规划回收任务提供参考。

1 问题建模 1.1 背景描述

当UUV集群完成自身任务后，运载平台需要对UUV集群进行快速回收并前往其他海域执行下一任务。UUV集群回收过程可分为如下几个阶段：

1）运载平台向UUV集群发送任务结束指令和自身位置信息，各UUV向运载平台发送所处的位置信息。

2）运载平台对各UUV回收位置进行规划并发送给各UUV。

3）所有UUV接收到运载平台规划的位置信息后，向预定的回收位置航行，同时运载平台向第一个回收点航行。

4）运载平台和某一UUV在预定回收点进行交会，运载平台对该UUV进行回收引导并完成UUV回收任务，在此回收时间段内运载平台无法回收其他UUV，且运载平台一直沿着预定轨迹航行以驶向下一个UUV回收点^[12]。

5）运载平台到达下一回收点并完成该点UUV交会和回收任务。

多UUV回收规划问题类似于旅行商问题（Traveling Salesman Problem, TSP），运载平台必须与每一个UUV进行交会，UUV交会顺序没有特定要求，全部UUV交会完成后即可完成UUV集群回收规划。与TSP问题相比，多UUV回收任务规划问题存在以下特点：

1）节点可移动。每个UUV作为交会节点并非固定不动，由于运载平台回收UUV的过程中一直在朝向下一个目标点航行，因此UUV也随之移动。

2）节点间路径可变。由于UUV交会节点位置不固定，导致节点间路径也随之无法固定不变。旅行商问题只需要优化节点访问的先后顺序，而多UUV回收任务规划问题既要优化节点访问顺序，还要优化节点交会位置，优化问题更加复杂。

1.2 建模分析

设某次回收任务包含$ N $艘UUV，分别处于任务海域的不同位置，UUV编号索引为$ N = \left\{ {1,2,\cdots,N} \right\} $，其初始位置为$ ({x_{i - init}},{y_{i - init}}) $，航速为$ {v_i} $，运载平台初始位置为$ ({x_0},{y_0}) $，航速为$ {v_M} $，需要优化的变量为各UUV的预期回收位置为$ ({x_i},{y_i}) $。UUV从初始位置$ ({x_{i - init}},{y_{i - init}}) $航行至预期回收位置$ ({x_i},{y_i}) $的时间为$ {t_i} $，运载平台从上一位置到达预期回收位置的时间为$ {t_{{M_i}}} $。下面建立运载平台回收UUV任务的数学模型并展开分析。

UUV在执行任务过程中，会受到洋流等外界因素的影响，也存在UUV加减速等自身动力学特性的影响。因此，若考虑所有影响因素，构建的模型将异常繁杂且呈现明显的非线性。因此，在不影响问题求解的情况下，做出如下假设：

1）所有UUV都是同类型UUV，即其物理特性相同，并将其视为二维平面内的质点，不考虑海洋环境等因素的影响；

2）UUV的加减速过程采用平均速度代替，视UUV的运动为匀速运动；

3）UUV与UUV，UUV与运载平台之间不存在通信干扰，即个体之间能够顺利通信；

4）由于实际环境和UUV姿态的影响，从交会到回收完成的时间并不固定，本文取平均值$ \tau $进行简化；

5）运载平台和各UUV在同一深度的二维平面中活动且UUV随机分布在二维平面内。

由于任务执行过程的不确定性，回收任务开始时，各UUV可能分散在任务海域的不同位置，因此回收任务的目的是在尽可能短的时间内回收UUV并回到起点，构造目标函数如下：

$ R\left(Z\right)=\mathrm{min}\displaystyle {\sum_{i=1}^{N}{t}_{{M}_{i}}+{t}_{{M}_{0}}}。$

(1)

式中：$ t_{M_{1}} $为运载平台从上一位置到达第i艘UUV回收位置所用的时间，计算公式如下：

$ {t_{{M_i}}} = \frac{{\sqrt {{{\left( {{x_i} - {x_{i - 1}}} \right)}^2} + {{\left( {{y_i} - {y_{i - 1}}} \right)}^2}} }}{{{v_M}}},\forall i = 1,2,\cdots N 。$

(2)

存在如下约束：

1）时间约束。UUV需在先于运载平台到达预期回收位置，即：

$ \sum\limits_i^m {{t_{{M_i}}} \geqslant {t_m}} ,\forall m = 1,2,\cdots N。$

(3)

式中：$ {t_{{M_i}}} $为运载平台从第i-1号回收位置前往第i号回收位置所用时间；$ {t_m} $为m号UUV从其初始位置到回收点的时间。

$ {t_m} = \frac{{\sqrt {{{\left( {{x_m} - {x_{m - init}}} \right)}^2} + {{\left( {{y_m} - {y_{m - init}}} \right)}^2}} }}{{{v_m}}}。$

(4)

2）电量约束。UUV需在电量耗尽前达到回收位置。即

$ {t_i} \leqslant B{E_i},\forall i = 1,2,\cdots N 。$

(5)

式中：$ {E_i} $ 为i号UUV的剩余电量；$ B $为比例系数；$ B{E_i} $ 为i号UUV的剩余可航行时长。

3）回收约束。运载平台存在回收占用时间$ \tau $，从运载平台开始回收某一UUV开始后的$ \tau $时刻内无法回收其他UUV。因此，为保证对UUV的顺利回收，运载平台需在到达下一回收位置前完成对UUV的回收，即：

$ {t_{{M_i}}} > \tau ,i = 1,2,\cdots ,N 。$

(6)

2 基于改进PSO算法的回收任务规划

为求解上述回收任务规划模型，本文提出一种改进的粒子群算法（Particle Swarm Optimization, PSO）进行求解。PSO算法具有参数少、收敛速度快等优点，在UUV集群任务分配、航路规划等领域有广泛的应用^[13]。本文中，由于回收规划任务约束条件导致无法得到解析的解空间范围，因此，由式(1)中的目标函数结合罚函数法，将约束条件作为罚函数作为适应度函数的一部分，对不满足约束条件的粒子进行惩罚以约束粒子的位置，达到限制解空间范围目的。因此，适应度函数计算公式为：

$ f = \sum\limits_{i = 1}^N {\left\{ {{t_{{M_i}}} + {\sigma _1}{{\left( {{t_{{M_i}}} - \tau } \right)}^2} + {\sigma _2}\left( {{t_i} - B{E_i}} \right)} \right\}}。$

(7)

式中：$ {\sigma _1} $与$ {\sigma _2} $为惩罚因子，代表对偏离约束的解的惩罚程度。

在更新时，每个粒子的位置代表一组规划的UUV的回收点：

$ {X_i} = \bigcup\limits_{i \in N} {\left( {{x_i},{y_i}} \right)}。$

(8)

作为群智能算法的一种，PSO算法同样不可避免得存在陷入局部最优、出现早熟现象的缺点。在此，通过对PSO算法的分析，对算法进行如下修改，以PSO算法减小陷入局部最优的概率。

1）Tent混沌映射

与大多数群智能算法相似，粒子种群的位置初始化采用随机生成的策略，可能导致种群的多样性较低，收敛速度较慢。为加强算法的全局收敛能力，加入Tent混沌映射对粒子的种群进行初始化，使初始个体尽可能的分布在问题的解空间中^[14]。Tent混沌映射表达式如下：

$ {X}_{t+1}=\left\{\begin{aligned} &\dfrac{{X}_{t}}{\alpha }\text{，}{X}_{i}\in \left[0,\alpha \right)，\\ &\dfrac{1-{X}_{t}}{1-\alpha }\text{，}{X}_{i}\in \left[\alpha ,1\right] ，\end{aligned}t=1,2,\cdots T 。\right. $

(9)

其中：$ {X_{t + 1}} $为第t+1次迭代的粒子位置；$ {X_t} $为第t次迭代的粒子位置；$ t $为当前的迭代次数；$ T $为算法的最大迭代次数。

2）自适应动态惯性权重系数

PSO算法中，惯性权重系数w对算法的效果至关重要，但在原始PSO算法中w取固定值而导致适应性较差，对w的取值进行自适应调整，使改进后的算法进行前期专注全局搜索，后期则专注局部寻优。$ w $的更新公式如下：

$ w = {w_h} - \left( {{w_h} - {w_l}} \right) \times \frac{t}{T}。$

(10)

式中：$ {w_h} $和$ {w_l} $分别为权重系数的最大值和最小值；$ t $为当前的迭代次数；$ T $为算法的最大迭代次数。

3）高斯-柯西变异策略

为减少PSO算法陷入局部最优的概率，引入高斯-柯西变异策略在每轮迭代时对全局最优解进行扰动^[15]。

高斯变异算子如下：

$ X_{gauss}^t = X_{gbest}^t \cdot \left( {1 + Gaussian(\mu )} \right)。$

(11)

柯西变异算子如下：

$ X_{cauchy}^t = X_{gbest}^t \cdot \left( {1 + Cauchy(\varphi )} \right)。$

(12)

高斯-柯西混合变异算子为：

$ X_{gbest}^t = \frac{t}{T}X_{gauss}^t + \left( {1 - \frac{t}{T}} \right)X_{cauchy}^t 。$

(13)

改进后的粒子群算法流程图如图1所示。

图 1 改进后粒子群算法流程图 Fig. 1 Flowchart of the improved PSO algorithm

3 仿真实验与结果分析

1）实验参数设置

本文选取在50 km×50 km大小范围内回收6艘UUV作为实验环境，UUV初始位置随机生成，分别在2种不同的场景进行实验，各场景的实验参数设置如表1所示。

表 1 实验场景参数设置 Tab.1 Experimental scene parameter settings

分别使用PSO、DBO（蜣螂优化算法，Dung Beetle Optimizer）、SSA（麻雀优化算法，Sparrow Search Algorithm）和改进的PSO算法结合回收任务规划模型对UUV回收任务进行规划，对比实验结果并进行分析。每个算法初始种群大小设置为100，最大迭代次数设置为1000次，实验次数为100次，各算法其余初始参数见表2。

表 2 各算法初始参数 Tab.2 The initial parameters of each algorithm

2）结果分析

图2为各算法求解的各回收场景的收敛曲线。可以看出，改进后的PSO算法的收敛速度和最终收敛结果均比其他算法更好。在这表明，与其他群智能算法相比，改进后的PSO算法能够在更短的时间内求得最优路径，且求得的解比其他算法更优。说明了本文所提算法的有效性。

图 2 各场景下不同算法收敛曲线 Fig. 2 Convergence curves of different algorithms in different scenarios

表3为各场景中运载平台最终回收方案。图3为各场景下运载平台回收UUV集群的回收路线及各UUV的返航路线。从表3可知，本文所提算法在不同UUV数量、UUV航速、UUV初始位置的情况下均可较快实现对UUV集群的回收任务的规划，各场景运载平台与UUV到达预定回收位置的时间差最大不超过0.13 h，且相邻两UUV的回收时间间隔均不小于回收占用时间。这表明，运载平台可在预定回收位置回收UUV，并在到达下一回收位置前完成对UUV的回收，满足实际场景需要。

表 3 各场景下运载平台回收方案 Tab.3 Recovery scheme of carrier platform in each scenario

图 3 各场景下运载平台回收路线示意图 Fig. 3 Schematic diagram of recovery route of carrier platform in each scenario

4 结　语

本文针对多UUV回收规划问题的优化目标、存在的约束条件进行了分析，建立多UUV回收模型。改进粒子群算法并求解多UUV回收问题，实验结果表明，所提出的多UUV回收方法能够获取多UUV的最优回收路径，与其他群智能算法相比，求解速度更快，生成的解更优，满足UUV集群实际应用的需求。下一阶段的研究将考虑建立各UUV的运动学约束、回收价值约束等约束条件，以满足实际应用的需要。

参考文献

[1]	孙彧, 潘宣宏, 王幸军, 等. 无人潜航器装备技术发展及作战运用研究[J]. 舰船科学技术, 2023, 45(21): 104-109. SUN Y, PAN X H, et al. Research on the development of unmanned underwater vehicle equipment technology and its combat application[J]. Ship Science and Technology, 2023, 45(21): 104-109.
[2]	孟令帅, 李明烁, 林扬, 等. 自主水下机器人布放回收技术综述[J]. 无人系统技术, 2024, 7(1): 1-19. MENG L S, LI M S. LIN Y, et al. Review on deployment and recovery technologies for autonomous underwater vehicles[J]. Unmanned Systems Technology, 2024, 7(1): 1-19.
[3]	张伟, 伍文华, 滕延斌, 等. 约束条件下基于满意模型预测控制的动基座水下无人航行器对接控制[J]. 哈尔滨工程大学学报, 2022, 43(1): 108-118. ZHANG W, WU W H, TENG Y B, et al. Docking control of dynamic base underwater unmanned vehicles based on satisfactory model predictive control under constrained conditions[J]. Journal of Harbin Engineering University, 2022, 43(1): 108-118.
[4]	BREIVIK M, LOBERG J E. A virtual target-based underway docking procedure for unmanned surface vehicles[J]. IFAC Proceedings Volumes, 2011, 44(1): 13630-13635. DOI:10.3182/20110828-6-IT-1002.02969
[5]	赵鹏程, 宋保维, 毛昭勇, 等. 基于改进的复合自适应遗传算法的UUV水下回收路径规划[J]. 兵工学报, 2022, 43(10): 2598-2608. ZHAO P C, SONG B W, MAO S Y, et al. Underwater recovery path planning of unmanned underwater vehicle based on an improved composite adaptive genetic algorithm[J]. Acta Armamentarii, 2022, 43(10): 2598-2608.
[6]	廉成斌, 杨亭鹏, 李磊, 等. UUV水下回收路径规划方法研究[J]. 舰船科学技术, 2021, 43(S1): 42-47. LIAN C B, YANG T P, LI L, et al. Research of unmanned underwater vehicle underwater recovery path planning[J]. Ship Science and Technology, 2021, 43(S1): 42-47.
[7]	陈秋莲, 郑以君, 蒋环宇, 等. 基于神经网络改进粒子群算法的动态路径规划[J]. 华中科技大学学报(自然科学版), 2021, 49(2): 51-55. CHEN Q L, ZHENG Y J, JIANG H Y, et al. Dynamic path planning based on neural network-improved particle swarm optimization algorithm[J]. Journal of Huazhong University of Science and Technology (Natural Science Edition), 2021, 49(2): 51-55.
[8]	YANG S M, SHAN Z, CAO J, et al. Path planning of UAV base station based on deep reinforcement learning[J]. Procedia Computer Science, 2022, 202: 89-104. DOI:10.1016/j.procs.2022.04.013
[9]	胡守一. UUV水下回收自抗扰控制方法研究[D]. 哈尔滨: 哈尔滨工程大学, 2019.
[10]	滕延斌. 基于模型预测控制的动基座UUV回收控制方法研究[D]. 哈尔滨: 哈尔滨工程大学, 2020.
[11]	LIU Y B, QI N M, et al. Cooperative path planning for aerial recovery of a uav swarm using genetic algorithm and homotopic approach[J]. IEEE Transactions on Vehicular Technology, 2020, 69: 3505-3509. DOI:10.1109/TVT.2020.2967124
[12]	刘永孛. 集群无人机空基回收任务规划方法研究[D]. 哈尔滨: 哈尔滨工业大学, 2021.
[13]	董校成, 于浩淼, 郭晨. 能耗与时间约束下的UUV三维路径规划[J]. 大连海事大学学报, 2022, 48(2): 11-20. DONG X C, YU H M, GUO C. Research on UUV three-dimensional path planning under energy consumption and time constraints[J]. Journal of Dalian Maritime University, 2022, 48(2): 11-20.
[14]	王龙宝, 栾茵琪, 徐亮, 等. 基于动态簇粒子群优化的无人机集群路径规划方法[J]. 计算机应用, 2023, 43(12): 3816-3823. WANG L B, LUAN Y Q, XU L, et al. UAV swarm path planning method based on dynamic-cluster particle swarm optimization[J]. Journal of Computer Applications, 2023, 43(12): 3816-3823.
[15]	JOHANNES J, ADRIAN B, STEFAN F.R. Directed particle swarm optimization with Gaussian-process-based function forecasting[J]. European Journal of Operational Research. 2021, 294(1): 157−169.


舰船科学技术 2025, Vol. 47 Issue (23): 92-97 DOI: 10.3404/j.issn.1672-7649.2025.23.014	PDF