舰船科学技术  2025, Vol. 47 Issue (3): 111-116    DOI: 10.3404/j.issn.1672-7649.2025.03.018   PDF    
自主水下航行器群探测行为关键技术分析
余敏, 刘浩煜, 张文凯, 汤奇荣     
同济大学 机械与能源工程学院机器人技术与多体系统实验室,上海 201804
摘要: 自主水下航行器协同技术发展需求日益迫切,研究多航行器协同探测技术能够提高未知海洋环境下作业效率、避免人员生命安全问题,在海洋资源探测、海洋搜救等应用中发挥着重要作用。在复杂未知水下环境中,通过多航行器协同行为实现对特定目标物的高效探测是一项巨大挑战。对水下群探测行为的关键技术进行研究,分析了基于图论、仿生模型、动力学模型和学习模型的水下群探测行为建模方法,分析了有组织和自组织群行为规划方法,分析了动力学模型、数据驱动的群体协同控制方法。研究结果表明,探测信息沟联的水下群体交互、可解释性强的学习类协同探测行为策略、动力学模型与数据相结合的行为控制方法是未来水下群探测行为技术的重要发展趋势。
关键词: 群体智能     水下机器人     行为规划与控制    
Analysis on key technologies of collective detection behavior by autonomous underwater vehicles
YU Min, LIU Haoyu, ZHANG Wenkai, TANG Qirong     
Laboratory of Robotics and Multibody System, School of Mechanical Engineering, Tongji University, Shanghai 201804, China
Abstract: Collective autonomous underwater vehicle (AUV) technology is in sore need. Researches on collective AUV technology can improve the operation efficiency of unknow ocean environment and avoid the human safety problem, which plays a significant role in applications such as ocean resource exploration and ocean search and rescue. High-efficient detection of specific targets via collective behavior of multi-AUV is a great challenge under the unknown, complex underwater environment. Key technologies on the underwater collective detecting behavior are studied, in which topological, biological, dynamical, and learning-based modelling methods, organized and self-organized collective behavior planning methods, as well as model and data-driven collaborative control methods are analyzed. Analysis results indicates that underwater collective interaction linked with detecting information, collective detecting behavior strategy via strong interpretable learning method, and behavior control combining dynamic models and data are important developing trends.
Key words: collective intelligence     underwater robot     behavior planning and control    
0 引 言

海洋任务的复杂性和海洋环境的特殊性决定了未来水下机器人技术势必朝着无人化、集群化、智能化方向发展。由多个自主水下航行器(Autonomous Underwater Vehicle, AUV)组成的多AUV系统能以超越单个AUV的覆盖范围广、效率高、冗错性高等优势应对复杂海洋任务。近20年,多AUV在协同探测水下目标物应用中发挥着重要作用。揭示水下群体行为交互机理、探索其协同行为规划与控制方法,有助于提升复杂水下环境中群体协同探测行为的自组织与自学习能力,为海洋探测、海洋资源开发等工程任务提供强有力的理论支撑与技术保障。

1 自主水下航行器协同探测现状

国外水下集群无人系统研究起步较早,典型AUV协同探测研究[15]表1图1。可以看出,水下集群无人系统的重要发展趋势之一是微小型化组网,以实现大范围区域下低成本、高灵活、多样化水下协同特种作业。复杂特殊水下环境、群体信息交互困难、群体协同机制不清晰、AUV自身物理约束等限制因素,使得多AUV协同探测任务成为一个极具挑战性的科学问题。本文聚焦于水下群探测行为的关键技术,包括群探测行为建模、协同探测行为规划及其控制理论与方法分析。

表 1 典型AUV协同探测研究 Tab.1 Typical research on collective detection by AUV

图 1 典型AUV协同探测研究 Fig. 1 Typical research on collective detection by AUV
2 水下群探测行为关键技术分析 2.1 群探测行为建模技术

对水下群体行为动力学的分析与建模能够深入地揭示其群智涌现机理。现有群体行为建模研究大致分为4类:基于图论、基于仿生模型、基于动力学模型和基于学习模型[6],群体行为建模方法对比和分析见表2。结合多AUV建模方法,以及群体探测分布广等行为特点,通过群体协同感知和通信交互,构建信息沟联的群探测行为动力学模型,掌握复杂水下环境中群体行为动力学规律,以揭示水下群探测行为的内在驱动机理。

表 2 群体行为建模方法对比和分析 Tab.2 Comparison and analysis of collective behavior modelling methods

2019年麻省理工学院领衔提出了一门名为“机器行为学”的新兴学科,借鉴人类和动物的行为模式深入研究机器以及机器群体的宏观行为规律,包含人工智能、生物行为学、群体智能、人机交互等多领域交叉[7]。针对AUV建模问题,挪威科技大学的Fossen[8]系统性研究了其建模方法,包括流体静力学和动力学分析、本体建模、耐波性建模、机动建模、推进器建模、环境(风、海浪、海流等)建模等,公开了水下系统仿真工具箱Marine System Simulator,包含了真实AUV(如Remus100)的参数和模型,以及大量仿真案例,为AUV建模与控制等研究奠定了坚实的基础。

针对水下群体协同探测行为的区域配置优化问题,生雪莉等[9]综合考虑了声呐探测模型、目标强度模型、环境噪声模型、水下空间阵位、水文条件等制约因素,提出了水下群体的协同探测效能建模方法;并结合仿生模型和稀疏表征模型理论,研究了模仿海豚哨叫信号的多水下无人集群发射信号建模方法,实现了水下集群的稳健性探测[10]。基于图论的建模方法分为无向拓扑和有向拓扑,Zhang等[11]设计了一种基于无向拓扑的多AUV动态切换拓扑模型,水下群体受限于时变的水声通信连接,各AUV仅和通信范围内的相邻航行器交互;Wang等[12]设计了一种基于有向拓扑的多AUV通信拓扑模型,设计有限时间速度观测器以减少通信负担,考虑了3种不同有向连接方式以应对不确定性动力学和环境干扰因素。

上述群体建模、AUV建模、水下探测建模、通信建模等研究,为多AUV协同探测行为建模提供了参考价值。然而,对目标探测信息建模的考虑仍较为薄弱,且较少考虑目标探测信息对协同探测行为动力学的影响机理。此外,群体之间的通信主要研究复杂水下环境中的通信受限等特点,较少考虑目标探测信息和群体通信的结合。通过分布式通信节点组网方式,实现目标探测信息的实时传递和交互,揭示水下群探测行为动力学规律和交互机理,是水下群探测行为建模研究的重要趋势,也是后续其行为规划及控制的研究基础。

2.2 群探测行为规划技术

多AUV协同探测行为规划是一类多智能体覆盖问题,期望以尽可能少的时间等优化指标实现对特定区域的大范围覆盖,以获得待探测目标信息。从群行为优化角度,研究方法包括旅行商算法、进化算法、覆盖路径规划、学习算法等;从群行为协同角度,研究方法包括领航者-跟随者、虚拟结构法、基于行为法、一致性理论等[13];从群智涌现机理角度,研究方法包括有组织、自组织机制。群探测行为规划方法对比和分析见表3,实际应用中多采用结合类方法以达到更好的效果。

表 3 群探测行为规划方法对比和分析 Tab.3 Comparison and analysis of collective detection behavior planning methods

有组织机制通过有序的分层将复杂群体行为分解为任务规划、个体协调、轨迹规划与控制等层级化目标,进而实现群体协同行为。McMahon等[14]基于旅行商问题提出了一种采样方式的AUV任务规划方法,考虑了低成本、动力学可行、碰撞规避等,实现了对水下目标的安全可靠探测。结合目标探测信息,Yordanova等[15]研究了启发式自适应航线间距的协同探测规划方法,以收集高质量数据为优化指标,在线调整多AUV的探测运动轨迹。Paull等[16]提出了一种基于传感驱动的AUV在线覆盖规划方法,设计了权重分配的多目标优化问题,基于六边形网格划分提出了分支熵概念,不仅能生成更短的航行器路径,且能应对实时探测的环境因素。Isokeit等[17]提出了基于计算几何方法的多AUV协同探测行为规划方法,通过分解多边形探测区域,实现了高效覆盖探测。

自组织机制通过个体之间、个体与环境等的交互作用结果,使集群整体涌现出个体所不具备的新属性或新行为。基于自适应动态交互拓扑模型,Liang等[18]提出了一种多AUV自组织协同一致性方法,通过优化群体之间的拓扑交互解决了个体行为冲突和群体链式灾难问题。受启发于生物智能,Zhu等[19]提出了一种自组织映射的多AUV任务分配和规划方法,利用自组织映射神经元网络自主执行多AUV协同探测多目标任务。Lindsay等[20]利用Q-learning算法解决了AUV探测规划问题,发现目标探测概率和虚警率与声呐的信躁比有关,分析了参数敏感性对AUV探测规划的影响。Yao等[21]提出了一种基于最大化累计探测奖励的静态目标探测方法,为多AUV设计了双向协商和最小一致性偏置算法,以决策各AUV的覆盖探测区域及其运动轨迹。不同于强化学习类方法,技能学习类方法主要研究如何将生物体具有的通用性和创造性复杂运动技能以相对直接的方式迁移到智能系统中,使其同样具备适应复杂物理世界的创造性通用技能,且对不确定性具备一定的泛化能力。

上述有组织和自组织水下群体协同探测机制研究主要考虑了水下目标搜索和区域覆盖运动优化问题,关注了目标探测信息驱动、群体任务分配、路径优化等方面。然而有组织机制大都事先规划好运动轨迹,对不确定性因素的应变性较差;自组织机制中的强化学习类策略难以显式建模和分析,导致其可解释性不足。因此,结合显式建模的技能学习类策略,研究可解释性较强的水下群体协同探测行为规划方法,自组织形成具备泛化能力的群探测行为是另一重要趋势,通过技能复现和泛化实现多AUV的队形保持和变换,进而实现特定水域下的快速全覆盖。

2.3 群探测行为控制技术

鉴于水下环境中多AUV能源供给有限,AUV续航、速度、潜深等均受能源的制约,因此需要研究能耗优化的多AUV协同控制方法。此外,由于水下环境的特殊性和复杂海况情形,可能存在多约束、水流干扰等不确定性,需要多AUV具备自学习应对环境、模型等不确定因素的能力。水下群探测行为的协同控制是一类受限多约束下的不确定性非线性优化控制问题。群体行为控制方法主要包括集中式和分散式,其中分散式又包括分布式和分层式,具体对比和分析见表4

表 4 群体行为控制方法对比和分析 Tab.4 Comparison and analysis of collective behavior control methods

针对AUV能耗优化控制研究,WANG等[22]提出了一种基于一致性理论的多AUV协同控制方法,设计了事件触发方式的通信策略,显著降低了多AUV的通信能耗。Wang等[23]提出了一种多AUV并行任务执行的时变约束驱动优化控制方法,将各AUV的广义输入向量作为能量消耗性能指标。Bai等[24]以能量消耗作为多AUV任务分配和路径规划的约束条件,通过消除冗余路径点、减少运动路径,实现能耗优化。

针对多AUV协同探测行为的控制研究,Fransman等[25]提出了一种多AUV协同探测水下目标的分布式受限优化控制方法,以任务完成时间、特定区域下目标被发现的置信度为性能指标,分布式协调各AUV的探测区域,采用压缩-伪树结构优化算法初始化待探测区域的分配结果,根据声呐探测结果优化后续多AUV控制过程。孙栋等[26]设计了一种模块化可重构的AUV,并提出了一种基于领航者-虚拟结构策略的集群编队控制方法,保证了水下群体协同控制的高效性。Abad等[27]提出了一种基于分散式MPC的多AUV协同探测控制方法,将低通讯频带、障碍物等限制考虑为次优化目标,而非约束,通过动态分配目标函数的优先级,保证最大程度地满足设置的多个性能指标。Xu等[28]提出了一种基于无模预测控制的AUV路径跟踪控制方法,不需要构建精确的数学模型,通过对大量数据集的学习和训练,直接获得AUV的控制输入。

上述能耗优化、受限优化控制等相关多AUV行为控制研究关注了目标探测信息、避障、通信受限、控制受限等多约束下非线性优化控制问题,但大多局限于基于动力学模型求解或基于纯数据驱动求解的控制策略。此外,现有水下群探测行为控制相关研究中较少考虑多洋流干扰、AUV能耗以及控制输入受限等问题。针对不确定性环境下多AUV协同控制问题,结合动力学模型和数据驱动策略,在精确的动力学建模基础上,利用学习类方法补偿可能存在的未知环境、模型等不确定性部分,实现受限多约束下能耗优化的鲁棒性群探测行为是多AUV协同控制研究的重要趋势。

3 结 语

本文对国内外自主水下航行器协同探测行为的关键技术现有研究进行了综述和分析,从技术发展角度分析群探测行为建模、规划与控制研究方法,并探讨了未来研究趋势。水下群探测行为研究涉及流体力学、水下机器人学、群体智能、人工智能、仿生理论、机器行为学、控制理论等多学科交叉和融合,亟需提升现有自主水下航行器的协同探测信息交互、协同行为自组织与自学习能力,以应对复杂不确定性水下环境、实现协同探测效益极大化。

针对自主水下航行器协同探测行为关键技术面临的挑战以及应对思路,展望如下:

1)群智化形式的多航行器群探测行为规划技术。在多航行器感知和探测范围受限等限制因素下,实现群探测行为规划,且能够根据目标、环境、自身等实时信息自组织地重新规划群体队形、各航行器任务及其运动轨迹。群智算法、强化学习、模仿学习等方法为多航行器探测行为提供了自主应对不确定性环境的规划策略,探究多航行器任务和运动之间的协同,构建群智化多航行器群探测行为形式,提升协同探测的效率和灵活性。

2)动力学-数据共同驱动的多航行器群探测行为控制技术。在非线性水动力不确定、航行器能源有限等限制因素下,实现不确定性下非线性多约束优化控制是群探测行为的一项挑战性技术。结合多航行器动力学模型和数据驱动的学习模型,借助学习类方法补偿不确定性干扰,构建不确定环境下动力学-数据共同驱动的多航行器群探测行为控制策略,提升协同控制的可靠性和鲁棒性。

参考文献
[1]
邱志明, 马焱, 孟祥尧, 等. 水下无人装备前沿发展趋势与关键技术分析[J]. 水下无人系统学报, 2023, 31(1): 1-9.
QIU Z M, MA Y, MENG X Y, et al. Analysis on the development trend and key technologies of unmanned underwater equipment[J]. Journal of Unmanned Undersea Systems, 2023, 31(1): 1-9. DOI:10.11993/j.issn.2096-3920.2023-0018
[2]
亚尔古水手, 深海追迹者-“蓝鳍金枪鱼-21”自主无人潜水器[EB/OL]. (2018-07-27) [2024-03-14].
[3]
宋保维, 潘光, 张立川, 等. 自主水下航行器发展趋势及关键技术[J]. 中国舰船研究, 2022, 17(5): 27-44.
SONG B W, PAN G, ZHANG L C, et al. Development trend and key technologies of autonomous underwater vehicles[J]. Chinese Journal of Ship Research, 2022, 17(5): 27-44.
[4]
BIRK A, ANTONELLI G, CAITI A, et al. The CO3AUVs (cooperative cognitive control for autonomous underwater vehicles) project: overview and current progresses[C]//Oceans, Santander, Spain, 2011.
[5]
吴校生. 水下微小无人机集群发展综述[J]. 数字海洋与水下攻防, 2020(3): 192-197.
WU X S. Review of small-size underwater drones swarm development[J]. Digital Ocean & Underwater Warfare, 2020(3): 192-197.
[6]
沈月, 沈博, 武文亮, 等. 集群机器人空间协作行为模型构建方法综述[J]. 计算机科学与探索, 2022, 16(8): 1706-1726.
SHEN Y, SHEN B, WU W L, et al. Survey on modeling method of spatial cooperative behavior of swarm robots[J]. Journal of Frontiers of Computer Science and Technology, 2022, 16(8): 1706-1726.
[7]
RAHWAN I, CEBRIAN M, OBRADOVICH N, et al[J]. Nature, 2019, 568: 477−486.
[8]
FOSSEN T I. Handbook of marine craft hydrodynamics and motion control[M]. Second Edition, Hoboken NJ: Wiley, 2021.
[9]
李鹏飞. 基于水下无人集群协同探测的区域配置优化研究[D]. 哈尔滨: 哈尔滨工程大学, 2020.
[10]
苍思远. 基于稀疏表示的水下无人集群稳健探测技术研究[D]. 哈尔滨: 哈尔滨工程大学, 2021.
[11]
ZHANG Y, ZHANG W, XIA G, et al. Distributed cooperative dual closed loop velocity-attitude consensus controller for rendezvous of the underactuated AUV swarm in 3-dimensional space[J]. Ocean Engineering, 2023, 273: 113752. DOI:10.1016/j.oceaneng.2023.113752
[12]
WANG J, DU J, and LI J. Distributed finite-time velocity-free robust formation control of multiple underactuated AUVs under switching directed topologies[J]. Ocean Engineering, 2022, 266: 112967. DOI:10.1016/j.oceaneng.2022.112967
[13]
WANG L, ZHU D, PANG W, et al A survey of underwater search for multi-target using multi-AUV: task allocation, path planning, and formation control[J]. Ocean Engineering, 2023, 278: 114393.
[14]
MCMAHON J and PLAKU E. Autonomous underwater vehicle mine countermeasures mission planning via the physical traveling salesman problem[C]//Oceans, Washington, USA, 2015.
[15]
YORDANOVA V and GIPS B. Coverage path planning with track spacing adaptation for autonomous underwater vehicles[J]. IEEE Robotics and Automation Letters, 2020, 5(3): 4774-4780. DOI:10.1109/LRA.2020.3003886
[16]
PAULL L, SAEEDI S, SETO M, et al. Sensor-driven online coverage planning for autonomous underwater vehicles[J]. IEEE/ASME Transactions on Mechatronics, 2013, 18(6): 1827-1838. DOI:10.1109/TMECH.2012.2213607
[17]
ISOKEIT C, OSIIK A, BEHRIE U, et al. Efficient complete coverage path planning for collaborative survey tasks by AUVs[C]//Oceans, Chennai, India, 2022.
[18]
LIANG H, YU F, and GAO J. Bio-inspired self-organized cooperative control consensus for crowded UUV swarm based on adaptive dynamic interaction topology[J]. Applied Intelligence, 2021, 51: 4664-4681. DOI:10.1007/s10489-020-02104-5
[19]
ZHU D, CAO X, SUN B, et al. Biologically inspired self-organizing map applied to task assignment and path planning of an AUV system[J]. IEEE Transactions on Cognitive and Developmental Systems, 2018, 10(2): 304−313.
[20]
LINDSAY J, SETO M, and BAUER R. Reinforcement Q-learning applied to underwater search planning towards maximizing information gain in environments with variable target detection probabilities[C]//IEEE/OES Autonomous Underwater Vehicles Symposium (AUV), St. Johns, Canada, 2020.
[21]
YAO P, QIU L, QI J, et al. AUV path planning for coverage search of static target in ocean environment[J]. Ocean Engineering, 2021, 241: 110050. DOI:10.1016/j.oceaneng.2021.110050
[22]
WANG L, ZHU D, PANG W, et al. A novel obstacle avoidance consensus control for multi-AUV formation system[J]. IEEE/CAA Journal of Automatica Sinica, 2023, 10(5): 1304-1318. DOI:10.1109/JAS.2023.123201
[23]
WANG C, ZHU S, LI B, et al. Time-varying constraint-driven optimal task execution for multiple autonomous underwater vehicles[J]. IEEE Robotics and Automation Letters, 2023, 8(2): 712-719. DOI:10.1109/LRA.2022.3231821
[24]
BAI G, CHEN Y, HU X, et al. Multi-AUV dynamic trajectory optimization and collaborative search combined with task urgency and energy consumption scheduling in 3-D underwater environment with random ocean currents and uncertain obstacles[J]. Ocean Engineering, 2023, 275: 113841. DOI:10.1016/j.oceaneng.2023.113841
[25]
FRANSMAN J, SIIS J, DOL H, et al. Distributed constraint optimization for autonomous multi AUV mine counter-measures[C]//Oceans, Charleston, USA, 2018.
[26]
孙栋, 汤奇荣, 刘明昊, 等. 面向模块化设计的水下机器人集群编队控制[J]. 舰船科学技术, 2024, 46(2): 68-73.
SUN D, TANG Q R, LIU M H, et al. Research on swarm formation control of modular underwater robots[J]. Ship Science and Technology, 2024, 46(2): 68-73.
[27]
ABAD A, DILEO N, FREGENE K. Decentralized model predictive control for UUV collaborative missions[C]//Oceans, Anchorage, USA, 2017.
[28]
XU W, XIAO Y, LI H, et al. Trajectory tracking for autonomous underwater vehicle based on model-free predictive control[C]//IEEE 20th International Conference on High Performance Switching and Routing (HPSR), 2019.