水下群体智能

吴婷婷 於志文 徐健

吴婷婷, 於志文, 徐健. 水下群体智能 [J]. 智能系统学报, 2026, 21(1): 179-200. doi: 10.11992/tis.202506033
引用本文: 吴婷婷, 於志文, 徐健. 水下群体智能 [J]. 智能系统学报, 2026, 21(1): 179-200. doi: 10.11992/tis.202506033
WU Tingting, YU Zhiwen, XU Jian. Underwater crowd intelligence [J]. CAAI Transactions on Intelligent Systems, 2026, 21(1): 179-200. doi: 10.11992/tis.202506033
Citation: WU Tingting, YU Zhiwen, XU Jian. Underwater crowd intelligence [J]. CAAI Transactions on Intelligent Systems, 2026, 21(1): 179-200. doi: 10.11992/tis.202506033

水下群体智能

doi: 10.11992/tis.202506033
基金项目: 人社部引智专项(T250401001);中央高校科研专项资金项目(3072025CFJ0605).
详细信息
    作者简介:

    吴婷婷,准聘副教授,主要研究方向为群智计算、分布式机器学习及弱监督机器学习。主持中央高校基础科研基金项目1项。发表学术论文10余篇。E-mail:ttwu@hrbeu.edu.cn;

    於志文,教授,博士生导师,哈尔滨工程大学党委常委、副校长,国家重点研发专项首席科学家,人机物融合群智计算教育部重点实验室主任,智能感知与计算工信部重点实验室主任。主要研究方向为物联网、普适计算、人机系统及感知大数据。承担国家重点研发计划项目、前沿科技创新项目、重点基金和国际合作项目等科研项目20余项。发表学术论文200余篇,并先后8次获得国际会议最佳论文奖。E-mail:zhiwenyu@hrbeu.edu.cn;

    徐健,教授,博士生导师,主要研究方向为水下无人系统的总体设计与集成、无人自主控制与群体智能。发表学术论文60余篇,出版专著1部。E-mail:xujian_bsa@hrbeu.edu.cn.

    通讯作者:

    於志文. E-mail:zhiwenyu@hrbeu.edu.cn.

  • 中图分类号: TP39

Underwater crowd intelligence

  • 摘要:

    水下智能系统在海洋资源勘探、生态监测和国防安全等关键领域发挥着不可替代的作用。面对复杂多变的海洋环境,传统单一智能体在作业效率、环境适应性和任务覆盖范围等方面存在不足。基于多智能体协同的水下群体智能技术,通过分布式感知、协同计算和自适应控制,为解决这些问题提供了新的技术路径。本文系统梳理了群体智能的概念演进与研究进展,聚焦水下环境中的核心挑战,提出了面向“感知−计算−协同”的水下群体智能系统架构。围绕该架构,深入阐述了智能感知、智能计算与智能协同3个关键技术,重点探讨了通信受限下的协同计算、跨域异构集群智能决策等前沿发展方向。最后,结合海洋资源勘探、水下环境监测和安防等典型应用,展望了水下群体智能的未来发展前景。

     

    Abstract:

    Underwater intelligent systems play an irreplaceable role in key areas such as marine resource exploration, ecological monitoring, and national defense. Faced with the complexity and variability of the marine environment, traditional single-agent systems exhibit limitations in operational efficiency, environmental adaptability, and task coverage. Underwater crowd intelligence, based on multi-agent collaboration, offers a new technical pathway through distributed sensing, cooperative computing, and adaptive control. This paper systematically reviews the conceptual evolution and research progress of crowd intelligence, identifies the core challenges in underwater environments, and proposes a system architecture for underwater crowd intelligence based on the “sensing-computing-collaboration” paradigm. Within this framework, it elaborates on three key technologies: intelligent sensing, intelligent computing, and intelligent collaboration. Particular attention is given to emerging directions such as cooperative computing under communication constraints and intelligent decision-making across heterogeneous agent clusters. Finally, the paper outlines future prospects of underwater crowd intelligence by examining its applications in marine resource exploration, underwater environmental monitoring, and underwater security.

     

  • 随着“海洋强国”战略的深入推进,我国海洋经济规模实现了历史性突破。根据自然资源部发布的《2025中国海洋经济发展指数》及《2024年中国海洋生态预警监测公报》,2024年我国海洋经济总量达105 438亿元,首次突破10万亿大关,同比增长5.9%,占GDP比重达到7.8%。海洋在资源勘探、生态监测、国防安全以及灾害预警等领域中的战略地位日益凸显[1]。然而,传统的作业模式已难以满足海洋经济数字化转型对高效、智能、协同技术的迫切需求。因此,随着海洋经济的快速发展,水下作业能力、资源探索及海洋环境监测技术的需求不断增长,为水下智能技术的广泛应用提供了广阔前景。

    近年来,无人水下航行器(unmanned underwater vehicle, UUV)[2-3]、水下预置观测系统[4-5]等水下智能平台不断取得进展并实现了广泛部署。这些技术在保障海洋资源调查、生态保护以及海底管道监测等方面发挥了重要作用。然而,由于海洋环境高度复杂,单一智能体在作业效率、系统鲁棒性和空间覆盖能力等方面仍面临显著局限,特别是在深海、高压、低温等极端环境条件下,传统作业模式和技术往往难以应对这些挑战。因此,如何通过先进的智能协作机制来优化水下智能平台的作业效率、提升系统稳定性和自适应能力,已成为当前水下智能技术发展的关键问题。

    相较而言,群体智能(crowd intelligence)[6]作为一种新兴的分布式智能协同机制,近年来已在智慧城市监测[7]、智能交通系统[8]、无人机编队[9]等领域展示出广泛的应用潜力。群体智能在多智能体系统中的自主协作、灵活调度与协同容错等能力,为提升系统整体智能水平与稳定性提供了有效支撑。群体智能的优势在于其能够充分发挥多智能体之间的协同作用,优化任务分配、提高系统鲁棒性,并有效应对动态变化的环境条件。随着终端智能和边缘计算技术的不断发展,群体智能在水下领域的应用潜力尤为巨大。通过引入群体智能技术,水下环境中的多智能体协同感知、任务分配和自组织决策,不仅有望突破传统水下作业模式的局限,也为应对复杂海洋环境下的自主作业提供了全新范式,具有重要的理论意义与现实价值。

    然而,相较于陆地和空域,水下环境存在通信链路不稳定、感知信息受限、环境动态变化剧烈以及能量补给困难等天然挑战,使得已有的群体智能方法难以直接迁移至水下应用。这些挑战不仅对通信、感知系统提出了更高要求,还对控制机制、任务分配和能量管理等方面带来了新的技术瓶颈。例如,水下通信受限于声波传输特性,存在低带宽和高延迟问题,而在深海环境下,这种限制将更加显著[10-11];同时,环境的动态变化使得分布式感知和协同工作的实时性和准确性难以保证,控制机制的鲁棒性不足也使得智能体在面对极端环境条件时难以保持良好的协同工作状态[12-13]。此外,水下群体智能面临的任务分配问题,尤其是在多任务和动态任务环境下,仍然是一个亟待解决的难题[14-15]

    近年来,针对水下多智能体的协同感知、智能控制与组网通信等关键问题,国内外学者开展了大量探索性研究[16-21]。水下群体智能也正逐步从概念提出阶段迈向理论建模与应用实践的深度融合,成为智能海洋技术的重要前沿[22-23]。随着计算能力、传感技术和人工智能算法的不断进步,水下群体智能有望在未来实现更为精准、高效和稳定的作业模式,推动智能海洋技术的全面应用。这些技术的成熟将为海洋资源的可持续开发、环境保护以及深海探索等领域提供强有力的技术支撑,为我国海洋强国战略的实施提供创新动力。

    本文旨在对水下群体智能的研究体系与关键问题进行系统梳理与总结。首先回顾群体智能的发展历程、基本内涵及其在典型领域的技术进展;其次,结合水下环境的独特性,构建水下群体智能的系统架构,并分析其面临的核心挑战;随后,围绕智能算法与关键应用,深入探讨在感知、计算与协同等方面的挑战,综述当前主流技术及代表性研究成果;最后,结合未来发展趋势与实际应用需求,展望水下群体智能在通信–感知–计算一体化、人在回路(human-in-the-loop)融合决策等方向的研究前景。本文期望为该领域的进一步发展提供系统化的参考与理论支持。

    “群体智能”起源于对群居性生物行为的观察与研究,最早由Beni和Wang于1989年提出[24]。其核心思想是个体智能有限的鱼群、鸟群、蚂蚁、蜜蜂等生物体,通过局部协作与简单规则涌现出超越个体的集体行为。随后,研究者从自然界汲取灵感,逐步将其发展为解决复杂问题和构建人工智能系统的方法,典型算法包括蚁群算法(ant colony optimization,ACO)[25]、粒子群优化(particle swarm optimization,PSO)[26]、人工鱼群算法(artificial fish swarm algorithm,AFSA)[27]和狼群算法(wolf pack algorithm,WPA)[28],奠定了从生物仿生到工程应用的理论基础。例如,Pugh 等[29]提出受PSO启发的多机器人搜索算法,通过修改PSO模拟多机器人搜索过程,从而建模系统参数变化对性能的影响。Wilson 等[30]提出基于蚂蚁启发的随机控制策略,用于多机器人集体运输任务的控制设计,通过模仿蚂蚁在集体运输中的微观和宏观行为,设计了控制机器人在多个负载周围非均匀分布的策略,并验证了其有效性。这些早期探索为后续研究提供了重要参考。

    近年来,群体智能的研究范式逐渐演进,不再局限于传统的生物行为模拟,而是与人工智能、机器人学等前沿领域深度融合,并涌现出一系列创新应用。Yang等[31]将深度学习与微纳机器人集群导航结合,提出实时动态规划框架,使群体具备更强的环境适应与自主决策能力。Song等[32]构建MAGECS框架,融合鸟群算法、生成式模型和图神经网络,实现二氧化碳还原电催化剂的逆向设计,展示了群体智能在人工智能(artificial intelligence,AI)驱动材料设计中的潜力。在机器人应用方面,Nitti等[33]提出了群体协作模型,融合元启发式与共识理论,解决小规模机器人集群的可靠性问题,并应用于海洋污染物定位任务。Arbel等[34]则从力学设计角度出发,证明通过调整机器人摩擦力和质量分布等物理属性即可实现协同运输,凸显了“物理智能”在群体行为涌现中的关键作用。与此同时,人机交互(human-swarm interaction, HSI)逐渐成为新兴研究方向。Deng等[35]将人类智能融入猴群算法(monkey algorithm, MA),通过多样化交互策略提升了多维优化性能。此外,Luo等[36]提出ASDMOPSO算法,利用角度分割存档和动态更新机制,在收敛性与解的多样性之间实现有效平衡。这些探索标志着群体智能从单一的计算优化逐步走向跨领域融合,开始面向更复杂的现实物理系统与工程设计问题。

    在学术探索不断深化的同时,群体智能也逐渐上升为国家战略层面的重点方向。2017年国务院发布《新一代人工智能发展规划》(即AI 2.0[37]),首次将群体智能纳入国家发展战略规划。随后科技部、工信部等陆续出台相关政策,推动群体智能技术落地应用,支撑国家战略性产业转型升级。在“人工智能2.0”的带动下,物联网、大数据与人工智能技术深度融合,群体智能研究从早期强调“行为仿生”转向更关注以人为中心的互联网群体智能涌现,强调通过分布式、自组织的方式完成复杂任务,具备自组织、自适应、自学习和持续演化等典型特征。

    随着智能终端(如智能手机、可穿戴设备)和多模态感知设备的普及,群体智能在普适计算环境中被赋予了更丰富的内涵,演化出以“人在回路”为核心特征的群智感知计算(crowdsensing)。该范式强调通过人类个体的认知参与与移动终端的感知能力,在分布式环境中完成大规模协同感知与推理任务[38-39]。在5G通信、边缘计算和人工智能的协同驱动下,群智感知正由传统的“以人为中心”集中式感知计算,演化为“人−机−物”协同感知和“云−边−端”融合计算主导的人机物融合群智计算(crowd intelligence with the deep fusion of human, machine, and internet of things, CrowdHMI)[40-42]。该范式通过异构智能体在感知能力、计算资源与任务目标上的互补性协同,构建具有自组织、自学习与持续演化能力的智能系统,实现从个体能力到群体认知的整体跃升。

    基于Crowdsensing、CrowdHMI 的协同范式,群体智能在民用和军事领域均展现出广泛应用前景与实际成效。在民用领域,无人群体智能系统已广泛应用于智慧城市建设[7,43]、农业与林业作业[44-45]、灾害响应[46-47]与物流与仓储[48]等场景,有效提升了系统的自动化与协同能力。在军事场景中,群体智能构建的高效协同体系推动了侦察、探测、搜救、测绘等任务实现非线性性能提升和技术突破。例如在基础设施智能监测方面,麻省理工学院提出基于移动众包的桥梁健康监测方法,以应对传统方法成本高、部署难的问题,成功实现桥梁模态频率的低成本获取[49]。在智慧农业中,研究人员提出基于 Lovebird 算法的农业机器人路径优化方法,有效提升了播种作业效率与适应性[45]

    在复杂场景的协同感知与决策中,CrowdHMI 的“人−机−物”融合特性进一步深化。在灾害响应方面,西北工业大学针对无人机、人员与车辆的协同路径规划问题,设计了一种融合全局−局部信息处理机制与异构多智能体建模的任务规划算法,显著提升了复杂场景下的感知效率与决策效果[47]。浙江大学则聚焦无人机集群在密林等障碍密集环境中的路径规划研究,结合单机局部轨迹规划与群体共享信息,实现了高效避障与协同飞行[50];香港科技大学提出一种去中心化的分布式无人集群协同探索方法,显著提升了未知区域的覆盖效率[51]。此外,大阪大学将活体昆虫与微型控制器结合,构建混合机器人(cyborg insects)系统,利用群体导航算法实现复杂软地形环境下的高效自主导航,拓展了群体智能在非传统机器人平台中的应用边界[52]

    综上,群体智能正通过跨学科融合不断拓展其理论边界与应用空间,以CrowdHMI 为代表的协同范式,在异构智能体组织、分布式感知与自主演化等方面展现出强大潜力,已成为新一代智能系统发展的重要方向之一,其技术演进路径如图1所示。

    图  1  群体智能技术里程碑
    Fig.  1  Milestones in crowd intelligence technology
    下载: 全尺寸图片

    相较于陆地与空域的群体智能系统,水下群体智能面临更加复杂且独特的运行环境。在陆地与空中,智能体通常具备稳定的无线电通信、丰富的定位手段和成熟的协同机制,系统运行易于感知、控制与干预。然而,水下环境受制于强介质约束、感知盲区广泛、能量补给困难以及通信手段受限,使得原有的群智机制难以直接迁移。深入剖析水下特有挑战,是构建高效水下群体智能系统的前提,也是提升系统稳定性与任务完成能力的重要基础。

    环境复杂多变 水下群体智能系统所处环境具有高度不确定性,主要表现为海水状态的层化结构与洋流的动态变化。海水温度、盐度、密度等参数随水深分布不均,形成多层结构,导致声信号传播速度发生变化,进而影响声波的传播路径与覆盖范围,从而使通信和定位精度难以保障。同时,海洋洋流具有强烈的时变性,流速与流向随时间、空间频繁变化,易造成节点在运动过程中偏离预设轨迹,带来额外能量消耗,并降低协同定位与任务执行的稳定性和有效性。这些特性对系统的鲁棒性与自适应能力构成严峻挑战。

    节点资源受限 受体积、成本与能耗等因素限制,水下节点普遍存在算力不足与能量受限的问题。算力方面,节点计算能力有限,难以承担复杂的数据处理、模型推理和实时决策等任务,难以支持高精度、低时延的决策需求;能量方面,水下节点普遍依赖电池供能,充电困难且更换不便,使得其在执行长距离、长时间或高频率任务时面临续航瓶颈,从而严重影响任务持续性和系统整体效能。上述制约因素要求系统在设计时充分考虑计算负载优化与能耗管理策略,以保障其在复杂环境下的持续稳定运行。

    通信性能受限 声学通信是水下信息交互的主要手段,但仍存在连通性差与时延高等技术障碍。其带宽受限且易受环境噪声与多路径效应干扰,信息传输质量不稳定,限制了节点间的高效协同,降低了集群在动态环境中的同步能力。同时,水声信道固有的长时滞特性使得节点间状态信息传输存在显著延迟,严重制约了路径规划与任务调整的实时性,降低了系统在突发事件中的响应速度和环境适应能力。这些通信限制显著增加了群体协同的复杂性,对系统的容错设计与调度机制提出更高要求。

    为有效应对上述挑战,有必要构建一套契合水下特性的群体智能系统架构。该架构不仅要能够适配复杂多变的海洋环境、资源受限的节点条件和通信不畅的现实制约,还应具备良好的可扩展性与适应性,以保障系统在动态任务与突发事件中的鲁棒运行。为此,本文提出的水下群体智能系统架构围绕“感知–计算–协同”的闭环机制展开设计,力求在三者之间建立高效联动的逻辑通路,支撑系统自感知、自决策与自协同的能力。图2给出了该系统的分层架构:从最底层的智能感知层开始,向上依次包括智能计算层和智能协同层。各层相互依赖、协同工作,分别承担环境感知、任务决策和集体执行等不同功能,共同构成了完整的水下群体智能运行体系。

    图  2  水下群体智能系统分层体系架构
    Fig.  2  Hierarchical architecture of underwater crowd intelligence systems
    下载: 全尺寸图片

    智能感知层是系统的感知前端,负责对复杂环境进行多源信息采集与预处理。其核心功能包括两方面:一是环境感知,利用声学、光学等多种感知手段获取环境信息。声学感知具备穿透力力强、适用范围广的优势,适合能见度低或远距离场景;光学感知则在清澈水域中具备高分辨率、适合近距离精细识别的能力。实际应用中通常融合多种感知方式,以互补优势构建更加全面且鲁棒的感知系统。二是数据预处理,对采集数据进行筛选、清洗与增强,提取关键特征,并进行信号降噪与模型反演(即通过观测数据反推环境或目标的原始状态),为后续智能计算与协同控制提供高质量的数据支撑。

    智能计算层作为系统的中枢模块,负责将感知信息转化为决策指令。该层面临去中心化架构、资源受限、设备异构等挑战,需发展轻量、高效的计算与推理机制。其主要功能包括:一是多源多模态数据融合,聚合来自多个智能体的异构感知信息,利用时空对齐、关联分析、数据补齐和特征匹配等方法,实现信息的统一表示;二是计算与推理模型构建,包括对目标的识别、行为模式的判断等任务,并通过引入知识蒸馏、模型剪枝等技术实现模型的轻量化与自适应更新,以提升动态环境下的计算效率和部署可行性。

    智能协同层作为系统的决策执行模块,承接智能计算层输出结果,具备协同决策、自主控制和动态调整能力,面向多智能体间的高效协作与集体任务执行需求。其关键功能包括:1)协同定位,通过信息共享与协同计算,在无基站条件下实现高精度的相对与绝对定位;2)路径规划,根据任务目标与环境变化动态生成最优路径,提升系统整体调度效率;3)拓扑控制,根据网络连通性与任务负载动态调整群体通信结构,增强系统鲁棒性与通信稳定性;4)资源分配,依据各节点的能力与状态,协同调度感知、计算与通信资源的合理分配,提高整体资源利用率。通过上述功能,智能协同层进一步构建起基于“感知–计算–控制”反馈通路的运行机制,使系统具备在复杂环境中自适应演化与动态协作的能力,从而实现群智系统的持续优化与高效运行。

    水下群体智能的高效运行依赖于感知、计算与协同等关键技术模块的协同演进与持续突破,这些模块不仅构成系统功能的支撑,更直接体现其智能化水平。其中,智能感知层作为系统的信息入口,需应对复杂水下环境下高质量数据获取与语义理解的挑战;智能计算层作为决策核心,需要在资源受限、数据异构的条件下,构建具备学习、推理与自适应能力的轻量化、鲁棒计算机制;智能协同层作为任务执行与群体协作的中枢,则面临通信延迟、不完全信息等约束,亟需发展高效可靠的多智能体协作与决策策略。本节将围绕上述三大功能层,系统梳理水下群体智能所依赖的核心技术进展,深入剖析各层智能能力的实现路径与研究难点,以期为系统的整体设计与实际部署提供理论支撑与技术借鉴。

    3.1.1   数据筛选与清洗

    数据筛选与清洗是水下智能感知中数据预处理的重要环节,旨在剔除噪声与异常信息,提升数据质量,为后续的特征提取与模型训练奠定坚实基础。在实际应用中,具体的筛选与清洗操作往往需根据任务目标和数据特性进行定制化设计。为展现该环节的实际应用过程,本文以Contini等[16]构建的海洋图像数据集Seatizen Atlas为例(该数据集涵盖水下及空中图像,用于海洋生物多样性与栖息地监测),介绍其数据筛选与清洗策略。如图3所示,该数据集构建过程中融合了多维度的数据质量控制方法。

    图  3  水下数据集Seatizen Atlas构建过程中的数据筛选与清洗操作
    Fig.  3  Data filtering and cleaning operations in the construction of the underwater dataset Seatizen Atlas
    下载: 全尺寸图片

    在数据筛选方面,Seatizen Atlas结合了内容、图像质量、生态相关性和隐私保护等多个维度进行筛选:内容筛选用于确保图像与研究任务的相关性;质量筛选剔除了模糊或无法满足分析需求的图像;生态相关性筛选进一步保障了数据的科学适用性;隐私保护筛选则排除了包含个人隐私信息的图像。

    在数据清洗方面,该数据集进行了包括时间同步与修正、GPS数据修正、位置偏移修正、标注一致性检查与标注完整性检查在内的多项处理操作。时间同步与修正确保了图像采集时的准确性;GPS数据修正通过后处理技术提升定位精度;位置偏移修正基于平台姿态数据计算图像的实际拍摄位置;标注一致性与完整性检查则保证了数据标注的准确性与完整性。

    通过上述多维度的筛选与清洗流程,Seatizen Atlas显著提升了数据的质量与生态学相关性,为海洋生物多样性监测与栖息地研究提供了坚实的数据支撑。

    3.1.2   数据增强

    为提升水下数据的质量,增强其在后续分析与处理中的可用性与可靠性,研究人员针对音频和图像等多种数据类型提出了多样的增强方法,以减弱复杂水下环境对数据采集造成的不利影响。下文将分别综述水下声信号与图像数据的典型增强技术,相关技术对比如表1所示。

    表  1  水下数据预处理典型方法对比
    Table  1  Comparison of typical underwater data preprocessing methods
    方法类型 具体技术 核心原理 优势 局限性
    声信号增强 时域处理[16,53] 直接增强原始波形 保留时序特征 高频信息捕捉弱
    频域处理[54-55] 优化频谱图 精准增强特定频段 相位估计易失真
    时频融合[56-57] 联合时域/频域特征 综合性能最优 计算复杂度高
    图像增强 物理模型[58-59] 模拟水下光学特性 物理可解释性 依赖环境参数
    非物理模型[60-62] 直接调整像素分布 计算高效 全局一致性差
    深度学习[63-68] 端到端退化−增强映射 自适应能力强 需大量标注数据
    信号降噪 波形处理[69,70-72] 时域直接建模 鲁棒性强 计算成本高
    频谱处理[17,73,74-76] 频域特征增强 频域去噪效果好 时序建模弱
    识别引导[77-79] 去噪与识别协同 任务性能提升显著 网络结构复杂

    水下声信号增强 水声信号增强方法主要包括3类:1)时域方法直接在时域上处理声信号,充分保留其时序特征,避免频域变换带来的相位误差。例如,Ling等[16,53]采用层次递归神经网络增强时域音频信号,有效建模其时序结构。然而,该类方法面对高维长序列时计算代价较高,且难以准确捕捉频率信息。2)频域方法在频谱图上操作,便于增强特定频率成分,如Eskimez等[54]基于对抗网络生成高频对数功率谱以提升分辨率。Zhang等[55]进一步结合全局与局部频谱上下文提升音频质量。该类方法依赖频域特征提取,重建时的相位估计误差可能引入失真。3)时频融合方法结合时域与频域优势,实现更全面的特征提取。如Tian等[56]通过注意力机制融合时域波形与频谱图;Lu等[57]并行建模幅度与相位频谱以提高语音可懂度。尽管性能优越,此类方法通常结构复杂、计算成本较高。

    水下图像增强 水下图像增强方法主要分为3类:1)基于物理模型的方法通过模拟水下光传播过程进行颜色校正和图像恢复。例如,Berman等[58]利用水体光谱特性建模;Zhang等[59]引入图像形成模型与先验约束。此类方法对环境参数依赖较强,限制了其实用性。2)基于非物理模型的方法无需成像模型,直接通过像素级调整提升图像质量,如Zhang等[60]采用CIELAB空间进行颜色平衡;Zhou等[61]结合像素分布重映射和变分模型缓解伪影;另有方法基于最小衰减通道实现颜色校正[62]。该类方法多忽略前背景差异,可能导致增强结果不均衡。3)基于深度学习的方法利用神经网络建模退化图像与增强图像间的映射关系,具备强大的特征提取和泛化能力。代表性工作如Qi等[63]提出融合语义注意力与多尺度感知的增强网络,Wang等[64]则引入大模型技术提升图像视觉质量。Peng 等[65]构建了多色彩空间 Transformer,以增强颜色和细节的恢复能力;Wang 等[66]通过强化学习优化物理模型,实现了自适应的水下图像增强。Li 等[67]提出了对比学习框架,通过融合多参考图像提升增强的鲁棒性;同样,Li 等[68]还引入物理感知 Swin Transformer以进一步提升视觉质量。总体来看,此类方法通常依赖大规模标注数据,泛化至新场景时仍存在挑战。

    3.1.3   信号降噪

    由于光、无线电等电磁波在水中衰减迅速,声波(声呐)是水下远距离探测的主要手段。因此,水下信号降噪的典型场景多集中在声学信号处理,如消除海洋环境噪声,包括波浪噪声、海洋生物发声以及船只干扰等[17,73];针对声波反射造成的信号重叠问题,抑制混响效应[69,80];从复杂背景中提取有效信号,如舰船、潜艇或海洋生物的特定发声等[81-82]

    现有水声信号去噪方法主要分为传统信号处理与深度学习两类。传统方法包括稀疏字典学习[83]、经验模态分解与小波阈值结合[84],以及优化二次分解与原始分量处理方法[85]等,具有计算高效,适用于实时场景的优势,但对复杂噪声的适应性有限,且依赖人工干预。深度学习方法可进一步分为3类:1)基于波形的方法:直接在时域处理信号,具备对复杂噪声的鲁棒性。例如,Zhang等[69]采用深度双向长短期记忆网络实现水声源分离,Luo等[70]基于卷积神经网络进行时间域语音分离。Tang等[71]构建复杂卷积双分支多尺度注意力网络,在极低信噪比条件下对水声信号的高鲁棒性去噪。Veluri等[72]提出Waveformer架构,将膨胀因果卷积与Transformer解码器结合,实现实时流式目标声信号提取。该类方法虽然效果优越,但计算成本高、依赖大量训练数据。2)基于频谱的方法:通过频谱建模提升去噪效果,适用于频率特征变化明显的场景。如Zhou等[17]提出噪声感知模型识别和消除环境噪声。Ashraf等[73]利用生成对抗网络生成纯净音频,去除海洋环境中的背景噪声。Tang等[74]提出TFTNet,融合频域与时域优势提升语音增强性能。Yang等[75]利用Transformer建模频率结构,实现频域特征精细建模与语音分离。Li等[76]提出频带感知注意力的U形Transformer,优化不同频带的差异化建模。然而,其对时序建模能力较弱,处理动态信号存在局限。3)识别引导的去噪方法:将去噪与识别任务联合优化,提升识别性能。例如,Zhou等[77]提出了一种去噪表示框架,通过优化去噪过程来提高水声信号的识别性能。Zhu等[78]设计的RGDNet通过特定模块实现去噪和识别任务协同,显著提高了去噪效果和识别准确性。Chen等[79]结合噪声包络调制检测(detection of envelope modulation on noise,DEMON)谱与Mel谱图及Swin Transformer,提升船舶噪声分类与去噪性能。尽管能显著提升性能,但网络结构复杂、训练难度较高。相关技术对比如表1所示。

    3.2.1   多源多模态数据融合

    多源多模态数据融合在水下环境中面临数据质量差、模态缺失等挑战,限制了信息整合与系统性能。为提升融合效果与系统鲁棒性,研究者围绕数据噪声与模态缺失两大核心问题开展了系统研究,相关技术对比如表2所示。

    表  2  多源多模态数据融合方法对比
    Table  2  Comparative study of multi-source and multi-modal data fusion methods
    研究维度 具体技术 核心原理 优势 局限性
    含噪多模
    态数据
    特定模态噪声处理[18,86] 针对单模态特性去噪 利用模态特征提升单模态质量 难处理模态间语义冲突
    跨模态噪声处理[87-89] 建模模态间误差与冲突 跨模态对齐;语义建模;适应不良对齐 复杂度高;计算量大
    模态缺失
    数据
    基于填充方法[90-92] 生成/恢复缺失模态 充分利用现有模态补全缺失信息 依赖填充质量;
    可能引入噪声
    基于非填充方法[93-95] 直接利用可用模态 结构简洁;高效;适应性强 无法利用缺失信息

    含噪多模态数据 根据噪声来源,可分为模态特定与跨模态两类处理策略。1)特定模态噪声处理针对每个模态的特性设计去噪方法。如Kumar等[18]采用总变分方法联合实现融合与去噪;Liu等[86]构建两阶段增强框架,引入结构自适应总变分与L1稀疏正则提取细节层和基础层,提升融合质量。这类方法利用模态自身特征应对传感器或环境噪声,能显著提升单模态质量,但难以处理模态间的语义冲突。2)跨模态噪声处理则关注模态对齐不佳或语义不一致引入的干扰。如Huang等[87]提出了一种名为NCR(noisy correspondence rectifier)的方法,基于记忆机制划分干净与噪声子集,自适应修正预测。NLIP采用噪声自适应正则与跨模态解码生成合成字幕,缓解图文对中的语义缺失[88]。Wang 等[89]进一步提出基于非对称相似性学习的噪声对齐机制,提升图像−文本匹配任务下的抗噪能力。这类方法能建模模态间关系、识别语义级噪声,适用于对齐不良场景,但往往模型复杂、计算开销较大。

    模态缺失数据 根据是否进行模态补全可分为:1)基于填充的方法通过生成或恢复缺失模态以补足信息。如RecFormer采用两阶段自编码结构提取高级语义并恢复数据,显著提升聚类性能[90]。Yin 等[91]基于双预测策略恢复缺失数据,并通过多层次对比学习优化聚类效果。Wang 等[92]结合特征级、数据级与重构级多层插补策略及对比对齐机制,有效提升多视图聚类性能。这类方法适用于模态缺失严重情况,能充分利用现有模态辅助重建,但填充数据质量对最终融合效果影响较大。2)基于非填充的方法则避免补全过程潜在噪声,直接依赖可用模态进行建模。如PMVC通过矩阵分解将双模态编码到统一潜在空间[93];IMG进一步引入图约束提升结构建模能力[94]。Liu [95]等融合标签驱动的多视图对比学习与质量感知子网络,直接从可用模态中提取判别性表示,有效适应不完全视图场景。这类方法结构简洁、计算高效,但无法挖掘缺失模态中的潜在信息。

    3.2.2   资源受限下模型高效计算与推理

    在水下群体智能系统中,智能计算层作为核心,需在极端受限的资源条件下实现高效计算与推理。受限于计算能力、能耗约束及通信带宽,传统大规模模型难以直接部署于水下环境。因此,发展轻量化、高效、低功耗的智能计算机制成为关键。当前研究主要聚焦于模型设计、硬件架构与协同推理3个方面,相关技术对比如表3所示。

    表  3  资源受限环境下的高效计算与推理方法对比
    Table  3  Comparison of efficient computing and inference methods in resource-constrained environments
    研究维度 具体技术 核心原理 优势 局限性
    模型设计 模型压缩[19,96-99] 量化/剪枝减少参数量 体积小、计算负担低 需精细设计,可能损失精度
    特征压缩[100-104] 降维/降精度减小传输成本 不改动模型、通信高效 特征表达能力可能下降
    轻量化设计[105-107] 重构网络结构优化效率 性能与效率平衡 架构设计复杂
    硬件架构 端侧加速[108-110] 软硬件协同优化推理速度 高效实时响应 定制成本高
    硬件感知优化[111-114] 针对硬件调整模型结构 能效比高 平台依赖性强
    协同推理 联邦学习[115-119] 分布式训练保护隐私 数据隐私、泛化能力 通信开销大
    知识蒸馏[120-124] 大模型指导小模型训练 高精度、低开销 依赖教师模型质量

    模型设计层面 研究者主要通过模型压缩、特征压缩和轻量化结构优化提升推理效率。1)模型压缩:采用量化、剪枝等技术减少模型体积与计算复杂度,在保持精度的同时提升推理效率。如Wang等[19]提出硬件感知的自动量化方法,结合混合精度提升推理效率;Yang等[96]引入能量感知的剪枝方法优化卷积神经网络的能效;Dikstein等[97]借助合成数据实现后训练量化优化;Gong等[98]提出Q-Limit框架,利用块重建与激活量化噪声注入将量化精度提升至2位;Lin等[99]通过激活感知权重量化与通道缩放,实现高效低比特量化。尽管这类方法能够显著压缩模型规模,但通常需在压缩率与精度之间进行权衡。2)特征压缩:此类方法通过压缩中间特征降低传输与存储负担,如Eshratifar 等[100]提出BottleNet架构提升移动云计算服务的能效;Shao等[101]进一步提出端到端BottleNet++用于设备边缘协同推理;Ahn等[102]提出边缘分布式推理加速框架ScissionLite,通过轻量级下采样/上采样网络压缩特征;Yuan等[103]则根据带宽动态调整特征压缩率;Qi等[104]联合优化压缩版本与切分点以平衡推理精度与延迟。然而,过度压缩可能引入信息损失,从而影响模型性能。3)轻量化设计:通过优化模型结构以适配低资源环境,如模型MobileNets通过深度可分离卷积实现高效设计[105];Hsu等[106]利用MONAS框架进行多目标神经架构搜索(neural architecture search,NAS);Cortês等[107]提出ENERGIZE框架,利用神经进化训练节能模型。然而,模型架构优化过程通常较为复杂,需要在性能、能耗与设计难度之间进行综合权衡。

    硬件架构层面 研究者主要围绕端侧加速与硬件感知模型优化展开探索。1)端侧加速:通过软硬件协同设计提升推理效率,如Ponzina等[108]设计了协同优化系统以提升边缘设备性能;Jiang等[109]通过联合优化硬件与网络结构加速推理;Feng等[110]基于异构智能体搜索优化DNN加速器。然而,该类方法通常需要对硬件进行定制,开发成本相对较高。2)硬件感知优化:通过匹配模型与硬件特性提高效率。如Wang等[111]提出能量感知的神经架构优化方法;Benmeziane等[112]综述了硬件感知NAS的研究进展;Wulfert等[113]提出AIfES框架,集成模块化设计与硬件加速器提升推理性能;Ragusa等[114]结合压缩感知与硬件感知NAS优化低功耗微控制器上的诊断任务。该类方法虽具备较大的效率提升潜力,但依赖对硬件特性的深入理解,整体优化过程较为复杂。

    协同推理层面 研究者主要聚焦于联邦学习与知识蒸馏等机制,以实现分布式、高效的智能推理。1)联邦学习:在保障数据隐私的前提下进行分布式训练模型。如McMahan 等[115]提出通信高效的联邦学习方案;Wang 等[116]提出了自适应联邦学习框架以提升资源受限系统性能;Lin等[117]设计HSFL框架,优化模型切分与聚合以降低通信开销;Zhou等[118]通过分组和异步聚合提升智能交通系统训练效率;Ren等[119]提出基于深度强化学习的聚合频率与边缘资源联合优化方法。尽管联邦学习具备隐私保护优势,但其通信成本较高,仍亟需在效率与鲁棒性方面进一步优化。2)知识蒸馏:以大模型为教师训练小模型,从而实现轻量化。如Romero等[120]通过教师网络的中间层特征蒸馏提升学生模型表现;Dennis等[121]采用渐进式集成蒸馏提升推理效率;Li等[122]通过跨光谱−空间知识蒸馏实现高光谱图像分类的终身学习;Wang 等[123]通过在同类内进行知识蒸馏减少预测偏差;Yang 等[124]引入信息解耦和反向信息传递以提升合成孔径雷达目标检测性能。该类方法虽能有效压缩模型规模,但通常依赖高性能教师模型,且蒸馏过程设计复杂、调优成本较高。

    综上,资源受限环境下的高效计算与推理已成为水下群体智能系统发展的关键挑战。围绕模型设计、硬件架构与协同推理3个层面,现有研究在提升模型效率、降低计算与通信成本方面已取得显著进展。模型压缩与轻量化结构优化有效减少了模型负载,硬件感知设计实现了软硬协同的性能增强,而协同推理机制则通过分布式智能进一步释放设备潜力。未来研究仍需在性能、能耗、通信与系统复杂性之间寻求更优折中,以构建更加鲁棒、高效且可部署的智能计算方案。

    3.3.1   协同定位

    在水下群体智能系统中,协同定位旨在于无全球定位系统(global positioning system, GPS)环境下,依托智能体间的测距、方位或轨迹信息,实现全局或局部的空间位置估计。作为系统空间认知的基础环节,它为协同感知与路径规划提供了关键支撑。现有方法大致可归为基于几何约束、滤波推理与优化推断3类。

    基于几何约束的方法 通过声学时间测距,如到达时间(time of arrival,TOA)、到达时间差(time difference of arrival,TDOA),以及方向感知,如到达角(angle of arrival,AOA),构建节点间几何关系,借助单一或少量参考节点实现全网定位。如Zhang 等[125]将Taylor级数最小二乘法拓展至融合AOA测量,在非视距环境下实现混合定位。Chen 等[126]设计动态传感器选择策略,以提升单目标跟踪中的观测效率。Jiang 等[10]提出基于时间差通信的协同定位模型与优化算法,解决锚点缺失与异步误差问题。Kim 等[127]构建基于TOA-AOA混合测量的广度优先3D定位框架,实现异构节点在随机DoS攻击下的稳健定位。Wang等[128]提出基于DDQN的协同路径规划框架,通过几何投影约束持续抑制多自动化水下航行器(autonomous underwater vehicle,AUV)的定位误差。此类方法结构直观、物理可解释性强,适用于静态或弱动态场景,但对测距与角度感知精度依赖较高,易受噪声、遮挡与网络拓扑限制的影响。

    基于滤波推理的方法 将协同定位建模为状态估计问题,利用扩展卡尔曼滤波(extended Kalman filter,EKF)、粒子滤波或其分布式变体在节点间迭代融合观测信息。如Battistelli 等[129]提出融合局部概率密度函数的分布式EKF方法,有效提升多智能体系统中的状态估计精度。Hung 等[130]结合距离观测与控制律,设计分布式EKF与协同跟踪策略,维持最优构型下的多AUV协同定位与追踪。Sui 等[131]基于单目视觉与自适应估计器设计无偏目标定位与绕行控制策略,结合EKF思想实现实时状态估计与路径引导。Liu等[132]结合EKF与神经网络,实现GPS缺失环境下未知机动目标的协同滤波定位与环绕控制,并针对多非合作目标,基于FWNN预测中心位移结合EKF实现双AUV协同滤波定位[133]。Li等[134]提出基于粒子表示的IMM-EKF框架,仅用AOA测量在多AUV网络中实现强机动目标的分布式协同定位与跟踪。此类方法具备良好的动态适应性与分布式扩展性,适用于动态环境下的协同任务,但对初始状态与通信拓扑稳定性较敏感,易受观测缺失与噪声干扰影响。

    基于优化推断的方法 则将定位问题转化为约束优化模型,常通过加权最小二乘、约束最小二乘等手段迭代求解高精度解。如Huang等[11]提出融合视觉、惯性与声学信息的紧耦合优化方法,显著提升水下机器人的自主定位精度。Thoms 等[135]设计基于图优化的多普勒速度计(Doppler velocity log,DVL)/惯性测量单元(inertial measurement unit,IMU)融合框架,结合图构建过程提升同时定位与地图构建(simultaneous localization and mapping,SLAM)定位鲁棒性。Wang 等[20]构建多智能体强化学习算法与分层SDN架构,联合优化多AUV协同定位与多目标跟踪性能。该类方法精度高、适应性强,适用于多源信息融合与精确定位任务,但计算资源需求大,依赖先验参数与合理初值,难以在资源受限节点上实时部署。

    3.3.2   协同拓扑控制

    在获得位置信息后,协同拓扑控制关注智能体间连接关系的管理,以保证网络的连通性、信息覆盖和任务效率。该机制不仅调控通信拓扑,还可引导节点位置调整,兼顾通信约束与任务需求。现有研究主要从功率、通信状态和节点位置3个方面展开,具体方法如下:

    功率感知型拓扑控制 通过为节点分配适当的发射功率,调整通信链路,从而优化网络拓扑与性能。如Su等[136]提出UPC-MAC协议,通过功率和速率自适应提升空间复用。Bai 等[137]设计了基于功率控制的冲突避免链路调度方法,确保高吞吐量与低延迟。Gou 等[12]利用深度强化学习优化功率分配,提升网络鲁棒性与公平性。Zhang 等[138]提出的UDARMF框架通过功率控制优化网络容量与并发性。Zhao 等[139]基于功率调整设计了拓扑恢复策略,以保持网络连通性。Shin等[140]研究水下光通信中的波束角和功率联合优化,采用两阶段深度强化学习算法,在保证信噪比的同时动态调整功率与发散角,实现节能通信。这些方法实现相对简单、具有良好可扩展性和节能优势,但可能降低网络连通性并增加端到端时延。

    接口休眠调度型拓扑控制 通过管理节点的无线通信接口(如在活动、休眠、关闭模式间切换)改变节点间连接,主要目标是节能。如Li 等[141]设计了低功耗值班电路和唤醒系统来控制水声调制解调器。Coutinho 等[142]提出的模型通过动态调整节点睡眠间隔来优化能量消耗。这种方法易于实现、具有良好可扩展性,但可能频繁改变路由路径,导致数据传输时延增加。

    移动驱动型拓扑控制 通过主动移动部分节点优化网络性能,如连通性与数据收集效率。如Gjanci 等[13]提出通过AUV路径规划优化信息收集的价值。Hou 等[143]通过优化 AUV 的移动路径来改善多层级水下计算框架中的网络拓扑,以提高网络性能。Xu 等[144]通过训练 UUV 的智能决策来优化其移动路径,改善网络拓扑以完成追逐任务。Luo 等[145]提出的聚类路由方法优化网络拓扑,提高网络性能。Fan等[146]提出AUV协同波束成形定位方案,利用深度强化学习优化AUV锚节点位置,在保障隐私的同时提升定位精度。这类方法能显著改善连通性、处理网络分区问题,但需要额外的轨迹规划,且移动过程消耗能量,可能影响感知覆盖范围。

    3.3.3   协同路径规划

    在感知与通信结构的支持下,协同路径规划引导多智能体在任务空间中进行高效协同运动,需综合考虑能耗、通信、障碍规避及目标达成等因素,实现复杂环境中的动态、分布式路径决策。现有研究主要从全局优化、自适应学习、分布式控制3个角度展开。

    全局优化方法 通过数学模型或智能算法求解最优路径,适用于静态或已知环境。如Wan等[147]提出改进多目标粒子群优化算法优化路径长度与威胁等级。Huang等[148]结合鲸鱼优化与区间数理论提高搜索效率。采样优化方法,如A-star算法(A*)、快速扩展随机树(rapidly-exploring random tree star,RRT*),也被广泛应用。Zhou等[149]结合A*和RRT*实现无人机高效路径规划。Yu等[150]提出圆柱形启发式RRT*,减少无效搜索。Hu等[14]通过动态竞争机制和半闭环优化显著提升了多AUV系统的任务分配与路径规划效率。这些方法具有较强的全局优化能力,但计算需求较高,实时性受限。

    自适应学习方法 通过强化学习或神经网络动态调整路径策略,适应变化的环境。如Xi等[151]结合D3QN框架优化AUV路径规划。Wang等[152]基于PPO算法实现多AUV协同任务调度。Chen[153]提出基于动态神经网络模型的路径优化方法。Zhu等[15]结合生物启发神经网络优化UUV目标分配与路径规划。Xu等[154]研究复杂海洋环境下的多AUV追逃博弈,提出基于离线强化学习与决策变换器的训练框架,实现高效路径规划与策略生成。Han等[155]利用参数化深度Q网络(PDQN)解决多目标节点路径规划问题,实现AUV精确的加减速控制。Zhang等[156]设计多AUV协同水下物联网数据收集系统,采用多智能体强化学习在平衡效率、能耗与时效性间进行路径规划。此类方法具备强鲁棒性与泛化能力,但依赖高质量训练数据,存在收敛慢与泛化不稳定的问题。

    分布式控制方法 通过分布式控制策略(如势场法、一致性算法)实现多智能体编队运动,适合实时避障与协调。如Pan等[157]改进人工势场法,引入旋转势场避免局部极小值。Pang等[158]结合距离和速度信息,优化多智能体避障。Wu等[159]结合PSO和一致性算法生成编队路径。Yan等[21]提出分布式滑模控制增强AUV编队稳定性。Zhang 等[160]提出基于共识−麻雀搜索算法(sparrow search algorithm,SSA)的AUV编队路径规划,通过改进的 SSA 算法与人工势场机制确保避障与编队控制。Dai等[161]设计多机器鱼系统分布式队形控制框架,结合一致性控制律与事件触发通信机制驱动群体保持预定队形。这些方法通信开销低、响应快,适用于在线任务执行,但难以保证全局最优,且对网络同步与系统建模有较高要求。

    综上所述,协同定位为协同拓扑控制提供空间感知,拓扑控制为路径规划构建网络保障,而路径规划的执行反过来影响智能体间的相对位置与连接状态。三者共同构成“感知—连接—决策”的协同闭环,是支撑水下群体智能运行的关键机制,相关技术对比如表4所示。

    表  4  水下群体智能协同机制对比
    Table  4  Comparison of coordination mechanisms in underwater crowd intelligence
    协同机制 具体技术 核心原理 优势 局限性
    协同定位 几何约束法[125-128] 声学测距+方向感知构建几何关系 直观、静态适用 依赖高精度感知,抗干扰差
    滤波推理法[129-134] EKF/粒子滤波融合观测 动态适应性强 需稳定拓扑,初始敏感
    优化推断法[11,135,20] 多源数据约束优化求解 精度高,复杂环境适用 计算量大,实时性差
    拓扑控制 功率调节[136-137,12,138-140] 动态调整发射功率 节能高效 可能降低连通性
    休眠调度[141-142] 节点休眠/唤醒管理 能耗极低 时延波动大
    移动驱动[13,143-146] 主动节点位置调整以优化网络 性能提升显著 移动能耗高
    路径规划 全局优化[147-150,14] 基于数学模型求静态最优解 理论最优 计算复杂,动态环境适应差
    自适应学习[151-156] 强化学习/神经网络在线适应 鲁棒性强 需大量训练数据
    分布式控制[157-159,21,160-161] 势场法/一致性算法实时编队与避障 响应快,通信低 易陷局部最优

    水下群体智能面临声学通信带宽窄、延迟高、误码率高等挑战,亟需发展兼顾通信效率与计算能力的协同计算范式。本节将从信息处理架构与资源优化配置等方面探讨技术突破路径。

    4.1.1   多维度信息编码与融合

    在通信受限条件下,智能体间高效共享关键信息是协同计算的核心问题。已有研究聚焦多模态信息的压缩编码与融合。Xia等[162]提出基于多传感器融合的可穿戴系统,整合IMU、视觉与声呐数据,实现水下环境的高维感知与信息传递;Lin等[163]开发TIDE模型,结合布局与模态互补性,生成高一致性的图像及其密集注释,缓解水下数据稀缺问题;Zha等[164]提出HEHP方法,通过RGB-深度解耦学习与层次引导融合,实现精细的水下显著目标检测与高效计算。

    未来研究应面向水下稀疏、高噪声、异构数据,引入基于大模型的多模态信息统一表征与智能编码机制,包括高效量化、压缩感知及跨模态语义关联挖掘,实现信息超高压缩与高保真重建,在极端通信受限下最大化信息传输效率、最小化延迟,为水下无人集群提供精炼、准确的态势感知。

    4.1.2   通信−感知−计算一体化

    水下群体智能对系统的实时性、资源协同能力和整体自主决策能力提出了更高要求。传统分层架构难以满足动态环境下的高效响应,因此亟需构建通信、感知与计算的深度融合一体化架构,从系统级范式上提升整体效能和环境适应性。当前已有研究在地面和空中网络中初步探索一体化机制。例如,Wen等[165]提出基于空中计算的协同优化策略,从感知精度、通信资源与任务调度3个维度提升边缘AI系统的推理效率;Zhuang等[166]构建集成感知、通信与计算(integrated sensing, computation and communication,ISCC)框架,联合优化感知采样、波束成形与计算推理,实现资源约束下性能最优;Hua等[167]设计的ISAC(集成感知与通信)系统则在通信中心协同感知与通信,有效提升目标检测性能与资源利用率。

    未来工作应重构水下通信−感知−计算范式,超越简单功能集成,探索面向复杂水下介质(声、光、电磁)的跨介质协同机制,实现信息传输与环境探测的无缝一体化。同时,需要发展基于人工智能的自适应、一体化协议栈,使系统能够根据环境动态、任务需求和资源状态,自主优化各功能模块参数与策略。此外,将大模型与边缘智能计算深度融合,依托异构传感器网络实现协同感知,可实现从数据到认知的跨层跃迁,为水下群体智能系统在极端环境下提供实时决策、资源自管理和环境自适应的颠覆性能力。

    4.1.3   面向水下环境的边缘智能计算

    在节点级实现方面,水下环境信道受限、能耗敏感、计算资源紧张,传统边缘计算方法难以直接迁移。为应对这些约束,需要将智能处理能力下沉至靠近水下数据源的边缘节点,实现高效模型推理、低能耗本地决策和智能资源管理。已有研究初步探索了模型轻量化、通信优化等方面。例如Wang等[168]提出一种适用于水下AUV的轻量化联邦学习框架,结合模型剪枝与梯度量化策略,在通信受限条件下实现高效在线学习。Cao等[169]设计轻量级网络DNnet,有效支撑边缘设备下4K分辨率图像的实时增强。Wu等[170]则开发EffiSeaNet网络,采用参数无关图像增强与跨层特征融合技术,实现低算力条件下的高质量水下目标检测。

    未来研究应聚焦构建超低功耗、高鲁棒性的水下边缘智能平台,发展适应动态拓扑和间歇通信的自适应联邦学习与协同推理框架。这包括探索事件驱动的计算调度机制,结合硬件加速(如类脑计算、存算一体)与轻量化AI模型(如蒸馏、剪枝、量化大模型),实现极度受限资源下的高效、低延迟智能决策。同时,应重点解决水下边缘AI模型的在线自适应更新与安全保障问题,确保水下无人集群在长期自主作业中的持续学习能力与数据隐私安全。

    随着水下作业场景的日益复杂化,如海洋牧场监测和海底管道巡检,传统的单一集群已无法满足需求。因此,构建空−海−潜跨介质协同的异构智能系统成为关键。该领域面临三大核心科学问题:1)异构模态数据的统一理解,2)非对称资源约束下的动态调度,3)人类先验知识与机器自主性的融合。图4给出了一个用于执行复杂任务的跨域异构集群智能决策的示意图。

    图  4  跨域异构集群智能决策示意图
    Fig.  4  Cross-domain heterogeneous cluster intelligent decision-making architecture
    下载: 全尺寸图片
    4.2.1   多层次跨时空的统一表征感知模型

    水下智能体面临多样化的感知需求与任务,实现跨时间与空间维度的协同尤为关键。相关研究在多个领域已有探索,如ViewFormer框架通过视图引导的变换器实现时空建模,提升了3D占用和流预测性能[171]。Zou等[172]提出的NuwaDynamics框架通过因果时空建模,增强了极端事件下的预测能力。Qiu等[173]开发的Spateo框架,在基因组学领域,通过多层次建模揭示胚胎发育的时空动态。

    未来研究应聚焦于构建面向不确定水下环境的多层次、跨时空统一表征感知模型。这不仅要求突破单一传感器或物理场的限制,还需探索如何利用多模态大模型、时空图神经网络等技术,智能融合声学、光学、惯性、化学等异构传感数据,并结合因果推理,实现对水下环境(如复杂洋流、生物活动、地形地貌)的精确建模、实时预测与异常识别。核心挑战在于破解水下多物理场耦合带来的复杂性,维持动态基准的智能更新,并在此基础上支撑水下无人集群的协作感知与精准决策,从而实现从“数据”到“态势”再到“预测”的认知闭环。

    4.2.2   多域异构平台的资源调度与任务分解

    水下群体智能系统由多种异构平台(如传感器、AUV、机器人)组成,如何在这些平台间实现高效的资源调度和任务分解,决定了系统的运行效率。已有少量研究关注该问题,如Li等[174]提出了一种基于深度强化学习的自适应网络切片方案,通过调整切片时间窗口优化无人机辅助边缘计算中的任务卸载;Ma等[175]提出了一个边缘云计算中的资源交易与任务调度框架,优化了计算资源利用效率;Zhang等[176]研究了异构移动边缘计算中的任务卸载与资源分配问题,提出两阶段交替优化算法降低了系统成本。

    在此基础上,未来水下群体智能的资源管理与任务分配将面临更复杂挑战,亟需构建基于大模型与多智能体强化学习的跨域异构资源智能调度与任务自组织分解框架,以突破传统优化算法的局限。通过生成式AI与因果推理,结合水下、水面与空中不同域智能体的异构能力、动态资源状态和复杂任务目标,可实现计算、通信、能源和载荷的实时匹配、任务的自适应重构以及系统的故障自愈。特别是水下无人集群内部,需重点发展智能载荷适配与精细化调度机制,根据任务需求与环境感知(如水文条件、目标特性),动态优化声呐模式、光学参数、传感器采样频率等配置,以提升数据质量与任务效率并降低能耗。同时,应探索基于深度强化学习和多目标优化的调度算法,解决计算单元、通信带宽、能源存储等异构资源的动态分配问题。例如,根据任务优先级、链路质量与电量状态,智能分配计算任务并调整通信策略,实现资源的全生命周期管理。核心挑战在于如何实现跨域异构数据与能力的统一建模,并在高度不确定性环境下赋予系统自主、鲁棒与高效的协作决策能力。

    4.2.3   人在回路的融合决策

    尽管水下群体智能系统的决策主要依赖智能体间的协作,人的决策仍然是不可忽视的因素,尤其在复杂、危险或不可预测的环境下。如何有效地将人类决策融入系统,并通过人机协作提升决策质量和效率,仍是一个亟待解决的问题。现有研究已在自动驾驶和智能制造领域取得初步成果。例如,Liu等[177]提出通过多阶段Transformer编码器建模交通参与者间的交互与意图,并通过强化学习增强决策能力,提高自动驾驶系统的样本效率与性能。Zhai等[178]结合视觉语言模型与强化学习,显著提升了多步目标导向任务中的决策能力,优化了任务完成的策略。Chen等[179]则从人本视角综述了智能制造中的人在回路机器人学习,提出了一个涵盖感知、认知、行为和共情等多方面的人类智能统一框架,并探讨了在制造场景中的应用。

    未来研究应致力于发展基于可解释AI与大模型的人机共融决策范式,构建能够理解、学习并反思人类专家经验的智能决策支持系统,实现人类的直觉、经验与机器智能的推理、优化能力的有机结合。核心在于实现人机意图的智能对齐,通过可解释AI增强人类对机器决策的信任度与可控性,从而在水下复杂环境和高风险任务中,形成更安全、高效且具韧性的人机协同决策闭环,推动水下群体智能系统向类人智能演进。

    水下群体智能技术已在多类典型任务场景中得到应用,其代表性的应用形态与任务类型如图5所示,主要涵盖海洋资源勘探、水下环境监测与污染评估以及安防与军事侦察等方向。

    图  5  典型的水下群体智能应用
    Fig.  5  Typical applications of underwater crowd intelligence
    下载: 全尺寸图片

    在海洋资源勘探领域,群体智能技术的应用展现了巨大的潜力。通过多智能体协同作业,水下机器人系统能够显著提升深海矿产、能源及生物资源的勘探效率与精度。集群作业方式使得系统能够实现大范围同步探测、高精度数据采集及实时信息共享,为深海资源评估与开发提供了强有力的技术支撑。近年来,我国在该领域的研究与应用取得了显著进展。例如,中国科学院沈阳自动化研究所在2017年首次采用多台“海翼”水下滑翔机开展协同观测任务,为我国深海环境精细探测开辟了新局面。此外,中国科学院沈阳自动化研究所等单位研制的“潜龙”系列AUV在深海矿产资源勘探方面也表现突出,填补了我国在深海资源自主勘查技术方面的空白。随着自主决策、智能避障等关键技术的不断突破,水下机器人集群将在深海矿区圈定、资源储量评估等场景中发挥更大作用,为人类可持续开发利用海洋资源提供智能化解决方案。

    水下群体智能技术在环境监测与污染评估方面的优势同样突出。凭借其分布式感知、协同作业和长时续航能力,水下集群能够高效获取大范围、多参数的水环境数据,进而为海洋生态保护、污染溯源及灾害预警提供有力支撑。一个典型的案例是2016年中国船舶科学研究中心研发的“海翔”号水下滑翔器系列,成功实现了编队组网作业,完成了约112 km2海域的高精度环境调查。该集群同步采集了温度、盐度、溶解氧等关键环境参数,为海洋生态研究与污染评估提供了可靠的数据支持。未来,随着智能感知、自适应组网和边缘计算技术的不断进步,水下群体智能系统将在赤潮预警、溢油追踪等领域发挥更大作用,为全球海洋环境保护和可持续发展提供智能化解决方案。

    在安防与军事侦察任务中,水下群体智能技术的应用正迅速发展并展现出巨大潜力。该技术通过分布式协同、自主决策和隐蔽性等特点,能够在复杂水域中提供高效的态势感知、目标追踪和情报搜集方案。随着无人集群技术的不断集成与验证,各国军方正在推动水下智能系统走向实战化。2024年,美国海军开展了“沉默蜂群2024”无人技术测试。此次测试中,无人侦察艇伪装成货运商队,并在接近敌方兵力集结区域或重要基地港口时投放大量UUV。这些侦察艇通过集装箱式侦察与通信设备与UUV协同工作,构建了通信中继和态势感知网络,全面实现情报搜集与实时数据回传。通过无人侦察艇与UUV的协作,形成了强大的水下情报网络,显著提升了侦察效率,并增强了战场透明度。随着自主协同算法、隐蔽通信技术及数据处理能力的不断突破,未来水下智能集群将在反潜作战、水雷排查、关键设施防护等领域发挥更大作用,成为现代海上防御体系中不可或缺的核心组成部分。

    水下群体智能作为融合多智能体系统、水声通信与环境感知的交叉研究领域,其技术演进大致经历了3个阶段:初期阶段以单节点功能构建为核心,感知、通信与控制相对独立,智能水平有限。中期阶段开始注重多节点协同,强调任务分工与决策协同,显著提升了系统在复杂任务中的适应性与扩展性。当前阶段受益于边缘计算与人工智能的推动,感知、通信与计算逐步融合。系统架构呈现高度耦合与自治化,具备更强的自适应调度能力与局部容错能力。总体来看,水下群体智能正处于由局部功能增强向系统智能演化的转型期。其核心特征包括体系结构的协同优化、行为策略的联合学习以及运行机制的自适应演进。这些特征为构建具备自主协同、稳健运行和持续学习能力的下一代水下智能系统奠定了坚实基础。

    人工智能的发展为水下系统注入了新的计算范式,自监督学习、多智能体强化学习等方法正在推动智能体由规则驱动向数据驱动演进,在低带宽、高动态环境中展现出更强的泛化性与自适应能力。同时,仿生学与海洋生物学的融入为系统设计带来新思路。通过模拟自然群体的协同行为,有望催生低通信依赖、高鲁棒性的分布式协同机制。此外,软硬件一体化设计、绿色计算理念和跨尺度建模方法的引入,正重塑系统的资源配置与调度逻辑,为高效、可持续的水下协同系统提供有力支撑。未来,水下群体智能的发展需要从跨技术融合走向跨领域协同。多学科联合攻关、系统级测试平台建设及标准协议体系的建立,将推动异构平台间的互联互通与能力迁移。多学科的深度融合将成为持续突破的核心动力,为构建具备自主学习、稳健协同和长期适应能力的水下智能系统指明方向。

  • 图  1   群体智能技术里程碑

    Fig.  1   Milestones in crowd intelligence technology

    下载: 全尺寸图片

    图  2   水下群体智能系统分层体系架构

    Fig.  2   Hierarchical architecture of underwater crowd intelligence systems

    下载: 全尺寸图片

    图  3   水下数据集Seatizen Atlas构建过程中的数据筛选与清洗操作

    Fig.  3   Data filtering and cleaning operations in the construction of the underwater dataset Seatizen Atlas

    下载: 全尺寸图片

    图  4   跨域异构集群智能决策示意图

    Fig.  4   Cross-domain heterogeneous cluster intelligent decision-making architecture

    下载: 全尺寸图片

    图  5   典型的水下群体智能应用

    Fig.  5   Typical applications of underwater crowd intelligence

    下载: 全尺寸图片

    表  1   水下数据预处理典型方法对比

    Table  1   Comparison of typical underwater data preprocessing methods

    方法类型 具体技术 核心原理 优势 局限性
    声信号增强 时域处理[16,53] 直接增强原始波形 保留时序特征 高频信息捕捉弱
    频域处理[54-55] 优化频谱图 精准增强特定频段 相位估计易失真
    时频融合[56-57] 联合时域/频域特征 综合性能最优 计算复杂度高
    图像增强 物理模型[58-59] 模拟水下光学特性 物理可解释性 依赖环境参数
    非物理模型[60-62] 直接调整像素分布 计算高效 全局一致性差
    深度学习[63-68] 端到端退化−增强映射 自适应能力强 需大量标注数据
    信号降噪 波形处理[69,70-72] 时域直接建模 鲁棒性强 计算成本高
    频谱处理[17,73,74-76] 频域特征增强 频域去噪效果好 时序建模弱
    识别引导[77-79] 去噪与识别协同 任务性能提升显著 网络结构复杂

    表  2   多源多模态数据融合方法对比

    Table  2   Comparative study of multi-source and multi-modal data fusion methods

    研究维度 具体技术 核心原理 优势 局限性
    含噪多模
    态数据
    特定模态噪声处理[18,86] 针对单模态特性去噪 利用模态特征提升单模态质量 难处理模态间语义冲突
    跨模态噪声处理[87-89] 建模模态间误差与冲突 跨模态对齐;语义建模;适应不良对齐 复杂度高;计算量大
    模态缺失
    数据
    基于填充方法[90-92] 生成/恢复缺失模态 充分利用现有模态补全缺失信息 依赖填充质量;
    可能引入噪声
    基于非填充方法[93-95] 直接利用可用模态 结构简洁;高效;适应性强 无法利用缺失信息

    表  3   资源受限环境下的高效计算与推理方法对比

    Table  3   Comparison of efficient computing and inference methods in resource-constrained environments

    研究维度 具体技术 核心原理 优势 局限性
    模型设计 模型压缩[19,96-99] 量化/剪枝减少参数量 体积小、计算负担低 需精细设计,可能损失精度
    特征压缩[100-104] 降维/降精度减小传输成本 不改动模型、通信高效 特征表达能力可能下降
    轻量化设计[105-107] 重构网络结构优化效率 性能与效率平衡 架构设计复杂
    硬件架构 端侧加速[108-110] 软硬件协同优化推理速度 高效实时响应 定制成本高
    硬件感知优化[111-114] 针对硬件调整模型结构 能效比高 平台依赖性强
    协同推理 联邦学习[115-119] 分布式训练保护隐私 数据隐私、泛化能力 通信开销大
    知识蒸馏[120-124] 大模型指导小模型训练 高精度、低开销 依赖教师模型质量

    表  4   水下群体智能协同机制对比

    Table  4   Comparison of coordination mechanisms in underwater crowd intelligence

    协同机制 具体技术 核心原理 优势 局限性
    协同定位 几何约束法[125-128] 声学测距+方向感知构建几何关系 直观、静态适用 依赖高精度感知,抗干扰差
    滤波推理法[129-134] EKF/粒子滤波融合观测 动态适应性强 需稳定拓扑,初始敏感
    优化推断法[11,135,20] 多源数据约束优化求解 精度高,复杂环境适用 计算量大,实时性差
    拓扑控制 功率调节[136-137,12,138-140] 动态调整发射功率 节能高效 可能降低连通性
    休眠调度[141-142] 节点休眠/唤醒管理 能耗极低 时延波动大
    移动驱动[13,143-146] 主动节点位置调整以优化网络 性能提升显著 移动能耗高
    路径规划 全局优化[147-150,14] 基于数学模型求静态最优解 理论最优 计算复杂,动态环境适应差
    自适应学习[151-156] 强化学习/神经网络在线适应 鲁棒性强 需大量训练数据
    分布式控制[157-159,21,160-161] 势场法/一致性算法实时编队与避障 响应快,通信低 易陷局部最优
  • [1] 陈健瑞, 王景璟, 侯向往, 等. 挺进深蓝: 从单体仿生到群体智能[J]. 电子学报, 2021, 49(12): 2458−2467.

    CHEN Jianrui, WANG Jingjing, HOU Xiangwang, et al. Advance into ocean: from bionic monomer to swarm intelligence[J]. Acta electronica sinica, 2021, 49(12): 2458−2467.
    [2] 柯冠岩, 吴涛, 李明, 等. 水下机器人发展现状和趋势[J]. 国防科技, 2013, 34(5): 44−47,6. doi: 10.3969/j.issn.1671-4547.2013.05.008

    KE Guanyan, WU Tao, LI Ming, et al. The improvements and trends of the unmanned underwater vehicles[J]. National defense technology, 2013, 34(5): 44−47,6. doi: 10.3969/j.issn.1671-4547.2013.05.008
    [3] 宋保维, 潘光, 张立川, 等. 自主水下航行器发展趋势及关键技术[J]. 中国舰船研究, 2022, 17(5): 27−44. doi: 10.19693/j.issn.1673-3185.02939

    SONG Baowei, PAN Guang, ZHANG Lichuan, et al. Development trend and key technologies of autonomous underwater vehicles[J]. Chinese journal of ship research, 2022, 17(5): 27−44. doi: 10.19693/j.issn.1673-3185.02939
    [4] 王凯朋, 孟祥尧, 滕月慧, 等. 海空跨域航行器流体动力特性研究[J]. 舰船科学技术, 2021, 43(19): 46−50. doi: 10.3404/j.issn.1672-7649.2021.10.011

    WANG Kaipeng, MENG Xiangyao, TENG Yuehui, et al. Study of aerodynamic and hydrodynamic characteristics for aerial underwater vehicle[J]. Ship science and technology, 2021, 43(19): 46−50. doi: 10.3404/j.issn.1672-7649.2021.10.011
    [5] 况阳, 顾颖闽. 基于几何力学的水面无人艇艇群控制技术[J]. 舰船科学技术, 2019, 41(12): 123−126.

    KUANG Yang, GU Yingmin. Control technology of USV group base on geometry mechanics[J]. Ship science and technology, 2019, 41(12): 123−126.
    [6] BONABEAU E, DORIGO M, THERAULAZ G. Swarm intelligence: from natural to artificial systems[M]. New York: Oxford University Press, 1999.
    [7] WANG Zhenning, CAO Yue, JIANG Kai, et al. When crowdsensing meets smart cities: a comprehensive survey and new perspectives[J]. IEEE communications surveys & tutorials, 2025, 27(2): 1101−1151. doi: 10.1109/COMST.2024.3400121
    [8] NGUYEN T H, JUNG J J. Swarm intelligence-based green optimization framework for sustainable transportation[J]. Sustainable cities and society, 2021, 71: 102947. doi: 10.1016/j.scs.2021.102947
    [9] TANG Jun, DUAN Haibin, LAO Songyang. Swarm intelligence algorithms for multiple unmanned aerial vehicles collaboration: a comprehensive review[J]. Artificial intelligence review, 2023, 56(5): 4295−4327. doi: 10.1007/s10462-022-10281-7
    [10] JIANG Liangyu, LI Yichen, YU Wenbin, et al. Cooperative localization for asynchronous AUVs using time difference of communication in underwater anchor-free environments[J]. IEEE transactions on cybernetics, 2024, 54(11): 6531−6544. doi: 10.1109/TCYB.2024.3447121
    [11] HUANG Yupei, LI Peng, MA Shaoxuan, et al. Visual-inertial-acoustic sensor fusion for accurate autonomous localization of underwater vehicles[J]. IEEE transactions on cybernetics, 2025, 55(2): 880−896. doi: 10.1109/TCYB.2024.3488077
    [12] GOU Yu, ZHANG Tong, LIU Jun, et al. Achieving fair-effective communications and robustness in underwater acoustic sensor networks: a semi-cooperative approach[J]. IEEE transactions on mobile computing, 2024, 23(5): 5722−5739. doi: 10.1109/TMC.2023.3310476
    [13] GJANCI P, PETRIOLI C, BASAGNI S, et al. Path finding for maximum value of information in multi-modal underwater wireless sensor networks[J]. IEEE transactions on mobile computing, 2018, 17(2): 404−418. doi: 10.1109/TMC.2017.2706689
    [14] HU Xinyu, CAO Zhe, CHEN Yanli. Dynamic task assignment and path optimization for multi-AUVs system[J]. IEEE transactions on intelligent transportation systems, 2025, 26(6): 8233−8246. doi: 10.1109/TITS.2025.3550415
    [15] ZHU Danjie, YANG S X. Current effect-eliminated optimal target assignment and motion planning for a multi-UUV system[J]. IEEE transactions on intelligent transportation systems, 2024, 25(8): 8419−8428. doi: 10.1109/TITS.2024.3351442
    [16] CONTINI M, ILLIEN V, JULIEN M, et al. Seatizen Atlas: a collaborative dataset of underwater and aerial marine imagery[J]. Scientific data, 2025, 12: 67. doi: 10.1038/s41597-024-04267-z
    [17] ZHOU Aolong, ZHANG Wen, LI Xiaoyong, et al. A novel noise-aware deep learning model for underwater acoustic denoising[J]. IEEE transactions on geoscience and remote sensing, 2023, 61: 4202813. doi: 10.1109/tgrs.2023.3254652
    [18] KUMAR M, DASS S. A total variation-based algorithm for pixel-level image fusion[J]. IEEE transactions on image processing, 2009, 18(9): 2137−2143. doi: 10.1109/TIP.2009.2025006
    [19] WANG Kuan, LIU Zhijian, LIN Yujun, et al. HAQ: hardware-aware automated quantization with mixed precision[C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE, 2020: 8604−8612.
    [20] WANG Shengbo, LIN Chuan, HAN Guangjie, et al. Multi-AUV cooperative underwater multi-target tracking based on dynamic-switching-enabled multi-agent reinforcement learning[J]. IEEE transactions on mobile computing, 2025, 24(5): 4296−4311. doi: 10.1109/TMC.2024.3521889
    [21] YAN Tao, XU Zhe, YANG S X. Consensus formation tracking for multiple AUV systems using distributed bioinspired sliding mode control[J]. IEEE transactions on intelligent vehicles, 2023, 8(2): 1081−1092. doi: 10.1109/TIV.2022.3175647
    [22] 邱志明, 孟祥尧, 马焱, 等. 海上无人系统发展及关键技术研究[J]. 中国工程科学, 2023, 25(3): 74−83. doi: 10.15302/J-SSCAE-2023.03.005

    QIU Zhiming, MENG Xiangyao, MA Yan, et al. Development and key technologies of maritime unmanned systems[J]. Strategic study of CAE, 2023, 25(3): 74−83. doi: 10.15302/J-SSCAE-2023.03.005
    [23] 闫敬, 关新平. 海上无人系统跨域集群发展现状及其关键技术[J]. 自动化学报, 2025, 51(4): 744−761. doi: 10.16383/j.aas.c240334

    YAN Jing, GUAN Xinping. Development status and key techniques for cross-domain swarm of maritime unmanned systems[J]. Acta automatica sinica, 2025, 51(4): 744−761. doi: 10.16383/j.aas.c240334
    [24] BENI G, WANG Jing. Swarm intelligence in cellular robotic systems[C]//Robots and Biological Systems: Towards a New Bionics? . Berlin: Springer, 1993: 703−712.
    [25] DORIGO M. Optimization, learning and natural algorithms[J]. Thesis, Politecnico di Milano, 1992.
    [26] KENNEDY J, EBERHART R. Particle swarm optimization[C]//Proceedings of ICNN'95 - International Conference on Neural Networks. Piscataway: IEEE, 2002: 1942−1948.
    [27] XIAO Limin. An optimizing method based on autonomous animats: fish-swarm algorithm[J]. Systems engineering-theory & practice, 2002, 22(11): 32−38.
    [28] 吴虎胜, 张凤鸣, 吴庐山. 一种新的群体智能算法——狼群算法[J]. 系统工程与电子技术, 2013, 35(11): 2430−2438.

    WU Husheng, ZHANG Fengming, WU Lushan. New swarm intelligence algorithm——wolf pack algorithm[J]. Systems engineering and electronics, 2013, 35(11): 2430−2438.
    [29] PUGH J, MARTINOLI A. Inspiring and modeling multi-robot search with particle swarm optimization[C]//2007 IEEE Swarm Intelligence Symposium. Piscataway: IEEE, 2007: 332−339.
    [30] WILSON S, PAVLIC T P, KUMAR G P, et al. Design of ant-inspired stochastic control policies for collective transport by robotic swarms[J]. Swarm intelligence, 2014, 8(4): 303−327. doi: 10.1007/s11721-014-0100-8
    [31] YANG Lidong, JIANG Jialin, GAO Xiaojie, et al. Autonomous environment-adaptive microrobot swarm navigation enabled by deep learning-based real-time distribution planning[J]. Nature machine intelligence, 2022, 4(5): 480−493. doi: 10.1038/s42256-022-00482-8
    [32] SONG Zhilong, FAN Linfeng, LU Shuaihua, et al. Inverse design of promising electrocatalysts for CO2 reduction via generative models and bird swarm algorithm[J]. Nature communications, 2025, 16: 1053. doi: 10.1038/s41467-024-55613-z
    [33] NITTI A, DE TULLIO M D, FEDERICO I, et al. A collective intelligence model for swarm robotics applications[J]. Nature communications, 2025, 16: 6572. doi: 10.1038/s41467-025-61985-7
    [34] ARBEL E, BUISE L, VAN WAES C, et al. A mechanical route for cooperative transport in autonomous robotic swarms[J]. Nature communications, 2025, 16: 7519. doi: 10.1038/s41467-025-61896-7
    [35] DENG Yong, ZHANG Yazhou, SHI Xianming. Refining swarm behaviors with human-swarm interaction strategies: an improved monkey algorithm for multidimensional optimization problems[J]. Scientific reports, 2025, 15: 31197. doi: 10.1038/s41598-025-12816-8
    [36] LUO Yi, LIU Yanmin, CHEN Jianjie, et al. Multi-objective particle swarm algorithm based on angular segmentation archive and dynamic update tactics[J]. Scientific reports, 2025, 15: 31012. doi: 10.1038/s41598-025-16539-8
    [37] PAN Yunhe. Heading toward artificial intelligence 2.0[J]. Engineering, 2016, 2(4): 409−413. doi: 10.1016/J.ENG.2016.04.018
    [38] 刘云浩. 群智感知计算[J]. 中国计算机学会通讯, 2012, 8(10): 38−41.

    LIU Yunhao. Crowd sensing and computing[J]. Communications of the China computer federation, 2012, 8(10): 38−41.
    [39] GUO Bin, WANG Zhu, YU Zhiwen, et al. Mobile crowd sensing and computing: the review of an emerging human-powered sensing paradigm[J]. ACM computing surveys, 2015, 48(1): 1−31.
    [40] YU Zhiwen, MA Huadong, GUO Bin, et al. Crowdsensing 2.0[J]. Communications of the ACM, 2021, 64(11): 76−80.
    [41] 郭斌, 於志文. 人机物融合群智计算[J]. 中国计算机学会通讯, 2021, 17(2): 36−41. doi: 10.16619/j.cnki.rmltxsqy.2020.13.004

    GUO Bin, YU Zhiwen. Crowd intelligence with the deep fusion of human, machine, and things[J]. Communications of the China computer federation, 2021, 17(2): 36−41. doi: 10.16619/j.cnki.rmltxsqy.2020.13.004
    [42] 梅宏, 曹东刚, 谢涛. 泛在操作系统: 面向人机物融合泛在计算的新蓝海[J]. 中国科学院院刊, 2022, 37(1): 30−37. doi: 10.16418/j.issn.1000-3045.20211117009

    MEI Hong, CAO Donggang, XIE Tao. Ubiquitous operating system: toward the blue ocean of human-cyber-physical ternary ubiquitous computing[J]. Bulletin of the Chinese academy of sciences, 2022, 37(1): 30−37. doi: 10.16418/j.issn.1000-3045.20211117009
    [43] LIU Yimeng, YU Zhiwen, CUI Helei, et al. SafeCity: a heterogeneous mobile crowd sensing system for urban public safety[J]. IEEE internet of things journal, 2023, 10(20): 18330−18345. doi: 10.1109/JIOT.2023.3279385
    [44] BLENDER T, BUCHNER T, FERNANDEZ B, et al. Managing a mobile agricultural robot swarm for a seeding task[C]//IECON 2016 - 42nd Annual Conference of the IEEE Industrial Electronics Society. Piscataway: IEEE, 2016: 6879−6886.
    [45] UTAMIMA A, SULASTRI M J, YUNIARTI L, et al. Optimizing multi-machine path planning for crop precision seeding with Lovebird Algorithm[J]. Computers and electronics in agriculture, 2025, 235: 110207. doi: 10.1016/j.compag.2025.110207
    [46] WANG Hao, LIU C H, DAI Zipeng, et al. Energy-efficient 3D vehicular crowdsourcing for disaster response by distributed deep reinforcement learning[C]//Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. New York: ACM, 2021: 3679−3687.
    [47] HAN Lei, TU Chunyu, YU Zhiwen, et al. Collaborative route planning of UAVs, workers, and cars for crowdsensing in disaster response[J]. IEEE/ACM transactions on networking, 2024, 32(4): 3606−3621. doi: 10.1109/TNET.2024.3395493
    [48] ZHANG Shuzhu, LEE C K M, CHAN H K, et al. Swarm intelligence applied in green logistics: a literature review[J]. Engineering applications of artificial intelligence, 2015, 37: 154−169. doi: 10.1016/j.engappai.2014.09.007
    [49] MATARAZZO T J, KONDOR D, MILARDO S, et al. Crowdsourcing bridge dynamic monitoring with smartphone vehicle trips[J]. Communications engineering, 2022, 1: 29. doi: 10.1038/s44172-022-00025-4
    [50] ZHOU Xin, WEN Xiangyong, WANG Zhepei, et al. Swarm of micro flying robots in the wild[J]. Science robotics, 2022, 7(66): eabm5954. doi: 10.1126/scirobotics.abm5954
    [51] ZHOU Boyu, XU Hao, SHEN Shaojie. RACER: rapid collaborative exploration with a decentralized multi-UAV system[J]. IEEE transactions on robotics, 2023, 39(3): 1816−1835. doi: 10.1109/TRO.2023.3236945
    [52] BAI Yang, TRAN NGOC P T, NGUYEN H D, et al. Swarm navigation of cyborg-insects in unknown obstructed soft terrain[J]. Nature communications, 2025, 16: 221. doi: 10.1038/s41467-024-55197-8
    [53] LING Zhenhua, AI Yang, GU Yu, et al. Waveform modeling and generation using hierarchical recurrent neural networks for speech bandwidth extension[J]. IEEE/ACM transactions on audio, speech, and language processing, 2018, 26(5): 883−894. doi: 10.1109/TASLP.2018.2798811
    [54] ESKIMEZ S E, KOISHIDA K. Speech super resolution generative adversarial network[C]//2019 IEEE International Conference on Acoustics, Speech and Signal Processing. Piscataway: IEEE, 2019: 3717−3721.
    [55] ZHANG Tingwei, RUAN S J. VM-ASR: a lightweight dual-stream U-Net model for efficient audio super-resolution[J]. IEEE transactions on audio, speech and language processing, 2025, 33: 666−677. doi: 10.1109/TASLPRO.2025.3533365
    [56] TIAN Ye, WANG Zhe, SUN Jianguo, et al. Time-frequency domain fusion enhancement for audio super-resolution[C]//Proceedings of the 32nd ACM International Conference on Multimedia. New York: ACM, 2024: 2879−2887.
    [57] LU Yexin, AI Yang, LING Zhenhua. Explicit estimation of magnitude and phase spectra in parallel for high-quality speech enhancement[J]. Neural networks, 2025, 189: 107562. doi: 10.1016/j.neunet.2025.107562
    [58] BERMAN D, LEVY D, AVIDAN S, et al. Underwater single image color restoration using haze-lines and a new quantitative dataset[J]. IEEE transactions on pattern analysis and machine intelligence, 2021, 43(8): 2822−2837. doi: 10.1109/tpami.2020.2977624
    [59] ZHOU Jingchun, LIU Qian, JIANG Qiuping, et al. Underwater camera: improving visual perception via adaptive dark pixel prior and color correction[J]. International journal of computer vision, 2025, 133(11): 8215−8233. doi: 10.1007/s11263-023-01853-3
    [60] ZHANG Weidong, ZHUANG Peixian, SUN Haihan, et al. Underwater image enhancement via minimal color loss and locally adaptive contrast enhancement[J]. IEEE transactions on image processing, 2022, 31: 3997−4010. doi: 10.1109/TIP.2022.3177129
    [61] ZHOU Jingchun, WANG Shiyin, LIN Zifan, et al. A pixel distribution remapping and multi-prior retinex variational model for underwater image enhancement[J]. IEEE transactions on multimedia, 2024, 26: 7838−7849. doi: 10.1109/TMM.2024.3372400
    [62] ZHANG Weibo, WANG Hao, REN Peng, et al. MACT: Underwater image color correction via minimally attenuated channel transfer[J]. Pattern recognition letters, 2025, 187: 28−34. doi: 10.1016/j.patrec.2024.11.007
    [63] QI Qi, LI Kunqian, ZHENG Haiyong, et al. SGUIE-net: semantic attention guided underwater image enhancement with multi-scale perception[J]. IEEE transactions on image processing, 2022, 31: 6816−6830. doi: 10.1109/TIP.2022.3216208
    [64] WANG Hao, KÖSER K, REN Peng. Large foundation model empowered discriminative underwater image enhancement[J]. IEEE transactions on geoscience and remote sensing, 2025, 63: 5609317. doi: 10.1109/tgrs.2025.3525962
    [65] PENG Lintao, ZHU Chunli, BIAN Liheng. U-shape transformer for underwater image enhancement[J]. IEEE transactions on image processing, 2023, 32: 3066−3079. doi: 10.1109/TIP.2023.3276332
    [66] WANG Hao, ZHANG Weibo, BAI Lu, et al. Metalantis: a comprehensive underwater image enhancement framework[J]. IEEE transactions on geoscience and remote sensing, 2024, 62: 5618319. doi: 10.1109/tgrs.2024.3387722
    [67] LI Kunqian, WU Li, QI Qi, et al. Beyond single reference for training: underwater image enhancement via comparative learning[J]. IEEE transactions on circuits and systems for video technology, 2023, 33(6): 2561−2576. doi: 10.1109/TCSVT.2022.3225376
    [68] LI Yuanyuan, MI Zetian, WANG Yulin, et al. TAFormer: a transmission-aware transformer for underwater image enhancement[J]. IEEE transactions on circuits and systems for video technology, 2025, 35(1): 601−616. doi: 10.1109/TCSVT.2024.3455353
    [69] ZHANG Wen, LI Xiaoyong, ZHOU Aolong, et al. Underwater acoustic source separation with deep Bi-LSTM networks[C]//2021 4th International Conference on Information Communication and Signal Processing. Piscataway: IEEE, 2021: 254−258.
    [70] LUO Yi, MESGARANI N. Conv-TasNet: surpassing ideal time–frequency magnitude masking for speech separation[J]. IEEE/ACM transactions on audio, speech, and language processing, 2019, 27(8): 1256−1266. doi: 10.1109/TASLP.2019.2915167
    [71] TANG Jianxun, CHEN Zhe, CHEN Mingsong. A novel underwater acoustic signal denoising model based on complex convolution dual-branch multi-scale attention network[C]//2025 IEEE International Conference on Acoustics, Speech and Signal Processing. Piscataway: IEEE, 2025: 1−5.
    [72] VELURI B, CHAN J, ITANI M, et al. Real-time target sound extraction[C]//2023 IEEE International Conference on Acoustics, Speech and Signal Processing. Piscataway: IEEE, 2023: 1−5.
    [73] ASHRAF H, SHAH B, SOOMRO A M, et al. Ambient-noise free generation of clean underwater ship engine audios from hydrophones using generative adversarial networks[J]. Computers and electrical engineering, 2022, 100: 107970. doi: 10.1016/j.compeleceng.2022.107970
    [74] TANG Chuanxin, LUO Chong, ZHAO Zhiyuan, et al. Joint time-frequency and time domain learning for speech enhancement[C]//Proceedings of the Twenty-Ninth International Joint Conference on Artificial Intelligence. Yokohama: IJCAI, 2020: 3816−3822.
    [75] YANG Lei, LIU Wei, WANG Weiqin. TFPSNet: time-frequency domain path scanning network for speech separation[C]//2022 IEEE International Conference on Acoustics, Speech and Signal Processing. Piscataway: IEEE, 2022: 6842−6846.
    [76] LI Yi, SUN Yang, WANG Wenwu, et al. U-shaped transformer with frequency-band aware attention for speech enhancement[J]. IEEE/ACM transactions on audio, speech, and language processing, 2023, 31: 1511−1521. doi: 10.1109/TASLP.2023.3265839
    [77] ZHOU Xingyue, YANG Kunde. A denoising representation framework for underwater acoustic signal recognition[J]. The journal of the acoustical society of America, 2020, 147(4): EL377−EL383. doi: 10.1121/10.0001130
    [78] ZHU Pengsen, GAO Lina, ZHANG Yonggang, et al. RGDNet: recognition-guided underwater acoustic signal denoising via mask integration and signal decoupling[J]. IEEE transactions on geoscience and remote sensing, 2025, 63: 4204422.
    [79] CHEN Lu, LUO Xinwei, ZHOU Hanlu. A ship-radiated noise classification method based on domain knowledge embedding and attention mechanism[J]. Engineering applications of artificial intelligence, 2024, 127: 107320. doi: 10.1016/j.engappai.2023.107320
    [80] DUAN Yichen, SHEN Xiaohong, WANG Haiyan. Time-domain anti-interference method for ship radiated noise signal[J]. EURASIP journal on advances in signal processing, 2022, 2022(1): 65. doi: 10.1186/s13634-022-00895-y
    [81] ZHU Pengsen, ZHANG Yonggang, HUANG Yulong, et al. SFC-sup: robust two-stage underwater acoustic target recognition method based on supervised contrastive learning[J]. IEEE transactions on geoscience and remote sensing, 2023, 61: 4209023. doi: 10.1109/tgrs.2023.3329653
    [82] ZHU Pengsen, ZHANG Yonggang, HUANG Yulong, et al. Underwater acoustic target recognition based on spectrum component analysis of ship radiated noise[J]. Applied acoustics, 2023, 211: 109552. doi: 10.1016/j.apacoust.2023.109552
    [83] XING Chuanxi, WU Yaowen, XIE Lixiang, et al. A sparse dictionary learning-based denoising method for underwater acoustic sensors[J]. Applied acoustics, 2021, 180: 108140. doi: 10.1016/j.apacoust.2021.108140
    [84] LI Yuxing, LI Yaan, CHEN Xiao, et al. A new underwater acoustic signal denoising technique based on CEEMDAN, mutual information, permutation entropy, and wavelet threshold denoising[J]. Entropy, 2018, 20(8): 563. doi: 10.3390/e20080563
    [85] YANG Hong, LAI Minyang, LI Guohui. Novel underwater acoustic signal denoising: Combined optimization secondary decomposition coupled with original component processing algorithms[J]. Chaos, solitons & fractals, 2025, 193: 116098.
    [86] LIU Yanyu, ZHOU Dongming, NIE Rencan, et al. TSE_Fuse: two stage enhancement method using attention mechanism and feature-linking model for infrared and visible image fusion[J]. Digital signal processing, 2022, 123: 103387. doi: 10.1016/j.dsp.2022.103387
    [87] HUANG Zhenyu, NIU Guocheng, LIU Xiao, et al. Learning with noisy correspondence for cross-modal matching[J]. Advances in neural information processing systems, 2021, 34: 29406−29419.
    [88] HUANG Runhui, LONG Yanxin, HAN Jianhua, et al. NLIP: noise-robust language-image pre-training[J]. Proceedings of the AAAI conference on artificial intelligence, 2023, 37(1): 926−934. doi: 10.1609/aaai.v37i1.25172
    [89] WANG Yunbo, WU Yujie, DAI Zhien, et al. Noisy correspondence rectification via asymmetric similarity learning[J]. Proceedings of the AAAI conference on artificial intelligence, 2025, 39(20): 21384−21392. doi: 10.1609/aaai.v39i20.35439
    [90] LIU Chengliang, WEN Jie, WU Zhihao, et al. Information recovery-driven deep incomplete multiview clustering network[J]. IEEE transactions on neural networks and learning systems, 2024, 35(11): 15442−15452. doi: 10.1109/TNNLS.2023.3286918
    [91] YIN Jun, WANG Pei, SUN Shiliang, et al. Incomplete multi-view clustering via multi-level contrastive learning[J]. IEEE transactions on knowledge and data engineering, 2025, 37(8): 4716−4727. doi: 10.1109/TKDE.2025.3568795
    [92] WANG Ziyu, DU Yiming, WANG Yao, et al. Deep incomplete multi-view clustering via multi-level imputation and contrastive alignment[J]. Neural networks, 2025, 181: 106851. doi: 10.1016/j.neunet.2024.106851
    [93] LI Shaoyuan, JIANG Yuan, ZHOU Zhihua. Partial multi-view clustering[J]. Proceedings of the AAAI conference on artificial intelligence, 2014, 28(1): 1−7.
    [94] ZHAO Handong, LIU Hongfu, FU Y R. Incomplete multi-modal visual data grouping[C]//Proceedings of the International Joint Conference on Artificial Intelligence, New York: IJCAI, 2016: 2392−2398.
    [95] LIU Chengliang, WEN Jie, XU Yong, et al. Reliable representation learning for incomplete multi-view missing multi-label classification[J]. IEEE transactions on pattern analysis and machine intelligence, 2025, 47(6): 4940−4956. doi: 10.1109/TPAMI.2025.3546356
    [96] YANG T J, CHEN Y H, SZE V. Designing energy-efficient convolutional neural networks using energy-aware pruning[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE, 2017: 6071−6079.
    [97] DIKSTEIN L, LAPID A, NETZER A, et al. Data generation for hardware-friendly post-training quantization[C]//2025 IEEE/CVF Winter Conference on Applications of Computer Vision. Tucson: IEEE, 2025: 5103−5113.
    [98] GONG Ruihao, LIU Xianglong, LI Yuhang, et al. Pushing the limit of post-training quantization[J]. IEEE transactions on pattern analysis and machine intelligence, 2025, 47(7): 5556−5570. doi: 10.1109/TPAMI.2025.3554523
    [99] LIN Ji, TANG Jiaming, TANG Haotian, et al. AWQ: activation-aware weight quantization for LLM compression and acceleration[EB/OL]. (2023−06−01)[2025−06−27]. https://arxiv.org/abs/2306.00978.
    [100] ESHRATIFAR A E, ESMAILI A, PEDRAM M. BottleNet: a deep learning architecture for intelligent mobile cloud computing services[C]//2019 IEEE/ACM International Symposium on Low Power Electronics and Design. Piscataway: IEEE, 2019: 1−6.
    [101] SHAO Jiawei, ZHANG Jun. BottleNet++: an end-to-end approach for feature compression in device-edge co-inference systems[C]//2020 IEEE International Conference on Communications Workshops. Piscataway: IEEE, 2020: 1−6.
    [102] AHN H, LEE M, SEONG S, et al. ScissionLite: accelerating distributed deep learning with lightweight data compression for IIoT[J]. IEEE transactions on industrial informatics, 2024, 20(10): 11950−11960. doi: 10.1109/TII.2024.3413340
    [103] ULICNY C, RAUCH R, GAZDA J, et al. Split computing in autonomous mobility for efficient semantic segmentation using transformers[C]//2025 IEEE Symposia on Computational Intelligence for Energy, Transport and Environmental Sustainability. Piscataway: IEEE, 2025: 1−8.
    [104] QI Huamei, REN Fang, WANG Leilei, et al. Multi-compression scale DNN inference acceleration based on cloud-edge-end collaboration[J]. ACM transactions on embedded computing systems, 2024, 23(1): 1−25. doi: 10.1145/3634704
    [105] HOWARD A G, ZHU Menglong, CHEN Bo, et al. MobileNets: efficient convolutional neural networks for mobile vision applications[EB/OL]. (2017−04−17)[2025−06−27]. https://arxiv.org/abs/1704.04861.
    [106] HSU C H, CHANG Shuhuan, LIANG J H, et al. MONAS: multi-objective neural architecture search using reinforcement learning[EB/OL]. (2018−06−26)[2025−06−27]. https://arxiv.org/abs/1806.10332.
    [107] CORTÊS G, LOURENÇO N, MACHADO P. ENERGIZE: a neuroevolution framework for energy-efficient machine learning[J]. IEEE transactions on evolutionary computation, 2025, PP(99): 1.
    [108] PONZINA F, MACHETTI S, RIOS M, et al. A hardware/software co-design vision for deep learning at the edge[J]. IEEE micro, 2022, 42(6): 48−54. doi: 10.1109/MM.2022.3195617
    [109] JIANG Weiwen, YANG Lei, SHA E H, et al. Hardware/software co-exploration of neural architectures[J]. IEEE transactions on computer-aided design of integrated circuits and systems, 2020, 39(12): 4805−4815. doi: 10.1109/TCAD.2020.2986127
    [110] FENG Kaijie, FAN Xiaoya, AN Jianfeng, et al. CSDSE: an efficient design space exploration framework for deep neural network accelerator based on cooperative search[J]. Neurocomputing, 2025, 623: 129366. doi: 10.1016/j.neucom.2025.129366
    [111] WANG Dilin, LI Meng, WU Lemeng, et al. Energy-aware neural architecture optimization with splitting steepest descent[J]. Proc. 5th Wkshop. Energy Efficient Mach. Learn. Cogn. Comput. (EMC), 2019: 1−5.
    [112] BENMEZIANE H, EL MAGHRAOUI K, OUARNOUGHI H, et al. A comprehensive survey on hardware-aware neural architecture search[EB/OL]. (2021−01−25)[2025−06−27]. https://arxiv.org/abs/2101.09336.
    [113] WULFERT L, KÜHNEL J, KRUPP L, et al. AIfES: a next-generation edge AI framework[J]. IEEE transactions on pattern analysis and machine intelligence, 2024, 46(6): 4519−4533. doi: 10.1109/TPAMI.2024.3355495
    [114] RAGUSA E, ZONZINI F, GASTALDO P, et al. Combining compressed sensing and neural architecture search for sensor-near vibration diagnostics[J]. IEEE transactions on industrial informatics, 2024, 20(8): 10488−10498. doi: 10.1109/TII.2024.3395648
    [115] MCMAHAN H B, MOORE E, RAMAGE D, et al. Communication-efficient learning of deep networks from decentralized data[C]//International Conference on Artificial Intelligence and Statistics. Lauderdale: PMLR, 2016: 1273−1282.
    [116] WANG Shiqiang, TUOR T, SALONIDIS T, et al. Adaptive federated learning in resource constrained edge computing systems[J]. IEEE journal on selected areas in communications, 2019, 37(6): 1205−1221. doi: 10.1109/JSAC.2019.2904348
    [117] LIN Zheng, WEI Wei, CHEN Zhe, et al. Hierarchical split federated learning: convergence analysis and system optimization[J]. IEEE transactions on mobile computing, 2025, 24(10): 9352−9367. doi: 10.1109/TMC.2025.3565509
    [118] ZHOU Xiaokang, LIANG Wei, KAWAI A, et al. Adaptive segmentation enhanced asynchronous federated learning for sustainable intelligent transportation systems[J]. IEEE transactions on intelligent transportation systems, 2024, 25(7): 6658−6666. doi: 10.1109/TITS.2024.3362058
    [119] REN Yijing, WU Changxiang, SO D K C, et al. DRL-based joint aggregation frequency and edge association for energy-efficient hierarchical federated learning[J]. IEEE transactions on wireless communications, 2025, 24(8): 6841−6856. doi: 10.1109/TWC.2025.3556514
    [120] ROMERO A, BALLAS N, KAHOU S E, et al. FitNets: hints for thin deep nets[EB/OL]. (2014−12−19)[2025−06−27]. https://arxiv.org/abs/1412.6550.
    [121] DENNIS D K, SHETTY A, SEVEKARI A, et al. Progressive ensemble distillation: building ensembles for efficient inference[EB/OL]. (2023−02−20)[2025−06−27]. https://arxiv.org/abs/2302.10093.
    [122] LI Zhenlin, XIA Shaobo, YUE Jun, et al. HyperKD: lifelong hyperspectral image classification with cross-spectral–spatial knowledge distillation[J]. IEEE transactions on geoscience and remote sensing, 2025, 63: 5509017.
    [123] WANG Lu, XU Liuchi, YANG Xiong, et al. Debiased distillation for consistency regularization[J]. Proceedings of the AAAI conference on artificial intelligence, 2025, 39(8): 7799−7807. doi: 10.1609/aaai.v39i8.32840
    [124] YANG Xi, SUN Jiachen, DUAN Songsong, et al. Dual information purification for lightweight SAR object detection[J]. Proceedings of the AAAI conference on artificial intelligence, 2025, 39(9): 9274−9282. doi: 10.1609/aaai.v39i9.33004
    [125] ZHANG V Y, WONG A K, WOO K T, et al. Hybrid TOA/AOA-based mobile localization with and without tracking in CDMA cellular networks[C]//2010 IEEE Wireless Communication and Networking Conference. Piscataway: IEEE, 2010: 1−6.
    [126] CHEN Y C, WEN C Y, CHEN Y C, et al. Decentralized cooperative TOA/AOA target tracking for hierarchical wireless sensor networks[J]. Sensors, 2012, 12(11): 15308−15337. doi: 10.3390/s121115308
    [127] KIM J. 3-D localization of heterogeneous underwater networks using hybrid TOA-AOA measurements under random DoS attack[J]. IEEE internet of things journal, 2025, 12(12): 22257−22266. doi: 10.1109/JIOT.2025.3550398
    [128] WANG Kaixuan, CHANG Shuai, WU Shijie, et al. A DDQN-based cooperative path planning for range-based AUV cooperative navigation system toward coverage survey and positioning error suppression[J]. IEEE internet of things journal, 2025, 12(21): 45022−45042. doi: 10.1109/jiot.2025.3599150
    [129] HUANG Yulong, ZHANG Yonggang, XU Bo, et al. A new adaptive extended Kalman filter for cooperative localization[J]. IEEE transactions on aerospace and electronic systems, 2018, 54(1): 353−368. doi: 10.1109/TAES.2017.2756763
    [130] HUNG N T, REGO F F C, PASCOAL A M. Cooperative distributed estimation and control of multiple autonomous vehicles for range-based underwater target localization and pursuit[J]. IEEE transactions on control systems technology, 2022, 30(4): 1433−1447. doi: 10.1109/TCST.2021.3107346
    [131] SUI Donglin, DEGHAT M, SUN Zhiyong, et al. Unbiased bearing-only localization and circumnavigation of a constant velocity target[J]. IEEE transactions on intelligent vehicles, 2024: 1−15.
    [132] LIU Fen, GUO Chuangpeng, MENG Wei, et al. Moving-target circumnavigation using adaptive neural anti-synchronization control via distance-only measurements[J]. IEEE transactions on cybernetics, 2024, 54(1): 308−318. doi: 10.1109/TCYB.2023.3234366
    [133] LIU Fen, YUAN Shenghai, MENG Wei, et al. Multiple noncooperative targets encirclement by relative distance-based positioning and neural antisynchronization control[J]. IEEE transactions on industrial electronics, 2024, 71(2): 1675−1685. doi: 10.1109/TIE.2023.3257364
    [134] LI Yichen, YANG Yang, YU Wenbin, et al. Cooperative highly-maneuvering target tracking using multi-AUV networks: a bearing-only approach[J]. IEEE transactions on mobile computing, 2025: 1−16.
    [135] THOMS A, EARLE G, CHARRON N, et al. Tightly coupled, graph-based DVL/IMU fusion and decoupled mapping for SLAM-centric maritime infrastructure inspection[J]. IEEE journal of oceanic engineering, 2023, 48(3): 663−676. doi: 10.1109/JOE.2023.3265742
    [136] SU Yishan, ZHU Yibo, MO Haining, et al. A joint power control and rate adaptation MAC protocol for underwater sensor networks[J]. Ad hoc networks, 2015, 26: 36−49. doi: 10.1016/j.adhoc.2014.10.014
    [137] BAI Weigang, WANG Haiyan, SHEN Xiaohong, et al. Link scheduling method for underwater acoustic sensor networks based on correlation matrix[J]. IEEE sensors journal, 2016, 16(11): 4015−4022. doi: 10.1109/JSEN.2015.2441140
    [138] ZHANG Tong, GOU Yu, LIU Jun, et al. UDARMF: an underwater distributed and adaptive resource management framework[J]. IEEE internet of things journal, 2022, 9(10): 7196−7210. doi: 10.1109/JIOT.2021.3097493
    [139] ZHAO Zhao, LIU Chunfeng, GUANG Xiaoyun, et al. A reliability-driven topology restoration strategy for underwater wireless sensor networks in dynamic ocean environments[J]. IEEE internet of things journal, 2025, 12(8): 10506−10523. doi: 10.1109/JIOT.2024.3510772
    [140] SHIN H, KIM S M, SONG Y. Learning-aided joint beam divergence angle and power optimization for seamless and energy-efficient underwater optical communication[J]. IEEE internet of things journal, 2023, 10(24): 22726−22739. doi: 10.1109/JIOT.2023.3304655
    [141] LI Xinguo, ZHU Min, WU Yanbo. Low-power system design for underwater acoustic modems[C]//Proceedings of the 10th International Conference on Underwater Networks & Systems - WUWNET '15. New York: ACM, 2015: 1−2.
    [142] COUTINHO R W L, BOUKERCHE A, VIEIRA L F M, et al. Modeling the sleep interval effects in duty-cycled underwater sensor networks[C]//2016 IEEE International Conference on Communications. Piscataway: IEEE, 2016: 1−6.
    [143] HOU Xiangwang, WANG Jingjing, BAI Tong, et al. Environment-aware AUV trajectory design and resource management for multitier underwater computing[J]. IEEE journal on selected areas in communications, 2023, 41(2): 474−490. doi: 10.1109/JSAC.2022.3227103
    [144] XU J, XIE Guanwen, ZHANG Zekai, et al. UPEGSim: an RL-enabled simulator for unmanned underwater vehicles dedicated in the underwater pursuit-evasion game[J]. IEEE internet of things journal, 2025, 12(3): 2334−2346. doi: 10.1109/JIOT.2024.3472700
    [145] LUO Tao, ZHANG Baitao, LI Jiahao, et al. An innovative cluster routing method for performance enhancement in underwater acoustic sensor networks[J]. IEEE internet of things journal, 2024, 11(14): 25337−25357. doi: 10.1109/JIOT.2024.3394498
    [146] FAN Rong, BOUKERCHE A, PAN Pan, et al. Secure localization for underwater wireless sensor networks via AUV cooperative beamforming with reinforcement learning[J]. IEEE transactions on mobile computing, 2025, 24(2): 924−938. doi: 10.1109/TMC.2024.3472643
    [147] WAN Yuting, ZHONG Yanfei, MA Ailong, et al. An accurate UAV 3-D path planning method for disaster emergency response based on an improved multiobjective swarm intelligence algorithm[J]. IEEE transactions on cybernetics, 2023, 53(4): 2658−2671. doi: 10.1109/TCYB.2022.3170580
    [148] HUANG Yujie, LI Yibing, ZHANG Zitang, et al. A novel path planning approach for AUV based on improved whale optimization algorithm using segment learning and adaptive operator selection[J]. Ocean engineering, 2023, 280: 114591. doi: 10.1016/j.oceaneng.2023.114591
    [149] ZHOU Qiang, LIU Guangcai. UAV path planning based on the combination of A-star algorithm and RRT-star algorithm[C]//2022 IEEE International Conference on Unmanned Systems. Piscataway: IEEE, 2022: 146−151.
    [150] YU Fujie, CHEN Yuan. Cyl-IRRT*: homotopy optimal 3D path planning for AUVs by biasing the sampling into a cylindrical informed subset[J]. IEEE transactions on industrial electronics, 2023, 70(4): 3985−3994. doi: 10.1109/TIE.2022.3177801
    [151] XI Meng, YANG Jiachen, WEN Jiabao, et al. Comprehensive ocean information-enabled AUV path planning via reinforcement learning[J]. IEEE internet of things journal, 2022, 9(18): 17440−17451. doi: 10.1109/JIOT.2022.3155697
    [152] WANG Ziyuan, DU Jun, JIANG Chunxiao, et al. Task scheduling for distributed AUV network target hunting and searching: an energy-efficient AoI-aware DMAPPO approach[J]. IEEe internet of things journal, 2023, 10(9): 8271−8285. doi: 10.1109/JIOT.2022.3230916
    [153] CHEN Mingzhi, ZHU Daqi. Optimal time-consuming path planning for autonomous underwater vehicles based on a dynamic neural network model in ocean current environments[J]. IEEE transactions on vehicular technology, 2020, 69(12): 14401−14412. doi: 10.1109/TVT.2020.3034628
    [154] XU J, ZHANG Zekai, WANG Jingjing, et al. Multi-AUV pursuit-evasion game in the Internet of underwater things: an efficient training framework via offline reinforcement learning[J]. IEEE internet of things journal, 2024, 11(19): 31273−31286. doi: 10.1109/JIOT.2024.3416616
    [155] HAN Guangjie, FENG Zixiao, WANG Hao, et al. Underwater multi-target node path planning in hybrid action space: a deep reinforcement learning approach[J]. IEEE transactions on mobile computing, 2024, 23(12): 13033−13047. doi: 10.1109/TMC.2024.3421541
    [156] ZHANG Zekai, XU J, XIE Guanwen, et al. Environment- and energy-aware AUV-assisted data collection for the Internet of underwater things[J]. IEEE internet of things journal, 2024, 11(15): 26406−26418. doi: 10.1109/JIOT.2024.3395568
    [157] PAN Zhenhua, ZHANG Chengxi, XIA Yuanqing, et al. An improved artificial potential field method for path planning and formation control of the multi-UAV systems[J]. IEEE transactions on circuits and systems II: express briefs, 2022, 69(3): 1129−1133.
    [158] PANG Zhonghua, ZHENG Changbing, SUN Jian, et al. Distance- and velocity-based collision avoidance for time-varying formation control of second-order multi-agent systems[J]. IEEE transactions on circuits and systems II: express briefs, 2021, 68(4): 1253−1257.
    [159] WU Yu, LIANG Tianjiao, GOU Jinzhan, et al. Heterogeneous mission planning for multiple UAV formations via metaheuristic algorithms[J]. IEEE transactions on aerospace and electronic systems, 2023, 59(4): 3924−3940. doi: 10.1109/TAES.2023.3234455
    [160] ZHANG Jie, CHEN Dugui, HAN Guangjie, et al. Formation path planning for collaborative autonomous underwater vehicles based on consensus-sparrow search algorithm[J]. IEEE internet of things journal, 2024, 11(8): 13810−13823. doi: 10.1109/JIOT.2023.3340432
    [161] DAI Shijie, WU Zhengxing, ZHANG Pengfei, et al. Distributed formation control for a multirobotic fish system with model-based event-triggered communication mechanism[J]. IEEE transactions on industrial electronics, 2023, 70(11): 11433−11442. doi: 10.1109/TIE.2022.3232659
    [162] XIA Haisheng, LIAO Fei, BAO Binglei, et al. Perspective on wearable systems for human underwater perceptual enhancement[J]. IEEE transactions on cybernetics, 2025, 55(2): 698−711. doi: 10.1109/TCYB.2024.3504840
    [163] LIN Hongkai, LIANG Dingkang, QI Zhenghao, et al. A unified image-dense annotation generation model for underwater scenes[C]//2025 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Nashville: IEEE, 2025: 961−970.
    [164] ZHA Mingfeng, WANG Guoqing, PEI Yunqiang, et al. Heterogeneous experts and hierarchical perception for underwater salient object detection[J]. IEEE transactions on image processing, 2025, 34: 3703−3717. doi: 10.1109/TIP.2025.3572760
    [165] WEN Dingzhu, JIAO Xiang, LIU Peixi, et al. Task-oriented over-the-air computation for multi-device edge AI[J]. IEEE transactions on wireless communications, 2024, 23(3): 2039−2053. doi: 10.1109/TWC.2023.3294703
    [166] ZHUANG Zeming, WEN Dingzhu, SHI Yuanming, et al. Integrated sensing-communication-computation for over-the-air edge AI inference[J]. IEEE transactions on wireless communications, 2024, 23(4): 3205−3220. doi: 10.1109/TWC.2023.3306465
    [167] HUA Meng, WU Qingqing, CHEN Wen, et al. Integrated sensing and communication: joint pilot and transmission design[J]. IEEE transactions on wireless communications, 2024, 23(11): 16017−16032. doi: 10.1109/TWC.2024.3435912
    [168] WANG Xianghe, HOU Xiangwang, GUAN Fangming, et al. Underwater federated learning: empowering autonomous underwater vehicle swarm with online learning capabilities[C]//2024 IEEE Global Communications Conference. Piscataway: IEEE, 2025: 379−384.
    [169] CAO Tianyu, YU Zhibin, ZHENG Bing. DNnet: a lightweight network for real-time 4K underwater image enhancement using dynamic range and average normalization[J]. Expert systems with applications, 2025, 270: 126561. doi: 10.1016/j.eswa.2025.126561
    [170] WU Qingyao, FU Zhenqi, LIN Hong, et al. EffiSeaNet: pioneering lightweight network for underwater salient object detection[C]//Computer Vision–ACCV 2024. Singapore: Springer Nature Singapore, 2024: 89−104.
    [171] LI Jinke, HE Xiao, ZHOU Chonghua, et al. ViewFormer: exploring spatiotemporal modeling for multi-view 3D occupancy perception via view-guided transformers[C]//Computer Vision–ECCV 2024. Cham: Springer, 2025: 90−106.
    [172] ZOU Xingchen, YAN Yibo, HAO Xixuan, et al. NuwaDynamics: discovering and updating in causal spatio-temporal modeling[C]//International Conference on Learning Representations. New Orleans: PMLR, 2024: 1−25.
    [173] QIU Xiaojie, ZHU D Y, LU Yifan, et al. Spatiotemporal modeling of molecular holograms[J]. Cell, 2025, 188(6): 1744.
    [174] LI Xulong, MAO Wencan, XU Xinyi, et al. Self-adjusting network slicing for dynamic heterogeneous task offloading in UAV-enabled mobile edge computing[J]. IEEE transactions on cognitive communications and networking, 2026, 12: 673−687. doi: 10.1109/TCCN.2025.3565942
    [175] MA Qian, QIN Yanling, ZHU Chaohui, et al. Joint resource trading and task scheduling in edge-cloud computing networks[J]. IEEE transactions on networking, 2025, 33(3): 994−1008. doi: 10.1109/TON.2024.3516381
    [176] ZHANG Guo, ZHANG Baoxian, PENG Shuo, et al. Dependency-aware joint task offloading and resource allocation in heterogeneous mobile edge computing[J]. IEEE transactions on wireless communications, 2024, 23(12): 19444−19458. doi: 10.1109/TWC.2024.3483658
    [177] LIU Haochen, HUANG Zhiyu, MO Xiaoyu, et al. Augmenting reinforcement learning with transformer-based scene representation learning for decision-making of autonomous driving[J]. IEEE transactions on intelligent vehicles, 2024, 9(3): 4405−4421. doi: 10.1109/TIV.2024.3372625
    [178] BAI Hao, LECUN Y, LEVINE S, et al. Fine-tuning large vision-language models as decision-making agents via reinforcement learning[J]. Advances in neural information processing systems, 2024, 37: 110935−110971. doi: 10.52202/079017-3522
    [179] CHEN Hongpeng, LI Shufei, FAN Junming, et al. Human-in-the-loop robot learning for smart manufacturing: a human-centric perspective[J]. IEEE transactions on automation science and engineering, 2025, 22: 11062−11086. doi: 10.1109/TASE.2025.3528051
WeChat 点击查看大图
图(5)  /  表(4)
出版历程
  • 收稿日期:  2025-06-27
  • 网络出版日期:  2026-01-04

目录

    /

    返回文章
    返回