舰船科学技术  2026, Vol. 48 Issue (3): 169-175    DOI: 10.3404/j.issn.1672-7649.2026.03.026   PDF    
基于复杂场景的智能航行技术研究
陈安1, 王子睿1, 张勇1, 段平平2     
1. 中国船舶及海洋工程设计研究院 ,上海 200011;
2. 中国地质调查局海洋地质研究所,山东 青岛 266237
摘要: 随着智能航行技术的发展,其在复杂场景应用中面临诸多难题。本文分析了智能航行技术在态势感知、避碰决策和运动控制方面的现状,阐述了交通流密集水域、狭水道及浅水、恶劣天气条件等复杂场景对智能航行技术的挑战,提出了基于多传感器融合的态势感知技术、基于VO−RRT的决策避碰技术以及基于深度强化学习的控制技术等优化策略,以提升智能航行技术在复杂场景下的性能,为智能航行技术的发展提供参考。尽管现有技术取得了一定进展,但仍面临多传感器融合精度不足、VO−RRT算法局部最优性以及深度强化学习训练成本高和可解释性差等问题。为此,本文探讨了引入BEV技术和多模态融合技术以提升态势感知精度,结合深度强化学习与轻量级模型以优化避碰决策,以及通过迁移学习和可解释性算法改进运动控制的潜力。这些改进方向可为智能航行技术的未来发展提供新的思路。
关键词: 智能航行     复杂场景     态势感知     避碰决策     运动控制    
Research on intelligent navigation technology based on complex scene
CHEN An1, WANG Zirui1, ZHANG Yong1, DUAN Pingping2     
1. Department of Strategy and Innovation Research, Marine Design and Research Institute of China, Shanghai 200011, China;
2. Qingdao Institute of Marine Geology, China Geological Survey, Qingdao 266237, China
Abstract: With the development of intelligent navigation technology, it faces numerous challenges in complex - scenario applications. This paper analyzes the current status of intelligent navigation technology in terms of situation awareness, collision avoidance decision - making, and motion control. It expounds on the challenges posed by complex scenarios such as dense traffic flow waters, narrow channels and shallow waters, and adverse weather conditions to intelligent navigation technology. Optimization strategies are proposed, including situation awareness technology based on multi - sensor fusion, decision - making and collision avoidance technology based on VO-RRT, and control technology based on deep reinforcement learning, to improve the performance of intelligent navigation technology in complex scenarios and provide reference for the development of intelligent navigation technology. Although certain progress has been made in existing technologies, there are still problems such as insufficient accuracy in multi-sensor fusion, local optimality of the VO-RRT algorithm, high training costs and poor interpretability of deep reinforcement learning. Therefore, this paper explores the potential of introducing BEV technology and multi-modal fusion technology to improve the accuracy of situation awareness, combining deep reinforcement learning with lightweight models to optimize collision avoidance decisions, and improving motion control through transfer learning and interpretable algorithms. These improvement directions provide new ideas for the future development of intelligent navigation technology.
Key words: intelligent navigation     complex scenes     perception     decision-making     motion controls    
0 引 言

航行是船舶的核心功能,安全、准确且高效的航行对船舶至关重要。海上自主水面船规则“MASS CODE”在MSC110次会议上完成了非强制性规则制定,计划2028年启动强制性规则制定,预计2032年生效。这标志着船舶智能化与自主化技术将被纳入国际海事组织的监管框架,智能航行已成为全球研发热点,以满足未来船舶行业的发展需求和规范要求。

各国正加速开发和测试辅助及自主航行技术,推进其商用化。韩国计划2025年实现高等级自主航行,2030年市场占有率达到50%。现代、三星和大宇等集团大力研发智能航行系统,已在大型远洋船舶上示范验证。2022年6月,韩国大型LNG船搭载“HINAS 2.0”完成全球首次跨洋自主航行,自主里程占总航程一半。

日本计划2025年实现自主航行商业化,2040年国内内航船无人驾驶比例达50%。日本以研发联盟为主,在区域性和中小型船舶上广泛开展实船示范验证。2022年,日本财团完成6条船的自主航行测试,涵盖自主靠离泊和开阔水域自主航行等技术,处于世界领先水平。

欧洲以康士伯、瓦锡兰等高端配套商为主体,针对短途航运和沿海内河航运开展实船示范验证。2023年,欧洲AUTOSHIP项目中的2艘内河驳船和短途海运饲料船展示了远程遥控和自主航行技术,优势明显。

目前,智能航行技术研究集中在开阔水域的态势感知、规划决策和运动控制,已实现辅助决策和部分自主能力。但要实现全航程自主航行,船舶在进出港、锚地等复杂场景(如交通密集、狭水道、浅水、夜航、雾航等)仍面临诸多技术难题,对自主航行系统的智能化程度要求更高。

1 智能航行技术概述 1.1 态势感知

智能航行态势感知是通过使用多种传感器获取船舶周围的动静态障碍物实时的方位、距离、速度、航向等信息,并通过感知技术对这些信息进行综合分析,实现对船舶航行状态的全面感知和监测。王百勇等[1]提出了一种雷达、图像与电子海图的融合感知技术,分别提取雷达和视觉图像的亮度、颜色等特征,利用支持向量机进行分类,实验验证识别准确率可达97%。孙旭等[2]指出在水面目标融合感知方面,基于雷达、光电和AIS的信息融合成为研发热点,但成熟应用还不多见。赵仓龙等[3]将AIS和雷达进行坐标转换、时间配准和航迹融合,建立数据融合模型提升了船舶避碰系统的信号采集精度。朱旭芳[4]提出导航雷达和相机的融合算法,先后基于视觉图像和导航雷达完成目标位置信息的检测,然后通过信息融合完成目标跟踪。由此可见,现有的态势感知手段主要有导航雷达、AIS、电子海图、摄像头等传感器和数据源。

1.2 避碰决策

智能航行避碰决策是指在航行中为避免船舶间发生碰撞而采取的决策建议。目前的避碰算法大多是针对开阔水域的避碰决策,通过路径规划算法给出避碰的路径。周凤杰等[5]提出一种基于粒子群算法和遗传算法混合的避碰算法,验证得出算法的有效性及运算效率均有了显著提高;李昀哲等[6]提出一种基于深度强化学习的船舶避碰算法,通过设置合理的奖励函数,保证决策的有效性和安全性。相较于以操舵为主的开阔水域避碰决策。宁君等[7]提出一种改进的快速搜索随机树算法的船舶路径规划方法,这是一种常见的全局路径规划算法,它能够在不同的避碰场景中生成不同的虚拟障碍物,并能够规划路径以避开障碍物,但无法保证规划的路径始终遵循避碰规则,无法正确处理追越等会遇态势,并且无法限制最小会遇距离保证航行安全,难以处理高度动态情况。除了全局性的避碰算法,速度障碍VO算法依靠能够实时动态调整航速和航向的优点,也被广泛应用于智能航行系统的避碰规划,特别是无人艇等操纵性较好的小型船舶。熊勇等[8]提出一种基于速度障碍的多船自动避碰算法,能够同时考虑避碰路径规划和本船运动控制。但VO算法通常只考虑短期的局部避碰,且容易陷入局部最优解,另外,由于其计算和更新复杂,在处理大规模问题时存在一定的实时性问题。

1.3 运动控制

智能航行运动控制指的是使船舶按照预期的运动轨迹和规定的运动参数进行运动。对于中大型欠驱动船舶,目前国内外一些自主航行系统的控制技术是根据规划路径利用自动舵进行航向和航速控制,这对于船舶在开阔水域航行勉强可以使用,但对于受限水域、外界海洋环境干扰和船舶自身运动模型参数不确定性等复杂情况具有一定的局限性[9],仅依靠自动驾驶仪自主航行是无法解决精确控制船舶艏向和位置的问题,需要人工介入进行频繁的操车与操舵。焦建芳等[10]提出一种预设性能轨迹跟踪抗扰控制方法应对海洋环境干扰下的无人艇轨迹跟踪问题。沈智鹏等[11]提出一种基于扩张观测器的欠驱动船舶轨迹跟踪低频学习自适应动态面输出反馈控制策略应对速度不可测的三自由度欠驱动船舶轨迹跟踪控制问题。

2 复杂场景对智能航行技术的挑战 2.1 复杂场景分析

综合考虑场景复杂性、岸基支持、通信条件、运维便利性、航程较短、尺度和造价适中等因素,自主船舶研究应从国内近海短途货物运输船入手。这类船舶盲区多、惯性大、操纵性受限,在复杂场景下存在感知能力不足、决策和控制有效性低等问题,适合作为全航程自主船舶的研究和测试对象。

以某大型油船近一个月的历史航次为例,其航线为上海-董家口-东营港-大连港。具体航段情况如下:

上海至董家口:吴淞口至长江口水深12 m,航道狭窄(宽度0.2 n mile),船舶密集。2 n mile内有20艘船舶(以货船为主,少量渔船)。进出港时,船舶间距为600 m(前后)和200 m(左右),航速9至12节;港内船舶间距为200 m(前后)和100 m(左右),船速5至7 kn。长江口锚地2 n mile内有15艘船舶,4 n mile内有45艘船舶,以及80艘以上锚泊船。董家口码头水深20 m。

董家口至东营港:黄海海域水深30 m以上,船舶稀疏。3 n mile内有5艘船舶,6 n mile内有15艘船舶。渤海湾内水深20 m。东营港水深14 m,作业船密集,2 n mile内有10艘作业船和20艘以上锚泊船。

东营港至大连港:渤海湾水深20 m。大连港锚地大型船舶密集,2 n mile内有30艘以上锚泊船。大连港2 n mile内有10艘运行中的船舶。

通过对典型大型船舶沿海航线的分析,结合资深船员咨询、航海规则和资料查阅,总结船舶航行涉及的复杂场景主要包括:交通流密集水域、狭水道及浅水区域、恶劣天气条件。

2.2 智能航行技术挑战

根据复杂场景的特点,进一步对复杂场景下智能航行技术面临的挑战进行分析。

1)交通流密集水域

船舶在进出港和锚泊过程中面临复杂的交通状况。港内船舶密集,航行速度低,船间距小;港外航速则相对较高。锚地区域,货船集中在锚地中心,周边和外围海域则有大量渔船进行锚泊和捕鱼作业。在这种环境下,船舶主要通过让速调整航行状态,辅以转向,船员需持续操车、操舵,保持合适航速和安全间距。

在这种复杂场景下,态势感知技术面临巨大挑战。全面及时感知大量目标是关键难题,尤其是遮挡情况下目标易被遮蔽,木制小船反射信号弱,探测难度大,而渔船拖网作业范围广、设备复杂,进一步增加了感知难度。

避碰决策技术也面临诸多挑战。在多目标场景下,实现安全、合规、合理的路径规划极为困难。例如,需根据不同类型船舶和会遇态势精准确定安全距离,判断多船会遇时的避碰行为是否合规,快速应对小船抢越船头等紧急情况。此外,避碰决策还需避免穿行多个目标船之间,减少频繁变道,这同样是衡量技术水平的重要指标。

2)狭水道及浅水

在狭窄水道中,船舶受岸壁和密集船流影响,回转余度不足,会遇时避让空间有限,大多只能通过减速避让。而在浅水区域,水深变化大,暗礁浅滩多,船舶容易搁浅。此外,浅水还会增大船舶阻力系数,降低舵力系数,导致转向和制动性能变差。

对于态势感知技术,狭窄水道和浅水区域的岸线、水深、航道、岛礁等静态障碍物信息至关重要。如何高效获取并清晰呈现这些信息是关键所在。

对于避碰和控制技术,狭窄水道和浅水区域显著增加了船舶操纵难度。狭窄水道宽度有限,船舶转向时可利用空间小,必须精确计算转向时机和角度,否则可能触碰岸边或障碍物。船舶会遇频繁,需要谨慎协调避让行动。同时,浅水区域水流流经舵面时流速和压力分布改变,导致舵效变差,船舶转向需要更大舵角和更长时间,进一步增加了操纵难度。

3)恶劣天气条件

在夜间、大雾、大雨等恶劣天气下,光照不足和能见度低,船员难以通过肉眼及时发现周围障碍物、船舶或异常情况,瞭望范围和效果大幅受限,碰撞和搁浅等事故风险显著增加。

对于态势感知技术而言,低能见度场景下传感器性能受限是关键问题。视觉传感器成像质量下降,图像模糊、失真,探测距离缩短,难以准确识别物体细节和轮廓,导致对障碍物和船舶等目标的检测与识别能力大幅削弱。雷达虽不受夜间光照影响,但在大雾和雨天,水汽会散射和衰减雷达波,导致雷达信号减弱,探测距离和精度降低,尤其是对小型或低反射率目标,容易漏检或误判。

因此,恶劣天气下船舶避碰面临多重挑战。一方面,需要考虑多个目标的动态变化、传感器误差和环境因素的综合影响,现有避碰算法难以应对如此复杂的情况;另一方面,船舶间相对运动速度和态势变化更快,决策系统需在更短时间内做出准确避碰决策。

3 应对复杂场景的智能航行技术优化策略 3.1 基于多传感器融合的态势感知技术

在复杂航行场景中,单一传感器难以全面、准确地感知环境信息,多传感器融合成为提升态势感知准确性和可靠性的关键。船用导航雷达、可见光相机、红外相机、AIS和电子海图等设备各具优势,通过融合技术可实现优势互补,为智能航行提供坚实的数据基础。融合感知流程如图1所示。

图 1 融合感知流程 Fig. 1 Fusion perception process

以下是主要的感知融合算法及优化策略:

1)数据获取。主要是通过船上导航雷达、AIS,以及现在流行的可见光和红外相机对船舶周围一定范围内的目标进行实时监测,获取目标的位置、距离、速度、船型等动静态信息。

对于木制渔船和小目标等,可组合使用X/S波段雷达、可见光和红外相机,提高对信号反射信号较弱目标的整体探测效果。针对渔船拖网作业场景,在可见光和红外相机数据获取方面,开发专门的图像识别算法,对拖网作业区域的特征进行学习和识别,训练模型以识别拖网的形状以及渔船在拖网作业时的独特姿态,从而更准确地将其与其他目标区分开来,并确定其作业范围。

2)数据预处理。数据预处理是对各传感器采集的数据进行去噪、异常值剔除、归一化等处理。

针对雷达图像可采用波数域滤波和多圈累计方法抑制雷达图像中的海杂波。基于不同海况和气象条件下的雷达回波特性,利用回归分析构建恶劣海况下雷达海杂波的演化模型,进一步优化杂波抑制效果,降低虚警率。最终,结合深度学习算法实现海上雷达图像的目标识别与分类。在AIS异常数据处理方面,通过分析船舶航行轨迹的连续性和速度变化的合理性,利用贝叶斯推断等方法,精准识别并剔除AIS传输中的异常值,确保数据可靠性。

3)数据时空配准。由于各传感器采样频率和数据传输延迟不同,采集的数据在时间上存在差异。通过高精度时钟同步技术,统一各传感器数据的时间基准,确保融合数据的时间一致性。在空间配准方面,利用坐标转换算法,将所有传感器数据转换到统一的全局坐标系,使不同传感器对同一目标的测量数据在空间位置上准确对应。

在信息融合系统中,各传感器的探测间隔差异较大:视频数据采集频率约为每秒3帧,雷达运转周期约为2 s一次(36 r/min),AIS数据发送周期则在10~360 s之间。因此,需要对这些数据进行时间配准,以统一数据更新频率。具体方法是:以固定频率为基准,通过视频画面提取、雷达和AIS目标外推,将各传感器数据的输出频率统一。针对不同类型传感器数据的空间特性差异,采用分阶段空间配准方法。首先,对雷达和AIS数据进行初步空间配准,利用其稳定的测量特性建立基础空间坐标系;然后,通过精细的图像匹配和坐标映射算法,将相机图像数据准确配准到该坐标系中,从而提高整体空间配准的精度和适应性。

4)特征提取与关联。从预处理数据中提取特征,雷达提取目标的速度和距离,可见光和红外相机提取船型和方位,AIS提取船舶身份和位置。航迹关联通过对比传感器特征向量,利用欧氏距离或模糊理论匹配,判断是否为同一目标。

在航迹关联方面,可以开发基于深度学习的航迹关联模型,利用深度神经网络对大量历史航迹数据进行学习,自动提取航迹之间的复杂关联特征。该模型能够根据当前传感器数据中的目标特征,更准确地判断不同传感器数据是否属于同一目标的航迹,尤其在目标密集、运动复杂的场景下,能够显著提高航迹关联的效率和准确性。

5)信息融合。对简单测量数据按传感器的精度、可靠性和适用性赋予权重,进行加权平均计算,得到更准确的目标距离估计值。利用卡尔曼滤波(如EKF或UKF)预测和更新目标动态信息(位置和速度),优化状态估计,提高跟踪精度和稳定性。对于不确定性信息融合问题,将不同传感器的判断作为证据,通过计算信任度和似然度等参数,综合得出对目标的最终判断。

在复杂场景下,如低能见度环境,优先赋予雷达和红外相机较高权重;对于狭水道、浅水区等复杂环境中的不规则运动,采用EKF或UKF算法,更准确地预测和更新目标的位置和速度信息。

6)航迹融合状态估计。航迹关联质量管理通过综合模糊评价方法计算关联概率并打分,确认和撤销虚假航迹关联,保留真实关联。利用多周期航迹数据实时更新质量分数,实现全生命周期管理。

航迹起始周期通常为8~10个周期,可根据航行环境复杂程度和目标动态变化灵活调整:复杂水域或目标密集区域缩短周期,快速确定真实航迹;简单区域延长周期,减少计算量。

3.2 基于VO-RRT的复杂场景下的决策避碰技术

在复杂航行场景下,避碰决策至关重要,但现有避碰算法存在诸多不足。例如,快速探索随机树(RRT)算法虽适用于开阔水域,但在交通密集区域,其生成的路径易穿过障碍物密集区,如港口附近,可能使船舶进入其他船舶的航行区域,降低航行安全性。此外,RRT主要关注全局路径生成,对动态障碍物的实时避让能力差,难以应对船舶频繁动态变化的情况。

另一种常用的速度障碍(VO)算法,多应用于小艇,通过计算速度空间中的障碍区域实现避碰。然而,对于大型船舶,VO算法并不适用。大型船舶转向半径大、加减速缓慢,无法及时执行VO算法的快速转向或加减速决策。此外,VO算法仅关注局部最危险目标的即时避碰,缺乏对多船会遇态势的考量,影响航行安全。

为解决这些问题,可采用VO-RRT结合的避碰算法。该算法融合了RRT的全局路径规划能力与VO的局部避碰能力。首先在全局路径规划阶段,利用RRT算法,将复杂场景构建为二维或三维搜索空间,明确起始与目标点,标记静态障碍物,不断在空间中随机采样点,从已有树节点中选距离采样点最近的,向采样点方向扩展生成新节点,只要不与静态障碍物碰撞就加入树结构,如此反复直至树节点接近目标点,从而得到全局初始路径。在航行过程中进入局部避碰阶段,运用VO算法。船舶通过传感器实时检测周围动态障碍物的位置、速度与航向信息,计算速度空间中的障碍区域,即确定哪些速度范围会导致与障碍物碰撞。然后在船舶可行速度空间内,选择既能避开速度障碍区域,又能尽量贴近全局路径方向的速度,以此调整船舶航向与速度,实现局部避碰。

在整个航行中,全局路径与局部避碰相互融合。局部避碰后,依据船舶新位置和速度重新评估全局路径可行性。若偏离较远,利用 RRT 算法对全局路径局部调整,让船舶尽快回到全局路径附近。持续重复全局路径规划与局部避碰过程,根据实时障碍物信息和船舶状态动态调整路径与速度。

VO-RRT结合算法在复杂场景避碰方面表现出色。它在全局层面避开静态障碍物,局部层面及时避让动态障碍物,有效提高路径安全性和适应性。针对大型船舶操纵性差的问题,该算法结合其转向半径和加减速能力,合理调整局部避碰决策。同时,它能实时更新障碍物信息,应对突发情况,并优化路径规划效率,减少陷入局部最优解的可能性。在遇到障碍物时,无需重新全局规划,仅通过局部调整即可避开,保障船舶在复杂场景下的安全高效航行。

此外,针对狭水道、浅水和低能见度的复杂会遇场景,避碰决策算法也可以进行相应的优化。狭水道中,空间受限,船舶会遇复杂。基于维持当前航速航向的最小船间距原则,保向减速是关键决策。浅水区域,因水深与船舶特性,船舶操纵响应时间延长,回转半径受影响,避碰决策时,要精准评估当前环境下船舶的操纵性能,借助船舶历史与实时数据及浅水动力学模型,明确关键参数。低能见度视觉受限,需及早行动,发现碰撞风险即刻避让,避免朝正横船舶转向。

3.3 基于深度强化学习的控制技术

在狭水道、浅水、高海况等复杂场景下,船舶运动控制面临诸多挑战,传统控制方法难以满足实际需求,而深度强化学习为解决这些问题提供了新的思路。

传统船舶运动控制往往基于预设模型和固定规则,在面对复杂多变的环境时灵活性不足。例如,在不同海况、气象条件以及复杂的航行交通状况下,船舶受到的外力干扰复杂多样,传统控制策略无法及时、有效地根据这些动态变化进行调整。

深度强化学习技术则将深度学习强大的特征提取能力与强化学习的决策优化机制相结合。在船舶运动控制中,它能够让船舶不断与所处环境进行交互。船舶的传感器实时采集各种环境信息,如风速、海浪高度与方向、周围船舶的位置与速度等,这些信息作为状态输入传递给深度强化学习模型。

模型通过不断试错,根据环境反馈的奖励信号来学习和优化控制策略。奖励信号的设计至关重要,它应紧密关联船舶的安全、高效航行目标。比如,若船舶成功避开障碍物且保持稳定航行,模型将获得正奖励;若船舶发生碰撞危险或航行效率低下,则给予负奖励。通过这种方式,模型逐渐学会在不同环境参数下采取最优控制行动。

以船舶在复杂航道中的航行控制为例,当遇到前方交通密集区域时,深度强化学习模型可根据传感器获取的周围船舶分布信息,动态调整船舶的速度和航向。如果模型发现前方有船舶近距离相向驶来,它会基于之前学习到的经验,选择合适的减速和转向幅度,以确保安全避让。同时,若在调整过程中,环境参数如风速突然增大,模型也能迅速感知这一变化,并相应地再次调整控制策略,保持船舶的稳定航行。

相比传统机器学习,深度强化学习无需对船舶运动建立精确的数学模型,能够自动从大量的环境交互数据中学习到复杂的控制模式。它能够适应各种复杂场景下的参数变化,实现船舶的自适应运动控制。这种自适应能力极大地提升了船舶在复杂场景下的航行安全性与效率,为智能航行技术在复杂环境中的应用提供了有力支撑,有望推动船舶运动控制领域实现质的飞跃。

4 技术改进与开放性讨论

本文提出的几种技术方案虽然在理论和实验中表现出一定的优势,但也存在一些局限性。其他相关领域的技术也可以应用于该问题的解决,以下分别从态势感知、避碰决策和运动控制3个方面展开讨论。

4.1 态势感知的改进方向

目前的多传感器融合算法主要基于目标级别的融合,但由于各传感器对目标的描述和理解存在差异,融合精度可能受到一定限制,容易导致漏检。例如,基于卷积神经网络(CNN)的图像目标检测与跟踪技术对目标的类别、方位识别效果较好,但受限于处理二维图像信息的特点,该方法对目标的距离、航速等信息的计算精度极低,难以直接用于后续的路径规划。

为改进这些问题,可以考虑引入以下技术:

1)BEV(鸟瞰图)技术。借鉴汽车自动驾驶领域中的BEV技术,将导航雷达数据和摄像头图像进行投影变换,生成三维坐标,从而获取目标的深度信息并减少信息遮挡。

2)多模态融合技术。结合深度学习中的多模态融合技术,利用神经网络自动学习异构传感器数据之间的关联,进行像素级的目标融合。这种方法能够在各种复杂条件下为智能航行系统提供更全面、更准确的环境感知,提高融合的准确性和效率。

4.2 避碰决策的改进方向

VO-RRT算法在路径规划中存在一定的局限性,例如计算复杂度高、路径规划容易陷入局部最优解、对环境动态变化的适应性差等问题。为解决这些问题,可以引入深度强化学习(DRL)算法,通过训练智能体学习全局最优的避碰路径,并在复杂的动态环境中实时调整路径,避免陷入局部最优解。具体改进方法包括:

1)深度强化学习算法。利用DRL算法的自适应性和全局优化能力,训练智能体在动态环境中实时调整避碰路径。

2)轻量级模型。结合轻量级的深度强化学习模型(如MobileNet或Tiny-YOLO等轻量级网络结构),减少计算复杂度,提高算法的实时性,使其更适合于实时避碰决策。

4.3 运动控制的改进方向

深度强化学习在控制任务中虽然具有显著优势,但也存在一些问题,例如训练成本高、泛化能力有限、实时性和可解释性差等。为改进这些问题,可以考虑以下方法:

1)迁移学习。引入迁移学习技术,将已训练好的模型迁移到新的场景中,减少重新训练的需求。通过这种方式,可以快速适应新的任务和环境,提高模型的泛化能力。

2)混合控制方法。将强化学习与传统的控制方法(如PID控制)结合,利用传统控制方法的稳定性和快速响应特性,提高系统的整体性能和适应性。

3)可解释性增强。引入可解释性算法(如LIME、SHAP等),帮助解释模型的决策过程,提高模型的可信度和透明度,使其更适合于对安全性要求较高的应用场景。

5 结 语

智能航行技术在复杂场景中仍面临诸多挑战。虽然在态势感知、避碰决策和运动控制方面已取得一定进展,但在进出港、锚地等复杂场景下,智能化程度仍需提升。

在态势感知方面,本研究提出的多传感器融合策略提升了感知精度和可靠性,但现有算法存在精度受限、信息遮挡等问题。未来可引入BEV技术和多模态融合,通过雷达与摄像头数据的投影变换获取深度信息,实现像素级目标融合,进一步提升感知能力。

在避碰决策方面,本研究提出的VO-RRT结合算法提高了路径安全性和决策效率,但在复杂场景下仍存在计算复杂度高、局部最优性问题。未来可引入深度强化学习算法结合轻量级模型,提升全局优化能力和实时性。

在运动控制领域,本研究引入深度强化学习技术实现了自适应运动控制,但存在训练成本高、泛化能力有限等问题。未来可引入迁移学习技术结合传统控制方法,提升系统稳定性和适应性,并引入可解释性算法提高模型可信度。

未来研究应聚焦于提升可靠性、适应性和智能化水平。传感器技术需向更高精度、强抗干扰方向发展;算法优化应基于大数据和人工智能,增强实时处理与决策能力。同时,进一步探索多智能体协同、技术融合及环境适应性,以全面提升系统性能。

参考文献
[1]
王百勇, 张艳华, 贾俊乾. 基于深度学习理论下电子海图与雷达图像船舶感知信息融合[J]. 现代雷达, 2021, 43(5): 44-50.
WANG B Y, ZHANG Y H, JIA J Q. Ship perception information fusion of electronic chart and radar image based on deep learning theory[J]. Modern Radar, 2021, 43(5): 44-50. DOI:10.16592/j.cnki.1004-7859.2021.05.007
[2]
孙旭, 郑凯, 公丕永等. 智能船舶航行态势感知技术现状[J]. 船舶工程, 2022, 44(4): 14-25.
SUN X, ZHENG K, GONG P Y, et al. Current status of intelligent ship navigation situation awareness technology[J]. Ship Engineering, 2022, 44(4): 14-25.
[3]
赵仓龙. AIS与雷达信号数据融合在船舶避碰系统中的应用[J]. 舰船科学技术, 2022, 44(12): 169-172.
ZHAO C L. Application of AIS and radar signal data fusion in ship collision avoidance system[J]. Ship Science and Technology, 2022, 44(12): 169-172.
[4]
朱旭芳, 黎奥丰, 夏家伟. 基于信息融合的无人艇船舶检测与跟踪[J]. 海军工程大学学报, 2022, 34(5): 20-26.
ZHU X F, LI A F, XIA J W. Unmanned boat ship detection and tracking based on information fusion[J]. Journal of Naval University of Engineering, 2022, 34(5): 20-26. DOI:10.7495/j.issn.1009-3486.2022.05.004
[5]
周凤杰. 船舶避碰的粒子群-遗传(PSO-GA)的混合优化算法研究[J]. 船舶力学, 2021, 25(7): 909-916.
ZHOU F J. Research on the hybrid optimization algorithm of particle swarm optimization and genetic algorithm for ship collision avoidance[J]. Journal of Ship Mechanics, 2021, 25(7): 909-916. DOI:10.3969/j.issn.1007-7294.2021.07.008
[6]
李昀哲, 王硕丰, 刘彬, 等. 基于深度强化学习的船舶避碰决策算法[J]. 船舶工程, 2022, 44(10): 118-126.
LI Y Z, WANG S F, LIU B, et al. Ship collision avoidance decision algorithm based on deep reinforcement learning[J]. Ship Engineering, 2022, 44(10): 118-126. DOI:10.13788/j.cnki.cbgc.2022.10.19
[7]
宁君, 马昊冉, 李伟等. 基于改进RRT算法的船舶路径规划与跟踪控制[J]. 中国航海, 2022, 45(3): 106-112.
NING J, MA H R, LI W, et al. Ship path planning and tracking control based on improved RRT algorithm[J]. China Maritime Affairs, 2022, 45(3): 106-112.
[8]
熊勇, 贺益雄, 黄立文. 基于速度障碍的多船自动避碰控制方法[J]. 中国航海, 2015, 38(3): 46-51.
XIONG Y, HE Y X, HUANG L W. A multi-ship automatic collision avoidance control method based on speed obstacles[J]. China Maritime Affairs, 2015, 38(3): 46-51. DOI:10.3969/j.issn.1000-4653.2015.03.011
[9]
徐亮, 王欣安, 刘希, 等. 中大型无人船舶自主控制系统架构设计及实现[J]. 中国舰船研究, 2024, 19(S1): 1-9.
XU L, WANG X A, LIU X, et al. Architecture design and implementation of autonomous control system for medium and large-sized unmanned ships[J]. Chinese Journal of Ship Research, 2024, 19(S1): 1-9. DOI:10.19693/j.issn.1673-3185.03218
[10]
焦建芳, 胡正中. 无人艇轨迹跟踪的预设性能抗扰控制研究[J]. 信息与控制, 2022, 51(3): 271-279.
JIAO J F, HU Z Z. Research on preset performance robust control for trajectory tracking of unmanned vessels[J]. Information and Control, 2022, 51(3): 271-279. DOI:10.13976/j.cnki.xk.2022.1414
[11]
沈智鹏, 邹天宇, 王茹. 基于扩张观测器的欠驱动船舶轨迹跟踪低频学习自适应动态面输出反馈控制[J]. 控制理论与应用, 2019, 36(6): 867-876.
SHEN Z P, ZOU T Y, WANG R. Low-frequency learning adaptive dynamic surface output feedback control for underactuated ship trajectory tracking based on extended observer[J]. Control Theory & Applications, 2019, 36(6): 867-876. DOI:10.7641/CTA.2018.80063