舰船科学技术  2025, Vol. 47 Issue (3): 163-166    DOI: 10.3404/j.issn.1672-7649.2025.03.027   PDF    
运输类船舶海上多点礁石视频监测方法研究
刘鑫, 李慧     
武汉船舶职业技术学院,湖北 武汉 430050
摘要: 为确保运输类船舶安全航行,提高海上交通的监管效果,本文研究了运输类船舶海上多点礁石视频监测方法。通过在运输类船舶上搭载高清摄像机采集航行过程中的海面图像,利用YOLOv7模型进行单帧图像的多点礁石初步检测,并在YOLOv7的特征提取部分引入了归一化的NAM轻量级注意力机制模块,以增强模型对礁石特征的提取能力;采用LSTM网络进行跨帧间的礁石位置预测,以提高监测的准确性和稳定性,实现运输类船舶海上多点礁石的持续监测。实验结果表明,该方法在不同海况下均能准确监测到多点礁石,且消融实验表明加入NAM轻量级注意力机制和LSTM,IoU峰值提高至0.91,FLOPs维持12.3×109次,验证了对检测准确性和计算效率的提升。
关键词: 运输类船舶     多点礁石     视频监测     LSTM     YOLOv7    
Research on multi point reef video monitoring method for transportation vessels at sea
LIU Xin, LI Hui     
Wuhan Institute of Shipbuilding Technology, Wuhan 430050, China
Abstract: In the field of maritime transportation, reefs are a serious threat to the safe navigation of transportation class ships. In order to ensure the safe navigation of transportation class ships and improve the regulatory effect of sea transportation, this paper proposes a research on the video monitoring method of multi-point reefs at sea for transportation class ships. By carrying a high-definition camera on the transport class ships to collect sea surface images during navigation, the YOLOv7 model is used to carry out the initial detection of multi-point reefs in a single frame image, and the normalized NAM lightweight attention mechanism module is introduced into the feature extraction part of YOLOv7 to enhance the model's ability of extracting features of the reefs; the LSTM network is used to carry out the prediction of the reef position across frames to improve the accuracy and stability of monitoring, and realize the continuous monitoring of multi-point reefs at sea for transportation class ships. The experimental results show that the method can accurately monitor multi-point reefs under different sea conditions, and the ablation experiments show that by adding the NAM lightweight attention mechanism and LSTM, the peak IoU is increased to 0.91 and the FLOPs are maintained at 12.3 × 109 times, which verifies the enhancement of detection accuracy and computational efficiency.
Key words: transport class ships     multiple reefs     video monitoring     LSTM     YOLOv7    
0 引 言

海洋环境的复杂性和不确定性给海上运输带来了诸多挑战,运输类船舶航行过程中,海上多点礁石往往构成潜在的航行障碍和安全风险,为了确保运输类船舶的安全航行,提高海上交通的监管效率,对海上多点礁石进行监测显得尤为重要[1 - 2]

许述文等[3]依据回波数据在频域上的幅度相关性构建出拉普拉斯矩阵,计算下该矩阵的最大特征值,与表征频域能量特征的相对多普勒峰高相结合,生成一个新的检测统计量。统计量能够显著提升在复杂海洋物理及电磁环境中,对诸如运输船舶周围多点礁石这类微弱慢速小目标的检测能力。但该方法适应性和泛化能力存在不足。王海峰等[4]采用变分模态分解技术对雷达系统接收到的海面回波信号进行预处理以减少噪声干扰,运用精细复合多尺度散布熵技术深入提取海面小目标的特征信息,并构建出多维特征矩阵。将这些特征输入到XGBoost分类网络中,通过训练模型来实现对运输类船舶海上多点礁石的精确检测。该方法依赖于特定的雷达设备和信号处理硬件,这些设备的成本和可用性可能限制了该方法的广泛应用。曹禹等[5]提出方法运用谱聚类技术将海面的侧扫声呐图像分割为多个区域,并从这些区域中提取出具有平移、旋转及缩放不变性的特征,构建特征矩阵。随后,通过熵权法确定各特征权重,计算区域综合得分,从而精确选定海上多点礁石区域,有效应对噪声与阴影干扰。基于声呐图像虽然可以在一定程度上能够提供海上目标的探测信息,但在对多点礁石的精确识别和持续监测方面仍存在不足。

视频监测能够实现对海上多点礁石的清晰捕捉和准确识别,为运输类船舶的航行提供有力的安全保障[6]。本文旨在探讨运输类船舶海上多点礁石的视频监测方法。通过对视频监测技术结合基于深度学习的图像处理技术,实现对海上多点礁石的全方位、全天候监测,为提升海上运输的安全性和效率做出贡献。

1 基于视频的运输类船舶海上多点礁石监测

为实现运输类船舶在海上行进过程中的多点礁石视频监测,通过在运输类船舶上搭载高清摄像机采集行驶过程中的海面图像,应用组合网络LSTM-YOLOv7,实现海上多点礁石视频监测。组合网络LSTM-YOLOv7海上多点礁石视频监测的具体结构见图1

图 1 组合网络LSTM-YOLOv7海上多点礁石视频监测结构 Fig. 1 Composite network LSTM-YOLOv7 multi point reef video monitoring structure at sea

组合网络LSTM-YOLOv7[7]实现海上多点礁石视频监测过程如下:

1)在组合网络模型中输入海上监测视频,利用改进YOLOv7模型对单针图像进行多点礁石检测,获取初步监测结果$ {\tilde D_i} $

2)同样以当前海上视频图像帧为LSTM模型的输入,得到多点礁石的预测结果$ {\bar D_i} $

3)融合$ {\tilde D_i} $$ {\bar D_i} $,得到最终的海上多点礁石监测结果Di

4)将包含多点礁石信息的监测结果Di,二次传输至LSTM中,对下一海上视频图像帧进行预测,同时也传入改进YOLOv7模型进行监测,如此反复,实现运输类船舶海上多点礁石视频持续监测。

1.1 改进YOLOv7模型的多点礁石监测

面向海上运输船舶的多点礁石监测YOLOv7模型由四大模块构成:图像输入端、特征提取主干网络、特征融合颈部网络以及检测结果输出头部网络。图像输入端将采集到的海上图像调整为适合模型处理的统一尺寸。特征提取主干网络,以MobileNetv3作为骨干网络,负责从图像中逐层提取具有不同感受野的礁石特征图,这些特征图富含了海上礁石及周围环境的详细信息。特征融合颈部网络通过引入空间金字塔池化结合卷积(SPPCSPC)模块和扩展的高效局部注意力(E-ELAN)模块,巧妙地结合上下采样技术,进一步提取并整合了不同尺度和感受野的礁石特征图,同时深度融合主干网络提取的特征,提升模型对多点礁石的识别能力。检测结果输出头部网络利用重参数化卷积(RepConv)技术,有效融合了矩阵特征,并准确分配了目标标签,从而实现了对海上运输船舶周围多点礁石位置的精确识别和分类。在特征融合颈部网络ELAN-H层后添加一层NAM(规范化注意力的)轻量级注意力机制模块,通过获取通道以及空间的信息,以降低非显著特征权值的方式降低海面气候、潮汐作用、海底地形和地质活动等多种因素对多点礁石监测的影响,并实现模型轻量化。

NAM轻量级注意力机制模块采用BN(批量归一化)中的缩放因子对礁石特征图中各个通道和空间的重要程度进行求解。缩放因子数值大小与通道或空间特征显著程度呈正比例关系,BN计算表达式为:

$ {B_{{\mathrm{out}}}} = BN({B_{{\mathrm{in}}}}) = \gamma \frac{{{B_{{\mathrm{in}}}} - {\mu _B}}}{{\sqrt {\sigma _B^2 + \varepsilon } }} + \beta 。$ (1)

式中:BinBout分别为输入、输出特征图;μBσB分别为最小批次对应的均值、方差;γβ均为可调节参数;BN()为缩放因子的函数。

通道注意力机制的输出表达式为:

$ {M_c} = {\mathrm{sigmoid}}({W_i}(BN({F_1}))) 。$ (2)

式中:F1McWi分别为通道注意力机制的输入、输出特征图以及通道的权值。

空间注意力机制的输出表达式为:

$ {M_s} = {\mathrm{sigmoid}}({W_j}(BN({F_j})))。$ (3)

式中:FjMsWj分别为空间注意力机制的输入、输出特征图以及空间像素s对应权值。

利用上述改进后的YOLOv7模型实现多点礁石监测结果的$ {\tilde D_i} $输出。

1.2 基于LSTM的多点礁石监测

鉴于海上监测视频中包含海量与时间相关的图像信息,相较于图像而言,视频可以其上下文信息增强运输类船舶的海上多点礁石监测能力。依据海上监测视频中连续两帧图像在礁石位置时间变化上的连续性,通过前一帧图像的礁石监测结果可以有效指导当前帧的礁石位置预测,因此引入LSTM的跨帧间预测,提升海上多点礁石监测的置信程度,避免仅依靠单一图像存在的监测不稳定以及效果差问题。设itftot分别为LSTM网络单元在时刻$ t $的输入、遗忘和输出门的表达形式,其中it能够区分当前帧图像中礁石特征的重要性,确保只有重要的新信息被纳入模型,从而增强模型对礁石位置变化的适应能力。ft能够利用前一帧图像的礁石监测结果来指导当前帧的礁石位置预测。如果前一帧中的礁石位置在当前帧中不再可见(例如由于海浪或船只遮挡),遗忘门可以降低这些过时信息对预测的影响,从而提高监测的准确性。ot决定了当前帧图像的礁石位置预测结果。通过结合记忆细胞状态和输出门的值,LSTM网络能够生成一个更加准确和稳定的礁石位置预测,从而避免仅依靠单一图像导致的监测不稳定和效果差问题。3种门的计算表达式为:

$ {i_t} = \psi ({{\boldsymbol{W}}_{xi}}{x_t} + {{\boldsymbol{W}}_{hi}}{h_{t - 1}} + {{\boldsymbol{b}}_i}),$ (4)
$ {f_t} = \psi ({{\boldsymbol{W}}_{xf}}{x_t} + {{\boldsymbol{W}}_{hf}}{h_{t - 1}} + {{\boldsymbol{b}}_f}) ,$ (5)
$ {o_t} = \psi ({{\boldsymbol{W}}_{xo}}{x_t} + {{\boldsymbol{W}}_{ho}}{h_{t - 1}} + {{\boldsymbol{b}}_o}) )。$ (6)

式中:WxiWhiWxfWhfWxoWhi分别为itftot等3个门的输入值和隐含状态对应的权值矩阵;bibfbo为三者对应的偏置矩阵;$ \psi $为激活函数,负责将$ ( - \infty , + \infty ) $区间内的数值转化到[0,1]区间。

单元状态ct和隐含状态ht的计算表达式为:

$ {c_t} = {f_t} + {i_t} \circ \tanh ({{\boldsymbol{W}}_{xc}}{x_t} + {{\boldsymbol{W}}_{hc}}{h_{t - 1}} + {{\boldsymbol{b}}_c}), $ (7)
$ {h_t} = {o_t}\tanh ({c_t})。$ (8)

式中:WxcWhc均为权值矩阵,分别对应于ct的输入与隐含状态;bcct的偏置矩阵;$ \circ $为哈达玛积运算。

LSTM网络利用海上监测视频中的时间连续性信息,实现了跨帧间的礁石位置预测,获取$ {\bar D_i} $,进一步提高了监测的准确性和稳定性。

通过将改进YOLOv7模型的初步监测结果$ {\tilde D_i} $与LSTM网络的预测结果$ {\bar D_i} $相结合,获取$ {D_i} $,组合网络LSTM-YOLOv7能够实现对运输类船舶海上多点礁石的持续、高效监测,为海上航行安全提供了有力保障。

2 结果与分析

以某运输类船舶为实验对象,在该船舶上搭载型号为YTH-G28K的船舶用4寸高清摄像机,采集其在海上运输过程中的航行监测视频,应用本文方法对该运输类船舶在海上的多点礁石进行监测。随机从监测视频中选取2个不同海况的关键帧展示应用本文方法监测到的海上多点礁石监测结果,结果如图2所示。分析发现,本文方法可以准确地监测到不同海况下的海上多点礁石,即使较小礁石也能准确监测,这表明该方法具有强大的特征提取和识别能力,能够在复杂的海洋环境中有效地捕捉到礁石的特征信息。这是因为本文使用的LSTM网络能够利用视频帧间时间连续性,跨帧预测礁石位置。在海浪涌动、船舶颠簸致礁石短时隐匿或部分遮挡场景中,有效保持监测连贯性,经模拟复杂动态场景测试。填补传统监测实时性与稳定性短板,全方位提升船舶应对礁石风险能力。

图 2 海上多点礁石监测结果 Fig. 2 Monitoring results of multi-point reefs at sea

选取IoU(交并比)与FLOPs(浮点运算次数)2个指标作为评价指标,IoU用于评估多点礁石目标检测准确性。IoU值越高,说明监测结果越精准;FLOPs表示模型每秒能够执行的浮点运算次数,反应模型计算性能,数值越小,代表计算效率越高。消融实验结果见表1。可知,在仅使用YOLOv7作为基础模型时,IoU值为0.85,表明模型在多点礁石目标检测上已具备一定的准确性。然而,此时的FLOPs高达85.5×109次,意味着模型的计算性能还有较大的优化空间。当引入NAM轻量级注意力机制后,IoU值显著提升至0.88,说明该机制能够有效增强模型对礁石目标的识别能力。同时,FLOPs降低至10.4×109次,展示了NAM机制在提升检测准确性的同时,也显著优化了模型的计算效率。当在YOLOv7基础上引入LSTM时,虽然IoU值有所提升,但FLOPs增加至52.4×109次,表明LSTM的引入在一定程度上增加了模型的计算复杂度。当同时引入NAM轻量级注意力机制和LSTM时,IoU值达到了最高的0.91,这表明2种机制的结合能够显著提升多点礁石监测的准确性。同时,FLOPs保持在相对较低的12.3×109次,说明在引入LSTM后,通过合理的模型设计和优化,仍然可以保持较好的计算效率。这是因为NAM轻量级注意力机制与LSTM协同,形成互补闭环。NAM聚焦单帧图像礁石特征提纯,为LSTM馈送精准特征序列。LSTM 借时间序列优势优化跨帧预测,反向指引NAM精准筛选动态变化下关键特征,动态协同校准,高效化解复杂海况难题。综上所述,本文提出的方法在多点礁石监测中展现出优异的性能。通过引入NAM轻量级注意力机制和LSTM,有效提升了目标检测的准确性和计算效率。

表 1 消融实验结果 Tab.1 Results of ablation experiment
3 结 语

本文针对运输类船舶在海上航行过程中可能遇到的多点礁石监测问题,提出基于组合网络的视频监测方法。该方法能够准确地监测到不同海况下的海上多点礁石,即使在大风浪等恶劣海况下也能保持较高的检测精度。这表明该方法具有强大的特征提取和识别能力,能够在复杂的海洋环境中有效地捕捉到礁石的特征信息。此外,通过消融实验进一步验证了本文方法在多点礁石监测中的应用效果。引入NAM轻量级注意力机制和LSTM,能够保持较好计算效率的同时进一步提升监测准确性。

参考文献
[1]
王志鹏, 郝寨柳, 田于逵, 等. 基于FEM/SPH耦合方法的极地运输船舶冰阻力预报研究[J]. 船舶力学, 2021, 25(1): 9-15.
WANG Z P, HAO Z L, TIAN Y K, et al. Research on ice resistance prediction of a polar vessel based on FEM/SPH coupling method[J]. Journal of Ship Mechanics, 2021, 25(1): 9-15. DOI:10.3969/j.issn.1007-7294.2021.01.002
[2]
孙琳. 基于群智能优化算法的船舶最优运输路线规划[J]. 船舶科学技术, 2024, 46(12): 166-169.
SUN L. Optimal transportation route planning for ships based on swarm intelligence optimization algorithm[J]. Ship Science and Technology, 2024, 46(12): 166-169.
[3]
许述文, 焦银萍, 白晓惠, 等. 基于频域多通道图特征感知的海面小目标检测[J]. 电子与信息学报, 2023, 45(5): 1567-1574.
XU S W, JIAO Y P, BAI X H, et al. Small target detection based on frequency domain multichannel graph feature perception on sea surface[J]. Journal of Electronics & Information Technology, 2023, 45(5): 1567-1574.
[4]
王海峰, 行鸿彦, 陈梦, 等. 基于精细复合多尺度散布熵与XGBoost的海面小目标检测方法[J]. 电子测量与仪器学报, 2023, 37(1): 12-20.
WANG H F, XING H Y, CHEN M, et al. Small target detection method based on refined composite multiscale dispersion entropy and XGBoost[J]. Journal of Electronic Measurement and Instrumentation, 2023, 37(1): 12-20.
[5]
曹禹, 刘光宇, 穆琳琳, 等. 基于多区域最优选择策略的声呐图像目标检测[J]. 西北工业大学学报, 2023, 41(1): 153-159.
CAO Y, LIU G Y, MU L L, et al. Sonar image target detection based on multi-region optimal selection strategy[J]. Journal of Northwestern Polytechnical University, 2023, 41(1): 153-159. DOI:10.3969/j.issn.1000-2758.2023.01.018
[6]
商林. 基于智能物联网平台的船舶运输路线规划系统[J]. 船舶科学技术, 2020, 42(20): 175-177.
SHANG L. Design of shipping route planning system based on intelligent Internet of things platform[J]. Ship Science and Technology, 2020, 42(20): 175-177.
[7]
王均成, 贺超, 赵志源, 等. 基于YOLOv3-tiny的视频监控目标检测算法[J]. 电子技术应用, 2022, 48(7): 30-33+39.
WANG J C, HE C, ZHAO Z Y, et al. Video surveillance object detection method based on YOLOv3-tiny[J]. Application of Electronic Technique, 2022, 48(7): 30-33+39.