舰船科学技术  2025, Vol. 47 Issue (11): 175-179    DOI: 10.3404/j.issn.1672-7649.2025.11.031   PDF    
动量-自适应人工神经网络下的舰船目标检测
贾世杰1, 陈伟2     
1. 英国诺丁汉大学 计算机科学学院,英国 诺丁汉 NG8 1BB;
2. 中国海洋大学,山东 青岛 266100
摘要: 舰船种类丰富、大小差异显著,从小型快艇到大型航空母舰,尺度范围跨度大,给舰船目标类型识别检测带来较大难度。为解决这一问题,提出了基于动量-自适应人工神经网络的舰船目标检测方法。此方法利用最大类间方差算法,结合图像灰度特性,通过计算类间方差最大化,将图像划分为目标与背景;采用最小外接矩形法提取舰船目标特征,通过计算能够完全包围舰船的最小矩形,获取目标的几何特征信息;将所提取特征输入基于改进人工神经网络的舰船目标检测模型,模型在权重调节中引入动量项,设计自适应学习率,增强网络对舰船特征的学习与识别能力,实现对舰船目标的识别检测。实验结果验证,该方法能够清晰地将舰船目标从背景中分离出来;对于单个舰船目标类型以及多目标类型的识别检测结果均稳定、准确。
关键词: 人工神经网络     舰船目标     识别检测     最大类间方差算法     最小外接矩形法    
Ship target detection under momentum adaptive artificial neural network
JIA Shijie1, CHEN Wei2     
1. School of Computer Science, University of Nottingham, Nottingham NG8 1BB, England;
2. Ocean University of China, Qingdao 266100, China
Abstract: There are a wide variety of ship types with significant differences in size, ranging from small speedboats to large aircraft carriers, which pose great difficulties in identifying and detecting ship target types. To address this issue, a ship target detection method based on momentum adaptive artificial neural network is proposed. This method utilizes the maximum inter class variance algorithm, combined with the grayscale characteristics of the image, to divide the image into target and background by calculating the maximum inter class variance; Using the minimum bounding rectangle method to extract ship target features, the geometric feature information of the target is obtained by calculating the minimum rectangle that can completely surround the ship; Input the extracted features into a ship target detection model based on an improved artificial neural network. The model introduces momentum terms in weight adjustment, designs an adaptive learning rate, enhances the network's ability to learn and recognize ship features, and achieves recognition and detection of ship targets. Experimental results verification: This method can clearly separate ship targets from the background; The recognition and detection results for both single ship target types and multiple target types are stable and accurate.
Key words: artificial neural network     ship targets     identification and detection     maximum inter class variance algorithm     minimum bounding rectangle method    
0 引 言

在海洋领域,舰船目标检测意义重大。民用方面,其是海上交通管理、海洋资源开发、海上搜救的关键,能保障航行安全;军事层面,其关乎战场态势掌控,对制定战略战术、保障海洋权益至关重要[1]

近年来,众多学者围绕舰船目标检测展开深入研究并取得一定进展。许京新等[2]研究融合自适应卷积神经网络在舰船目标检测中的应用,在自适应 OD-ELAN模块融入动态卷积处理,增强主干网络特征提取能力;在头部网络引入EVC机制,提升对目标的空间感知与定位能力;采用 SIOU 损失函数,进一步优化目标定位精度。SIOU 损失函数侧重目标定位优化,但在舰船目标检测中,分类准确性同样重要。该研究未有效协同优化分类与定位损失,可能致使模型目标分类出现误差。杨明秋等[3]通过设计轻量残差特征增强模块、采用轻量动态蛇形卷积及融入 BiFormer 动态稀疏注意力模块,改进 YOLOv8s 网络以提升 SAR 图像舰船目标检测能力。然而,这些模块融合时,未深入研究协同机制,因各模块特征提取和处理方式、节奏不同,易造成特征冗余或冲突,制约舰船目标检测性能进一步优化。扈琪等[4]采用非下采样剪切波和频谱残差法,提取舰船目标图像全局显著性区域,再借助动态恒虚警率的活动轮廓模型消除虚警、提取轮廓以检测舰船目标。但该方法对不同尺度和形态目标适应性差,小目标因特征微弱易漏检,大型或特殊形态目标则因轮廓复杂导致定位不准。张炳焱等[5]研究YOLO-FNC网络在舰船目标检测中的应用,从3个方面优化:网络架构上,基于 FasterNet 构建 FasterNeXt 模块,在保证精度的同时提升推理速度;特征处理中,引入 NAM 注意力机制抑制特征权重,增强船舶关键特征检测鲁棒性与准确性;训练优化时,提出新型边界框回归损失函数,改进误差度量,优化目标定位精度与收敛效率。然而,当面对密集舰船目标或复杂背景图像时,NAM 注意力机制抑制非关键特征的过程易引发计算冗余,影响检测效果。

为了提高舰船目标检测效果,设计了基于动量-自适应人工神经网络的舰船目标检测方法,并分析其性能。该方法将最大类间方差(Otsu)算法与最小外接矩形(MBR)方法相结合,实现了舰船目标的精准分割与特征提取。Otsu算法通过分析图像灰度分布自动确定最优分割阈值,有效克服了复杂海面背景下光照不均、波浪干扰等问题;而MBR方法则通过计算完全包围舰船目标的最小矩形,提取了目标的几何特征,为后续识别提供了更具判别性的特征表示。且通过引入动量项和自适应学习率机制优化人工神经网络,显著提升传统人工神经网络的训练效率和泛化能力。动量项的加入使得权重更新过程具有“惯性”,能够加速收敛并减少震荡;而自适应学习率则根据训练状态动态调整学习步长,避免了固定学习率导致的训练不稳定问题。这种双重优化策略使模型能够更高效地学习舰船目标的本质特征。

在舰船目标检测领域,传统方法在复杂海况下泛化能力有限,而本文方法通过神经网络自动学习特征,结合Otsu和MBR提供的先验知识,既保留了传统方法的可解释性,又具备了更强的特征表达能力。且通过引入动量项和自适应学习率机制,该方法能够根据不同的检测任务自动调整模型参数,大大降低了实际部署时的调参难度,提高了对复杂海况的泛化能力,以应对更复杂的海上检测需求。

1 基于动量-自适应人工神经网络的舰船目标检测方法 1.1 基于最大类间方差算法的舰船目标分割

设置舰船目标监测图像像素数量是$ N \times N $,像素灰度$ j $数值处于0~255[6 - 7],设置不同灰度级别数值出现的次数是$ {m_j} $,则灰度值$ j $在舰船目标监测图像全部像素内出现的次数占比是:

$ {q_{j}} = \frac{{{m_j}}}{{N \times N}}。$ (1)

舰船目标监测图像结合最优阈值$ H $,将图像分割成目标与背景两部分,其中目标像素是$ {A_0} $$ {A_0} \in \left\{ {0,1,...,H - 1} \right\} $,目标区域的灰度值不大于$ H $;背景区域像素$ {A_1} $不小于$ H $。则目标与背景出现的概率$ {q_0} $$ {q_1} $运算方法为:

$ {q_0} = \sum\limits_{j = 0}^{H - 1} {{q_j}} ,$ (2)
$ {q_1} = \sum\limits_{j \in H}^{255} {{q_j} = 1 - } {q_0}。$ (3)

舰船目标监测图像目标与背景像素的灰度值均值$ {\alpha _0} $$ {\alpha _1} $为:

$ {\alpha _0} = \sum\limits_{j = 0}^{H - 1} {j{q_j}/{q_0}},$ (4)
$ {\alpha _1} = \sum\limits_{j = 0}^{H - 1} {j{q_j}/{q_1}} 。$ (5)

舰船目标监测图像整体灰度均值为:

$ \alpha = \sum\limits_{j = 0}^{255} {j{q_j}} 。$ (6)

类间方差的运算方法为:

$ \beta = {q_0}{\left( {{\alpha _0} - \alpha } \right)^2} + {q_1}{\left( {{\alpha _1} - \alpha } \right)^2}。$ (7)

$ \beta $为最大值,即可获取舰船目标监测图像分割的最优阈值$ H $

$ H = \arg \max \left( {{\beta ^2}} \right)。$ (8)

把每个像素灰度级都当作候选阈值,计算其对应的类间方差。通过对比所有候选阈值的类间方差,取方差最大时的灰度值作为最优分割阈值,以此精准区分前景和背景,实现舰船目标监测图像最佳分割,输出分割后舰船目标图像$ \hat A $

1.2 基于最小外接矩形法的舰船目标几何特征提取

不同类型舰船在长宽比与矩形度上存在显著差异,这些差异与其功能定位、航行性能、作战需求等密切相关。最小外接矩形法能够提取$ \hat A $的几何特征,当使用最小外接矩形法找到包围舰船的最小矩形后,能得到主轴方向长度(长边)和垂直主轴方向宽度(短边),以此作为舰船长和宽。由长和宽算出矩形面积,进而得出 “舰船矩形度” 参数,该参数衡量目标形状接近矩形的程度,值高表示形状接近矩形,值低则差异大,计算矩形度有助于深入了解舰船形状特征,辅助目标检测与识别。提取步骤为:

步骤1 在$ \hat A $中提取舰船目标质心坐标$ \left( {{x_1},{y_1}} \right) $,将目标轮廓绕$ \left( {{x_1},{y_1}} \right) $旋转,旋转区间是$ 0.5{{\text{π}} }$,旋转角度设成$ \delta $

步骤2 旋转后结合舰船目标的x轴坐标最大值xmaxx轴坐标最小值xminy轴坐标最大值ymax轴坐标最小值ymax,便可运算获取外接矩形的面积为:

$ R = \left| {{x_{\max }} - {x_{\min }}} \right| \cdot \left| {{y_{\max }} - {y_{\min }}} \right| 。$ (9)

步骤3 再次旋转,旋转角度为$ \delta $,多次执行步骤2与步骤3,当旋转角度为$ 0.5{{\text{π}} }$便可不再旋转;

步骤4 在全部外接矩形面积内,提取面积值最小的矩形Rmin,其是最小外接矩形。提取Rmin的4个顶点坐标,运算Rmin的长$ C $、宽$ K $以及长宽比$ C/K $,作为目标的长、宽以及长宽比,则舰船目标的矩形度为:

$ S = \frac{{{R_0}}}{{{R_{\min }}}}。$ (10)

式中:R0为舰船目标面积。

1.3 基于改进人工神经网络的舰船目标检测模型

基于改进人工神经网络的舰船目标检测模型结构如图1所示。

图 1 舰船目标检测模型结构图 Fig. 1 Structure diagram of ship target detection model

将提取的$ i $$ S $输入模型,把模型的输出的舰船目标识别结果pi,与实际标注的舰船目标类型$ {\hat p_i} $进行对比分析,两者之间误差作为损失函数$ F $。结合损失函数进行反向传播,更新模型各层连接权重。不断学习调整权重后,将训练好的模型应用于新的舰船图像数据,识别检测舰船目标类型。

设置模型训练样本数据是$ \theta = \left( {\hat S,\hat Z} \right) $$ \hat S $$ \hat Z $分别表示已知舰船目标类型的目标特征、目标类型。隐藏层神经元是$ l $,输入层与隐藏层神经元之间连接权重矩阵是$ {\lambda ^1} $,隐藏层与输出层神经元之间连接权重矩阵是$ {\lambda ^2} $,隐藏层神经元和输出层神经元的阈值依次是$ {\varepsilon _1} $$ {\varepsilon _2} $,则隐藏层神经元输出的经过非线性变换后、与舰船目标检测相关的抽象特征为:

$ {l_i} = \int {\left( {\sum\limits_1^n {{\lambda ^1}{S_i} - {\varepsilon _1}} } \right)}。$ (11)

式中:$ n $为特征样本数目。

输出层神经元输出的舰船目标类型识别检测结果为:

$ {p_i} = \int {\left( {\sum\limits_{i = 1}^n {{\lambda ^2}{l_i} - {\varepsilon _2}} } \right)},$ (12)
$ F = \frac{1}{2}\sum\limits_{i = 1}^n {{{\left( {{{\hat p}_i} - {p_i}} \right)}^2}} 。$ (13)

模型中$ {\lambda _1} $$ {\lambda _2} $由梯度下降法调节,调节目标是$ F $最小,则调节量为:

$ \Delta {\lambda _i} = - \vartheta \frac{{\partial F}}{{\partial {\lambda _i}}} 。$ (14)

式中:$ \vartheta $为学习率。

为增强网络对舰船特征的学习与识别能力,引入动量项,把上一时刻($ t - 1 $)人工神经网络各层权重调节量$ \Delta \lambda \left( {t - 1} \right) $,融入本次权重调节中,则计算公式为:

$ \Delta \lambda = - \vartheta \frac{{\partial F}}{{\partial {\lambda _i}}} + \mu \Delta \lambda \left( {t - 1} \right) 。$ (15)

式中:$ \mu $为动量系数。

且考虑学习率影响网络对舰船特征的学习能力,设计自适应学习率为:

$ \vartheta\left(t+1\right)=\vartheta\left(t\right)\times2^{-\mathrm{sign}\left[F\left(t\right)-F\left(t-1\right)\right]} 。$ (16)

将训练好的模型应用于新的舰船图像数据,识别检测舰船目标类型,由式(12)输出识别检测结果。则基于动量-自适应人工神经网络的舰船目标检测实现流程如图2所示。

图 2 基于动量-自适应人工神经网络的舰船目标检测实现流程图 Fig. 2 Implementation flowchart of ship target detection based on momentum adaptive artificial neural network
2 仿真实验 2.1 实验场景

实验中,将本文方法作为某舰船目标检测系统中的核心方法,此系统的运行环境场景图如图3所示。

图 3 舰船目标检测实验场景 Fig. 3 Experimental scene for ship target detection

该系统以云平台架构为依托,整合陆基与海基数据中心,二者通过数据链路和海上舰船终端实现数据双向交互。在舰船端,借助自身图像采集设备获取海域监测图像,并利用配备的 CPU、GPU 计算设备,以本文方法作为目标检测手段。训练阶段,该方法结合陆基、海基数据中心积累的历史数据,训练基于改进人工神经网络的舰船目标检测模型。通过不断学习历史数据中的舰船特征,提升检测能力。在实际应用中,训练好的模型可对舰船采集的实时图像进行目标检测,快速且准确地识别舰船目标类型,从而达成目标检测目的。

实验中,首先使用本文方法对采集的舰船目标监测图像进行目标分割,所采集的舰船目标监测图像中目标是兰海军的“普拉斯基将军”号护卫舰,其标准排水量约3000 t,舰船在满载状态下的重量为4100 t。从船头到船尾的长度为138 m,舰船最宽处的宽度为13.7 m,舰船底部到水面的垂直距离为6.7 m。舰船在全力加速时能达到的最高速度是29 kn,舰船在长时间航行时保持的经济速度是20 kn。舰船在特定速度下能够连续航行的最大距离是4500 n mile/20 kn。

基于上述所采集的图片按1∶2的比例划分为验证集和测试集。利用验证集进行方法重复性验证,以确保后续检测数据可靠性。通过多次独立实验(每组实验重复10次),统计改进后模型的质量因子均值为0.96 ± 0.02(标准差),表明算法在不同初始条件下具有稳定输出能力,其输出检测数据结果具有可靠性。

2.2 舰船目标检测实验数据分析

本文方法使用最大类间方差算法分割获取的舰船目标监测图像如图4所示。可知,从视觉上看,分割效果较为理想。原始图像中舰船与背景(海面及天空)混杂,经最大类间方差算法分割后,舰船主体从背景中清晰分离出来,舰船轮廓完整且边界清晰,说明算法能有效区分舰船目标和背景,在视觉层面达到较好的分割目的。

图 4 分割前后舰船目标监测图像 Fig. 4 Monitoring images of ship targets before and after segmentation

舰船目标分割后,提取目标的长、宽、长宽比,作为目标的长、宽以及长宽比,提取舰船目标的矩形度特征,进行目标识别检测。

基于上述步骤,为进一步测试本文方法使用改进人工神经网络,对舰船目标进行识别检测的效果,以表1部分测试集中的样本作为输入样本,测试改进人工神经网络前后,本文方法对舰船目标识别检测精度,引入质量因子$ \Omega $作为衡量指标。

表 1 多种舰船参数信息 Tab.1 Multiple ship parameter information
$ \Omega = \frac{{{\tau _a}}}{{{\tau _b} + {\tau _c}}}。$ (17)

式中:$ {\tau _a} $$ {\tau _b} $$ {\tau _c} $依次为准确识别监测的目标数目、错误识别的目标数目、实际舰船数目。

测试结果如图5图6所示。可知,对比改进前后舰船目标检测结果质量因子图,改进前训练前期曲线波动大,质量因子起伏频繁,尤其多个目标识别检测时,在 20~40轮波动剧烈;改进后前期波动小,更快趋于平稳,收敛后单一和多个目标质量因子都稳定在较高水平,表明改进后模型收敛速度加快、舰船目标检测结果质量因子更稳定,检测结果更准确。

图 5 改进前舰船目标检测结果质量因子 Fig. 5 Quality factor of ship target detection results before improvement

图 6 改进后舰船目标检测结果质量因子 Fig. 6 Quality factor of improved ship target detection results
3 结 语

本文主要研究基于动量-自适应人工神经网络的舰船目标检测方法,此方法集舰船目标检测图像分割技术、目标特征提取技术、目标识别检测技术于一身,实现精准的舰船目标检测。结果表明,所提方法能够清晰地将舰船目标从背景中分离出来;对于单个舰船目标类型以及多目标类型的识别检测结果均更快趋于平稳,且位于较高水平。由此表明所提方法收敛速度加快、舰船目标检测结果质量因子更稳定,检测结果更准确。

参考文献
[1]
赵其昌, 吴一全, 苑玉彬. 光学遥感图像舰船目标检测与识别方法研究进展[J]. 航空学报, 2024, 45(8): 46-79.
[2]
许京新, 王金伟, 宋富骏, 等. 融合自适应卷积神经网络的SAR图像舰船目标检测方法[J]. 信号处理, 2024, 40(9): 1696-1708.
[3]
杨明秋, 左小清, 董燕. 基于改进YOLOv8s的SAR图像舰船目标检测方法[J]. 激光与光电子学进展, 2024, 61(22): 296-309.
[4]
扈琪, 胡绍海, 刘帅奇. 基于多层显著性模型的SAR图像舰船目标检测[J]. 系统工程与电子技术, 2024, 46(2): 478-487.
[5]
张炳焱, 张闯, 石振男, 等. 基于YOLO-FNC模型的轻量化船舶检测方法[J]. 中国舰船研究, 2024, 19(5): 180-187.
[6]
徐继尚, 柳翠寅, 刘明. 改进YOLOV4-Tiny的SAR图像舰船小目标检测[J]. 小型微型计算机系统, 2023, 44(12): 2791-2796.
[7]
陈玺, 何斌, 龙勇机, 等. 复杂海背景下的自适应舰船目标检测[J]. 液晶与显示, 2022, 37(3): 405-414. DOI:10.37188/CJLCD.2021-0219