舰船科学技术  2022, Vol. 44 Issue (18): 177-180    DOI: 10.3404/j.issn.1672-7649.2022.18.037   PDF    
远洋船舶目标检测中图像分类识别研究
陈燕     
中北大学 信息与通信工程学院,山西 太原 030051
摘要: 为准确划分远洋船舶类别,实现远洋船舶目标检测,保障海洋生态环境、海洋交通与国防安全,研究远洋船舶目标检测中图像分类识别方法。采用小波分析法,通过二维小波变换获取低频子图像、水平细节子图像、垂直细节子图像和对角细节子图像,将其作为远洋船舶图像特征;采用采用双向递归神经网络(BRNN)的深度学习方法构建分类器,将远洋船舶图像特征作为输入向量,通过递归神经网络将输入向量映射至输出向量,得到船舶目标图像分类结果。同时利用改进粒子群算法优化分类器中的权重与偏差参数,提升船舶目标图像分类精度。实验结果显示,所研究方法能够有效划分船舶目标图像类别,且划分精度高于97%。
关键词: 远洋船舶     目标检测     图像分类     小波分析     递归神经网络    
Research on image classification and recognition in ocean going ship target detection
CHEN Yan     
School of Information and Communication Engineering, North university of China, Taiyuan 030051, China
Abstract: In order to accurately classify ocean ships, realize the target detection of ocean ships, and ensure the protection of marine ecological environment, marine traffic and national defense security, the image classification and recognition methods in ocean ship target detection are studied. The low-frequency sub image, horizontal sub image, vertical sub image and diagonal sub image are obtained by two-dimensional wavelet transform, which are used as the image features of ocean going ships; The deep learning method of bidirectional recurrent neural network (brnn) is used to construct a classifier. The features of ocean going ship images are taken as input vectors, and the input vectors are mapped to the output vectors through the recurrent neural network to obtain the classification results of ship target images; At the same time, the improved particle swarm optimization algorithm is used to optimize the weight and deviation parameters in the classifier, so as to improve the classification accuracy of ship target images. Experimental results show that the proposed method can effectively classify ship target images, and the classification accuracy is higher than 97%.
Key words: ocean going ships     target detection     image classification     wavelet analysis     recurrent neural network    
0 引 言

远洋船舶作为远洋运输的主要载体[1],对其进行目标检测与分类识别对于海洋生态环境保护、海洋交通与国防安全产生重要意义[2],远洋船舶目标检测中的图像分类识别方法成为相关领域中的研究热点。

周慧等[3]利用特征金字塔深度网络定位船舶图像,采用CNN网络划分船舶图像类别。但该方法在实际应用过程中需通过反复的实验确定CNN网络参数,效率低且耗费大量时间。王莉等[4]在研究船舶图像分类识别方法中,构建约束稀疏表达线性编码模型,依照相似度判断函数,实现船舶图像分别识别目的。但该方法在实际应用过程中学习能力有限,导致最终所得分类结果具有一定误差。针对这些问题,研究远洋船舶目标检测中图像分类识别方法,使远洋船舶图像分类的效果得到整体提升。

1 远洋船舶图像分类识别方法 1.1 远洋船舶图像特征提取

远洋船舶图像特征提取是远洋船舶目标检测中图像分类识别的基础。采用小波分析法提取远洋船舶图像特征,获取高频或低频系数。而远洋船舶图像的大部分有效信息均存在于低频系数内[5],因此远洋船舶目标检测中图像分类识别过程中可将低频系数作为分类的特征向量。若一维图像信号 $ f\left( t \right) \in {L^2}\left( R \right) $ 于子空间 $ {V_{{{m + 1}}}} $ 内实施标准正交基展开,以m表示尺度,由此得到:

$ f\left( t \right) = \sum\limits_n {{a_{{{m + 1,n}}}}{\phi _{{{m + 1,n}}}}}。$ (1)

式中, $ {a_{{{m + 1}}}} = \left\langle {f,{\phi _{{{m + 1}}}}} \right\rangle $

$ {a_{mk}} $ $ {d_{mk}} $ 分别描述尺度与小波系数,则 $ f\left( t \right) $ 可表示为:

$ f\left( t \right) = \sum\limits_k {{a_{mk}}{\phi _{mk}}\left( t \right)} + \sum\limits_k {{d_{mk}}{\varphi _{mk}}\left( t \right)}。$ (2)

式中: $\displaystyle \sum\limits_k {{a_{mk}}{\phi _{mk}}\left( t \right)}$ 用于描述 $ f\left( t \right) $ 的低频部分; $\displaystyle \sum\limits_k {{d_{mk}}{\varphi _{mk}}\left( t \right)}$ 用于描述 $ f\left( t \right) $ 的高频部分。

远洋船舶图像 $ f\left( {x,y} \right) $ 是一种二维信号,所以需要构建二维尺度函数,公式描述如下:

$ \partial \left( {x,y} \right) = \partial \left( x \right)\partial \left( y \right),$ (3)

利用式(4)描述二维小波变换过程中的三组正交基函数:

$ \left\{ \begin{gathered} {\psi ^1}\left( {x,y} \right) = \partial \left( x \right)\psi \left( y \right),\\ {\psi ^2}\left( {x,y} \right) = \psi \left( x \right)\partial \left( y \right),\\ {\psi ^3}\left( {x,y} \right) = \psi \left( x \right)\psi \left( y \right)。\\ \end{gathered} \right. $ (4)

针对远洋船舶图像f(x,y),在x方向利用 $ \partial \left( x \right) $ $ \psi \left( x \right) $ 进行分析,能够获取f(x,y)的逼近部分与细节部分;在此基础上于y方向实施相同处理过程,能够获取低频子图像 $ {A_1}f\left( {x,y} \right) $ 、水平细节子图像 $ Z_1^{\left( 1 \right)}f\left( {x,y} \right) $ 、垂直细节子图像 $ Z_1^{\left( 2 \right)}f\left( {x,y} \right) $ 和对角细节子图像 $ Z_1^{\left( 3 \right)}f\left( {x,y} \right) $ 。可将所获取的子图像作为远洋船舶图像特征,以此为基础实现远洋船舶目标检测中图像分类识别。

1.2 双向递归神经网络的远洋船舶图像分类识别

针对远洋船舶目标检测中图像,采用双向递归神经网络(BRNN)的深度学习方法进行分类识别,其通过反相连接隐藏层与输出层,可在任意时间点输出过去与未来的数据。BRNN内的输入值与输出值均为向量[6],若以 $ X = \left\{ {{x_t}} \right\} $ 表示BRNN的输入,即 $ {A_1}f\left( {x,y} \right) $ $ Z_1^{\left( 1 \right)}f\left( {x,y} \right) $ $ Z_1^{\left( 2 \right)}f\left( {x,y} \right) $ $ Z_1^{\left( 3 \right)}f\left( {x,y} \right) $ ;以 $ Y = \left\{ {{y_t}} \right\} $ 表示BRNN的输出;以 $ t $ 表示时间步长, $ {x_t} \in {R^n} $ $ {y_t} \in {R^n} $ 均为不同 $ t $ 下的向量。经由构建 $ P\left( {Y\left| X \right.} \right) $ 分布模型,求解模型得到最终结果。

h表示隐含层,利用式(5)能够描述单向递归神经网络的输出 $ {y_t} $

$ \left\{ \begin{gathered} P\left( {{y_t}\left| {\left( {{x_i}} \right)_{i = 1}^t} \right.} \right) = \sigma \left( {{W_y}{h_t} + {b_y}} \right),\\ {h_t} = \tanh \left( {{W_h}{h_{t - 1}} + {W_x}{x_t} + {b_h}} \right) 。\\ \end{gathered} \right. $ (5)

式中:Wyby分别表示连接隐含层与输出层的权重矩阵和输出层偏差向量;WhWx分别表示隐藏至隐含层的权重矩阵和连接输出层与隐含层的权重矩阵, $ \tan h $ bh分别表示激活函数与隐含层偏差向量。

作为单向RNN的扩展,BRNN内包含2个隐含层[7],这两者间依照相反的时间顺序排序进行连接。基于此,BRNN可使用过去的数据和未来的数据,f表示前进方向的非约束重量,由此得到的yt可表示为:

$ \left\{ \begin{gathered} P\left( {{y_t}\left| {\left( {{x_i}} \right)_{i \ne t}^{}} \right.} \right) = \sigma \left( {W_y^fh_t^f + W_y^{bac}h_t^{bac} + {b_y}} \right),\\ h_t^f = \tanh \left( {W_h^fh_{t - 1}^f + W_x^f{x_t} + b_h^f} \right),\\ h_t^{bac} = \tanh \left( {W_h^{bac}h_{t + 1}^{bac} + W_x^{bac}{x_t} + b_h^{bac}} \right)。\\ \end{gathered} \right. $ (6)

式中,上标 $ bac $ 表示后向隐藏的激活。

针对输入与输出的影响水平与隐含层学习率的控制来说,BRNN内的权重设定极为重要。线性回归过程中经由输入与权重的乘积然后相加生成输出:

$ y = f\left( x \right) = \sum\limits_{j = 1}^n {{x_j}{w_j} + b}。$ (7)

式中: $ b $ 用于描述偏差,其主要功能为令输出与神经元输入间实现平衡。

1.3 基于粒子群算法的神经网络优化

权重与偏差作为BRNN分类器内的2个关键参数,两者对最终的分类结果产生直接影响。因此为了提升BRNN分类性能,采用粒子群算法这2个参数进行优化,改善BRNN不稳定的缺陷,提升BRNN分类精度,基本流程如图1所示。以权重为例,具体参数优化步骤如下:

图 1 改进粒子群算法的基本流程 Fig. 1 Basic flow of improved particle swarm optimization algorithm

步骤1 初始化粒子群相关超参数。初始化不同粒子 $ l $ 的位置与速度,根据专家经验设定权重值;将 $ l $ 位置描述成网络参数,以均方差描述适应度值。

步骤2 确定不同 $ l $ 的适应度值,并更新 $ l $ 。若全局最优粒子lz的适应度值下降,低于所设定的阈值,那么将停滞计数器的数值提升1,相反,将停滞计数器清零。

步骤3 确定是否符合收敛标准,若符合,则转入步骤7。

步骤4 如果停滞计数器的值不小于最大迭代次数,则转入步骤6;相反转入步骤5。

步骤5 更新全部 $ l $ 的速度与位置,转入步骤2。

步骤6 停滞计数器清零,更新惯性权重,同时二次初始化除lz外的剩余 $ l $ ,转入步骤2。

步骤7 输出lz作为BRNN内权重的优化结果,结束。

2 实验结果与分析 2.1 实验数据和环境

为验证本文所研究的远洋船舶目标检测中图像分类识别方法在远洋船舶图像分类中的应用效果,在Matlab软件实时编程验证本文方法功性能。实验对象为来自不同时间、不同类别的远洋船舶目标检测图片集,其中共包含1034幅远洋船舶目标检测所用的图像,其中共包含4个远洋船舶类别,不同远洋船舶类别图像的数量与来源如表1所示。

表 1 实验对象来源与构成 Tab.1 Source and composition of experimental objects
2.2 最优参数选择

为了有效评价本文方法的性能,将Spearman相关系数与Pearson相关系数作为分析指标,前者描述本文方法的准确性,后者可分析本文方法的性能。2个分析指标的取值范围均为[0,1],取值越接近1表示本文方法性能越好。在计算本文方法的Pearson相关系数前,需先进行回归分析,也就是对本文方法所得的分类结果与主观分析所得的主观分类结果之间进行非线性映射。Spearman相关系数Sp与Pearson相关系数Pe的计算公式:

$ {S_p} = 1 - \frac{{\displaystyle \sum\limits_{i = 1}^c {{{\left( {{r_{{x_i}}} - {r_{{y_i}}}} \right)}^2}} }}{{c\left( {{c^2} - 1} \right)}},$ (8)
$ {P_e} = \frac{{\displaystyle\sum\limits_{i = 1}^c {\left( {{x_i} - \overline x } \right)\left( {{y_i} - \overline y } \right)} }}{{\sqrt {\displaystyle\sum\limits_{i = 1}^c {{{\left( {{x_i} - \overline x } \right)}^2}\sum\limits_{i = 1}^c {{{\left( {{y_i} - \overline y } \right)}^2}} } } }} 。$ (9)

式中:xiyi分别表示第i幅实验对象的预估分类结果与主观分类结果,从大至小排列xiyi的顺序后,以 $ {y_i} $ $ {y_i} $ 表示其在相对排序处的位置; $ c $ 表示实验对象的数量; $ \overline x $ $ \overline y $ 分别表示本文方法对全部类别实验对象分类结果准确度的平均值和针对全部类别实验对象主观分类结果准确度的平均值。

本文方法中BRNN分类器内不同时间步长对本文方法的应用性能也同样产生显著影响,因此,对比BRNN分类器内不同时间步长条件下本文方法的Sp值与Pe值,所得结果如图2所示。分析图2能够得到,在时间步长为60的条件下,本文方法的Sp值与Pe值分别为0.974和0.972,均为不同时间步长条件下的最大值。在此之后随着时间 步长的提升,本文方法的Sp值与Pe值都呈现不同程度地降低,由此可知本文方法中的时间步长应设定为60。

图 2 不同时间步长条件下本文方法的应用性能 Fig. 2 Application performance of this method under different time steps
2.3 分类识别结果

采用本文方法对游艇类船舶和战斗类船舶进行分类识别,所得结果如图3所示。分析图3(a)能够得到,采用本文方法能够在包干若干船舶的图像中有效分类识别出3艘游艇类;分析图3(b)能够得到采用本文方法能够在包含3艘船舶的图像中有效分类识别出2艘战斗类。以上实验结果充分说明采用本文方法可有效实现不同类型远洋船舶图像分别识别。

图 3 实验对象分类结果 Fig. 3 Classification results of experimental objects
2.4 图像分类识别精度测试

不同类别船舶图像分类识别精度测试过程中,以Sp值与整体精度为评价指标,同时以文献[3]中基于特征金字塔模型的方法和文献[4]中基于约束稀疏表达的方法为对比方法,分析本文方法与2种对比方法的Sp值与整体分类识别精度,所得结果如表2所示。分析表2得到,采用本文方法划分实验对象类别过程中,本文方法的所得的Sp值与整体精度分别高于0.94%和97%,与2种对比方法相比均具有明显优势,由此说明本文方法与2种对比方法相比能够得到更准确的分类结果。

表 2 分类精度分析 Tab.2 Classification accuracy analysis
3 结 语

本文提出远洋船舶目标检测中图像分类识别方法,根据远洋船舶图像特征,采用双向递归神经网络对远洋船舶图像进行分类研究,并通过改进粒子群算法优化双向递归神经网络,提升分类性能。实验结果显示,本文方法在设定条件下能够准确划分实验对象类别。

参考文献
[1]
马啸, 邵利民, 金鑫, 等. 基于改进Mask R-CNN的可见光图像中舰船目标检测方法[J]. 北京理工大学学报, 2021, 41(7): 734-744.
MA Xiao, SHAO Limin, JIN Xin, et al. Ship Target Detection in Optical Images Based on Improved Mask R-CNN[J]. Transactions of Beijing Institute of Technology, 2021, 41(7): 734-744.
[2]
李健伟, 曲长文, 彭书娟. 基于级联CNN的SAR图像舰船目标检测算法[J]. 控制与决策, 2019, 34(10): 2191-2197.
LI Jian-wei, QU Chang-wen, PENG Shu-juan. A ship detection method based on cascade CNN in SAR images[J]. Control and Decision, 2019, 34(10): 2191-2197. DOI:10.13195/j.kzyjc.2018.0168
[3]
周慧, 严凤龙, 褚娜, 等. 基于特征金字塔模型的高分辨率遥感图像船舶目标检测[J]. 大连海事大学学报, 2019, 45(4): 131-138.
ZHOU Hui, YAN Feng-long, CHU Na, et al. Ship target detection in high resolution remote sensing images based on characteristic pyramid model[J]. Journal of Dalian Maritime University, 2019, 45(4): 131-138. DOI:10.16411/j.cnki.issn1006-7736.2019.04.018
[4]
王昌安, 田金文. 生成对抗网络辅助学习的舰船目标精细识别[J]. 智能系统学报, 2020, 15(2): 296-301.
WANG Chang'an, TIAN Jinwen. Fine-grained inshore ship recognition assisted by deep-learning generative adversarial networks[J]. CAAI Transactions on Intelligent Systems, 2020, 15(2): 296-301. DOI:10.11992/tis.201901004
[5]
陈彦彤, 李雨阳, 姚婷婷. 复杂海况下遥感图像舰船目标检测方法研究[J]. 激光与光电子学进展, 2019, 56(18): 152-160.
CHEN Yantong, LI Yuyang, YAO Tingting. Ship Detection from Remote Sensing Image Under Complex Sea Conditions[J]. Laser & Optoelectronics Progress, 2019, 56(18): 152-160.
[6]
杨龙, 苏娟, 黄华, 等. 一种基于深层次多尺度特征融合CNN的SAR图像舰船目标检测算法[J]. 光学学报, 2020, 40(2): 132-140.
YANG Long, SU Juan, HUANG Hua, et al. SAR Ship Detection Based on Convolutional Neural Network with Deep Multiscale Feature Fusion[J]. Acta Optica Sinica, 2020, 40(2): 132-140.
[7]
孙忠镇, 戴牧宸, 雷禹, 等. 基于级联网络的复杂大场景SAR图像舰船目标快速检测[J]. 信号处理, 2021, 37(6): 941-951.
SUN Zhongzhen, DAI Muchen, LEI Yu, et al. Fast Detection of Ship Targets for Complex Large-scene SAR Images Based on a Cascade Network[J]. Journal of Signal Processing, 2021, 37(6): 941-951. DOI:10.16798/j.issn.1003-0530.2021.06.005