海洋环境要比陆地和空中更为复杂,其中波浪、雾、光线等环境因子不但会对船体的航向产生一定的影响,而且也会使船体与周边障碍物的安全范围大大缩短。考虑到海洋目标的种类十分复杂,因此对周边海域进行有效而精确的识别,对其进行快速、准确的定位十分必要[1-4]。对海洋目标进行系统的归纳、分析,并采用合适的分类方法,建立一组适合于海洋目标的识别资料,为船舶提供基础的取样资料,已成为学术界研究的共识。
近几年,海上交通环境日趋复杂,无人船的发展具有广阔的发展空间。在海洋交通中,可通航的船舶类型越来越多,其运行路线也越来越复杂。所以,在海洋环境中,对海洋环境进行识别与监控,既要对其进行有效、精确的追踪,又要对其进行准确的分类和识别,从而对周边环境进行及时的评价,这将保证运输的安全性,节约人力、物力和时间。传统的船体跟踪检测算法计算速度慢、跟踪效率低、缺乏检测和识别特征。所以,有必要对船舶目标进行实时检测[5-6]。
1 海上船舶移动目标分类与数据分析 1.1 目标识别常用数据集随着深度学习技术在各个领域的应用和影响,大量的独立、专业化的数据库应运而生。为了进一步改善识别率和分类效率,机器学习工程和机器学习网络模型都需要一个更适合的样本库。最近几年,ImageNet是全球最大的图片资料。该资料集包括了1400万种颜色的图片,可以分成大约20000个分类,每一类包括500个以上的例子。美国斯坦福的电脑专家们制作了ImageNet数据,其目标是让ImageNet成为一个高质量开放的数据,可以最大限度为全球的研究者服务。在2001−2017年,SVRC(ImageNet)只从ImageNet数据中抽取部分样品进行训练、验证和测试。海上船舶移动目标如图1所示,海上船舶静态目标如图2所示。
在机器学习任务中,数据扩展是最常见的方法,可以有效地处理不同类型的样本数量和不均衡。通过对样本的强化,可以对网络进行训练,从而改善原有的网络性能。因此,在深度学习中,数据增强技术已逐渐成为一个热门课题。资料扩充是以已有的资料为基础,藉由一组变更的原始资料,产生新的资料。可以用下列映射来表达数据改善:
$ \phi :\delta \to \tau \text{,} $ |
式中:
$ {\delta ^ \bullet } = \delta \cup \tau 。$ |
在实际分类任务中,y代表样本x的标记,那么该扩展的样本依然是y。在图像识别中,最常用的是光度转换和几何转换。该方法利用一定的规律,把3个信道的像素数据转化成一个新的三声道像素。常用的处理方式有边缘增强、色彩抖动等。几何转换算法利用一定的几何规律,将原样本图像中的各个像素按一定的方式分布到新的位置,并对其进行修正,从而得到新的采样。辐射转换是一种常见的空间转换方式,若原图中变化的位置为yx,则将像素点转换为新的座标yx及径向转换矩阵T,则该矩阵按以下方式进行运算,得出以下结果:
$ \left[ {\begin{array}{*{20}{c}} {{{x}^ \bullet }} \\ {{{y}^ \bullet }} \\ 1 \end{array}} \right] = T\left[ {\begin{array}{*{20}{c}} {{{x}^{}}} \\ {{{y}^{}}} \\ 1 \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {{\alpha _{11}}}&{{\alpha _{12}}}&0 \\ {{\alpha _{21}}}&{{\alpha _{22}}}&0 \\ {{\alpha _{31}}}&{{\alpha _{32}}}&1 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {x} \\ {y} \\ 1 \end{array}} \right] 。$ |
通过设定辐射转换矩阵中的因数,可以对样品图像进行镜像倒置、任意角度转动、平移放大等操作。在此基础上,平移转换将样品图像中的所有像素点沿横向或纵向移动。x和y代表方向的移动量,平移运算矩阵表达式为:
$ \left[ {\begin{array}{*{20}{c}} {{{x}^ \bullet }} \\ {{{y}^ \bullet }} \\ 1 \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 1&0&{\Delta {x}} \\ 0&1&{\Delta {y}} \\ 0&0&1 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {x} \\ {y} \\ 1 \end{array}} \right] \text{,} $ |
旋转变换将样本图像中所有像素点绕同一固定点旋转一定角度,设原图像顺时针旋转角度θ,则其矩阵变换表示为:
$ \left[ {\begin{array}{*{20}{c}} {{{x}^ \bullet }} \\ {{{y}^ \bullet }} \\ 1 \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {{\text{cos}}\theta }&{ - {\text{sin}}\theta }&0 \\ {{\text{sin}}\theta }&{{\text{cos}}\theta }&0 \\ 0&0&1 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {x} \\ {y} \\ 1 \end{array}} \right] 。$ |
缩放转换又称为标度转换,它是在原始图象的x和y方向上分别按比例系数大小进行缩放运算,其矩阵转换可以重叠,这里通过左面翻转(见图3)、右面翻转(见图4)等方法来扩大样品。
卷积层是卷积神经网络的基础,而卷积神经网络则是最基础的一种操作,卷积器利用电流启动来完成卷积动作。该方法利用已有的图像进行迭代计算,从而得到有意义的信息,并将其传递给下一层的网络。卷积运算是指在卷积核上的资料与影像资料间进行直线累计运算,在传统的卷积式神经网络中,各输出端均有一方对应的输入,而卷积神经网络则利用本地接收域将输出影像的特性资讯与输入影像的子集相连,然后根据邻近的空间像素进行重新卷积。卷积神经网络的一个重要特征是采用一种通用的参数控制策略,它可以对各个卷积层的各个参数进行分割。由于采用了这种新的方法,使整个卷积神经网络的运算量和参数量明显降低,从而大大提高了网络的学习效率。一般情况下,在卷积层的卷积运算完成后,将该特征图以输入形式传送至集合层。在接收到的海量数据中,池化层可以简化有用的信息,从而降低输出的尺寸,池化层一般是在输出中指定的地方提供的。特征点被用来替代后续的特征点,从而减少特征量。池作业一般可以分成平均池和最大池,其工作原理与折页运算相似,但在折页运算中,将相加运算转化成数值间的比较运算或求取平均值。采用池式运算,既能保证图像特征的传输变化,又能增强网络的健壮性,还能降低抽取的特征失真。
2.2 AlexNetAlexNet的网络结构主要包括3个完全连接层和5个卷积层,在部分卷积层的后方设有一个池化层,采用Max法,得出图5的网络结构图。
同时,本文在基于AlexNet的网络结构之上,也提出一些新的想法,即重叠式的集合运算和局部响应标准化运算。
2.3 海上目标识别相关算法在海洋环境下,卷积式神经网络是海洋目标辨识的关键环节,而卷积式作业则是其中最常见的一项。另外,本文还采用了反向传播、分类和随机梯度下降等关键算法。BP算法是Rumelhart和Hinton在1986年首先提出的,它是根据所得到的梯度值来进行神经网络训练的,在从各参量的错误接收到局部推导后,可以对网络中的权重进行更新。在一个小型的训练集合中,可以将整个训练集合看作是神经网络的一个输入,它可以通过求出局部的微分和更新所需的参数。但是,由于训练集中的数据量较大,因此训练过程中会产生大量的运算,因此,这种运算要求较高的存储空间和较强的运算能力。由于现有的设备不能满足这一需求,所以一般采用随机梯度法来进行大规模的数据采集。
随机梯度下降方法将训练集合分为n个批次,每批包含一组训练样本,每次测试周期仅调用一次训练样本来更新该数据。Mini-batch SGD算法实际上是 SGD的一种扩展,当 n为1时,即每次训练只能使用一个样本。Mini-batch SGD的运算公式如下:
$ {\theta }_{{t}+1}={\theta }_{{t}}-\eta \cdot {\nabla }_{\theta }J(\theta ,{{x}}^{({ii}+{n})},{{y}}^{({ii}+{n})})。$ |
式中:t为迭代次数;
目前,Mini-batch SGD是目前应用最为广泛的一种深度学习方法,但是仍然有许多不足,有待于进一步提高。另外,每个更新的梯度值只针对目前的训练资料,而不会影响到其他训练资料。在此条件下,会使损失函数在训练时产生振动,或者使其在局部极小化。
3 特征融合海上船舶移动目标识别卷积神经网络的特点提取原则是将网络上各个层次的特征映射到不同的层次上,从而得到从低到高的层次特征。尽管该方法能有效地进行特征抽取,并最终完成目标的识别,但是难免会有一些细节信息的缺失。建立更加精细的特征图形,可以进一步改善SSD网络的探测准确率。有研究利用VGGNet-16进行了基于卷积神经网络的靶位分析。由此得出,不同深度的褶皱层所发出的特征图会呈现出不同的性质。在提取抽象特征时,较深层次的卷积层具有较好的优点,能够较好地表示出更多的语义信息,并能有效地将不同类型的对象进行分类。在遮挡情况下,对目标进行有效的探测,但在相同的情况下,对多个目标的探测效果却不理想。
3.1 多层次特征融合的网络结构SSD的网络结构类似于图像金字塔,把第4个卷积层和第5个卷积层的最后一层的输出特性相结合,即把Conv4_3和Conv5_3相结合。图6为VGGNet-16融合后的网络结构。
该算法的具体步骤是:先采用反卷积算法对五级卷积输出的特征图进行取样,再将2张同样大小的特征图相加,从而获得更深的融合特性。VGGNet-16中,前5个卷积核数为16,32,64,128,256,卷积核的大小一致为3×3,滑动步长为1,采用了补零法进行边缘填充。为了避免过度拟合,将dropout法引入到了全连接层,这与L2正则化不同,它是根据dropout速率随机地导致局部神经元失活。在选择非激活的情况下,无论输入的参数如何改变,其输出的数值都会维持在0。而丢弃的神经元,在前向和后向2个方向上都不会对网络的训练造成影响。
据此得出,dropout算法可以有效克服神经网络在学习过程中出现的不协调现象,有效防止了过度拟合,并能有效地对目标进行识别。
3.2 迁移学习在深度学习研究中,训练样本的数量是影响深度神经网络是否会出现过度拟合现象的主要原因。迁移学习的目的是更有效、更准确地训练新网络。学习应用程序迁移的好处主要体现在几个方面:
1)构建的新网络更稳定。将训练有素的网络模型的一些参数添加到训练中,将比从零开始构建和训练一个新网络模型更加稳定和强大;
2)网络培训成本更低。使用一些迁移的网络参数进行培训可以节省大量的人力、物力和时间成本;
3)适用于小样本训练。由于网络越大,对数据的需求就越大,因此该方法可以避免过度适应训练。
4 结 语本文对船舶移动目标识别方法进行研究。首先,对研究背景、意义、海洋移动目标识别技术的发展状况进行简要阐述,并对其中所使用的卷积式网络算法进行分析。通过对不同类型海洋靶材形态特点的研究,建立一个与此相关的独立数据库,已基本实现了对船舶目标的识别。
[1] |
王梁, 侯义锋, 贺杰. 基于Mask-RCNN的自然场景下油茶果目标识别与检测[J]. 中国农机化学报, 2022, 43(12): 148-15+189. |
[2] |
康志强, 张思乾, 封斯嘉, 等. 稀疏先验引导CNN学习的SAR图像目标识别方法[J/OL]. 信号处理, 2022: 1–15. KANG Zhi-qiang, ZHANG Si-qian, FENG Si-jia, et al. SAR Image Target Recognition Method Based on Sparse Prior Guided CNN Learning[J/OL]. Signal Processing: 1–15. |
[3] |
陈瑾龙, 徐哲壮, 黄平, 等. 基于机器视觉的四足机器人目标识别与跟随系统设计[J]. 实验技术与管理, 2022, 39(10): 135–139+167.
|
[4] |
王宏伟, 杨力, 张方雨. 基于神经网络的电磁感应探雷目标识别方法[J]. 探测与控制学报, 2022, 44(5): 90-96. WANG Hong-wei, YANG Li, ZHANG Fang-yu. Target recognition method for electromagnetic induction mine detection based on neural network[J]. Journal of Detection and Control, 2022, 44(5): 90-96. |
[5] |
李建江, 陈玮, 李明, 等. 基于网格热度值的船舶规律路径提取算法[J]. 计算机研究与发展, 2018, 055(005): 908-919. DOI:10.7544/issn1000-1239.2018.20170226 |
[6] |
朱岱寅, 耿哲, 俞翔, 等. 地面目标多角度SAR数据集构建与目标识别方法[J]. 南京航空航天大学学报, 2022, 54(5): 985-994. ZHU Dai-yin, GENG Zhe, YU Xiang, HAN Sheng-liang, YANG Wei-xing, LV Ji-ming, YE Zheng, YAN He. Ground target multi-angle SAR data set construction and target recognition method[J]. Journal of Nanjing University of Aeronautics and Astronautics, 2022, 54(5): 985-994. |