由于自主式水下机器人(AUV)在海事研究和海洋开发中具有远大前景,在未来水下信息获取、精确打击和“非对称情报战”中也有广泛应用,因此自主式水下机器人技术在世界各国都是一个重要和积极的研发领域[1]。AUV导航系统一直是近几年的研究重点,AUV需要通过导航系统实现高精度自主导航。AUV基本惯性导航系统一般采用捷联式惯导,由于AUV特殊的工作环境限制和惯性器件产生的固有漂移误差,单一的导航设备无法满足AUV长期高精度导航的需求,需要采用组合导航系统。AUV在远距离端一般采用水声引导的方法,或者采用惯性导航系统和多普勒速度计程仪组合导航的方法接近目标物,AUV对远距离端导航精度要求并不高,而近距离端导航定位才是AUV进行水下目标探测的关键[2]。目前,用于水下测量的传感器有:惯性导航传感器、声呐传感器和视觉传感器等。其中,惯性导航传感器测出的是水下机器人的相对位置,由于累计误差的产生,其精度会随着时间的推移而下降,一般应用于水下的远距离端导航;声呐传感器分为长基线、短基线和超短基线等类型,但其测量精度较差,不适用于复杂的水下环境。视觉传感器是近几年兴起的传感器,其成本低,体积小、运动方式灵活,适用于局部的精确定位,是近几年来各国的重点研究方向。AUV的水下视觉引导一般是通过摄像机来获取目标物信息,从而进行目标物识别与测距定位[3]。
水下目标自动识别是目前水下识别技术的主要研究领域,如何对图像进行特征提取是目标识别的重点研究内容。基于深度学习的发展,卷积神经网络广泛应用于物体检测、动作识别、图像分类识别等领域,能有效提取特征,性能远远优于传统方法[4]。基于卷积神经网络的视觉导航系统能够使AUV对目标观测物进行自主识别,大幅提升AUV的图像特征提取和图像识别能力,实现近距离对目标物的精准定位[5-6]。
1 卷积神经网络设计本文采用卷积神经网络对矩形木框和三角形木框进行分类,数据集来自水下对三角形木框和矩形木框的图像采集,采用1340个大小为
本文设计的卷积神经网络共有9层,有关矩形木框和三角形木框识别的详细过程如下:
1)输入层
利用双线性插值算法对原始输入图像进行缩放处理,把图像大小缩放为
2)Conv1-Relu1层
Conv1-Relu1层是一个特征提取层,利用32个
$ {{Y}}_{1}=ReLU(\omega X+{b}_{1}) \text{。}$ | (1) |
式中:X为输入图像,Y1为Conv1-Relu1层输出特征图,
3)Max-pooling层
该层是子采样层,对Conv1-Relu1层得到的32个
$ {Y}_{2}={max}_{i=1,j=1}^{2\times 2}\left({X}_{ij}\right)+b \text{。}$ | (2) |
4)Conv2-Relu2层
为了更好地提取出图像的局部特征,扩展神经元的感受野,本文对Max-pooling层得到的特征子图像进行二次卷积操作,本层采用64个
5)Max-pooling层
该层同样是子采样层,对Conv2-Relu2层得到的64个
6)Conv3-Relu3层
为了增加CNN的深度,提高分类的准确性,本文继续采用128个
7)全连接层和输出层
经过6层卷积池化操作后,得到128个大小为
本文所使用的图像数据集是来自水下对矩形木框和三角形木框不同角度的拍摄图片,数据集包含有1340张图片。实验通过TensorFlow软件完成,Linux操作系统,Intel i7-4710 CPU,主频3.00 GHz,8 G内存,显卡GTX860。
通过上述设计的卷积神经网络进行训练和测试,可以得到训练损失随着训练迭代次数的增多而降低,测试准确率也随之提高。当训练迭代的次数达到一定时,测试的准确率和损失相对处于一个平稳的状态。
由图2训练损失值图和准确率图可得,经过100次迭代训练后,卷积神经网络的训练损失值下降为10,训练准确率达到90%,变化较缓慢,且测试集精确度不高,卷积神经网络的泛化能力弱。为了将分布式特征图映射到样本标记空间,减少特征位置对分类带来的影响,本文采用了3层全连接层,并增加一层卷积层和池化层,增加训练深度,卷积神经网络如图3所示。
采用三段式全连接方式,对卷积神经网络进行训练,如图3所示。在FC1层中,输入的神经元数量为6*6*128=4608个,设置输出的神经元数量为1024个,对权重进行dropout函数操作和L2正则化,降低过拟合现象,采用ReLU激活函数进行激活,在FC2层中,同样对权重进行dropout正则化,将神经元缩减为512个,在FC3层中,采用softmax函数对输入进行二分类。
训练准确率如图4所示。比较两图可以得到,在本次试验中,经过90次训练迭代后,网络基本收敛,网络迭代了100次,卷积神经网络结构参数优化后的测试损失值为5.8%,准确率达到99.18%。
同时对比2次测试集精确度,如图5所示。加入3层全连接后,对权重参数进行dropout正则化后,测试集精度提高,卷积神经网络的过拟合现象降低,泛化能力增强。
本文将卷积神经网络应用于AUV,利用卷积神经网络进行水下目标识别,建立一个9层的卷积神经网络对水下拍摄的木框和三角框进行训练分类,使用卷积神经网络提取水下目标特征,通过目标特征提取和池化,水下目标识别在经过100次迭代训练后准确率达到90%。之后对上述神经网络结构进行优化改进,将1层连接层化分为3层连接,采用三段式全连接方式,对卷积神经网络权重分别进行dropout正则化,并增加一层卷积层和池化层,训练经过90次迭代后基本收敛,训练速度得到提高,在100次迭代训练后,水下目标识别的准确率达到99.18%,同时降低了的过拟合,提高了卷积神经网络的泛化能力。
[1] |
钟宏伟. 国外无人水下航行器装备与技术现状及展望[J]. 水下无人系统学报, 2017(4). DOI:10.11993/j.issn.2096-3920.2017.04.001 |
[2] |
段世梅, 康凤举, 王彦恺. 基于SINS/DVL/GPS的AUV组合导航技术[J]. 火力与指挥控制, 2009, 34(12): 50-52. DOI:10.3969/j.issn.1002-0640.2009.12.016 |
[3] |
Murat KÜÇÜKBAYRAK, Özhan GÜNEŞ, Arica N. Underwater Acoustic Signal Recognition Methods[J]. 2009.
|
[4] |
SHIN H C, ROTH H R, GAO M, et al. Deep convolutional neural networks for computer-aided detection: CNN architectures, dataset characteristics and transfer learning[J]. IEEE Transactions on Medical Imaging, 2016, 1-1. |
[5] |
RUSSELL S J, NORVIG P, et al. Instructor’s manual: exercise solutions for artificial intelligence a modern approach[J]. Second Edition. Artificial Intelligence A Modern Approach, 2015, 15(96): 217-218. |
[6] |
HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition[C]. IEEE Conference on Computer Vision and Pattern Recognition, Las Vegas: Computer Science, 2016: 272–275.
|
[7] |
BOUVRIE J. Notes on convolutional neural networks, MIT CBCL Tech Report, Cambridge, MA, 2006.
|
[8] |
黄德双. 神经网络模式识别系统理论[M]. 北京: 电子工业出版社, 1996.
|