«上一篇
文章快速检索     高级检索
下一篇»
  哈尔滨工程大学学报  2019, Vol. 40 Issue (6): 1072-1077  DOI: 10.11990/jheu.201803011
0

引用本文  

刘磊, 蒋仲廉, 初秀民, 等. 船舶自动识别系统数据修复和预测算法研究[J]. 哈尔滨工程大学学报, 2019, 40(6): 1072-1077. DOI: 10.11990/jheu.201803011.
LIU Lei, JIANG Zhonglian, CHU Xiumin, et al. Automatic identification system data restoration and prediction[J]. Journal of Harbin Engineering University, 2019, 40(6): 1072-1077. DOI: 10.11990/jheu.201803011.

基金项目

国家自然科学基金项目(51479155, 51709220);中央高校基本科研业务经费专项资金(2017-zy-0479)

通信作者

蒋仲廉, E-mail:z.jiang@whut.edu.cn

作者简介

刘磊, 男, 博士研究生;
蒋仲廉, 男, 副研究员

文章历史

收稿日期:2018-03-05
网络出版日期:2018-12-18
船舶自动识别系统数据修复和预测算法研究
刘磊 1,2, 蒋仲廉 1,2, 初秀民 1,2, 钟诚 1,2, 张代勇 1,3     
1. 武汉理工大学 国家水运安全工程技术研究中心, 湖北 武汉 430063;
2. 武汉理工大学 能源与动力工程学院, 湖北 武汉 430063;
3. 武汉理工大学 物流工程学院, 湖北 武汉 430063
摘要:针对船舶AIS数据丢失或错误等问题,本文借助分段三次Hermite插值实现AIS数据初步修复或预测,建立神经网络训练集和测试集,开展单点和连续多点AIS数据修复和预测;对比分析了BP神经网络与三次样条插值、分段三次Hermite插值方法以及组合算法在船舶AIS数据修复和预测中的精度。以重庆弯曲河段和武汉顺直河段为例,分析了航道平面形态、算法组合等对于船舶AIS数据修复和预测精度的影响。结果表明:联合算法有效提升了船舶AIS数据修复精度;在船舶AIS预测中,神经网络模型表现最优。研究成果可为船舶行为特征分析、建模等相关领域的研究提供借鉴。
关键词水路运输    数据修复和预测    BP神经网络    分段三次Hermite插值    三次样条插值    联合数学模型    自动识别系统数据    修复和预测精度    
Automatic identification system data restoration and prediction
LIU Lei 1,2, JIANG Zhonglian 1,2, CHU Xiumin 1,2, ZHONG Cheng 1,2, ZHANG Daiyong 1,3     
1. National Engineering Research Center for Water Transport Safety, Wuhan University of Technology, Wuhan 430063, China;
2. School of Energy and Power Engineering, Wuhan University of Technology, Wuhan 430063, China;
3. School of Logistics Engineering, Wuhan University of Technology, Wuhan 430063, China
Abstract: We established models for single-point and continuous multipoint automatic identification system (AIS) data restoration and prediction on the basis of the training and testing sets of the BP neural network and the piecewise cubic Hermite interpolation to resolve AIS data loss or error. The precisions of the BP neural network, traditional cubic spline interpolation, piecewise cubic Hermite interpolation and combinecl algorithm in ship AIS data restoration and prediction were compared. Finally, the Chongqing and Wuhan Waterways were investigated in case studies. The influence of river configuration and algorithm combinations on the accuracy of AIS data restoration and prediction models was analyzed. Results indicated that the data repairing accuracy of the combined algorithm is dramatically improved, and the neural network model demonstrated the best AIS data prediction performance. Results can provide references to research on ship behavior characteristic analysis, modeling, and other related fields.
Keywords: waterway transportation    data restoration and prediction    BP neural network    piecewise cubic Hermite interpolation    cubic spline interpolation    joint mathematical model    automatic identification system (AIS) data    repair and prediction accuracy    

船舶自动识别系统(automatic identification system, AIS)由岸基设施和船载设备组成,是一种集网络技术、现代通信技术、计算机技术、电子信息显示技术为一体的数字助航系统[1-3],其核心是将船舶的GPS信息用甚高频数字通信广播给周围的其他船舶,使船舶间共享信息,实现船舶的自动识别和监视[4]。AIS在水路中的应用包含多个方面,包括船舶引航[5]、船舶航行监测[6]、搜救和救助以及应用AIS数据进行船舶行为分析、事故分析[7]、海事空间规划[8]等。因此,利用AIS数据开展船舶交通流研究成为交通领域的焦点问题之一。上述关于AIS数据的应用与研究,均依赖于准确完整的AIS数据,而工程中基站所接收的AIS数据常常存在不完整或不准确等问题[9]。因此,亟需开展船舶AIS数据的修复与预测研究。

传统的船舶AIS数据修复主要通过数据插值[10]方式实现。吴建华等[11]在AIS轨迹异常点进行分类的基础上,采用三次样条插值进行数据修复;刘立群等[12]在采用Vondrak对数据进行预处理的基础上,应用三次样条插值完成了轨迹修复,但仅验证了轨迹中的部分点,并未给出完整轨迹的修复结果。鉴于AIS数据标准时间间隔的差异性,Nguyen等[13]首先对时间序列进行特征识别,继而采用分段线性插值或分段三次Hermite插值进行数据修复。由于该方法融合了时间序列特征识别与插值修复方法,因此对一类AIS数据具有自适应修复能力。神经网络模型被广泛应用于交通数据预测,姚志洪等[14]采用神经网络构建了交通流预测模型,实验结果显示模型能够很好地显示交通流的变化。徐婷婷等[15]采用BP神经网络进行了船舶航迹预测,以航向、航速和经纬度差作为模型的输入和输出,将Sigmoid函数作为轨迹点预测的激活函数;甄荣等[16]借助BP神经网络开展了AIS数据预测,以前3个点的数据预测第4个点的数据。然而,上述文献中船舶AIS数据预测仅依靠少量的船舶轨迹,且以单点预测为主。

本文基于重庆弯曲河段和武汉顺直河段的大量历史AIS数据,在完成AIS数据的预处理的基础上,调整数据格式并标准化,确定神经网络模型各项参数;最后,通过分段三次Hermite插值结果构建了BP神经网络的训练集和测试集,开展了船舶AIS数据修复和预测。通过与传统插值方法、BP神经网络算法相对比,评价并探讨了4类方法在工程应用中的有效性。

1 分段三次Hermite插值和BP神经网络联合数学模型

以船舶AIS数据修复为例,BP神经网络的输入由丢失点前后轨迹点和和插值修复结果构成,输出为丢失点实际值与插值结果之间的误差。假设xi={x1, x2, …, xn}为一条船舶轨迹数据,则{x1, x2, …, xt-1}、{xt}及{xt+1, xt+2, …, xn}共同构成输入向量集xinput,{x1-x1, x2-x2, …, xm-xm}构成神经网络的输出,其中xt为拟修复的点,xt为插值修复的点。将插值修复结果与神经网络输出误差相加,可得到2种方法结合下的数据修复结果。

常用BP(back propagation)神经网络的拓扑结构包括输入层、隐藏层和输出层3层BP网络模型[14]。BP神经网络模型的基本计算流程如图 1所示。神经网络循环终止条件分别有权重的更新低于某个阈值、预测的错误率低于某个阈值以及达到预设的一定的循环次数。

Download:
图 1 BP神经网络计算流程 Fig. 1 Flowchart of BP neural network model

在神经网络运算过程中,每个连接的权重由反方向最小化误差进行更新,其核心问题在于∂C/∂ω和∂C/∂b的求解,具体推导算法流程可概括为:

1) 权重初始化;

2) 输入x,设置输入层的activation;

3) 正向更新:对于i=1, 2, …, l计算

$ z^{l}=\omega^{l} a^{l-1}+b^{l}, a^{l}=\sigma\left(z^{l}\right); $

4) 计算输出层error,δL=∇aCσ′(zL);

5) 反向更新error,

$ \delta^{L}=\left(\left(\omega^{l+1}\right)^{T} \delta^{l+1}\right) \odot \sigma^{\prime}\left(z^{L}\right); $

6) 输出$\frac{\partial C}{\partial \omega_{j k}^{l}}=a_{k}^{l-1} \delta_{j}^{l} $$ \frac{\partial C}{\partial b_{j}^{l}}=\delta_{j}^{l}$

2 船舶AIS数据预处理与模型建立

AIS数据预处理是开展航迹数据预测和修复的前提;在此基础上,对标准格式AIS数据分别进行分段三次Hermite插值、三次样条插值和BP神经网络训练,同时将分段三次Hermite插值结果输入到另一个神经网络模型中进行训练和输出;最后将4类方法结果进行对比。具体流程如图 2所示。

Download:
图 2 AIS数据处理流程示意 Fig. 2 Flowchart of AIS data pre-processing
2.1 AIS数据预处理

AIS数据中包含了船舶MMSI、UTC时间、经度、纬度、速度、航向、船舶类型以及AIS船台类型等动静态数据,本文以船舶经纬度数据为研究对象,开展船舶AIS数据修复和预测算法研究。

1) 轨迹分离。

船舶轨迹分离具体过程分为2步:分离不同船舶的数据;分离同一船舶不同轨迹数据。MMSI号是船舶的唯一标识,可作为分离不同船舶的依据;船舶在不同时间段内航行轨迹不连续,可根据AIS数据时间戳分离同一船舶不同轨迹。

2) 时间间隔标准化。

AIS数据发送时间间隔有标准规范;然而,采集的AIS数据时间间隔存在大量与标准不符的情形。此外,在内河中很少有船舶装备高成本的电罗经,船舶航向改变所引起AIS报文发送时间变化较少见。根据长江武汉段2015年7月的AIS数据统计结果(如图 3所示)及AIS数据发送时间间隔,确定将AIS数据发送特征时间间隔定义为6、10、15和30 s。

Download:
图 3 船台动态信息发送时间间隔分布 Fig. 3 Distribution of dynamic information transmission time intervals

3) 数据清洗。

船舶AIS的经纬度数据源自GPS,而在GPS相对定位中,观测值可能出现误差,原因包括大气延迟、多路径效应以及衍射等[17]。经纬度漂移数据过滤规则定义如下:通过计算船舶当前行驶速度与时间间隔的乘积可求得理论上船舶行驶的距离,将该距离值增加一定阈值之后与通过经纬度求得的距离进行比较,若后者较大则认为数据点存在漂移,应予以剔除。

2.2 神经网络模型结构

1) 激活函数。

选取tanh函数作为激活函数,tanh为Sigmoid函数的变形,是常用的非线性激活函数。其数学形式表达为:

$ f(x)=2 \cdot\left(\frac{1}{1+\mathrm{e}^{-2 x}}\right)-1 $ (1)

相比于sigmoid函数,tanh函数可将输入的连续值压缩到-1~1,并且输出均值为0,较sigmoid具有更高的适用性。

2) 网络参数。

本文将神经网络设定为3层,即输入层、隐藏层和输出层。根据文献[18]所述神经网络隐含层神经元确定的方法,即(n_in+n_out)·0.5,其中n_in为输入神经元数量,n_out为输出节点数。在分段三次Hermite插值和神经网络联合算法中,由于输入为完整轨迹数据个数30,输出由预测或修复点数确定。因此,根据预测或修复的数据量和输入来决定隐藏层神经元个数。同时由初始实验结果,可知训练30轮基本达到了最优效果,因此设定训练轮次为30轮,学习率初始化为0.01。

3 模型验证与讨论

长江干线航道在上游河段呈现急弯、卡口多等特征,中游则以顺直、分汊河道为主。本文分别选取长江干线航道重庆段和武汉段,开展AIS数据修复与预测研究。AIS数据经预处理后,重庆段、武汉段数据分布如图 4所示。通过选取标准时间间隔(30 s)的AIS数据,以30个点作为一条完整据。在重庆段,满足条件的重庆段轨迹数据4 229条,将3 000条数据作为训练集,1 229作为测试集;在武汉段,满足条件的船舶段轨迹数据31 611条,将30 000条作为训练数据,1 611条作为测试数据;此外,另设定了一组武汉段训练数据3 000条和测试数据1 229条,用于重庆段与武汉段的数据对比。

Download:
图 4 船舶自动识别系统数据分布图 Fig. 4 Original AIS data for case studies

为评价实验结果,本文引入指标衡量参数:

$ R = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {X_{{\rm{ distance }}, i}^2} } $ (2)
$ M = \frac{1}{n}\left\{ {\sum\limits_{i = 1}^n {\frac{{\left| {{X_{{\rm{obs}}, i}} - {X_{{\rm{model}}, i}}}\;\;\;\; \right| \cdot 100}}{{{X_{{\rm{obs}}, i}}}}} } \right\} $ (3)

式中:Xdistance表示通过原始经纬度和修复经纬度求得的距离误差,m;系数R为均方根误差;M是统计中对预测精度的度量方法;Xobs表示经度和纬度的实际值;Xmodel表示经度和纬度的预测值。同时,为了分析验证算法有效性,开展神经网络模型、三次样条插值和分段三次Hermite插值方法对比研究。

3.1 船舶AIS数据修复

重庆段和武汉段AIS数据修复实验结果如图 5所示。其中,“武汉1”表示训练集和测试集分别为3 000和1 229,即与重庆段相同数据量下实验结果。根据实验结果,得出纬度的M要高于对应经度的M,这是由纬度值本身较小导致的。4种算法均可较好的修复AIS数据:1)神经网络和分段三次Hermite插值联合算法、神经网络和两类插值算法均能有效修复AIS数据;2)4种方式数据修复方式中,以分段三次Hermite插值和神经网络联合修复最优;3)重庆弯曲河段的神经网络修复优于插值修复;4)重庆弯曲河段修复总体效果低于武汉顺直河段;5)增加训练集对武汉河段基于神经网络的船舶AIS数据修复精度提升效果不明显。

Download:
图 5 重庆段和武汉段船舶自动识别系统数据修复距离误差变化曲线 Fig. 5 Variations of error curves in AIS data restoration for the Chongqing and Wuhan reaches
3.2 船舶AIS数据预测

重庆段和武汉段AIS数据预测实验结果如图 6示。其中,“武汉1”表示训练集和测试集分别为3 000和1 229,与重庆段相同数据量下实验结果。根据结果可得插值方法预测精度远低于神经网络方法。

Download:
图 6 重庆段和武汉船舶自动识别系统数据段预测距离误差变化曲线 Fig. 6 Variations of error curves in AIS data prediction for the Chongqing and Wuhan reaches

图 6可知:1)随着预测点数的增加,神经网络的优势逐渐显现;2)使用BP神经网络和插值联合预测多个点时,受到分段三次Hermite插值精度误差较大的影响,预测精度低于神经网络模型;3)重庆弯曲河段的预测效果总体低于武汉顺直河段;4)增加训练数据集可提升基于BP神经网络和分段三次Hermite插值联合算法的预测精度,但对BP神经网络的精度提升效果不明显。

4 结论

1) 采用BP网络模型和插值方法可较好地实现船舶AIS数据修复。

2) 船舶AIS数据修复时,BP神经网络和分段三次Hermite插值联合算法修复效果最优;在重庆弯曲河段,BP神经网络修复精度高于插值方法。

3) 船舶AIS数据预测时,BP神经网络较插值方法优势明显;受到插值预测精度的影响,BP神经网络和分段三次Hermite插值联合算法的预测误差较大。

4) 重庆弯曲河段的修复预测效果总体低于武汉顺直河段。

参考文献
[1]
邹秋花.基于模糊综合函数的AIS与雷达信息融合研究[D].大连: 大连海事大学, 2013.
ZOU Qiuhua. Study on AIS and radar information fusion based on fuzzy comprehensive function[D]. Dalian: Dalian Maritime University, 2013. http://cdmd.cnki.com.cn/Article/CDMD-10151-1013204857.htm (0)
[2]
于俊逸, 陈伟, 刘建, 等.内河航道VTS与AIS系统信息融合关键技术的研究[C]//第十三届海峡两岸智能运输系统学术研讨会论文集.成都, 2013.
YU Junyi, CHEN Wei, LIU Jian, et al. Research on VTS and AIS information fusion in the inland waterway[C]//The Taiwan Strait intelligent transportation systems Symposium. Chengdu, 2013. http://www.wanfangdata.com.cn/details/detail.do?_type=conference&id=8169614 (0)
[3]
林祎珣.数据挖掘技术在海上交通特征分析中的应用研究[D].厦门: 集美大学, 2011.
LIN Yixun. Application of data mining technology in analysis of marine traffic characteristics[D]. Xiamen: JiMei University, 2011. http://cdmd.cnki.com.cn/Article/CDMD-10390-1011209748.htm (0)
[4]
吴青, 崔建平, 马枫, 等. 基于奥村模型的内河AIS基站监测范围研究[J]. 武汉理工大学学报(信息与管理工程版), 2011, 33(1): 36-39, 42.
WU Qing, CUI Jianping, MA Feng, et al. Research of monitoring scope of inland ais base station based on Okumura-Hata model[J]. Journal of Wuhan University of Technology (information & management engineering), 2011, 33(1): 36-39, 42. DOI:10.3963/j.issn.1007-144X.2011.01.009 (0)
[5]
魏冰. AIS的应用及前景展望[J]. 中国水运, 2012, 12(7): 70, 92.
WEI Bing. AIS application and prospects[J]. China water transport, 2012, 12(7): 70, 92. (0)
[6]
童笑.基于AIS的电子海图导航系统设计与实现[D].武汉: 武汉理工大学, 2012.
TONG Xiao. The design and implementation of electronic chart navigation system based on AIS[D]. Wuhan: Wuhan University of Technology, 2012. http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y2100115 (0)
[7]
WANG Yang, ZHANG Jinfen, CHEN Xianqiao, et al. A spatial-temporal forensic analysis for inland-water ship collisions using AIS data[J]. Safety science, 2013, 57: 187-202. DOI:10.1016/j.ssci.2013.02.006 (0)
[8]
FIORINI M, CAPATA A, BLOISI D D. AIS data visualization for maritime spatial planning (MSP)[J]. International journal of e-navigation and maritime economy, 2016, 5: 45-60. DOI:10.1016/j.enavi.2016.12.004 (0)
[9]
刘兴龙, 初秀民, 马枫, 等. 山区航道虚拟航标基站布设间距研究[J]. 哈尔滨工程大学学报, 2016, 37(3): 382-387.
LIU Xinglong, CHU Xiumin, MA Feng, et al. Base station spacing of virtual aids to navigation in mountain waterways[J]. Journal of Harbin Engineering University, 2016, 37(3): 382-387. (0)
[10]
戴鹏睿. AIS轨迹动态插值在实时视景显示中的应用[J]. 电子设计工程, 2016, 24(14): 172-175.
DAI Pengrui. Application of AIS trajectory dynamic interpolation in real-time visual display[J]. Electronic design engineering, 2016, 24(14): 172-175. DOI:10.3969/j.issn.1674-6236.2016.14.052 (0)
[11]
吴建华, 吴琛, 刘文, 等. 舶舶AIS轨迹异常的自动检测与修复算法[J]. 中国航海, 2017, 40(1): 8-12, 101.
WU Jianhua, WU Chen, LIU Wen, et al. Automatic detection and restoration algorithm for trajectory anomalies of ship AIS[J]. Navigation of China, 2017, 40(1): 8-12, 101. DOI:10.3969/j.issn.1000-4653.2017.01.003 (0)
[12]
刘立群, 吴超仲, 褚端峰, 等. 基于Vondrak滤波和三次样条插值的船舶轨迹修复研究[J]. 交通信息与安全, 2015, 33(4): 100-105.
LIU Liqun, WU Chaozhong, CHU Duanfeng, et al. A study of ship trajectory restoration based on Vondrak filtering and cubic spline interpolation[J]. Journal of transport information and safety, 2015, 33(4): 100-105. (0)
[13]
NGUYEN V S, IM N K, LEE S M. The interpolation method for the missing AIS data of ship[J]. Journal of navigation and port research, 2015, 39(5): 377-384. DOI:10.5394/KINPR.2015.39.5.377 (0)
[14]
姚志洪, 蒋阳升, 韩鹏, 等. 基于神经网络的小时间粒度交通流预测模型[J]. 交通运输系统工程与信息, 2017, 17(1): 67-73.
YAO Zhihong, JIANG Yangsheng, HAN Peng, et al. Traffic flow prediction model based on neural network in small time granularity[J]. Journal of transportation systems engineering and information technology, 2017, 17(1): 67-73. (0)
[15]
徐婷婷, 柳晓鸣, 杨鑫. 基于BP神经网络的船舶航迹实时预测[J]. 大连海事大学学报, 2012, 38(1): 9-11.
XU Tingting, LIU Xiaoming, YANG Xin. BP neural network-based ship track real-time prediction[J]. Journal of Dalian Maritime University, 2012, 38(1): 9-11. DOI:10.3969/j.issn.1671-7031.2012.01.003 (0)
[16]
甄荣, 金永兴, 胡勤友, 等. 基于AIS信息和BP神经网络的船舶航行行为预测[J]. 中国航海, 2017, 40(2): 6-10.
ZHEN Rong, JIN Yongxing, HU Qinyou, et al. Vessel behavior prediction based on AIS data and BP neural network[J]. Navigation of China, 2017, 40(2): 6-10. DOI:10.3969/j.issn.1000-4653.2017.02.002 (0)
[17]
戴吾蛟, 丁晓利, 朱建军. 基于观测值质量指标的GPS观测量随机模型分析[J]. 武汉大学学报(信息科学版), 2008, 33(7): 718-722.
DAI Wujiao, DING Xiaoli, ZHU Jianjun. Comparing GPS stochastic models based on observation quality indices[J]. Geomatics and Information Science of Wuhan University, 2008, 33(7): 718-722. (0)
[18]
GLOROT X, BENGIO Y. Understanding the difficulty of training deep feedforward neural networks[J]. Journal of machine learning research, 2010, 9: 249-256. (0)