2. 北京市交通委员会政务服务中心(北京市船舶检验所),北京 100028
2. Government Service Center of Beijing Municipal Transport Commission (Beijing Boats Inspection Center), Beijing 100028, China
近年来,船舶自动识别系统(Automatic Identification System, AIS)快速发展与广泛应用,为船舶的行为特征和航行规律研究提供了大量的船舶轨迹数据。开展船舶轨迹预测技术研究,能够预报船舶将来的位置、航速等特征数据。一般而言,船舶轨迹预测是指基于船舶的历史轨迹,学习轨迹变化模式并预测船舶在未来时刻的位置。在模型应用中,实测数据与预测数据的偏离程度可以及时提示异常船舶航行行为,识别水域内船舶动态。在此基础上,提升预警与态势感知能力,辅助水上交通管理决策,能够为船舶交通安全保障和交通事故预防提供技术支持[1 - 2]。
从模型的可解释性方面,船舶轨迹建模可分为白箱和黑箱两类。在白箱方面,高斯过程回归模型、卡尔曼滤波是基于运动学建模的经典白箱结构[3],该两类方法往往利用船舶运动速度和航向数据开展轨迹建模,并在此基础上预报船舶轨迹,白箱模型的参数具有一定的船舶运动学物理意义。杜志强等[4]采用卡尔曼滤波的状态转移矩阵实现船舶运动状态的预测,预测直航轨迹的状态向量中存在表现船舶位置和平面直角坐标系纵横方向的加速度等物理意义的参数,预测曲线轨迹的状态向量中存在表现船舶运动线速度、角速度和预测位置对应圆心角等物理意义的参数。Rong等[5]提出一种基于高斯过程回归的概率轨迹预测模型,实现了船舶位置的概率化预测。闫佩玉[6]基于高斯过程回归提出一种轨迹预测数学模型,完成了非线性轨迹的预测。Ding等[7]通过分析船舶在不同运动状态下的姿态和速度变化,建立了一种船舶轨迹预测模型。由于白箱模型结构难以扩展,当轨迹数据噪声信息缺失时,轨迹预测模型的泛化性能受限。
在黑箱方面,深度学习的神经网络成为了时间序列数据研究的热门方法,也为船舶轨迹预测提供了新思路,它具备自适应大数据处理和非线性拟合能力。循环神经网络(Recurrent Neural Networks, RNN)依靠其循环结构能够捕捉前后时刻信息,被应用于船舶轨迹预测。Tu等[8]提出了基于RNN的综合框架进行特征选择,实现了最优特征识别和船舶轨迹预测,而梯度爆炸和梯度消失是RNN需要解决的难题。长短期记忆神经网络(Long Short-Term Memory,LSTM)和门控循环单元网络(Gated Recurrent Units,GRU)2种网络模型通过引出不同的门控单元,解决了RNN的梯度爆炸和梯度消失问题[9 - 10]。而RNN、LSTM和GRU属于单向网络,模型依赖数据量而缺乏灵活性。双向网络能够进一步反向挖掘预测数据信息,捕获前后船舶轨迹特征[11]。双向网络通常由2个对称的相同神经网络构成,能够同时考虑前向和后向的信息,在序列的任何给定点都能访问过去和未来的数据。如双向LSTM模型(Bidirectional LSTM, Bi-LSTM)是依靠正向LSTM和反向LSTM模型实现历史和未来信息的依赖关系捕获[12]。此外,双向GRU模型(Bidirectional GRU,Bi-GRU)也被应用于船舶轨迹预测[13 - 14]。
上述研究表明,双向网络相较于单项网络拥有更强预测能力,但是目前双向网络具有对称的网络结构,其模型复杂、运算效率低。结构复杂的Bi-LSTM计算效率低、耗时较长;结构简洁的Bi-GRU计算效率高,但模型鲁棒性不足。而利用双向网络将LSTM和GRU结合起来,则能够既能增强前后时刻信息捕捉能力,又能提升计算效率和模型鲁棒性。进而本文提出一种非对称双向长短期记忆门控循环单元模型(Asymmetric Bidirectional LSTM-GRU, AB-LGRU),建立船舶轨迹预测模型,预报船舶将来时刻轨迹特征数据。本文在数据提取、数据清洗、轨迹分段和轨迹插补等预处理后,利用AB-LGRU开展轨迹预测,评估模型训练损失度和分析测试集预测结果,并与另外4种神经网络对比验证模型的准确性和有效性。
1 模型构建 1.1 AB-LGRU神经网络AB-LGRU神经网络的由LSTM的三重门控与GRU的双重门控组成,模型结构如图1所示。模型的正向回路采用LSTM结构,能够捕捉前后时刻信息;反向回路则使用GRU,获取反向传播信息进而优化计算效率。这种正向和反向非对称的网络结构具备复杂序列建模的能力,也提高了反向传播的性能,实现性能与效率的平衡。这种特殊的网络结构适用于多维的船舶轨迹时间序列数据,提取速度、位置、航向信息特征[12]。
|
图 1 AB-LGRU网络模型结构 Fig. 1 AB-LGRU network model structure |
AB-LGRU的
| $ {\vec h_t} = {\text{LSTM}}\left( {{x_t},{{\vec h}_{t - 1}}} \right)。$ | (1) |
AB-LGRU的
| $ {\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{h} _t} = {\text{GRU}}\left( {{x_t},{{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{h} }_{t + 1}}} \right)。$ | (2) |
通过拼接前向隐藏状态
| $ {h_t} = \left[ {{{\vec h}_t};{{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{h} }_t}} \right]。$ | (3) |
式(1)的
|
图 2 LSTM网络模型结构 Fig. 2 LSTM network model structure |
LSTM的记忆单元通过少量线性操作修改存储和传递的信息来保留长期依赖信息。三重门控机制指LSTM模型中的遗忘门、输入门和输出门,它们通过Sigmoid函数实现对数据的处理与控制。输出
| $ \left\{\begin{gathered}f_t=\sigma\left(\boldsymbol{W}_f\cdot\left[h_{t-1},x_t\right]+b_f\right),\\ i_t=\sigma\left(\boldsymbol{W}_i\cdot\left[h_{t-1},x_t\right]+b_i\right),\\ o_t=\sigma\left(\boldsymbol{W}_o\cdot\left[h_{t-1},x_t\right]+b_o\right),\\ \tilde{C}_t=\tanh\left(\boldsymbol{W}_c\cdot\left[h_{t-1},x_t\right]+b_c\right),\\ C_t=f_t\Theta C_{t-1}+i_t\Theta\tilde{C}_t,\\ h_t=o_t\Theta\tanh\left(C_t\right)。\\ \end{gathered}\right. $ | (4) |
式中:
式(2)的GRU通过使用重置门和更新门2个门控单元动态控制信息的传递,在这个过程中决定信息的遗忘和更新,从而有效解决长距离依赖问题。GRU神经网络结构如图3所示。
|
图 3 GRU网络模型结构 Fig. 3 GRU network model structure |
重置门和更新门通过Sigmoid函数控制数据,相较于LSTM模型更加简洁高效。GRU模型的输出计算公式[11]为:
| $ \left\{ \begin{gathered} {r_t} = \sigma ({{\boldsymbol{W}}_r} \cdot [{h_{t - 1}},{x_t}] + {b_r}),\\ {z_t} = \sigma ({{\boldsymbol{W}}_z} \cdot [{h_{t - 1}},{x_t}] + {b_z}),\\ {{\tilde h}_t} = \tanh ({{\boldsymbol{W}}_h} \cdot [{r_t} * {h_{t - 1}},{x_t}] + {b_h}),\\ {h_t} = (1 - {z_t}) * {h_{t - 1}} + {z_t} * {{\tilde h}_t}。\\ \end{gathered} \right. $ | (5) |
式中:
本文的船舶轨迹预测模型包括4个部分:1)数据提取与预处理部分;2)船舶轨迹预测模型构建部分;3)超参数确定与模型训练部分;4)船舶轨迹预测结果比较部分。首先,提取AIS数据中轨迹数据,开展数据清洗、轨迹分段和轨迹插补等预处理操作,对输入的轨迹数据进行归一化操作。其次,划分数据为训练集和测试集,构建AB-LGRU模型。为了验证AB-LGRU模型的优越性,选择LSTM等4种其他模型进行对比。然后,确定预测模型的超参数并开展训练。最后,通过对比各模型的损失曲线确定模型的预测精度,通过对比各模型的测试集数据预测情况确定模型的预测精确度。综上,本文构建的船舶轨迹预测流程图如图4所示。
|
图 4 船舶轨迹预测流程图 Fig. 4 Flowchart of ship trajectory prediction |
船舶轨迹预测模型是常见的回归问题,一般采用均方误差(Mean Square Error, MSE)作为损失函数,通过计算预测值与真实值偏差值的平方的平均值,量化测试值与真实值间的偏离程度。故本文采用MSE作为损失函数,其数值越小表示模型精度越高,其计算公式为:
| $ MSE = \frac{1}{n}\sum\limits_{i = 1}^n {{{({{\hat y}_i} - {y_i})}^2}}。$ | (6) |
式中:
宁波舟山港区存在分道通航制、警戒区和无分道通航制区域交汇情况,交通流量大,通航环境复杂,存在一定安全隐患。本文收集了该水域2022年7月15日−17日的船舶AIS数据,参考文献[16]中的聚类算法获取了该水域包括弯曲轨迹和直航轨迹两类典型的AIS数据,进行预处理等后续工作。典型轨迹如图5所示。
|
图 5 典型轨迹图 Fig. 5 Typical trajectory diagram |
首先,开展AIS数据提取,并清理4类明显异常数据:1)MMSI为0的数据;2)经度超过180°或纬度超过90°;3)航向或船艏向小于0°或大于360°。4)重复数据。其次,通过轨迹分段将航行轨迹处理成多组连续的轨迹点序列数据。然后,采用三次样条插值法对轨迹缺失数据进行插补,提高轨迹的准确性和完整度,得到了以5 s为时间间隔船舶轨迹数据集
| $ {X_{nor}}{\text{ = }}\frac{{{X_i} - {X_{\min }}}}{{{X_{\max }} - {X_{\min }}}}。$ | (7) |
式中:
在轨迹预测任务中,滑动窗口技术是目前开展预测任务的常用方式,能够按顺序高效、实时地处理大数据[18]。滑动窗口技术通过固定大小的时间窗口在连续的船舶轨迹数据上滑动,在这个过程中输出的预测轨迹数据会作为输入进入模型,从而实现时空特征捕捉,进一步预测未来的轨迹。通过设定输出步长
为客观比较各模型间的预测效果,本文划分20%作为测试集数据,划分80%作为训练集数据。此外,验证集可以帮助模型进一步调整学习率等超参数,增强模型泛化性。因此本文将80%训练集中20%的数据划分为验证集。
最后,本文经过多轮模型训练,将各模型间的超参数进行统一设置[11],避免各模型超参数差异影响模型间预测性能的对比结果。超参数设置如表1所示。
|
|
表 1 模型超参数设置 Tab.1 Model hyperparameter setting |
在模型训练过程中,为了客观评价对比5种模型进行船舶轨迹预测的精度,如前所述采用MSE对分别评价了训练集和验证集的预测损失度,如图6所示。在两类典型轨迹的预测损失中,AB-LGRU模型的损失低于其他5种预测模型,表现出了AB-LGRU优秀的预测精度和泛化性能。
|
图 6 各模型预测结果损失度对比 Fig. 6 Comparison of Loss of prediction results of various models |
为了直观展示5种模型的预测结果,选取了预测难度更高的A类典型弯曲轨迹的测试集数据进行预测,绘制了图7所示的各模型预测结果对比图,其中横轴为轨迹时间点,纵轴为船舶轨迹各类特征数据值。如图7(a)和图7(b)所示,AB-LGRU的经度、纬度、航向、船首向和航速的预测结果与真实值误差较低。其次,如图7(c)~图7(e)所示,在轨迹特征值变化剧烈时,AB-LGRU模型响应迅速,预测误差低,侧面表现了AB-LGRU模型的高鲁棒性和高泛化性。
|
图 7 A类典型轨迹测试集的预测结果对比 Fig. 7 Comparison of prediction results of the A test sets |
此外,为了量化对比5种模型对测试集数据的预测精度,采用MSE评价A类典型轨迹测试集的预测结果,如表2所示。在5种船舶轨迹特征数据的预测结果中,AB-LGRU的MSE值最低,验证了本文模型的有效性和准确性。
|
|
表 2 A类典型轨迹测试集的预测结果MSE值 Tab.2 MSE value of class a typical trajectory test set prediction result |
本文针对船舶轨迹预测问题,结合LSTM单元和GRU单元,提出了非对称双向结构的AB-LGRU模型,解决了Bi-LSTM和Bi-GRU的结构复杂度高、鲁棒性不足的问题。
采用宁波舟山港水域船舶历史轨迹数据,开展AB-LGRU的训练和验证,并与4种神经网络对比实验结果,验证了AB-LGRU船舶轨迹预测模型可行性和有效性。
后续将研究如何把优化理论和方法添加到网络参数调整过程中,自动设置不同的学习率、隐藏层节点数、正则化系数等参数,已获得适用于不同水域的通用型船舶轨迹预测算法。
| [1] |
XIN X, LIU K, LI H, et al. Maritime traffic partitioning: an adaptive semi-supervised spectral regularization approach for leveraging multi-graph evolutionary traffic interactions[J]. Transportation Research Part C: Emerging Technologies, 2024, 164: 104670. DOI:10.1016/j.trc.2024.104670 |
| [2] |
WANG W, HE N, CHEN M, et al. Freight rate index forecasting with prophet model based on multi-dimensional significant events[J]. Expert Systems with Applications, 2024, 249: 123451. DOI:10.1016/j.eswa.2024.123451 |
| [3] |
何静. 利用卡尔曼滤波预测船舶航行轨迹异常行为[J]. 舰船科学技术, 2017, 39(2): 16−18. HE J. Prediction of ship navigation trajectory abnormal behavior by Kalman filter[J]. Ship Science and Technology, 2017, 39(1Z): 16−18. |
| [4] |
杜志强, 谭玉琪, 仇林遥. 基于卡尔曼滤波的船舶轨迹异常行为快速检测方法[J]. 地理信息世界, 2021, 28(4): 112−118. DU Z Q, TAN Y Q, QIU L Y. On the rapid detection of abnormal ship trajectories by kalman filter[J]. Geomatics World, 2021, 28(4): 112−118. |
| [5] |
RONG H, TEIXEIRA A P, GUEDES SOARES C. Ship trajectory uncertainty prediction based on a gaussian process model[J]. Ocean Engineering, 2019, 182: 499-511. DOI:10.1016/j.oceaneng.2019.04.024 |
| [6] |
闫佩玉. 舰船航行非线性轨迹预测的数学模型[J]. 舰船科学技术, 2020, 42(18): 25−27. YAN P Y. Mathematical model design for nonlinear trajectory prediction of ship navigation[J]. Ship Science and Technology, 2020, 42(18): 25−27. |
| [7] |
DING X, BIAN H, MA H, et al. Ship trajectory generator under the interference of wind, current and waves[J]. Sensors, 2022, 22(23): 9395. DOI:10.3390/s22239395 |
| [8] |
TU E, ZHANG G, MAO S, et al. Modeling historical AIS data for vessel path prediction: a comprehensive treatment[M]. arXiv, 2020.
|
| [9] |
高大为, 朱永生, 张金奋, 等. 基于AIS数据的船舶航迹多维预测方法[J]. 中国航海, 2021, 44(3): 56−63. GAO D W, ZHU Y S, ZHANG J F, et al. MuIti-dimensional prediction of ship track with AIS data augmentation[J]. Navigation of China, 2021, 44(3): 56−63. |
| [10] |
AGARAP A F M. A neural network architecture combining gated recurrent unit (GRU) and support vector machine (SVM) for intrusion detection in network traffic data[C]//Proceedings of the 2018 10th International Conference on Machine Learning and Computing. Macau China: ACM, 2018: 26−30.
|
| [11] |
LI H, XING W, JIAO H, et al. Bi-directional information fusion-driven deep network for ship trajectory prediction in intelligent transportation systems[J]. Transportation Research Part E: Logistics and Transportation Review, 2024, 192: 103770. DOI:10.1016/j.tre.2024.103770 |
| [12] |
GAO M, SHI G, LI S. Online prediction of ship behavior with automatic identification system sensor data using bidirectional long short-term memory recurrent neural network[J]. Sensors, 2018, 18(12): 4211-4227. DOI:10.3390/s18124211 |
| [13] |
马全党, 张丁泽, 王群朋, 等. 双向门控循环单元在船舶轨迹预测中的应用[J]. 安全与环境学报, 2024, 24(1): 83-91. MA Q D, ZHANG D Z, WANG Q P, et al. Application of Bi-GRU for ship trajectory prediction[J]. Journal of Safety and Environment, 2024, 24(1): 83-91. DOI:10.13637/j.issn.1009-6094.2022.2308 |
| [14] |
谢海波, 乔冠洲, 代程, 等. 基于NGO-Bi-GRU的船舶轨迹预测模型[J]. 舰船科学技术, 2025, 47(4): 14-20. XIE H B, QIAO G Z, DAI C, et al. Ship trajectory prediction model based on NGO-Bi-GRU[J]. Ship Science and Technology, 2025, 47(4): 14-20. DOI:10.3404/j.issn.1672-7649.2025.04.003 |
| [15] |
徐洪敏. LSTM网络在船舶航行轨迹预测中的应用[J]. 舰船科学技术, 2021, 43(8): 37-39. XU H M. Application of LSTM network in ship trajectory prediction[J]. Ship Science and Technology, 2021, 43(8): 37-39. |
| [16] |
杨家轩, 吴长胜, 赵时雨. 基于相似度和密度的抗噪声船舶轨迹聚类方法[J]. 舰船科学技术, 2025, 47(2): 178−184. YANG J X, WU C S, ZHAO S Y. The method of ship traffic trajectory clustering based on degree of similarity and density with noise[J]. Ship Science and Technology, 2025, 47(2): 178−184. |
| [17] |
WANG Y, WATANABE D, HIRATA E, et al. Real-time management of vessel carbon dioxide emissions based on automatic identification system database using deep learning[J]. Journal of Marine Science and Engineering, 2021, 9(8): 871. DOI:10.3390/jmse9080871 |
| [18] |
WANG J, GUO Y, WANG Y. A sequential random forest for short-term vessel speed prediction[J]. Ocean Engineering, 2022, 248: 110691. DOI:10.1016/j.oceaneng.2022.110691 |
2026, Vol. 48
