AIS数据是研究船舶轨迹的重要参考依据,通过AIS数据反应出的船舶轨迹,不仅可以体现出船舶的状态,也可以为船舶导航和避碰提供参考,更是有关部门进行安全管理和检测的重要依据。通过对船舶轨迹进行观测,可以提前感知潜在的危险以便尽早采取相应行动。目前,越来越多的新方法被用来进行船舶轨迹的挖掘和预测等相关工作。
包括灰色预测模型、高斯过程回归模型、卡尔曼滤波和神经网络等一系列传统预测方法被用于进行船舶轨迹预测中。其中神经网络因为其擅长处理大量数据和优秀的自适应能力和处理非线性问题的能力,近年来被逐渐应用于船舶轨迹预测。现阶段广泛使用的是反向传播(Back Propagation, BP)神经网络、长短时记忆神经网络(Long Short Term Memory, LSTM)。本文船舶AIS数据是一种典型的时间序列类型的数据,BP神经网络并不合适时序数据的处理,其他神经网络模型里,循环神经网络(Recurrent Neural Network, RNN)能够挖掘数据中前后一段时间之间的关系,然而RNN在训练过程中却存在难以避免的梯度爆炸和梯度消失等问题。而LSTM却在轨迹预测类型的研究上有着相比前几种神经网络模型更优秀的表现[1-2],相比BP、和RNN的结果更精准也更稳定。而门控循环单元(Gated Recurrent Unit, GRU)相比LSTM有着更为简单便捷的结构,在神经元数量相同的情况下,处理相同数据量的数据时,GRU拥有更快的响应和处理速度[3]。
而相较于单一神经网络,组合神经网络以更强的学习能力和更强的特征挖取能力逐渐受到研究者的青睐。但更复杂的网络结构所带来的是更复杂的计算方式和更大的计算量。刘姗姗等[4]使用CNN-Bi-LSTM模型,先利用CNN对时序数据的潜在特征进行提取提取,确保了输入数据的有效性而后使用Bi-LSTM模型,利用其能综合考虑吧过往和现在数据的能力,进一步提高了预测的精度。万洪亮等[5]提出将 CNN-GRU 应用于船舶轨迹预测,利用CNN提取经度和纬度的相关特征。上述的神经网络预测方法都在一定程度上存在着轨迹序列相关特征识别和提取能力不足、预测精度较低、预测数据不稳定等问题。针对这些问题,马全党等[6]将BI-GRU神经网络用于了轨迹预测并和其他传统的模型进行了对比。
上述研究都证明了神经网络模型在船舶航迹预测中表现出良好的性能。然而,这些模型具有多个需要优化的超参数,这对预测性能至关重要[7]。传统的超参数优化方法通常需要大量的实验,对多个超参数进行组合对比优化结果,效率低下,并且容易陷入局部最优[8]。因此通过优化算法寻找神经网络的最佳超参数组合也是主流的提高精度的方法。吴春鹏等[9]使用AMS优化算法利用当前和上一时刻的
北方苍鹰算法是一种多目标最优寻参优化算法,是通过搜寻目标并进行全局搜索的方式找寻最优解的一种优化算法。经过实验验证,在多特征值的数据处理中相比灰狼、鲸鱼等优化算法有着更好的性能,适合用于时间序列的船舶轨迹预测。
本文针对上述方法的不足和优点,将北方苍鹰算法和Bi-GRU神经网络结合,用以进行船舶轨迹的预测之中,构建了一种基于NGO-Bi-GRU的船舶轨迹预测模型。
该模型通过进行数据清洗、数据聚类、数据预处理和归一化等步骤后,利用构建的NGO-Bi-GRU模型进行训练和对比,并通过抽取对比部分的轨迹实例进行分析,与GRU、LSTM以及NGO-LSTM模型进行比对和分析,验证了NGO-Bi-GRU船舶轨迹预测模型的有效性。
1 模型构建 1.1 Bi-GRU神经网络GRU是在LSMT的基础上进行改进的一种用于预测时序数据的主流神经网络,受益于更简单的网络结构,其相比LSTM拥有更快的训练和计算效率,并且可以解决LSTM存在的梯度消失和梯度爆炸的现象[11]。其结构如图1所示。
![]() |
图 1 GRU网络结构图 Fig. 1 GRU network diagram |
一个GRU的基础单元由重置门
$ {r_t} = \sigma ({{\boldsymbol{W}}_r}{x_t} + {{\boldsymbol{U}}_r}{h_{t - 1}} + {b_r}) ,$ | (1) |
$ {z_t} = \sigma ({{\boldsymbol{W}}_z}{x_t} + {{\boldsymbol{U}}_z}{h_{t - 1}} + {b_z}),$ | (2) |
$ {H_t} = \tan{\mathrm{h}}({{\boldsymbol{W}}_h}{x_t} + {{\boldsymbol{U}}_h}({r_t} \cdot {h_{t - 1}}) + {b_h}),$ | (3) |
$ {h_t} = (1 - {z_t}) \cdot {h_{t - 1}} + {z_t} \cdot H{}_t。$ | (4) |
式中:
Bi-GRU是一种双层GRU网络,分为前向层和逆向层。在前向层中,会通过将前向传播将时间序列传输到网络训练中,并挖掘数据的前向相关性。在逆向层中,输入序列通过反向传播进行训练,挖掘逆向相关性。通过这种网络结构可以对输入的时间序列特征双向提取,更好的提高时序特征的完整性和全局性。Bi-GRU的网络如图2所示。
![]() |
图 2 Bi-GRU网络结构图 Fig. 2 Bi-GRU network diagram |
北方苍鹰算法是M. Dehghani[12]于2021年提出的一种基于北方苍鹰捕猎过程包括识别和追捕2个部分的优化算法,此算法在迭代过程中,主要分为猎物的识别阶段和猎物的追捕阶段,其相应的数学模型和表达函数如下:
1)猎物识别和追击阶段
北方苍鹰算法的第一阶段是通过随机选择挑选出一个猎物并立即对其展开迅速攻击,以增强NGO算法的探索能力。这个阶段增加了NGO的探索能力,由于在搜索空间中随机选择猎物。这个阶段会对搜索空间进行全局搜索,以此寻求最佳区域。使用式(5)~式(7)对第一阶段中表达的概念进行数学建模。
$ {P_i} = {X_k},i = 1,2,...,N,k = 1,2,...,i - 1,...,N,$ | (5) |
$ {x}_{i,j}^{{\mathrm{new}},{P}_{1}}=\left\{\begin{array}{c}{x}_{i,j}+r({p}_{i,j}-I{x}_{i,j}),{F}_{{P}_{i}} < {F}_{i},\\ {x}_{i,j}+r({x}_{i,j}-{p}_{i,j}),{F}_{{P}_{i}} \geqslant {F}_{i},\end{array}\right. $ | (6) |
$ {X}_{i}=\left\{\begin{array}{l}{X}_{i}^{{\mathrm{new}},{P}_{1}},{F}_{i}^{{\mathrm{new}},{P}_{1}}<{F}_{i}\\ {X}_{i},{F}_{i}^{{\mathrm{new}},{P}_{1}} \geqslant {F}_{i}\end{array} \right.$ | (7) |
式中:
2)追赶逃逸阶段
北方苍鹰在成功攻击猎物后,猎物尝试逃离。在这种追逐过程中,北方苍鹰不断追赶猎物。受益于北方苍鹰具备的高速性,其可以再绝大多数的情况下对猎物进行追逐和捕获。这种行为是对搜索空间进行局部搜索并提高了这一能力。在所提出的NGO算法中,如果这次狩猎是接近半径为R的攻击位置。使用式(8)~式(10)对在第2阶段中表达的概念进行数学建模。
$ x_{i,j}^{{\mathrm{new}},{P_2}} = {x_{i,j}} + R(2r - 1){x_{i,j}},$ | (8) |
$ R = 0.02\left(1 - \frac{t}{T}\right),$ | (9) |
$ {X}_{i}=\left\{\begin{array}{l}{X}_{i}^{{\mathrm{new}},{P}_{2}},{F}_{i}^{{\mathrm{new}},{P}_{2}}<{F}_{i},\\ {X}_{i},{F}_{i}^{{\mathrm{new}},{P}_{2}} \geqslant {F}_{i}。\end{array}\right. $ | (10) |
式中:
在基于NGO算法的第1和第2阶段更新了群体的所有成员之后,完成了算法的迭代,并且确定了群体成员、目标函数和最佳建议解的新值。然后,进入下一次迭代,并且群体成员更新基于式(5)~式(10)继续,直到达到算法的最后一次迭代。在结束时,将迭代过程中得到的算法最佳建议解决方案被引入作为一个准最优解决方案,为给定的优化问题。所提出的NGO算法的流程如图3所示。
![]() |
图 3 NGO算法流程图 Fig. 3 NGO algorithm flow chart |
更新过程的复杂度等于
NGO算法具有较高的收敛精度以及良好的稳定性,因此选用其来选择Bi-GRU算法的训练参数。
1.3 NGO-BI-GRU模型的构建NGO-Bi-GRU模型分为NGO算法部分、Bi-GRU部分和数据处理部分。在数据处理部分,针对AIS数据出现的轨迹点漂移,时间间隔过大,信息缺失和异常等问题进行预处理。随后对AIS数据进行归一以减轻量纲的影响,并将其划分为训练集和测试集。本模型以均方差作为适应度值,通过NGO算法求得一组网络的最优参数组合,最终应用到整个数组,使得NGO-Bi-GRU的预测值误差最小。NGO-Bi-GRU模型具体流程如下:首先,确定北方苍鹰算法迭代次数、种群数量、个体维度空间,确定学习率、隐藏层节点数、正则化系数为优化对象,并确定各对象的上限和下限。然后,随机生成种群,得到初始化参数并计算种群值和真实值之间的均方误差,并将其设置为训练阶段的适应度,选取适应度最小的参数组合作为最优解,进行全局测试;开始进行迭代,通过北方苍鹰优化算法得到的网络参数组合并进行更新,不断重复上述过程直到最大迭代次数。迭代结束后输出Bi-GRU中的学习率、隐藏层节点数、正则化系数的最优值组合。最后,进行最优情况下的训练和预测,并通过对得出预测输出值和真实值之间各项评判指标数的计算得出模型的表现结果。
综上,本文构建了基于NGO-Bi-GRU的船舶轨迹预测模型,模型框架如图4所示。
![]() |
图 4 NGO-Bi-GRU模型框架图 Fig. 4 Frame diagram of the Ngo-Bi-Gru model |
在结果评价和分析部分采用目前评价神经网络预测结果的常用指标,包括均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)等。其数值越小,模型的精度越高。其计算公式如下式:
$ {S_{mse}} = \frac{1}{N}\sum _{m = 1}^N{{({O_m} - {P_m})}^2} ,$ | (11) |
$ {S_{rmse}} = \sqrt {\frac{1}{N}\sum _{m = 1}^N{{({O_m} - {P_m})}^2} } ,$ | (12) |
$ {S_{mae}} = \frac{1}{N}\sum _{m = 1}^N\left| {({O_m} - {P_m})} \right|。$ | (13) |
式中:N为序列的长度;
本文选取宁波舟山港进港靠泊的一段航道内一段时间内的数10艘船舶靠离泊的数据为原始样本。航道位置具体区域为29.687641N、122.183418E;29.684943N、122.522621E;29.890082N、122.518501E;29.888586N、122.181358E。
该区域是靠离泊航道,锚地和常规航道的交汇区域,存在一定的安全隐患。收集该区域2022年6月的靠泊船的AIS数据。通过对AIS数据的编辑与处理,即将连续的轨迹点及其包含的各类信息集合成轨迹序列进行链接,以此表示每艘船舶的航行轨迹,将每条航线都处理成为一组连续的AIS数据。例如
部分船舶的AIS信息数据如表1所示。前80%的数据为预测模型的训练数据,后20%数据为测试数据。
![]() |
表 1 部分船舶AIS数据 Tab.1 Partial ship AIS data |
由于AIS数据在上传加密和解码的过程中,难免会产生缺失和错误的数据,因此有必要对原始样本的数据进行处理,对异常的数据点进行剔除,对缺失的数据进行修复。
异常数据点的排除方法如下:借鉴陈凯达等[13]对船舶AIS数据异常点的处理方式,对异常点进行剔除。这包括计算经度和纬度的算术平均值以及计算剩余误差,然后计算其标准偏差
缺失数据点的修复,由于AIS数据本身存在的数据间隔不稳定不等时的问题以及剔除异常数据点的缘故,为了保障数据量和数据间隔的稳定等时,以有利于预测模型对时间序列的分析,为了获得更精确的经纬度时间序列特征,本文采用了3次样条差值方法对船舶轨迹进行修正,从而得到了以2 min为时间间隔的经纬度序列数据。
数据归一化,轨迹数据的特征值,由于数据间存在较大差距,包括经度、纬度、航速和航行等信息,为了降低误差并尽量提高训练的效率,有必要对实验采用的数据进行归一化的处理。本文所采用的是离差标准化方法,即将所有的数据都转换为相应的标准化值。
$ {x^ * } = \frac{{x - \max }}{{\max - \min }} 。$ | (14) |
式中:max和min是数据中的最大和最小值;
在预测之后,还需要将预测结果进行反归一化处理,将数据反转化为现实意义的数据。
2.3 实验结果分析本文构建了NGO-Bi-GRU神经网络模型对宁波舟山港虾峙门水道进出航道部分的水域的船舶轨迹进行预测。为了验证本文构建的神经网络模型在轨迹预测上的有效性,本文选取了GRU、LSTM、以及同样使用NGO优化后的NGO-LSTM模型进行相同的实验。为确保输入至每个神经网络的轨迹数据序列和长度一致,本文将轨迹数据进行了节选,选择了和交汇水域附近的一段航道,并确保每段轨迹数据的信息个数为相同。
为了相对客观的对比出模型对船舶轨迹的预测的优劣,本文通过NGO-Bi-GRU进行优化参数后的结果和未优化的模型进行对比,未优化的模型分别选取2次不同的参数进行训练并选取结果较好的进行比较。除此之外,还需要利用式(11)~式(13)的误差指标对各模型的预测结果进行评价。具体参数如表2和表3所示。
![]() |
表 2 优化后的神经网络经度训练参数 Tab.2 Optimized longitude training parameters for the neural network |
![]() |
表 3 优化后的神经网络纬度训练参数 Tab.3 Optimized latitude training parameters for the neural network |
具体结果如图5~7所示。可知,GRU模型误差相对较大,LSTM在部分位置虽然误差较小但稳定性存在明显劣势且优化后的2个模型在稳定性上都有明显优势,其中NGO-LSTM的纬度误差较大,但NGO-Bi-GRU模型不论是稳定性还是精确度相比实验中的几个模型都有一定的提升。图5的整体轨迹情况也能证明这一点,图7为航道方向转变和附近有锚地干扰的地区,NGO-Bi-GRU仍然保持较小的误差和较好的稳定性。模型的预测结果误差评价指标也能证明上述观点。表4和表5为各个神经网络模型预测评价指标对比。
![]() |
图 5 整体轨迹图 Fig. 5 Overall trajectory diagram |
![]() |
图 6 部分轨迹图1 Fig. 6 Partial trajectory diagram 1 |
![]() |
图 7 部分轨迹图2 Fig. 7 Partial trajectory diagram 2 |
![]() |
表 4 各模型经度评价指标对比 Tab.4 Comparison of longitude evaluation indexes of each model |
![]() |
表 5 各模型纬度评价指标对比 Tab.5 Comparison of latitude evaluation indexes of each model |
可知,LSTM和GRU模型的各项评价指标数值接近,这说明其精确的相似,但相比精确度相似的LSTM和GRU模型,经过NGO优化后的NGO-LSTM的各项评价指标都低于LSTM和GRU模型,这说明了NGO算法对这两个模型具有一定的优化效果。并且NGO-Bi-GRU模型在经度和纬度预测结果的MSE、RMSE、MAE、MAPE几项评价指标均为实验模型中的最低,代表着在经度和纬度预测时该模型在4种模型中的误差最小,精确性最高。
3 结 语本文针对传统的循环神经网络中存在的相关参数设置复杂和最优参数配比难寻的问题,引入北方苍鹰优化算法并构建了NGO-Bi-GRU船舶轨迹预测的神经网络模型,以宁波舟山港虾峙门水道附近进出港航道一段时间内的船舶轨迹AIS数据为案例,验证NGO-Bi-GRU预测模型在船舶轨迹预测的精度和可靠性,并通过与另外3种神经网络模型在不同参数配比下的预测结果进行对比和分析。其结果显示,NGO优化算法可以针对样本的数据特点,选取适合的参数对传统模型进行优化,并且相比传统的神经网络模型,所需的数据量较少。相比于选取不同参数的GRU、LSTM和NGO-LSTM模型,NGO-Bi-GRU的MSE分别降低了
由于船舶轨迹的影响因素很多,在接下来的工作中应考虑船首向、航向变化等对船舶轨迹有微观影响的因素以及航行所处航行时段以及航行位置等因素对船舶轨迹的影响,增加特征值个数。此外,该模型的精度还可以进一步提高,后续应该考虑在现有基础上引入卷积神经网络或者注意力机制进一步优化模型,提高模型的预测精度。
[1] |
李永, 成梦雅. LSTM船舶航迹预测模型[J]. 计算机技术与发展, 2021, 31(9): 149-154. LI Y, CHENG M Y. LSTM ship track prediction model[J]. Computer Technology and Development, 2021, 31(9): 149-154. |
[2] |
任宇翔, 赵建森, 刘卫, 等. 基于AIS数据和LSTM网络的船舶航行动态预测[J]. 上海海事大学学报, 2019, 40(3): 32-37. REN Y X, ZHAO J S, LIU W, et al. Ship navigation behavior prediction based on AIS data and LSTM network,[J]. Journal of Shanghai Maritime University, 2019, 40(3): 32-37. |
[3] |
胡玉可, 夏维, 胡笑旋, 等. 基于循环神经网络的船舶航迹预测[J]. 系统工程与电子技术, 2020, 42(4): 871-877. HU Y K, XIA W, HU X X, et al. Vessel trajectory prediction based on recurrent neural network,[J]. Systems Engineering and Electronics, 2020, 42(4): 871-877. |
[4] |
刘姗姗, 马社祥, 孟鑫, 等. 基于CNN和Bi-LSTM的船舶航迹预测[J]. 重庆理工大学学报(自然科学), 2020, 34(12): 196-205. LIU S S, MA S X, MENG X, et al. Prediction model of ship trajectory based on CNN and Bi-LSTM,[J]. Journal of Chongqing University of Technology (Natural Science), 2020, 34(12): 196-205. |
[5] |
万洪亮, 潘家财, 甄荣, 等. 基于CNN-GRU的船舶轨迹预测[J]. 广州航海学院学报, 2022, 30(2): 12-18. WAN H L, PAN J C, ZHEN R, et al. Prediction of ship trajectory based on CNN-GRU,[J]. Journal of Guangzhou Maritime University, 2022, 30(2): 12-18. DOI:10.3969/j.issn.1009-8526.2022.02.004 |
[6] |
马全党, 张丁泽, 王群朋, 等. 双向门控循环单元在船舶轨迹预测中的应用[J/OL]. 安全与环境学报: 1−10[2023-10-09]. MA Q D, ZHANG D Z, WANG Q P, et al. Application of Bi-GRU for ship trajectory prediction, [J]. Journal of Safety and Environment, 1−10[2023-10-09]. |
[7] |
FISCHER T, KRAUSS C. Deep learning with long short-term memory networks for financial market predictions[J].European Journal of Operational Research, 2018, 270, 654−669.
|
[8] |
RATH P, MALLICK P K, TRIPATHY H K, et al. A tuned whale optimization-based stacked-LSTM network for digital image segmentation[J]. Arabian Journal for Science and Engineering. 2023, 48, 1735–1756.
|
[9] |
吴春鹏, 冯姣. 结合AMS的C-LSTM船舶轨迹预测[J]. 船海工程, 2021, 50(6): 141-146+152. WU C P, FENG J. Ship trajectory prediction based on C-LSTM combined with AMS[J]. Ship & Ocean Engineering, 2021, 50(6): 141-146+152. |
[10] |
JIA H, YANG Y, AN J, et al. A Ship trajectory prediction model based on attention-BILSTM optimized by the whale optimization algorithm[J]. Applied Science, 2023, 13: 4907.
|
[11] |
GU W T, ZHENG S H, WANG R, et al. Forecasting realized volatility based on sentiment index and GRU model[J]. Journal of Advanced Computational Intelligence and Intelligent Informatics, 2020, 24(3): 299-306. DOI:10.20965/jaciii.2020.p0299 |
[12] |
DEHGHANI M, HUBÁLOVSKÝ Š, TROJOVSKÝ P. Northern goshawk optimization: a new swarm-based algorithm for solving optimization problems[J] IEEE Access, 2021, 9: 162059−162080.
|
[13] |
陈凯达, 朱永生, 闫柯, 等. 基于LSTM的船舶航迹预测[J]. 船海工程, 2019, 48(6): 121-12. CHEN K D, ZHU Y S, YAN K, et al. The ship track prediction method based on long short-term memory network[J]. Ship & Ocean Engineering, 2019, 48(6): 121-12. |