2. 中国船舶研究设计中心,湖北 武汉 430000;
3. 上海交通大学深圳研究院,广东 深圳 518063
2. China Ship Development and Design Center, Wuhan 430000, China;
3. Shenzhen Research Institute of Shanghai Jiao Tong University, Shenzhen 518063, China
随着全球航运业的快速发展,船舶轨迹预测在智能航运、海上交通管理和水面态势感知等领域的重要性日益凸显[1]。船舶轨迹预测技术是指通过分析船舶的历史航行数据(如位置、速度、航向等),运用算法模型,预测船舶未来运动轨迹的技术[2]。该技术不仅有助于提升航行安全、优化航线规划,还能为碰撞预警和异常行为检测提供关键支持。然而,由于船舶运动受复杂环境因素(如风流、洋流)及人为操作的影响,其轨迹往往呈现高度的非线性和时空相关性。
近年来,船舶轨迹预测方法已经取得了大量研究成果,最常见的是基于物理模型的方法和基于深度学习的方法[3]。在基于物理学模型的方法中,滤波方法是船舶轨迹预测中较为常见的方法。Jaskolska等[4]提出了离散卡尔曼滤波方法,提升了在分道航行及航道区域内船舶追踪和监控能力。但在航速及航向等关键特征上,很难克服噪声的影响。Fossen等[5]构建了一套船舶可视化与运动预测系统,解决了在复杂水域中船舶的非线性运动估计问题。Perera等[6]设计了基于卡尔曼滤波的船舶导航和船舶交通监控系统。Qiao等[7]通过加权平均的方法更新卡尔曼滤波的预测值,降低了船舶轨迹短期预测的误差。虽然滤波方法及其衍生方法在短期轨迹预测任务中已展现了较好的预测精度,然而在长期预测场景下,这些方法面临明显的精度衰减问题[8]。
随着人工智能技术迅速发展,基于深度学习的预测方法逐渐成为主流方法。极限学习机作为一种单层前馈神经网络,无需迭代调整神经网络的权重和偏差,能在较短时间内实现船舶轨迹的预测[9]。徐婷婷等[10]提出的三层BP神经网络船舶轨迹预测模型,能有效捕捉船舶运动的时空特征,但该模型存在对训练数据依赖性较强、长期预测误差累积明显等问题。除此之外,以递归神经网络为代表的网络模型在时间序列问题上展现出更好的效果。Suo等[11]提出了基于长短期记忆网络(Long Short-term Memory,LSTM)的船舶轨迹预测方法,但其仅考虑了单个船舶的轨迹预测,缺少对真实场景下水面多目标间运动影响的考虑。Jaseena等[12]将小波变换等数据分解模型与双向LSTM网络结合,增强了对前后时空依赖关系的捕捉;Xue等[13]提出了基于分层LSTM的新型网络,通过分别处理时空动态交互提升推理准确性;Zhao等[14] 提出的图神经网络与LSTM融合模型,使用图注意力网络(GAT)编码船舶间动态交互,耦合LSTM捕获时序依赖,降低了预测误差。虽然这些深度学习方法在预测精度方面表现出色,但由于模型结构复杂、参数量庞大,在实际部署时往往面临计算资源消耗大、推理速度慢等工程实现挑战。
针对船舶轨迹预测精度低、计算量大等问题,本文提出基于组稀疏LSTM的预测方法。通过感知社交池化层编码船舶间运动交互,结合稀疏掩码模型实现权重稀疏化。实测数据验证表明,SGLNet模型显著提高了预测精度,为船舶态势感知提供可靠支持。
1 基于组稀疏长短期记忆模型的船舶轨迹预测方法 1.1 船舶运动轨迹数据处理船舶运动轨迹数据集的质量直接影响轨迹预测效果。为提高模型性能,对原始数据进行预处理,构建特征显著的数据集。本文基于实测数据建立船舶轨迹数据集,从异常轨迹检测和轨迹重采样两方面进行优化,避免特征丢失。
1.1.1 船舶异常运动轨迹信息检测复杂海面环境、传感器噪声、目标位置及密度等因素可能导致船舶运动轨迹数据异常。因此,异常检测对保障神经网络性能至关重要。定义船舶运动轨迹信息为:
| $ {x}_{i}^{k}=(LON_{i}^{k},LAT_{i}^{k}),i=0,1,...,T 。$ | (1) |
式中:
由于船舶不断运动,使用滑动窗口法对先验数据集进行异常轨迹信息检测。对于第
| $ W_{{}_{i}}^{k}=\left\{ {x}_{{}_{ {i}\mathbf- {w}\mathbf+\mathbf{1}}}^{k}\mathbf{,} {x}_{{}_{ {i}\mathbf- {w}\mathbf+\mathbf{2}}}^{k}\mathbf{,}\mathbf{...}\mathbf{,} {x}_{{}_{ {i}}}^{k}\right\}。$ | (2) |
式中:
在轨迹点集合
| $ {\mu }_{{i}}^{{k}}=\frac{1}{w}\sum \limits_{j=i-w+1}^{i}{x}_{{j}}^{{k}},$ | (3) |
| $ \Sigma _i^k=\frac{1}{w}\sum _{j=i-w+1}^{i}\left( {x}_j^k- {\mu }_i^k\right){\left( {x}_j^k- {\mu }_i^k\right)}^{{\rm{T}}} 。$ | (4) |
使用马氏距离,考虑局部轨迹的分布特性,计算目标船舶
| $ \begin{split}&D_{i}^{k}=\sqrt{{{\left({x}_i^k-{\mu }_i^k\right)}^{\rm{T}}} \left(\varSigma_i^{k}\right)^{-1}\left({x}_i^k-{\mu }_i^k\right)},\\ &\tau =\left\{\begin{aligned} &\tau,{\text{直线行驶}},\\ &\tau \left(1+\frac{{\theta }_{i}}{\max \theta }\right),{\text{转弯}}。\\ \end{aligned}\right. \end{split} $ | (5) |
式中:
设定动态阈值
针对多源传感器数据采样率不一致和异常值问题,现有研究提出了插值法、最近邻聚类等多种处理方法。本文根据轨迹曲率特征,分别采用拉格朗日插值和三次样条插值进行自适应重采样。
对于弯曲程度较小的轨迹,选择拉格朗日插值法对目标轨迹进行补充。根据牛顿第二定律,船舶运动方程可以表述为:
| $ m\frac{{\mathrm{d}}v}{{\mathrm{d}}i}={F}_{T}-D(v)-R(v)。$ | (6) |
式中:
| $ D(v)\approx D({v}_{0})+D'({v}_{0})(v-{v}_{0}) ,$ | (7) |
| $ R(v)\approx R({v}_{0})+R'({v}_{0})(v-{v}_{0})。$ | (8) |
因此,式(6)可以简化并整理为线性微分方程:
| $ \left\{\begin{aligned}&\frac{{\mathrm{d}}v}{{\mathrm{d}}i}+\frac{B}{m}v=\frac{C+B{v}_{0}}{m},\\ &C=F_T-D({v}_{0})-R({v}_{0}),\\&B={D'}{({v}_{0})+R'({v}_{0})}。\\ \end{aligned}\right. $ | (9) |
式中:
因此,在短时间内,式(9)的解可近似为:
| $ v(i)\approx {v}_{0}+\frac{C}{m}\Delta i 。$ | (10) |
式中:
| $ { {x}}^{ {k}}(i)= {x}_{\mathbf{0}}^{ {k}}+{v}_{0}i+\frac{1}{2}a{i}^{2}。$ | (11) |
式中:
因此,对于在滑动窗口空值点
| $ x_{{\mathrm{lagrange}}}^{k}(i)=\sum \limits_{p=j-1}^{j+1}x_{p}^{k}\prod \limits_{p\neq q}\frac{i-{i}_{q}}{{i}_{p}-{i}_{q}}。$ | (12) |
在短时间内,船舶速度的线性化模型导致位置呈现二次变化,而拉格朗日插值本身作为二次多项式则可以精确补充轨迹。
对于弯曲程度较大的轨迹,选择样条插值法构建三次多项式以确保目标船舶轨迹在插值点处连续,同时保证速度和加速度连续,满足船舶运动的平滑性要求。
在船舶弯曲程度较大的窗口内选择偏离程度小于阈值
| $ {x}_{}^{ {k}}(j)=b{(j-{{j}_{i}})}^{3}+c{(j-{{j}_{i}})}^{2}+d(j-{j}_{i})+e 。$ | (13) |
式中:
令式(13)分别满足区间断点处插值条件、连续性条件和边界条件可求解待定系数
在船舶运动轨迹预测的过程中,船舶间可能会出现避让情况,而现有的船舶轨迹运动轨迹预测方法较少考虑该情况导致估计准确率较低。本文提出一种组稀疏序列预测模型,即SGLNet模型。首先,利用编码层对目标船舶的历史轨迹信息进行编码整理,通过长短期记忆网络对每个目标船舶运动特征的捕捉;构建感知社交池化层,共享目标间的运动状态信息;提出稀疏掩码模型,对模型权重进行稀疏化表示,提升模型训练与推理速度。本文的SGLNet网络模型如图1所示,包括1个输入编码层(含稀疏掩码模型)、2个LSTM网络层、1个感知社交池化层以及1个输出编码层(含稀疏掩码模型)。
|
图 1 SCLNet 网络架构图 Fig. 1 The architecture diagram of SCLNet |
LSTM网络通过其门控机制(输入门、遗忘门、输出门)有效建模船舶轨迹的时序特征,适用于捕捉长距离依赖关系。本文利用LSTM提取船舶运动的潜在规律[16]。将处理后的时序数据输入LSTM网络学习和记忆船舶运动的长短期依赖关系。通过LSTM单元计算更新隐藏状态和细胞状态,动态调整对船舶运动规律的建模。最终,将更新后的隐藏状态通过全连接层和激活函数处理,输出预测的船舶轨迹坐标。LSTM网络层可以表达为:
| $ \left\{\begin{split} & f_t=\sigma (W_f\cdot [h_{t-1},x_t]+b_f),\\ & o_t=\sigma (W_o\cdot [h_{t-1},x_t]+b_o),\\ & i_t=\sigma (W_i\cdot [h_{t-1},x_t]+b_i),\\ & {\tilde{C}} _t= {\mathrm{tanh}} (W_C \cdot [h_{t-1},x_t]+b_C)\\ & C_t=f_t \cdot C_{t-1}+i_t \cdot {\tilde{C}}_t,\\ & h_t=o_t\cdot \tanh (C_t)。\end{split}\right. $ | (14) |
式中:
利用时间序列网络对船舶轨迹的预测作用,构建基于目标船舶运动隐藏状态的共享编码模型,即感知社交池化层,如图2所示。感知社交池化层通过三维张量以目标船舶为中心进行空间建模:首先用独立LSTM获取各船舶隐藏状态;然后聚合相邻目标的隐藏状态实现信息共享;最后将融合后的状态输入新LSTM进行轨迹预测。该层实现了水域时空信息的有效编码。
|
图 2 感知社交池化层 Fig. 2 The perceptual social pooling layer of SGLNet |
在SGLNet模型中,假设第
| $ {H}_{i}^{k}(p,q,\colon ) = \sum \limits_{j\in {\mathrm{N }}_{k}}o(LON_{i}^{j} - LON_{i}^{k},LAT_{i}^{j} - LAT_{i}^{k}) {h}_{i}^{k}。$ | (15) |
式中:
将编码后的社交张量
| $ {g}_{i+1}^{k}=\Delta ( {H}_{i}^{k}, {h}_{i}^{k}),$ | (16) |
| $ {h}_{i+1}^{k}=\Phi ((LON_{i+1}^{k},LAT_{i+1}^{k}), {g}_{i+1}^{k};{ {W}}_{\text{LSTM}})。$ | (17) |
式中:
在模型训练的过程中,确定合适的参数对于提升模型的预测准确性至关重要。鉴于此,选择均方误差(Mean Square Error,MSE)函数作为目标函数直观反映预测误差的整体水平,并引导模型训练过程朝着减小误差的方向进行,优化模型。
针对船舶轨迹预测模型中权重值较低的链节,提出了稀疏掩码模型进行优化。
| $ \begin{split}& \underset{ {W}_{1: M}^{k}}{\min }\displaystyle\frac{1}{NT}\sum _{j=1}^{N}\sum _{i=1}^{T}{(f(x_i^k : W_j^k)-{\boldsymbol{x}}_i^k)}^{2}+\lambda \sum _{j=1}^{N}\left|\left| W_j^k\right|\right|_{F}\\ &{\mathrm{ s.t.}} W_j^k= V_j^k,\;j=1,\ldots ,N,\;i=1,\ldots ,T。\end{split} $ | (18) |
式中:
由于在数学上对范数梯度难以求解。因此,本文引入对偶变量,并定义增广拉格朗日函数:
| $ \begin{split}&L( W_{1: N}^{k}, V_{1:N}^{k}; {\Omega }_{1: N}^{k})=\\ & \frac{1}{NT}\sum _{j=1}^{N}\sum _{i=1}^{T}{(f(x_i^k: W_j^k)-x_i^k)}^{2}+\lambda \sum _{j=1}^{N}{\left|\left| V_j^k\right|\right|}_{F}+\\ & \sum _{j=1}^{N}tr[ \Omega _j^k{}^{{{}^{{\mathrm{T}}}}}( W_j^k- V_j^k)]+\sum _{j=1}^{N}\dfrac{{\rho }_j}{2}\left|\left| W_j^k- V_j^k\right|\right|^{2}_{F}。\end{split} $ | (19) |
式中:
本文提出一种基于SGLNet模型的船舶轨迹预测方法。通过构建感知社交池化层和稀疏掩码模型,充分整合目标船舶所在一定空间内的其他目标的运动趋势,提升船舶运动轨迹预测的可信度和准确度。首先将船舶运动轨迹数据集进行预处理后,调取初始化模型进行模型的预训练,根据输入场景下的实时数据对模型进行重训练。模型进入评估模式后,将编码后的信息输入至网络层中,获取目标船舶周围空间内多艘船舶的位置信息,检查这些船舶是否在目标船舶的邻域空间内。利用LSTM网络获取邻域空间内其他船舶的隐藏状态并利用感知社交池化层嵌入至目标船舶的隐藏状态中,得到感知社交张量后再输入至下一时刻的时间序列模型,实现对船舶间交互关系的精准建模与表达。构建稀疏掩码模型,围绕权重矩阵生成与之相应的掩码矩阵,根据掩码矩阵在保证模型精度的前提下,对模型权重进行稀疏化表示,降低计算需求。
1.3 实验及分析 1.3.1 船舶运动轨迹数据集为了评估本文所提出方法的性能,本文使用实船采集的3份数据集开展实验研究,原始数据中共存在189艘船舶,189条轨迹,每艘船舶的记录轨迹点等。经过处理后可用的轨迹数据106条,包含106艘船舶。将处理后的数据集根据时间戳划分为4组训练集,2组测试集以及2组交叉验证集。
1.3.2 船舶运动轨迹预测实验设置为了验证本文方法的准确性,在船舶运动轨迹数据集中进行了模型的训练和验证。在软件方面,使用Windows 11 操作系统,Python3 编程语言并利用PyTorch 深度学习框架部署本文模型;在硬件方面,以配备了NVIDIA GeForce RTX4090的计算机为平台进行训练和测试。
本实验采用均方误差、最终位置与真实位置误差(Final Displacement Error,FDE)和估计轨迹上的点与真实轨迹上的对应点之间的平均欧几里得距离(Average Displacement Error,ADE)对模型的估计精度进行评估,评估指标的计算公式为:
| $ MSE=\frac{1}{M}\sum \limits_{i=1}^{M}{({{ {x}}_{i}}-{{{\hat{ {x}}}}_{i}})}^{2} ,$ | (20) |
| $ FDE=\left| x_{final}-{{\hat{ x}}}_{final}\right|,$ | (21) |
| $ ADE=\frac{1}{MT}\sum \limits_{i=1}^{M}\sum \limits_{t=1}^{T}\left| {x}_{i}^{t}-{\hat{ {x}}}_{i}^{t}\right|。$ | (22) |
式中:
本文实验选择LSTM[16]、Social LSTM[13]等代表性方法作为实验对照组,与本文提出的基于组稀疏序列预测模型的船舶轨迹预测方法进行对比。其中,LSTM是不考虑船舶之间相互影响的基础模型。Social LSTM是一种基于分层LSTM的新型网络。通过3种不同的LSTM捕捉动态场景信息,以预测船舶轨迹。
首先,调整模型参数以确保收敛性。然后,以常用运动轨迹预测方法作为对比组,比较性能。提取轨迹数据中的目标批号、经纬度、航速及航向等特征作为可选输入。针对历史轨迹长度不一的问题,探究SGLNet模型在不同输入序列长度下的性能。
如表1所示,随着输入序列长度的不断增加,验证集的损失和平均误差分别在
|
|
表 1 序列长度与验证集损失和误差的关系 Tab.1 The red party's operation loop characters |
除序列长度外,模型的学习率、批处理数目以及训练轮数均会对模型效果产生影响。经多次实验对比分析,本文选择迭代学习率为0.001,最小批处理数量确定为
同时,对于式(19)中
本文的SGLNet模型与其他模型进行对比,在MSE、FDE以及ADE上各类算法的预测性能指标如表2所示。
|
|
表 2 3种方法的预测结果对比 Tab.2 Comparison of the prediction results of the three methods. |
实验表明,传统LSTM在MSE、FDE及ADE等指标均低于其他2种模型。通过对模型的预训练、训练和重训练后,具有基础参数的SGLNet,即本文所提到的模型在MSE、FDE及ADE的指标上都最低,以某研究所的真实数据集合为例,相较于Social-LSTM模型的MSE提升
|
图 3 SGLNet 预测结果图 Fig. 3 The Prediction Results of SGLNet |
在参数量方面,以探测区域出现4个目标时为例,未加入稀疏掩码模型的参数量约为
|
图 4 训练损失随训练迭代次数的变化 Fig. 4 The variation training loss with the lterations |
本文提出的基于组稀疏序列预测模型的船舶轨迹预测方法,通过构建感知社交池化层和稀疏掩码模型,显著提升了船舶运动时空特征的提取能力,有效降低了模型对硬件计算资源的依赖。实验验证表明,与传统时间序列预测方法相比,SGLNet在预测精度和模型收敛速度方面均取得了显著提升,充分证明了该方法的有效性和优越性。然而,本研究仍存在一定局限性,特别是在复杂动态环境下的适应性有待进一步提高。未来的研究将重点探索环境因素对网络模型的影响机制,通过引入动态环境特征提取和自适应机制,进一步增强模型在复杂场景下的预测性能和鲁棒性。建议后续研究可考虑结合多源数据融合技术,以提升模型在实际应用中的可靠性,为智能航运系统提供更为精准的轨迹预测支持。
| [1] |
许洋. 船舶轨迹预测与路径规划技术研究[D]. 杭州: 杭州电子科技大学, 2022.
|
| [2] |
胡启慧. 智能汽车周边多目标行为识别与轨迹预测[D]. 镇江: 江苏大学, 2023.
|
| [3] |
HUANHUAN L, HANG J, ZAILI Y. Ship trajectory prediction based on machine learning and deep learning: A systematic review and methods analysis[J]. Engineering Applications of Artificial Intelligence, 2023, 126(C): 418-423. |
| [4] |
JASKOLSKI, KRZYSZTOF. Automatic identification system (AIS) dynamic data estimation based on discrete kalman filter (KF) algorithm[J]. Scientific Journals of the Naval Academy, 2017, 211(4): 71-87. |
| [5] |
FOSSEN S, FOSSEN T I. Exogenous kalman filter (XKF) for visualization and motion prediction of ships using live automatic identification systems (AIS) data[J]. Modeling, Identification and Control, 2018, 4(39): 233-244. |
| [6] |
PERERA L P, OLIVEIRA P, GUEDESSOARES C. Maritime traffic monitoring based on vessel detection, tracking, state estimation, and trajectory prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2012, 13(3): 1188-1200. DOI:10.1109/TITS.2012.2187282 |
| [7] |
QIAO S J, HAN N, ZHU X, et al. A dynamic trajectory prediction algorithm based on kalman filter[J]. Acta Electronica Sinica, 2018, 46(2): 418-423. |
| [8] |
TAMER B. A new approach to linear filtering and prediction problems[C]//Control Theory: Twenty-Five Seminal Papers (1932-1981). IEEE, 2001.
|
| [9] |
MAO S, TU E, ZHANG G, et al. An automatic identification system (AIS) database for maritime trajectory prediction and data mining[C]//Proceedings of ELM-2016. Springer, 2018.
|
| [10] |
徐婷婷, 柳晓鸣, 杨鑫. 基于BP神经网络的船舶航迹实时预测[J]. 大连海事大学学报, 2012, 38(1): 9-11. DOI:10.16411/j.cnki.issn1006-7736.2012.01.028 |
| [11] |
SUO Y F, CHEN W K, CLARAMUNT C, et al. A ship trajectory prediction framework based on a recurrent neural network[J]. Sensors, 2020, 20(18): 5133. DOI:10.3390/s20185133 |
| [12] |
JASEENA K U, KOVOOR B C. Decomposition-based hybrid wind speed forecasting model using deep bidirectional LSTM networks[J]. Energy Conversion and Management, 2021, 234: 113944. DOI:10.1016/j.enconman.2021.113944 |
| [13] |
HAO X, DU Q, REYNOLDS M. SS-LSTM: A hierarchical LSTM model for pedestrian trajectory prediction[C]//2018 IEEE Winter Conference on Applications of Computer Vision. IEEE, 2018.
|
| [14] |
ZHAO J S, YAN Z W, ZHOU Z Z, et al. A ship trajectory prediction method based on gat and LSTM[J]. Ocean Engineering, 2023, 289(1): 116159. |
| [15] |
BOYD S, PARIKH N, CHU E, et al . Distributed optimization and statistical learning via the alternating direction method of multipliers[C]//IEEE, 2011.
|
| [16] |
HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780. DOI:10.1162/neco.1997.9.8.1735 |
| [17] |
NOCEDAL J, WRIGHT S J. Numerical optimization[M]. Springer, 2006: 1−684.
|
| [18] |
黄时星. 野外环境下多运动目标检测与轨迹预测方法研究[D]. 哈尔滨: 哈尔滨工业大学, 2023.
|
| [19] |
牛鑫, 吕现伟, 余辰. 边缘智能: 现状与挑战[J]. 武汉大学学报(理学版), 2023, 69(2): 270-282. DOI:10.14188/j.1671-8836.2023.0026 |
| [20] |
QIAO S, TANG C, JIN H, et al. PutMode: prediction of uncertain trajectories in moving objects databases[J]. Applied Intelligence, 2010, 33: 370-386. DOI:10.1007/s10489-009-0173-z |
| [21] |
GAO R, SÄRKKÄ S, CLAVERIA-VEGA R, et al. Autonomous tracking and state estimation with generalized group lasso[J]. IEEE Transactions on Cybernetics, 2022, 52(11): 12056-12070. DOI:10.1109/TCYB.2021.3085426 |
2026, Vol. 48
