基于组稀疏长短期记忆模型的船舶轨迹预测

引用本文

王中瑞, 周嘉华, 朱修奇, 高睿, 罗威. 基于组稀疏长短期记忆模型的船舶轨迹预测. 舰船科学技术, 2026, 48(3): 138-144 复制到剪切板

WANG Zhongrui, ZHOU Jiahua, ZHU Xiuqi, GAO Rui, LUO Wei. Trajectory prediction of ships based on sparse group long short-term memory model. Ship Science and Technology, 2026, 48(3): 138-144 复制到剪切板

基于组稀疏长短期记忆模型的船舶轨迹预测

王中瑞¹, 周嘉华², 朱修奇¹, 高睿^1,3, 罗威²

1. 上海交通大学海洋智能装备与系统教育部重点实验室，上海 200240;
2. 中国船舶研究设计中心，湖北武汉 430000;
3. 上海交通大学深圳研究院，广东深圳 518063

收稿日期: 2025-04-17.

基金项目: 国家自然科学基金青年科学基金（C类）（52301402）；上海交通大学深蓝计划资助项目（SL2022MS002）；广东省基础与应用基础研究基金资助项目（2022A1515110574）

作者简介: 王中瑞（2001 – ），男，博士研究生，研究方向为无人艇态势感知

摘要: 船舶轨迹预测是智能航运系统的核心技术之一。现有船舶轨迹预测方法较少考虑目标间运动的相互影响，导致预测准确率低且计算量大。为解决上述问题，提出一种基于组稀疏长短期记忆（Sparse Group Long short-term memory Network，SGLNet）模型的船舶轨迹预测方法。利用编码层对输入的目标船舶运动轨迹数据进行编码，通过长短期记忆网络捕捉每个目标的运动特征；基于笛卡尔积构建水面目标周身网格空间，建立感知社交池化层，共享空间近端目标的隐藏状态；设计基于稀疏表示的掩码模型，对SGLNet网络参数量进行压缩。实验结果表明，相比其他序列预测网络模型，船舶轨迹预测精度提高了55.8%，模型参数量降低了12.77%。该方法满足了水面态势感知中对于船舶轨迹的需求，为构建智能航运系统提供了新的技术路径。

关键词: 智能航运系统轨迹预测序列预测网络长短期记忆网络

Trajectory prediction of ships based on sparse group long short-term memory model

WANG Zhongrui¹, ZHOU Jiahua², ZHU Xiuqi¹, GAO Rui^1,3, LUO Wei²

1. Key Laboratory of Marine Intelligent Equipment and System Ministry of Education, Shanghai Jiao Tong University, Shanghai 200240, China;
2. China Ship Development and Design Center, Wuhan 430000, China;
3. Shenzhen Research Institute of Shanghai Jiao Tong University, Shenzhen 518063, China

Abstract: Ship trajectory prediction constitutes one of the core technologies in intelligent shipping systems. Nevertheless, the existing methods for ship trajectory prediction seldom consider the mutual influence of movements among targets, leading to low prediction accuracy and considerable computational volume. To address this issue, we propose a novel trajectory prediction method based on the Sparse Group Long Short-Term Memory Network (SGLNet) model. In this approach, the encoding layer processes input data from of ship movement trajectories, while the LSTM network extracts the motion features of individual targets. A grid space surrounding the ship is constructed using the Cartesian product, and the hidden states of spatially proximal targets are shared to create perceptual social pooling layer. Furthermore, a sparse representation-based mask model is introduced to compress network weights. The proposed method effectively captures interdependent motion dynamics. Experimental results demonstrate that it achieves 55.8% higher accuracy compared to existing models. It offers a novel technical approach for the establishment of an intelligent shipping system.

Key words: intelligent waterway transportation system trajectory prediction sequence prediction network long short-term memory network

0 引　言

随着全球航运业的快速发展，船舶轨迹预测在智能航运、海上交通管理和水面态势感知等领域的重要性日益凸显^[1]。船舶轨迹预测技术是指通过分析船舶的历史航行数据（如位置、速度、航向等），运用算法模型，预测船舶未来运动轨迹的技术^[2]。该技术不仅有助于提升航行安全、优化航线规划，还能为碰撞预警和异常行为检测提供关键支持。然而，由于船舶运动受复杂环境因素（如风流、洋流）及人为操作的影响，其轨迹往往呈现高度的非线性和时空相关性。

近年来，船舶轨迹预测方法已经取得了大量研究成果，最常见的是基于物理模型的方法和基于深度学习的方法^[3]。在基于物理学模型的方法中，滤波方法是船舶轨迹预测中较为常见的方法。Jaskolska等^[4]提出了离散卡尔曼滤波方法，提升了在分道航行及航道区域内船舶追踪和监控能力。但在航速及航向等关键特征上，很难克服噪声的影响。Fossen等^[5]构建了一套船舶可视化与运动预测系统，解决了在复杂水域中船舶的非线性运动估计问题。Perera等^[6]设计了基于卡尔曼滤波的船舶导航和船舶交通监控系统。Qiao等^[7]通过加权平均的方法更新卡尔曼滤波的预测值，降低了船舶轨迹短期预测的误差。虽然滤波方法及其衍生方法在短期轨迹预测任务中已展现了较好的预测精度，然而在长期预测场景下，这些方法面临明显的精度衰减问题^[8]。

随着人工智能技术迅速发展，基于深度学习的预测方法逐渐成为主流方法。极限学习机作为一种单层前馈神经网络，无需迭代调整神经网络的权重和偏差，能在较短时间内实现船舶轨迹的预测^[9]。徐婷婷等^[10]提出的三层BP神经网络船舶轨迹预测模型，能有效捕捉船舶运动的时空特征，但该模型存在对训练数据依赖性较强、长期预测误差累积明显等问题。除此之外，以递归神经网络为代表的网络模型在时间序列问题上展现出更好的效果。Suo等^[11]提出了基于长短期记忆网络（Long Short-term Memory，LSTM）的船舶轨迹预测方法，但其仅考虑了单个船舶的轨迹预测，缺少对真实场景下水面多目标间运动影响的考虑。Jaseena等^[12]将小波变换等数据分解模型与双向LSTM网络结合，增强了对前后时空依赖关系的捕捉；Xue等^[13]提出了基于分层LSTM的新型网络，通过分别处理时空动态交互提升推理准确性；Zhao等^[14] 提出的图神经网络与LSTM融合模型，使用图注意力网络（GAT）编码船舶间动态交互，耦合LSTM捕获时序依赖，降低了预测误差。虽然这些深度学习方法在预测精度方面表现出色，但由于模型结构复杂、参数量庞大，在实际部署时往往面临计算资源消耗大、推理速度慢等工程实现挑战。

针对船舶轨迹预测精度低、计算量大等问题，本文提出基于组稀疏LSTM的预测方法。通过感知社交池化层编码船舶间运动交互，结合稀疏掩码模型实现权重稀疏化。实测数据验证表明，SGLNet模型显著提高了预测精度，为船舶态势感知提供可靠支持。

1 基于组稀疏长短期记忆模型的船舶轨迹预测方法 1.1 船舶运动轨迹数据处理

船舶运动轨迹数据集的质量直接影响轨迹预测效果。为提高模型性能，对原始数据进行预处理，构建特征显著的数据集。本文基于实测数据建立船舶轨迹数据集，从异常轨迹检测和轨迹重采样两方面进行优化，避免特征丢失。

1.1.1 船舶异常运动轨迹信息检测

复杂海面环境、传感器噪声、目标位置及密度等因素可能导致船舶运动轨迹数据异常。因此，异常检测对保障神经网络性能至关重要。定义船舶运动轨迹信息为：

$ {x}_{i}^{k}=(LON_{i}^{k},LAT_{i}^{k}),i=0,1,...,T 。$

(1)

式中：$ {x}_{i}^{k} $为目标船舶第$ i $时刻的位置信息；$ LON_{i}^{k} $和$ LAT_{i}^{k} $分别为目标船舶第$ i $时刻的经度坐标和纬度坐标。

由于船舶不断运动，使用滑动窗口法对先验数据集进行异常轨迹信息检测。对于第$ i $时刻目标船舶$ k $的运动轨迹信息$ {x}_{i}^{k} $，窗口大小为$ w(w \gt 4) $，用来表示每次检测时考虑的连续轨迹点数量。因此，在第$ i $时刻，目标船舶$ k $轨迹点集合所包含的轨迹点为：

$ W_{{}_{i}}^{k}=\left\{ {x}_{{}_{ {i}\mathbf- {w}\mathbf+\mathbf{1}}}^{k}\mathbf{,} {x}_{{}_{ {i}\mathbf- {w}\mathbf+\mathbf{2}}}^{k}\mathbf{,}\mathbf{...}\mathbf{,} {x}_{{}_{ {i}}}^{k}\right\}。$

(2)

式中：$ W_{{}_{i}}^{k} $为轨迹点集合，并随着时间推进，始终保持最新的$ w $个轨迹点。

在轨迹点集合$ W_{{}_{i}}^{k} $内，计算局部平均轨迹点$ {\mu }_{ {i}}^{ {k}} $和局部平均协方差矩阵$ {{\Sigma }}_{{i}}^{{k}} $：

$ {\mu }_{{i}}^{{k}}=\frac{1}{w}\sum \limits_{j=i-w+1}^{i}{x}_{{j}}^{{k}}，$

(3)

$ \Sigma _i^k=\frac{1}{w}\sum _{j=i-w+1}^{i}\left( {x}_j^k- {\mu }_i^k\right){\left( {x}_j^k- {\mu }_i^k\right)}^{{\rm{T}}} 。$

(4)

使用马氏距离，考虑局部轨迹的分布特性，计算目标船舶$ k $在第$ i $时刻的轨迹点$ {x}_{ {i}}^{ {k}} $与局部平均轨迹的偏离程度：

$ \begin{split}&D_{i}^{k}=\sqrt{{{\left({x}_i^k-{\mu }_i^k\right)}^{\rm{T}}} \left(\varSigma_i^{k}\right)^{-1}\left({x}_i^k-{\mu }_i^k\right)}，\\ &\tau =\left\{\begin{aligned} &\tau，{\text{直线行驶}}，\\ &\tau \left(1+\frac{{\theta }_{i}}{\max \theta }\right)，{\text{转弯}}。\\ \end{aligned}\right. \end{split} $

(5)

式中：$ D_{i}^{k} $为当前轨迹点$ {x}_{ {i}}^{ {k}} $与局部平均轨迹的偏离程度；θ_i表示当前时刻船舶运动方向的改变程度。

设定动态阈值$ \tau $，当偏离程度$ D_{i}^{k} \gt \tau $时，认为此时刻的轨迹点$ {x}_{ {i}}^{ {k}} $是异常点，并将其从先验数据中去除并补充空值点代替异常轨迹点在船舶运动轨迹信息数据集中的位置。

1.1.2 船舶轨迹信息重采样

针对多源传感器数据采样率不一致和异常值问题，现有研究提出了插值法、最近邻聚类等多种处理方法。本文根据轨迹曲率特征，分别采用拉格朗日插值和三次样条插值进行自适应重采样。

对于弯曲程度较小的轨迹，选择拉格朗日插值法对目标轨迹进行补充。根据牛顿第二定律，船舶运动方程可以表述为：

$ m\frac{{\mathrm{d}}v}{{\mathrm{d}}i}={F}_{T}-D(v)-R(v)。$

(6)

式中：$ m $为船舶质量；$ {F}_{T} $为推力；$ D(v) $为兴波阻力；$ R(v) $为粘性阻力。其中$ D(v) $和$ R(v) $通常与速度相关。但在传感器扫描周期内，如雷达的扫描周期为2～4 s，短时间内速度的变化较小。因此，可以将阻力在初始速度$ {v}_{0} $处线性化：

$ D(v)\approx D({v}_{0})+D'({v}_{0})(v-{v}_{0}) ，$

(7)

$ R(v)\approx R({v}_{0})+R'({v}_{0})(v-{v}_{0})。$

(8)

因此，式(6)可以简化并整理为线性微分方程：

$ \left\{\begin{aligned}&\frac{{\mathrm{d}}v}{{\mathrm{d}}i}+\frac{B}{m}v=\frac{C+B{v}_{0}}{m}，\\ &C=F_T-D({v}_{0})-R({v}_{0})，\\&B={D'}{({v}_{0})+R'({v}_{0})}。\\ \end{aligned}\right. $

(9)

式中：$D'(v_0) $和$R'(v_0) $分别为兴波阻力函数D(_v)和粘性阻力函数R(v)对速度v在v₀处的一阶导数；C为在初始时刻船舶的净受力，B为船舶的总阻尼系数。

因此，在短时间内，式(9)的解可近似为：

$ v(i)\approx {v}_{0}+\frac{C}{m}\Delta i 。$

(10)

式中：$ {v}_{0} $为船舶的初始速度；船舶速度随时间呈现线性变化关系，加速度$ a=C/m $可以近似为常数。因此，船舶的位置变化可以表示为：

$ { {x}}^{ {k}}(i)= {x}_{\mathbf{0}}^{ {k}}+{v}_{0}i+\frac{1}{2}a{i}^{2}。$

(11)

式中：$ {x}_{\mathbf{0}}^{ {k}} $为船舶轨迹的初始信息。

因此，对于在滑动窗口空值点$ {x}_{ {i}}^{ {k}} $，已知3个时刻的位置$ {x}_{ {j}\mathbf{-}\mathbf{1}}^{ {k}}、{x}_{ {j}}^{ {k}}、{x}_{ {j}\mathbf{+}\mathbf{1}}^{ {k}} $构造二次拉格朗日多项式：

$ x_{{\mathrm{lagrange}}}^{k}(i)=\sum \limits_{p=j-1}^{j+1}x_{p}^{k}\prod \limits_{p\neq q}\frac{i-{i}_{q}}{{i}_{p}-{i}_{q}}。$

(12)

在短时间内，船舶速度的线性化模型导致位置呈现二次变化，而拉格朗日插值本身作为二次多项式则可以精确补充轨迹。

对于弯曲程度较大的轨迹，选择样条插值法构建三次多项式以确保目标船舶轨迹在插值点处连续，同时保证速度和加速度连续，满足船舶运动的平滑性要求。

在船舶弯曲程度较大的窗口内选择偏离程度小于阈值$ \tau $的轨迹点构造三次样条插值函数：

$ {x}_{}^{ {k}}(j)=b{(j-{{j}_{i}})}^{3}+c{(j-{{j}_{i}})}^{2}+d(j-{j}_{i})+e 。$

(13)

式中：$ b、c、d、e $为待定系数。

令式(13)分别满足区间断点处插值条件、连续性条件和边界条件可求解待定系数$ b、c、d、e $，并根据求解后的三次样条插值函数计算空值处的船舶轨迹位置信息。

1.2 基于组稀疏长短期记忆模型的船舶轨迹预测方法

在船舶运动轨迹预测的过程中，船舶间可能会出现避让情况，而现有的船舶轨迹运动轨迹预测方法较少考虑该情况导致估计准确率较低。本文提出一种组稀疏序列预测模型，即SGLNet模型。首先，利用编码层对目标船舶的历史轨迹信息进行编码整理，通过长短期记忆网络对每个目标船舶运动特征的捕捉；构建感知社交池化层，共享目标间的运动状态信息；提出稀疏掩码模型，对模型权重进行稀疏化表示，提升模型训练与推理速度。本文的SGLNet网络模型如图1所示，包括1个输入编码层（含稀疏掩码模型）、2个LSTM网络层、1个感知社交池化层以及1个输出编码层（含稀疏掩码模型）。

图 1 SCLNet 网络架构图 Fig. 1 The architecture diagram of SCLNet

1.2.1 长短期记忆(LSTM)网络

LSTM网络通过其门控机制（输入门、遗忘门、输出门）有效建模船舶轨迹的时序特征，适用于捕捉长距离依赖关系。本文利用LSTM提取船舶运动的潜在规律^[16]。将处理后的时序数据输入LSTM网络学习和记忆船舶运动的长短期依赖关系。通过LSTM单元计算更新隐藏状态和细胞状态，动态调整对船舶运动规律的建模。最终，将更新后的隐藏状态通过全连接层和激活函数处理，输出预测的船舶轨迹坐标。LSTM网络层可以表达为：

$ \left\{\begin{split} & f_t=\sigma (W_f\cdot [h_{t-1},x_t]+b_f)，\\ & o_t=\sigma (W_o\cdot [h_{t-1},x_t]+b_o)，\\ & i_t=\sigma (W_i\cdot [h_{t-1},x_t]+b_i)，\\ & {\tilde{C}} _t= {\mathrm{tanh}} (W_C \cdot [h_{t-1},x_t]+b_C)\\ & C_t=f_t \cdot C_{t-1}+i_t \cdot {\tilde{C}}_t，\\ & h_t=o_t\cdot \tanh (C_t)。\end{split}\right. $

(14)

式中：$ \sigma \left(\cdot \right) $为sigmoid激活函数；$ \tanh \left(\cdot \right) $为tanh激活函数；$ { {W}}_{ {f}}、{ {W}}_{ {o}}、{ {W}}_{ {i}} $分别为遗忘门$ {{f}}_{ {t}} $、输出门$ { {o}}_{ {t}} $和输入门$ { {i}}_{ {t}} $的权重系数矩阵；$ { {b}}_{ {f}}、{ {b}}_{ {o}}、{ {b}}_{ {i}} $分别为遗忘门、输出门和输入门的偏置向量。

1.2.2 感知社交池化层

利用时间序列网络对船舶轨迹的预测作用，构建基于目标船舶运动隐藏状态的共享编码模型，即感知社交池化层，如图2所示。感知社交池化层通过三维张量以目标船舶为中心进行空间建模：首先用独立LSTM获取各船舶隐藏状态；然后聚合相邻目标的隐藏状态实现信息共享；最后将融合后的状态输入新LSTM进行轨迹预测。该层实现了水域时空信息的有效编码。

图 2 感知社交池化层 Fig. 2 The perceptual social pooling layer of SGLNet

在SGLNet模型中，假设第$ i $时刻，时间序列模型捕捉到了第$ k $艘船舶的隐藏状态$ {h}_{ {i}}^{ {k}} $，以该船舶为中心，建立大小为$ d $的邻域网格，对于第$ k $艘船舶，以其为中心建立感知社交池化层模型$ {H}_{ {i}}^{ {k}} $，其中$ {H}_{ {i}}^{ {k}} $是一个维度为$ d\times d\times {\mathbb{R}}_{h} $的三维张量，$ {\mathbb{R}}_{h} $是其隐藏状态$ {h}_{ {i}}^{ {k}} $的维度。因此，社交感知池化层$ {H}_{ {i}}^{ {k}} $可以表达为：

$ {H}_{i}^{k}(p,q,\colon ) = \sum \limits_{j\in {\mathrm{N }}_{k}}o(LON_{i}^{j} - LON_{i}^{k},LAT_{i}^{j} - LAT_{i}^{k}) {h}_{i}^{k}。$

(15)

式中：$ {H}_{ {i}}^{ {k}} $为感知社交池化层的三维张量；$ o\left(\cdot \right) $为用于检查第$ j $艘船舶是否在第$ k $艘船舶的邻域网格$ \left(p,q\right) $内；$ {N}_{k} $为该船舶的周围环境域。

将编码后的社交张量$ {H}_{ {i}}^{ {k}} $嵌入相应目标的隐藏状态中，将下一个时刻的传感器输入和当前时刻嵌入$ {H}_{ {i}}^{ {k}} $的隐藏状态作为下一时刻的网格输入，LSTM神经网络的更新模型如下：

$ {g}_{i+1}^{k}=\Delta ( {H}_{i}^{k}, {h}_{i}^{k})，$

(16)

$ {h}_{i+1}^{k}=\Phi ((LON_{i+1}^{k},LAT_{i+1}^{k}), {g}_{i+1}^{k};{ {W}}_{\text{LSTM}})。$

(17)

式中：$ \Delta \left(\cdot \right) $为用于将感知社交池化层产生的信息嵌入到当前第$ k $艘船舶的隐藏状态中；$ {g}_{ {i}\mathbf{+}\mathbf{1}}^{ {k}} $为嵌入社交信息后的隐藏状态；$ \left(LON_{i+1}^{k},LAT_{i+1}^{k}\right) $为第$ k $艘船舶下一时刻的位置信息；$ { {W}}_{ {L} {S} {T} {M}} $为LSTM网络中的权重稀疏的矩阵集合；$ \Phi \left(\cdot \right) $为LSTM的网络计算。

1.2.3 稀疏掩码模型

在模型训练的过程中，确定合适的参数对于提升模型的预测准确性至关重要。鉴于此，选择均方误差（Mean Square Error，MSE）函数作为目标函数直观反映预测误差的整体水平，并引导模型训练过程朝着减小误差的方向进行，优化模型。

针对船舶轨迹预测模型中权重值较低的链节，提出了稀疏掩码模型进行优化。

$ \begin{split}& \underset{ {W}_{1: M}^{k}}{\min }\displaystyle\frac{1}{NT}\sum _{j=1}^{N}\sum _{i=1}^{T}{(f(x_i^k : W_j^k)-{\boldsymbol{x}}_i^k)}^{2}+\lambda \sum _{j=1}^{N}\left|\left| W_j^k\right|\right|_{F}\\ &{\mathrm{ s.t.}} W_j^k= V_j^k,\;j=1,\ldots ,N,\;i=1,\ldots ,T。\end{split} $

(18)

式中：$ W_{1:N}^{k} $为SGLNet中输入、输出及感知社交池化层的网络权重层；$ f\left(\cdot \right) $为输入数据到隐藏状态的映射，其中包括输入、输出及感知社会池化层的映射；$ {x}_{ {i}}^{ {k}} $为第$ i $时刻第$ k $艘船舶的输入数据；${\hat{ {x}}}_{i}^{k} $为SGLNet模型所估计的当前目标的运动状态信息；$ {\left|\left| {W}_{ {j}}^{ {k}}\right|\right|}_{F} $为第$ j $个组件权重矩阵的F范数。

由于在数学上对范数梯度难以求解。因此，本文引入对偶变量，并定义增广拉格朗日函数：

$ \begin{split}&L( W_{1: N}^{k}, V_{1:N}^{k}; {\Omega }_{1: N}^{k})=\\ & \frac{1}{NT}\sum _{j=1}^{N}\sum _{i=1}^{T}{(f(x_i^k: W_j^k)-x_i^k)}^{2}+\lambda \sum _{j=1}^{N}{\left|\left| V_j^k\right|\right|}_{F}+\\ & \sum _{j=1}^{N}tr[ \Omega _j^k{}^{{{}^{{\mathrm{T}}}}}( W_j^k- V_j^k)]+\sum _{j=1}^{N}\dfrac{{\rho }_j}{2}\left|\left| W_j^k- V_j^k\right|\right|^{2}_{F}。\end{split} $

(19)

式中：$ {\rho }_{j} $为惩罚因子；$ tr\left(\cdot \right) $为矩阵的迹；$ \Omega _{j}^{k} $为对应于约束$ {W}_{j}^{k}= {V}_{j}^{k} $的拉格朗日乘子。利用融合变量分离法与PruneAdam^{[15 - 16]}优化器进行求解对上述优化问题进行求解^{[18 - 21]}，该优化方法通过交替$ {W}_{1: N}^{k}、{V}_{1: N}^{k} $最小化步骤和对偶变量$ \Omega _{1: N}^{k} $更新步骤最小化增广拉格朗日函数$ L $，最终实现SGLNet模型权重的优化。

1.2.4 算法总结与讨论

本文提出一种基于SGLNet模型的船舶轨迹预测方法。通过构建感知社交池化层和稀疏掩码模型，充分整合目标船舶所在一定空间内的其他目标的运动趋势，提升船舶运动轨迹预测的可信度和准确度。首先将船舶运动轨迹数据集进行预处理后，调取初始化模型进行模型的预训练，根据输入场景下的实时数据对模型进行重训练。模型进入评估模式后，将编码后的信息输入至网络层中，获取目标船舶周围空间内多艘船舶的位置信息，检查这些船舶是否在目标船舶的邻域空间内。利用LSTM网络获取邻域空间内其他船舶的隐藏状态并利用感知社交池化层嵌入至目标船舶的隐藏状态中，得到感知社交张量后再输入至下一时刻的时间序列模型，实现对船舶间交互关系的精准建模与表达。构建稀疏掩码模型，围绕权重矩阵生成与之相应的掩码矩阵，根据掩码矩阵在保证模型精度的前提下，对模型权重进行稀疏化表示，降低计算需求。

1.3 实验及分析 1.3.1 船舶运动轨迹数据集

为了评估本文所提出方法的性能，本文使用实船采集的3份数据集开展实验研究，原始数据中共存在189艘船舶，189条轨迹，每艘船舶的记录轨迹点等。经过处理后可用的轨迹数据106条，包含106艘船舶。将处理后的数据集根据时间戳划分为4组训练集，2组测试集以及2组交叉验证集。

1.3.2 船舶运动轨迹预测实验设置

为了验证本文方法的准确性，在船舶运动轨迹数据集中进行了模型的训练和验证。在软件方面，使用Windows 11 操作系统，Python3 编程语言并利用PyTorch 深度学习框架部署本文模型；在硬件方面，以配备了NVIDIA GeForce RTX4090的计算机为平台进行训练和测试。

本实验采用均方误差、最终位置与真实位置误差（Final Displacement Error，FDE）和估计轨迹上的点与真实轨迹上的对应点之间的平均欧几里得距离（Average Displacement Error，ADE）对模型的估计精度进行评估，评估指标的计算公式为：

$ MSE=\frac{1}{M}\sum \limits_{i=1}^{M}{({{ {x}}_{i}}-{{{\hat{ {x}}}}_{i}})}^{2} ，$

(20)

$ FDE=\left| x_{final}-{{\hat{ x}}}_{final}\right|，$

(21)

$ ADE=\frac{1}{MT}\sum \limits_{i=1}^{M}\sum \limits_{t=1}^{T}\left| {x}_{i}^{t}-{\hat{ {x}}}_{i}^{t}\right|。$

(22)

式中：$ { {x}}_{i} $为真实轨迹的数值；$ {{\hat{ {x}}}}_{i} $为算法估计的轨迹数值；$ M $为轨迹中点的个数；$ T $为轨迹运行的时间。MSE通过计算所有轨迹点中估计值与真实值之间距离差的平方评价估计轨迹真值轨迹之间的拟合程度。FDE通常应用在位置估计领域如智能体的轨迹估计等场景。ADE误差则表示在估计时间段内的每一个时间步，估计轨迹上的点与真实轨迹上的对应点之间的平均欧几里得距离。

1.3.3 实验结果分析

本文实验选择LSTM^[16]、Social LSTM^[13]等代表性方法作为实验对照组，与本文提出的基于组稀疏序列预测模型的船舶轨迹预测方法进行对比。其中，LSTM是不考虑船舶之间相互影响的基础模型。Social LSTM是一种基于分层LSTM的新型网络。通过3种不同的LSTM捕捉动态场景信息，以预测船舶轨迹。

首先，调整模型参数以确保收敛性。然后，以常用运动轨迹预测方法作为对比组，比较性能。提取轨迹数据中的目标批号、经纬度、航速及航向等特征作为可选输入。针对历史轨迹长度不一的问题，探究SGLNet模型在不同输入序列长度下的性能。

如表1所示，随着输入序列长度的不断增加，验证集的损失和平均误差分别在$ 8.5\times {10}^{-3} $和$ 1.15\times {10}^{-2} $附近波动，为保证模型精度，选择数据的输入序列长度为16。说明本文方法在不同的输入序列长度下都有较好的性能。

表 1 序列长度与验证集损失和误差的关系 Tab.1 The red party's operation loop characters

除序列长度外，模型的学习率、批处理数目以及训练轮数均会对模型效果产生影响。经多次实验对比分析，本文选择迭代学习率为0.001，最小批处理数量确定为$ 5 $，选择PruneAdam^[17]对轻量化模型进行优化。

同时，对于式(19)中$ \lambda $的选择上，设置一系列呈现二倍关系的测试值，并将数据集划分为训练集、验证集和测试集。使用训练集对不同$ \lambda $下的带有正则化的SGLNet模型进行训练，并用训练后的模型对交叉验证集计算得出误差值，并选择误差值最小的模型所对应的。根据前期试验验证，本文选择的为$ 0.01 $。

本文的SGLNet模型与其他模型进行对比，在MSE、FDE以及ADE上各类算法的预测性能指标如表2所示。

表 2 3种方法的预测结果对比 Tab.2 Comparison of the prediction results of the three methods.

实验表明，传统LSTM在MSE、FDE及ADE等指标均低于其他2种模型。通过对模型的预训练、训练和重训练后，具有基础参数的SGLNet，即本文所提到的模型在MSE、FDE及ADE的指标上都最低，以某研究所的真实数据集合为例，相较于Social-LSTM模型的MSE提升$ 83.3\mathrm{\% } $，说明SGLNet对于轨迹的多步估计能力显著提高，模型泛化性能更强。SGLNet模型的FDE相比于Social-LSTM也提升了$ 55.8\mathrm{\% } $，说明SGLNet模型的预测能力得到了显著的提升，预测目标轨迹在同一时间出现重合或接近的概率进一步降低。可视化实验结果如图3所示，其中横纵坐标是将经纬度映射到目标范围后的坐标，浅色为船舶轨迹预测值，深色为船舶轨迹真实值，部分船舶由于在观测中驶出观测区域，不在预测范围内，导致最终预测结果中缺少相应轨迹。

图 3 SGLNet 预测结果图 Fig. 3 The Prediction Results of SGLNet

在参数量方面，以探测区域出现4个目标时为例，未加入稀疏掩码模型的参数量约为48384，加入了稀疏掩码模型的SGLNet的参数量约为42205，SGLNet的参数量降低了12.77%，有效降低了模型的参数量和计算量。此外，在训练过程中训练损失随训练迭代次数的变化对比如图4所示。其中，LSTM-Adam是$ \lambda =0 $时模型的收敛情况；SGLNet是$ \lambda =0.01 $时模型的收敛情况。对比3种以LSTM为基本单元的模型发现，加入稀疏后的SGLNet模型的收敛速度更快。对比基本参数量更小的GRU单元，加入稀疏后的SGLNet模型的收敛速度与之相近，损失值更低。这是由于加入稀疏后的SGLNet通过对权重矩阵进行弱化，优化权重值较低的连接，因此在参数量上与结构更为简单的GRU单元接近，收敛速度变快，SGLNet模型的准确率更高。

图 4 训练损失随训练迭代次数的变化 Fig. 4 The variation training loss with the lterations

2 结　语

本文提出的基于组稀疏序列预测模型的船舶轨迹预测方法，通过构建感知社交池化层和稀疏掩码模型，显著提升了船舶运动时空特征的提取能力，有效降低了模型对硬件计算资源的依赖。实验验证表明，与传统时间序列预测方法相比，SGLNet在预测精度和模型收敛速度方面均取得了显著提升，充分证明了该方法的有效性和优越性。然而，本研究仍存在一定局限性，特别是在复杂动态环境下的适应性有待进一步提高。未来的研究将重点探索环境因素对网络模型的影响机制，通过引入动态环境特征提取和自适应机制，进一步增强模型在复杂场景下的预测性能和鲁棒性。建议后续研究可考虑结合多源数据融合技术，以提升模型在实际应用中的可靠性，为智能航运系统提供更为精准的轨迹预测支持。

参考文献

[1]	许洋. 船舶轨迹预测与路径规划技术研究[D]. 杭州: 杭州电子科技大学, 2022.
[2]	胡启慧. 智能汽车周边多目标行为识别与轨迹预测[D]. 镇江: 江苏大学, 2023.
[3]	HUANHUAN L, HANG J, ZAILI Y. Ship trajectory prediction based on machine learning and deep learning: A systematic review and methods analysis[J]. Engineering Applications of Artificial Intelligence, 2023, 126(C): 418-423.
[4]	JASKOLSKI, KRZYSZTOF. Automatic identification system (AIS) dynamic data estimation based on discrete kalman filter (KF) algorithm[J]. Scientific Journals of the Naval Academy, 2017, 211(4): 71-87.
[5]	FOSSEN S, FOSSEN T I. Exogenous kalman filter (XKF) for visualization and motion prediction of ships using live automatic identification systems (AIS) data[J]. Modeling, Identification and Control, 2018, 4(39): 233-244.
[6]	PERERA L P, OLIVEIRA P, GUEDESSOARES C. Maritime traffic monitoring based on vessel detection, tracking, state estimation, and trajectory prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2012, 13(3): 1188-1200. DOI:10.1109/TITS.2012.2187282
[7]	QIAO S J, HAN N, ZHU X, et al. A dynamic trajectory prediction algorithm based on kalman filter[J]. Acta Electronica Sinica, 2018, 46(2): 418-423.
[8]	TAMER B. A new approach to linear filtering and prediction problems[C]//Control Theory: Twenty-Five Seminal Papers (1932-1981). IEEE, 2001.
[9]	MAO S, TU E, ZHANG G, et al. An automatic identification system (AIS) database for maritime trajectory prediction and data mining[C]//Proceedings of ELM-2016. Springer, 2018.
[10]	徐婷婷, 柳晓鸣, 杨鑫. 基于BP神经网络的船舶航迹实时预测[J]. 大连海事大学学报, 2012, 38(1): 9-11. DOI:10.16411/j.cnki.issn1006-7736.2012.01.028
[11]	SUO Y F, CHEN W K, CLARAMUNT C, et al. A ship trajectory prediction framework based on a recurrent neural network[J]. Sensors, 2020, 20(18): 5133. DOI:10.3390/s20185133
[12]	JASEENA K U, KOVOOR B C. Decomposition-based hybrid wind speed forecasting model using deep bidirectional LSTM networks[J]. Energy Conversion and Management, 2021, 234: 113944. DOI:10.1016/j.enconman.2021.113944
[13]	HAO X, DU Q, REYNOLDS M. SS-LSTM: A hierarchical LSTM model for pedestrian trajectory prediction[C]//2018 IEEE Winter Conference on Applications of Computer Vision. IEEE, 2018.
[14]	ZHAO J S, YAN Z W, ZHOU Z Z, et al. A ship trajectory prediction method based on gat and LSTM[J]. Ocean Engineering, 2023, 289(1): 116159.
[15]	BOYD S, PARIKH N, CHU E, et al . Distributed optimization and statistical learning via the alternating direction method of multipliers[C]//IEEE, 2011.
[16]	HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780. DOI:10.1162/neco.1997.9.8.1735
[17]	NOCEDAL J, WRIGHT S J. Numerical optimization[M]. Springer, 2006: 1−684.
[18]	黄时星. 野外环境下多运动目标检测与轨迹预测方法研究[D]. 哈尔滨: 哈尔滨工业大学, 2023.
[19]	牛鑫, 吕现伟, 余辰. 边缘智能: 现状与挑战[J]. 武汉大学学报(理学版), 2023, 69(2): 270-282. DOI:10.14188/j.1671-8836.2023.0026
[20]	QIAO S, TANG C, JIN H, et al. PutMode: prediction of uncertain trajectories in moving objects databases[J]. Applied Intelligence, 2010, 33: 370-386. DOI:10.1007/s10489-009-0173-z
[21]	GAO R, SÄRKKÄ S, CLAVERIA-VEGA R, et al. Autonomous tracking and state estimation with generalized group lasso[J]. IEEE Transactions on Cybernetics, 2022, 52(11): 12056-12070. DOI:10.1109/TCYB.2021.3085426


舰船科学技术 2026, Vol. 48 Issue (3): 138-144 DOI: 10.3404/j.issn.1672-7649.2026.03.022	PDF