基于LSTM的船舶运动多模态预测方法

张彦峰 杨震 王立鹏 于淼

张彦峰, 杨震, 王立鹏, 等. 基于LSTM的船舶运动多模态预测方法 [J]. 智能系统学报, 2026, 21(1): 201-213. doi: 10.11992/tis.202512005
引用本文: 张彦峰, 杨震, 王立鹏, 等. 基于LSTM的船舶运动多模态预测方法 [J]. 智能系统学报, 2026, 21(1): 201-213. doi: 10.11992/tis.202512005
ZHANG Yanfeng, YANG Zhen, WANG Lipeng, et al. Multi-modal prediction method for ship motion based on LSTM [J]. CAAI Transactions on Intelligent Systems, 2026, 21(1): 201-213. doi: 10.11992/tis.202512005
Citation: ZHANG Yanfeng, YANG Zhen, WANG Lipeng, et al. Multi-modal prediction method for ship motion based on LSTM [J]. CAAI Transactions on Intelligent Systems, 2026, 21(1): 201-213. doi: 10.11992/tis.202512005

基于LSTM的船舶运动多模态预测方法

doi: 10.11992/tis.202512005
基金项目: 国家自然科学基金面上项目(62173103,62573151,52171332);黑龙江省自然科学基金项目(LH2024F037);中央高校基本科研业务费专项(3072024XX0403).
详细信息
    作者简介:

    张彦峰,硕士研究生,主要研究方向为船舶状态预报。E-mail:zhangyf_gl@hrbeu.edu.cn;

    杨震,讲师,主要研究方向为船舶运动控制和智能预报,获省部级科技进步一等奖。发表学术论文20余篇。E-mail:yzhen@hrbeu.edu.cn;

    王立鹏,副教授,博士生导师,主要研究方向为复杂系统建模与控制,主持国家自然科学基金面上项目、青年项目、民品横向等,获省部级科技进步特等奖、一等奖,获发明专利授权9项。发表学术论文30余篇。E-mail:wlp_heu@163.com.

    通讯作者:

    杨震. E-mail:yzhen@hrbeu.edu.cn.

  • 中图分类号: TP183

Multi-modal prediction method for ship motion based on LSTM

  • 摘要:

    为提升长短期记忆网络(long short-term memory, LSTM)在船舶运动姿态领域的预测精度,同时简化参数调优的过程。针对船舶运动数据设计了双层模态分解策略,结合开普勒优化算法(Kepler optimization algorithm, KOA),提出一种船舶运动姿态多模态预测模型。采用改进的完全自适应噪声集合经验模态分解(improved complete ensemble empirical mode decomposition with adaptive noise, ICEEMDAN)和变分模态分解(variational mode decomposition, VMD)的双层模态分解(double-layer mode decomposition, DLMD)模式,对原始船舶运动姿态时序数据进行双层分解,解决了第一层分解存在的高频分量过度平滑问题,同时消除了高频噪声与有效信号在相同频带下的耦合干扰,提升了模型的预测效果;进一步在模型训练中引入KOA优化LSTM的超参数,解决了LSTM调参效率低、易陷入局部最优的问题。基于实船运动数据集开展消融实验和算法整体验证实验,消融实验验证了DLMD和KOA模块的独立贡献;算法整体验证实验结果验证了两个模块的共同作用,并表明了该模型能够对船舶横摇和纵摇姿态实现较高精度的预测及超参数组合的自动优化。

     

    Abstract:

    To improve the prediction accuracy of the long short-term memory (LSTM) model in the field of ship motion attitude and simplify the parameter tuning process, a double-layer mode decomposition strategy is designed for ship motion data. Combined with the Kepler optimization algorithm (KOA), a multi-modal prediction model for ship motion attitude is proposed. This model adopts a double-layer mode decomposition (DLMD) scheme integrating improved complete ensemble empirical mode decomposition with adaptive noise (ICEEMDAN) and variational mode decomposition (VMD) to perform double-layer decomposition on the original time-series data of ship motion attitude. This decomposition resolves the over-smoothing issue of high-frequency components in the first-layer decomposition, while eliminating the coupling interference between high-frequency noise and effective signals in the same frequency band, thus improving the prediction performance of the model. Furthermore, KOA is introduced to optimize the hyperparameters of LSTM during model training, which addresses the problems of low efficiency and easy trapping in local optima in LSTM parameter tuning. Ablation experiments and overall algorithm verification experiments are conducted based on a real ship motion dataset. The ablation experiments verify the independent contributions of the DLMD and KOA modules; the results of the algorithm verification experiments confirm the synergistic effect of the two modules, and demonstrate that the proposed model can achieve high-precision prediction of ship roll and pitch attitudes as well as automatic optimization of hyperparameter combinations.

     

  • 海洋环境具有强非线性、时变性和不确定性,在这种扰动下船舶会产生横摇、纵摇等运动,不仅直接影响船舶航行稳定性,还与动力系统能耗以及航行决策紧密相关[1-6]。随着全球贸易量增长与海洋装备智能化升级,船舶在复杂海况下的航行安全性和操纵效率面临更高要求[7-10]。时间序列分析法是船舶姿态预测的主流方法之一。然而,传统方法难以准确捕获船舶的运动特性,导致其在预测中难以满足高精度预报需求。近年来,随着深度学习技术的兴起,为船舶姿态短期预测带来了快速发展[11-12]

    长短期记忆网络(long short-term memory, LSTM)具有独特的时序数据处理能力,因其能够捕获船舶运动的长周期动态关联,在船舶姿态预测领域得到了广泛研究[13-14]。Sun等[15]提出一种基于LSTM和高斯过程回归(Gaussian process regression, GPR)的预测模型,针对船舶横摇角与纵摇角在运动与静止状态下进行预测实验,验证了混合模型的有效性与先进性。Geng等[16]提出一种EMD(empirical mode decomposition)-PSO(particle swarm optimization)-LSTM混合模型,针对解决非线性非平稳数据对预测的影响,实验结果表明,该算法在预测精度与稳定性方面均展现出显著优势。Liu等[17]研究了基于脉冲响应函数(IRF)和自相关函数(ACF)的输入向量空间优化技术确定LSTM最佳输入向量维数,能够降低计算成本并提高自适应性。Yao等[18]提出一种基于PSO的LSTM改进方法,仿真实验结果表明,这种结合有效提升了船舶运动姿态预测的精度。Jiang等[19]提出并应用一种基于LSTM的新型辨识建模方案,用于构建船舶操纵运动的非参数模型。结果表明,LSTM能够有效辨识船舶操纵运动的数学模型,并且具有良好的抗噪性能。Zhang等[20]利用过自适应PSO算法对BiLSTM网络超参数进行优化设计,在船舶运动姿态预测中展现出良好的预测性能。Han等[21]提出变步长−变采样频率特性的LSTM船舶运动预测方法,提升了模型预测精度与船舶运动获取的时效性。

    但船舶运动由于受海洋环境的影响,其姿态除了具有非平稳性、多尺度耦合、非线性和时变的特性外还含有噪声,使得LSTM对实船时序数据的预测精度并不是很好,且预测性能高度依赖于超参数的选取,传统手动调参方法易陷入局部最优[22-26],优良的优化算法可以更快速选定参数组合,提升模型收敛速度和预测效果[27-29]。本文针对船舶运动信号的特点,利用双层模态分解,能够精准分离不同频段的噪声与有效信号,为后续预测奠定了高质量的数据基础。但分解后的多模态分量使LSTM训练轮次成倍数增加,为了提升参数选择效率和预测精度,本文利用开普勒优化算法(Kepler optimizational-gorithm, KOA)在LSTM超参数空间内进行全局搜索,使LSTM能快速收敛至最优参数组合,解决了双层模态分解(double-layer mode decomposition, DLMD)带来的调参难题。

    受上述文献启发,提出了一种船舶运动姿态多模态预测模型(D-K-LSTM),整体流程分为DLMD、KOA超参数优化、LSTM预测3个核心模块,称为D-K-LSTM模型。首先,输入原始船舶运动姿态时序信号,通过双层模态分解模块进行预处理:第1步采用改进的完全自适应噪声集合经验模态分解(improved complete ensemble empirical mode decomposition with adaptive noise, ICEEMDAN),将原始信号初步分解为若干模态函数(IMF)与残余分量;第2步识别出其中的高频分量,对其进行变分模态分解(variational mode decomposition, VMD),通过预设带宽约束与变分优化实现高频段噪声与有效信号的精准分离,最终得到多组去混叠、高纯度的模态分量。接着,将分解后的多模态分量输入LSTM预测模块,同时引入KOA优化模块,基于开普勒算法模拟天体运动的原理,KOA在LSTM超参数取值空间内进行全局搜索,通过自适应调节快速收敛至最优参数组合,以此解决LSTM手动调参效率低、易陷入局部最优的问题。最后,经KOA优化后的LSTM网络对多模态分量进行训练与预测,输出最终的船舶运动姿态预测结果,完成所设计模型的完整流程。

    LSTM[30]网络引入了记忆单元、输入门、遗忘门和输出门,实现了对时间序列数据中长短期依赖关系的动态建模。在LSTM网络中,将当前和前一个时间步输入的状态送入网络中,其结构如图1所示。

    图  1  LSTM结构
    Fig.  1  LSTM structure diagram
    下载: 全尺寸图片

    原理可以概括为

    $$ {f}_{t}=\sigma ({W}_{xf}\cdot {x}_{t}+{h}_{t-1}\cdot {W}_{hf}+{b}_{f}) $$ (1)
    $$ {i}_{t}=\sigma ({W}_{xi}\cdot {x}_{t}+{h}_{t-1}\cdot {W}_{hi}+{b}_{i}) $$ (2)
    $$ {o}_{t}=\sigma ({W}_{xo}\cdot {x}_{t}+{h}_{t-1}\cdot {W}_{ho}+{b}_{o}) $$ (3)

    式中:$ {f}_{t} $、$ {i}_{t} $、$ {o}_{t} $分别为当前时刻遗忘门、输入门、输出门的输出,$ {x}_{t} $表示当前时刻输入,$ {h}_{t-1} $表示上一时刻的隐藏状态,$ {W}_{xf} $、$ {W}_{xi} $、$ {W}_{xo} $、$ {b}_{f} $、$ {b}_{i} $、$ {b}_{o} $分别为对应的权重参数和偏差参数,$ {W}_{hf} $、$ {W}_{hi} $、$ {W}_{ho} $为对上一时间步隐藏状态的权重参数,$ \sigma $表示Sigmoid激活函数。

    $$ {\tilde{c}}_{t}=\tanh ({W}_{xc}\cdot {x}_{t}+{h}_{t-1}\cdot {W}_{hc}+{b}_{c}) $$ (4)
    $$ {c}_{t}={f}_{t}\odot {c}_{t-1}+{i}_{t}\odot {\tilde{c}}_{t} $$ (5)
    $$ {h}_{t}={o}_{t}\odot \tanh ({c}_{t}) $$ (6)

    式中:$ {c}_{t} $、$ {W}_{xc} $、$ {b}_{c} $分别是候选记忆细胞输出、对输入的权重参数、偏差参数,$ {h}_{t} $表示隐藏状态输出,$ {W}_{hc} $是$ {h}_{t-1} $的权重参数,记忆细胞输出用$ {\tilde{c}}_{t} $表示,$ \odot $表示互相关运算。

    船舶运动受风浪流等海洋环境动态影响,呈现出显著的非平稳性、多尺度耦合性及高频噪声干扰特性。致使船舶运动时间序列原始信号中高频波动(如瞬时风浪扰动)、中频趋势(如船体周期性摇摆)与低频成分(如缓慢漂移)相互叠加,且高频噪声与有效信号在相同频带内深度耦合,直接输入预测模型易导致特征提取失真,难以实现高精度预测。

    为此,设计了双层模态分解策略进行数据预处理:第1层利用ICEEMDAN的自适应分解能力,将原始船舶运动姿态信号初步拆解为若干不同尺度的内蕴模态函数(IMF)与残余分量,实现中低频主导的有效趋势与高频波动成分的初步分离;但实验发现,ICEEMDAN 基于集合平均的分解机制易导致高频分量过度平滑,且无法彻底解决高频段噪声与有效信号的耦合问题,仍存在预测精度提升的瓶颈。

    基于上述分析,在第2层引入VMD对第1层分解得到的高频分量进行二次精细化分解:VMD通过预设带宽约束与变分优化目标函数,可在分解前明确模态数量与频带范围,具备严格的频带分割特性,能够精准分离高频段中混杂的无效噪声与真实有效信号成分,彻底解决了第1层分解的高频处理缺陷。

    双层模态分解策略通过两种分解策略相结合的递进式处理,既保留了ICEEMDAN对非平稳信号的自适应分解优势,又借助VMD的频带精准控制能力优化高频成分质量,实现了原始信号中不同频率尺度特征的有效剥离与提纯,为后续预测模型提供了更纯净、更具辨识度的输入特征,为预测精度提升奠定了关键数据基础。

    2.1.1   经验模态分解(EMD)

    EMD通过计算出输入数据的上下包络线,分解得到一组最高频信号和去除这组频率信号的剩余信号,再产生新的包络线进行第1次分解,直至最后得到单一频率信号,分解结束。

    得到的IMF分量从高频到低频依次排列,需要注意的是,要符合以下条件:

    (I)不允许出现分量在穿过零点后有多个极点的情况,即IMF极值点和零点的个数之差为0或1。

    (II) 在任意时刻,分别绘制由局部极大值点、极小值点形成的上、下包络线要相对于时间轴局部对称。

    实现经验模态分解的具体步骤如下:

    1) 确定信号$ X(t) $的上包络线$ {U}_{0}(t) $、下包络线$ {D}_{0}(t) $。

    2) 计算上下包络线的均值,并将原始信号$ X(t) $减去均值$ {M}_{0}(t) $得到第一个IMF分量$ H_{1}^{1}(t)= X(t)-{M}_{0}(t) $。上下包络线均值计算公式为

    $$ {M}_{0}(t)=\frac{{U}_{0}(t)+{D}_{0}(t)}{2} $$ (7)

    3) 判断$ H_{1}^{1}(t) $是否为平稳信号,若得到的$ H_{1}^{1}(t) $不满足条件(I)、(II),则重复1)、2)步骤继续分解$ k $次,直至得到满足条件的单一频率信号$ H_{1}^{k}(t) $,这便是最高频的IMF。

    4) 原始信号$ X(t) $减去得到的IMF信号$ H_{1}^{k}(t) $,得到残余分量:

    $$ {R}_{1}(t)=X(t)-H_{1}^{k}(t) $$ (8)

    5) 使用残余分量继续上述分解步骤,当残余分量R满足条件(I)、(II)时,分解结束,最终得到$ n $组IMF分量和一个残差R。原始信号与IMF信号和残差项的关系计算公式为

    $$ X(t)=\sum\limits_{i=1}^{n}H_{i}^{k}(t)+R $$ (9)
    2.1.2   ICEEMDAN

    ICEEMDA以经验模态分解(EMD)为基础,其核心改进在于分解迭代的全过程中,会嵌入高斯白噪声以构建多组附加噪声信号,随后通过对这些信号的均值化处理,实现对模态混叠问题的抑制,同时强化信号自身的抗干扰性能。与EMD在每次迭代中直接生成模态函数(IMF)的方式不同,ICEEMDAN采用了差异化的IMF构建逻辑:以前一轮迭代产生的残差信号为基础,减去当前迭代阶段中多组附加噪声信号残差的平均值,以此作为本轮迭代输出的IMF分量。这一优化策略能够显著降低IMF分量中残留的噪声干扰,同时有效缓解模态混叠现象,进而从根本上提升信号分解的整体质量。借助这一关键设计,ICEEMDAN不仅能够更精准地挖掘船舶姿态数据中的有效信息,还能进一步增强算法对复杂干扰信号的抵御能力,最终保障信号分解结果的准确性与可靠性。

    设原始信号为$ x $, $ {\omega }^{(i)} $为添加的第i组高斯白噪声,$ H_{j}^{k}(\cdot ) $为通过EMD分解得到的第j个IMF分量,$ {\varepsilon }_{k} $为加入噪声时所乘的系数,$ {x}^{(i)} $为加入白噪声后的信号,$ M(\cdot ) $表示信号的局部均值函数,n为实验次数[31]。ICEEMDAN分解的具体步骤如下:

    1) 对原始船舶姿态数据信号$ x $添加特殊的白噪声$ {\varepsilon }_{1}H_{1}^{k}\left({\omega }^{(1)}\right) $得到$ {x}_{(1)} $:

    $$ {x}_{(1)}=x+{\varepsilon }_{1}H_{1}^{k}\left({\omega }^{(1)}\right) $$ (10)

    2) 计算$ {x}_{(1)} $的局部均值之和,并求其平均值即为第1个残差分量$ {r}_{1} $:

    $$ {r}_{1}=\frac{1}{n}\sum\limits_{i=1}^{n}M\left({x}^{(i)}\right) $$ (11)

    3) 计算第一个模态分量IMF1

    $$ {F}_{1 {\mathrm{IM}}}=x-{r}_{1} $$ (12)

    4) 以残差信号$ {r}_{1} $作为新的原始信号,继续添加白噪声,进而通过局部均值计算得到第2个残差分量$ {r}_{2} $:

    $$ {r}_{2}=\frac{1}{n}\sum\limits_{i=1}^{n}M\left({r}_{1}+{\varepsilon }_{2}H_{2}^{k}\left({\omega }^{(i)}\right)\right) $$ (13)
    $$ {F}_{2{\mathrm{IM}}}={r}_{1}-{r}_{2} $$ (14)

    5) 以此类推,计算第p阶模态分量函数:

    $$ {F}_{p{\mathrm{IM}}}={r}_{p-1}-{r}_{p} $$ (15)
    $$ {r}_{p}=\frac{1}{n}\sum\limits_{i=1}^{n}M\left({r}_{p-1}+{\varepsilon }_{p}H_{p}^{k}\left({\omega }^{(i)}\right)\right) $$ (16)

    变分模态分解利用求解变分问题的思想去对信号进行提取,在不丢失原始信号特征的情况下,把一个原始信号分解成多个不同中心频率的信号,适用于非线性时间序列信号[32]。变分模态分解的约束变分模型为

    $$ \begin{cases} {\min }_{\{{{u}_{k}}\},\{{{\omega }_{k}}\}}\left\{\displaystyle\sum\limits_{k=1}^{K}\left|\left|{\partial }_{t}\left[\left(\delta (t)+\frac{{\mathrm{j}}}{\text{π} t}\right) \times {u}_{k}(t)\right]{{\mathrm{e}}}^{-{\mathrm{j}}{{\omega }_{k}}t}\right|\right|_{2}^{2}\right\}\\ {\mathrm{s}}.{\mathrm{t}}.\displaystyle\sum\limits_{k=1}^{K}{u}_{k}=f(t) \end{cases} $$ (17)

    式中:$ f(t) $为输入信号,$ \{{u}_{k}\} = \{{u}_{1},{u}_{2}, \cdots ,{u}_{K}\} $和$ \{{\omega }_{k}\}= \{{\omega }_{1}, {\omega }_{2}, \cdots , {\omega }_{K}\} $分别表示各个模态分量和各个模态对应中心频率的集合。

    为找到约束变分问题的最优解,通过拉格朗日乘子$ \tau (t) $和二阶惩罚因子$ \alpha $,将约束变分问题转化为无约束变分问题,计算公式为

    $$ \begin{gathered} \mathcal{L}(\{{u}_{k}\},\{{\omega }_{k}\},\lambda ) = \alpha \sum\limits_{k}\left|\left|{\partial }_{t}\left[\left(\delta (t)+\frac{{\mathrm{j}}}{\text{π} t}\right) \times {u}_{k}(t)\right]{{\mathrm{e}}}^{-{\mathrm{j}}{{\omega }_{k}}t}\right|\right|_{2}^{2} + \\ \bigg|\bigg|f(t)-\sum\limits_{k}{u}_{k}(t)\bigg|\bigg|_{2}^{2}+\bigg\langle \lambda (t),f(t)-\sum\limits_{k}{u}_{k}(t)\bigg\rangle \end{gathered} $$ (18)

    式中:$ \delta (t) $为冲激函数,二阶惩罚因子$ \alpha $可以保证高斯噪声环境下信号重构的准确性,拉格朗日乘子$ \tau (t) $可以保证保持约束条件的严格性。

    利用交替方向乘子法和傅里叶等距变换,迭代模态分量$ {u}_{k} $、中心频率$ {\omega }_{k} $和拉格朗日乘子$ \tau (t) $,当满足$ \displaystyle\sum\limits_{}\frac{\left|\left|\hat{u}_{k}^{n+1}-\hat{u}_{k}^{n}\right|\right|_{2}^{2}}{\left|\left|\hat{u}_{k}^{n}\right|\right|_{2}^{2}} \lt \varepsilon $时停止迭代,精度收敛判据$ \varepsilon \gt 0 $。

    在进行船舶姿态时间序列预测时,超参数的选取对LSTM预测精度和速度具有重要影响。开普勒优化算法具有结构简单、精度高、收敛速度快的特点,在解决非线性多变量问题上展现出优越的能力是一种优化LSTM网络参数的有效方法。行星沿椭圆轨道绕恒星运动如图2所示。

    图  2  行星沿椭圆轨道绕恒星运动
    Fig.  2  Planets move around the Sun along elliptical orbits
    下载: 全尺寸图片

    KOA算法由Mohamed等提出[33],该算法的设计灵感源于天体物理学中的开普勒行星运动定律,通过模拟行星的椭圆轨道运动来完成全局寻优。KOA将全局最优解和可行解分别类比为恒星和行星。在迭代过程中,行星的位置会不断被动态调整,持续逼近并确定最优解。

    在不同的时间,行星将处于轨道中的不同位置,这种策略有效地执行了参数的寻优过程。恒星与行星的吸引力、旋转速度等因素也共同决定了行星与恒星的接近程度。KOA的流程如图3所示。

    图  3  KOA流程
    Fig.  3  KOA flow chart
    下载: 全尺寸图片

    对行星位置进行初始化,公式为

    $$ \begin{array}{c} X_{i}^{j}=X_{i,{\rm{low}}}^{j}+{\rm{rand}}_{\left[0,1\right]}\times \left(X_{i,{\rm{up}}}^{j}-X_{i,{\rm{low}}}^{j}\right)\\ i=1,2, \cdots ,N\\ j=1,2, \cdots ,d \end{array} $$ (19)

    式中:$ {X}_{i} $表示第$ i $个行星,$ N $、$ d $分别表示行星的数量、问题的维度,$ X_{i,{\rm{up}}}^{j} $表示第$ j $个变量的上界,$ X_{i,{\rm{low}}}^{j} $表示下界,$ {\rm{rand}}_{\left[0,1\right]} $是生成0~1随机数字。第$ i $个行星的轨道偏心率($ e $)的初始化计算公式为

    $$ \begin{array}{cc} {e}_{i}={\rm{rand}}_{\left[0,1\right]} & i=1,2, \cdots ,N \end{array} $$ (20)

    初始化第$ i $个行星的轨道周期$ T $和引力的表达式为

    $$ \begin{array}{cc} {T}_{i}=\left| r\right| & i=1,2, \cdots ,N \end{array} $$ (21)
    $$ {F}_{gi}\left(t\right)={e}_{i}\times \mu \left(t\right)\times \frac{{\overline{M}}_{s}\times {\overline{m}}_{i}}{{\overline{R}}_{i}{}^{2}+\varepsilon }+{r}_{1} $$ (22)

    式中:$ r $是根据正态分布随机生成的数字,$ \mu \left(t\right) $是万有引力常数,$ {\overline{M}}_{s} $和$ {\overline{m}}_{i} $分别表示恒星$ {X}_{S} $、行星$ {X}_{i} $质量的归一化值,$ {\overline{R}}_{i} $表示$ {X}_{S} $和$ {X}_{i} $之间的欧氏距离($ {R}_{i} $)的归一化值,$ \varepsilon $表示极小值,$ {r}_{1} $是0~1的随机值;$ {R}_{i} $表达式为

    $$ {R}_{i}\left(t\right)={\left|\left|{{\boldsymbol{X}}}_{S}\left(t\right)-{{\boldsymbol{X}}}_{i}\left(t\right)\right|\right|}_{2}=\sqrt{{\sum\limits_{j=1}^{d}\left({X}_{Sj}\left(t\right)-{X}_{ij}\left(t\right)\right)^{2}}} $$ (23)

    在时间$ t $、恒星和天体$ i $的质量简单地使用适应度评估计算为(考虑最小化问题)

    $$ \begin{gathered} {M}_{S}={r}_{2}\frac{{\rm{fit}}_{s}\left(t\right)-{\rm{worst}}\left(t\right)}{\displaystyle\sum\limits_{k=1}^{N}\left({\rm{fit}}_{k}\left(t\right)-{\rm{worst}}\left(t\right)\right)}\\ {m}_{i}={r}_{2}\frac{{\rm{fit}}_{i}\left(t\right)-{\rm{worst}}\left(t\right)}{\displaystyle\sum\limits_{k=1}^{N}\left({\rm{fit}}_{k}\left(t\right)-{\rm{worst}}\left(t\right)\right)} \end{gathered} $$ (24)

    式中:$ {r}_{2} $是0~1随机生成的数字,用于发散各行星的质量;$ {\rm{fit}}_{S}={\mathrm{best}}\left(t\right)=\underset{k\in 1,2, \cdots ,N}{\min }{\rm{fit}}_{k}\left(t\right) $,$ {\rm{worst}}\left(t\right)= \underset{k\in 1,2, \cdots ,N}{\max }{\rm{fit}}_{k}\left(t\right) $,$ \gamma $是一个常数;$ {\mu }_{0} $是初始值;$ t $和$ {T}_{\max } $分别是当前迭代次数和最大迭代次数;$ \mu \left(t\right) $计算公式为

    $$ \mu \left(t\right)={\mu }_{0}\times \exp \left(-\gamma \frac{t}{{T}_{\max }}\right) $$ (25)

    目标行星的速度取决于恒星的位置,表达式为

    $$ {\boldsymbol{V}}_i(t)=\left\{ \begin{array}{l} \ell \times\left(2 r_4 {\boldsymbol X}_i-{\boldsymbol X}_b\right)+\ddot{\ell} \times\left({\boldsymbol X}_a-{\boldsymbol X}_b\right)+ \left(1-R_{i- {\rm{norm}}}(t)\right) \times \mathcal{F} \times {{\boldsymbol{U}}}_1 \times {{\boldsymbol{r}}}_5 \times \left({\boldsymbol X}_{i, {\mathrm{u p}}}-{\boldsymbol X}_{i, {{\mathrm{low}} }} \right) , \quad R_{i- {\rm{norm}}}(t) \leq 0.5 \\ r_4 \times \mathcal{L} \times\left({\boldsymbol X}_a-{\boldsymbol X}_i\right)+\left(1-R_{i- {\rm{norm}}}(t)\right)\times \mathcal{F} \times U_2 \times {{\boldsymbol{r}}}_5 \times\left(r_3 {\boldsymbol X}_{i, {\mathrm{u p}}}-{\boldsymbol X}_{i, { {\mathrm{low}} }}\right), \quad {其他} \end{array}\right. $$ (26)

    式中:$ {{\boldsymbol{V}}}_{i}\left(t\right) $表示对象$ {X}_{i} $在$ t $时刻的速度,$ {r}_{3} $、$ {r}_{4} $、$ {\boldsymbol{r}}_{5} $、$ {\boldsymbol{r}}_{6} $分别表示是0~1的随机数、随机值向量,$ {\boldsymbol{X}}_{a} $和$ {\boldsymbol{X}}_{b} $表示不同的解,$ {R}_{i}\left(t\right) $、$ {R}_{i-{\mathrm{norm}}}\left(t\right) $分别表示$ t $时刻恒星$ {X}_{S} $与行星$ {X}_{i} $之间的距离和欧氏距离的归一化值。

    如果$ {R}_{i-{\mathrm{norm}}}\leq 0.5 $,那么天体靠近恒星,并且由于恒星的巨大引力,它会增加速度以防止向恒星漂移;否则,对象将减慢速度。$ {R}_{i-{\mathrm{norm}}}\left(t\right) $和$ \ell $、$ \ell $、$ \mathcal{F} $、$ \boldsymbol{U} $、$ \mathcal{L} $、$ {U}_{2} $的定义为

    $$ \begin{gathered} \ell={\boldsymbol U} \times \mathcal{M} \times \mathcal{L} \\ \mathcal{L}=\left[\mu(t) \times\left(M_S+m_i\right)\left|\frac{2}{R_i(t)+\varepsilon}-\frac{1}{a_{i(t)}+\varepsilon}\right|\right]^{\tfrac{1}{2}} \\ \mathcal{M}=\left(r_3 \times\left(1-r_4\right)+r_4\right), \quad {\boldsymbol M }=\left(r_3 \times\left(1-{\boldsymbol r}_5\right)+{\boldsymbol r}_5\right) \\ \ddot{\ell}=(1-{\boldsymbol U}) \times {\boldsymbol M } \times \mathcal{L} \\ {\boldsymbol U}=\left\{\begin{array}{ll} 0, \quad {\boldsymbol r}_5 \leq {\boldsymbol r}_6 \\ 1, \quad 其他 \end{array} \quad \mathcal{F}=\left\{\begin{array}{lll} 1, \quad r_4 \leq 0.5 \\ -1, \quad {其他} \end{array}\right.\right. \\ {\boldsymbol U}_1=\left\{\begin{array}{ll} 0, \quad {\boldsymbol r}_5 \leq r_4 \\ 1, \quad 其他 \end{array} \quad U_2= \begin{cases}0, \quad r_3 \leq r_4 \\ 1, \quad 其他 \end{cases} \right. \end{gathered} $$ (27)

    式中$ {a}_{i\left(t\right)} $是$ t $时天体$ i $的椭圆轨道的半长轴,计算公式为

    $$ {a}_{i\left(t\right)}={r}_{3}\times {\left[T_{i}^{2}\times \frac{\mu \left(t\right)\times \left({M}_{S}+{m}_{i}\right)}{4{\text{π}}^{2}}\right]}^{\tfrac{1}{3}} $$ (28)
    $$ {R}_{i-{\mathrm{norm}}}\left(t\right)=\frac{{R}_{i}\left(t\right)-\min \left({R}_{i}\left(t\right)\right)}{\max \left({R}_{i}\left(t\right)-\min {R}_{i}\left(t\right)\right)} $$ (29)

    更新远离恒星的行星位置的计算公式为

    $$\begin{gathered} {\boldsymbol{X}}_{i}\left(t+1\right)={\boldsymbol{X}}_{i}\left(t\right)+{\boldsymbol{F}}\times {\boldsymbol{V}}_{i}\left(t\right)+\left({F}_{gi}\left(t\right)+\left| r\right| \right)\times \\ \boldsymbol{U}\times \left({\boldsymbol{X}}_{s}\left(t\right)-{\boldsymbol{X}}_{i}\left(t\right)\right) \end{gathered} $$ (30)

    通过调节参数$ h $的值,更新与恒星距离的公式为

    $$ \begin{array}{c} {\boldsymbol{X}}_{i}\left(t+1\right)={\boldsymbol{X}}_{i}\left(t\right)\times {\boldsymbol{U}}_{1}+\left(1-{\boldsymbol{U}}_{1}\right)\times \\ \left(\dfrac{{\boldsymbol{X}}_{i}\left(t\right)+{\boldsymbol{X}}_{s}\left(t\right)+{\boldsymbol{X}}_{a}\left(t\right)}{3.0}+ \right.\\ \left.h\times \left(\dfrac{{\boldsymbol{X}}_{i}\left(t\right)+{\boldsymbol{X}}_{s}\left(t\right)+{\boldsymbol{X}}_{a}\left(t\right)}{3.0}-{\boldsymbol{X}}_{b}\left(t\right)\right)\right) \end{array} $$ (31)

    式中:$ h=\dfrac{1}{\mathrm{\mathrm{\mathrm{e}}}^{r\eta}} $是自适应因子;$ r $是根据正态分布随机生成的数字;$ \eta $是1~−2的线性递减因子,定义为$ \eta =\left({a}_{2}-1\right)\times {r}_{4}+1 $;$ {a}_{2} $是一个循环控制参数,从$ -1 $逐渐减小到$ -2\overline{T} $,定义为$ {a}_{2}=-1-1\times \left(\dfrac{t\text{% } {{T}_{\max }}/{\overline{T}}}{ {{T}_{\max }}/{\overline{T}}}\right) $,%为取余符号。

    为了确保行星和恒星之间是最佳位置,实施精英主义策略,表达式为

    $$ {\boldsymbol{X}}_{i,{\mathrm{new}}}\left(t+1\right)=\begin{cases} {\boldsymbol{X}}_{i}\left(t+1\right), & \begin{array}{ll} & {\boldsymbol{X}}_{i}\left(t+1\right)\leq {\boldsymbol{X}}_{i}\left(t\right) \end{array}\\ {\boldsymbol{X}}_{i}\left(t\right), & 其他 \end{cases} $$ (32)

    以上一套完整的理论能够保证KOA在取值空间内快速寻得恒星的位置(最优解),将其应用于LSTM网络超参数优化时,可针对性解决传统手动调参效率低、随机搜索易陷入局部最优的核心痛点,通过算法对关键超参数的智能寻优,可以让LSTM模型参数组合达到更优配置,为后续预测精度的提升奠定基础。

    本文提出的D-K-LSTM预测模型整体结构如图4所示。

    图  4  D-K-LSTM预测模型整体结构
    Fig.  4  Overall structural of D-K-LSTM prediction model
    下载: 全尺寸图片

    其核心在于先对船舶姿态时间序列数据进行双层模态分解,然后将KOA与LSTM融合,形成具有数据分解和参数优化能力的预报模型。在双层模态分解环节对船舶位姿数据进行两次分解可得到多个分量;在优化参数环节中,将LSTM超参数视为行星位置,通过天体运动规律求得“恒星”的位置,即为最优参数组合。该预测模型的具体实现流程如为

    1) 数据输入阶段:模型接收船舶横摇、纵摇运动的时序数据,按比例划分为训练集、验证集与测试集并进行标准化处理。

    2) 双层模态分解阶段:先利用ICEEMDAN对船舶姿态时序数据进行第1层分解,将原始时序数据拆分为若干个分量;为进一步细化特征,对首层分解后的高频分量(IMF_0、IMF_1)进行VMD分解,提取特定频段的本征模态,最终得到用于模型训练与测试的数据分量。

    3) 参数优化阶段:利用训练集和验证集数据寻得最优解。首先,设置行星种群数量N、超参数数量d最大迭代次数$ {T}_{\max } $以及搜索空间的上界bu和下界bl;初始化控制参数$ {\mu }_{0} $、$ \lambda $、$ \overline{T} $,并初始化种群位置$ X_{i}^{j} $,即初始参数组合;利用适应度函数评估初始种群适应度,将当前最优参数组合记录为最优解。然后,在每轮迭代时分别计算恒星与所有天体之间的欧氏距离、引力及所有天体的速度。随机选择探索机制更新行星的位置或者利用机制更新行星与恒星之间的距离。计算评估更新后行星与恒星的适应度值,若新位置的适应度值优于历史最优,则更新全局最优解。最后,当达到最大迭代次数$ {T}_{\max } $时终止优化,输出LSTM网络的最优超参数。

    4) 验证模型性能阶段:利用寻得最优参数组合配置LSTM网络,并使用训练集上的船舶时序数据分量进行预测,完成船舶姿态的预测验证。

    为了明确模型性能提升的原因,本文设计2类实验,消融实验用以验证DLMD和KOA模块的独立作用,算法验证实验验证两个模块的共同作用,以及D-K-LSTM模型的综合性能。

    本节对船舶的横摇、纵摇时序数据进行预测,数据来自于实船采集,采样周期为0.05 s,且为连续采集,每组数据有20000个数据点,即1000 s的数据。在对数据其进行简单处理后,进行双层模态分解,并转化为适合LSTM神经网络训练、具有明确时间关联性数据对的监督学习格式。在构造样本过程中,将船舶姿态数据划分训练集、测试集和验证集,占比分别为60%、20%、20%,且不同数据集之间相互独立、不存在时间重叠,以免造成数据信息泄露。最后,将不同数据集分别标准化处理以消除量纲影响。

    为了验证模型对未来第5 s的船舶姿态状态预测的效果,设置输出序列的长度为100,这意味着模型将预测未来数据点的个数。在验证阶段,将标准化的预测值转换回原始数据形式,选择转换后数组的最后一列,即所要研究的预测值。利用测试集数据和预测出的数据计算均方根误差和平均绝对误差,并绘制出预测结果图,综合评估多模态短期预测模型的预测效果。

    在双层模态分解中,设置第1层分解的参数为:集成次数100、初始噪声幅值0.2。设置VMD参数为:带宽约束参数2000、模态数量3、收敛容差$ {10}^{-7} $。

    在KOA算法中,使用KOA优化LSTM的学习率和神经元数量参数,采用均方根误差(RMSE)作为适应度函数在验证集上计算进而训练模型,其定义为

    $$ E_{\mathrm{RMS}}=\sqrt{\frac{1}{n}\sum\limits_{i=1}^{n}{({y_{{\mathrm{pre}}}^{i}}-{{y}^{i}})}^{2}} $$ (33)

    式中:$ n $为预测的数据点总量,$ i $表示第$ i $个数据点,$ y_{{\mathrm{pre}}}^{i} $为模型在第$ i $个数据点对船舶姿态的预测值,$ {y}^{i} $为第$ i $个数据点的真实姿态数据。

    本节实验对船舶横摇、纵摇数据采取不同分解方式处理,利用LSTM模型对船舶横摇纵摇进行预测,实验过程中LSTM的详细参数设置如表1所示。

    表  1  模型参数设置
    Table  1  Model parameter settings
    模型参数数值
    LSTM层数1
    学习率0.025
    神经元数125
    激活函数tanh、Sigmoid
    优化器Adam
    批量大小32
    训练轮数100

    在双层模态环节中,经多次实验最终选择对第1层ICEEMDAN的高频分量(IMF_0、 IMF_1)进行第2层VMD分解,双层分解效果对比如图5所示。

    图  5  双层分解效果对比
    Fig.  5  Effect comparison of double-layer decomposition
    下载: 全尺寸图片

    图5(a)和(b)分别给出了IMF_0和IMF_1双层分解前后的对比。从图5(a)和(b)可以直观地看出,无论是分解后的IMF_0还是IMF_1高频分量,原始信号均呈现密集的噪声耦合特征,经VMD处理后,重构信号的毛刺大幅减少、波动更规整,而处理后的残差仅表现为随机小幅度波动,证明了VMD能有效解决ICEEMDAN高频分量的噪声耦合问题,实现了噪声剔除与有效信号的清晰保留,验证了该双层分解方法的有效性。

    进一步对本文所设计双层模态分解方法进行分析,首先,船舶运动姿态普遍存在非平稳性、多尺度耦合性及高频噪声干扰的共有特性,而ICEEMDAN的自适应分解可适配不同海况下信号的非平稳特性,VMD的频域约束又能精准分离噪声与有效分量,二者的组合恰好匹配船舶运动信号的普遍特征。另一方面,该方法无需依赖特定海况或船型,仅通过双层分解逻辑,即可稳定处理不同场景下的船舶姿态信号,因此其设计既适用于本文实验数据,也能适用于更广泛的船舶运动信号分析需求。

    不同分解方式下船舶姿态预测结果如图6所示,所绘制的是4000个样本点的预测情况。其中,无分解表示不使用任何分解方式,直接对船舶姿态进行预测;VMD 分解和ICEEMDAN分解分别为使用VMD和ICEEMDA对数据进行分解后再进行预测;Bimodal 分解表示使用所设计的双层模态分解后构造LSTM模型进行预测。

    图  6  不同分解方式下的船舶姿态预测结果
    Fig.  6  Ship attitude prediction results under different decomposition methods
    下载: 全尺寸图片

    分析图6中曲线可知,虽然4种分解方式均能预测出横摇和纵摇的整体趋势,但是不难看出,不采取分解模型的预测效果是最差的,采取双层模态分解的预测效果是最好的。4种不同分解方式预测横摇和纵摇的结果分别如表23所示。从表23中可看出采取双层模态处理后再预测的方法的均方根误差(root mean square error, RMSE)、平均绝对误差(mean absolute error, MAE)、标准差(standard deviation, Std)均最小,误差绝对值(|Error|)小于0.05rad的样本点占比最高,说明其预测效果为最好,采取ICEEMDAN次之,不做任何处理的LSTM最差。表明了所设计的双层模态分解能够提升LSTM模型的预测精度。

    表  2  不同分解方式预测横摇结果
    Table  2  Predict roll results under different decomposition methods
    分解方式 RMSE MAE Std |Error|<0.05 rad
    占比%
    无分解 0.1034 0.0784 0.1029 43.35
    VMD 0.0962 0.0766 0.0948 41.08
    ICEEMDAN 0.0955 0.0744 0.0943 43.93
    DLMD 0.0924 0.0712 0.0922 46.30
    表  3  不同分解方式预测纵摇结果
    Table  3  Predict pitch results under different decomposition methods
    分解方式 RMSE MAE Std |Error|<0.05 rad
    占比/%
    无分解 0.0397 0.0317 0.0385 79.19
    VMD 0.0383 0.0301 0.0275 79.09
    ICEEMDAN 0.0378 0.0300 0.0366 80.65
    DLMD 0.0358 0.0286 0.0349 82.44

    本节实验中的船舶运动姿态时间序列数据不做分解处理,在横摇、纵摇数据集下展开对比实验,选取相同的种群数量和迭代次数,对比KOA、PSO、灰狼优化算法(grey wolf optimizer, GWO)的寻优速度、适应度值变化;并对比KOA-LSTM、PSO-LSTM、GWO-LSTM的预测效果。其中,KOA的具体参数设置见表4

    表  4  KOA参数设置
    Table  4  KOA parameter settings
    模型参数数值
    行星群体规模15
    最大迭代次数18
    寻优维度2
    $ {\mu }_{0} $0.1
    $ \lambda $15
    $ \overline{T} $2

    图7给出了以横摇数据集为例,3种算法在优化LSTM参数过程中,随着迭代次数增加适应度值的变化曲线。从图7中可以看出,KOA能够在迭代7次时就寻得最优解,而PSO、GWO分别需要迭代9次和10次,说明KOA能够在较短时间内寻得最优参数组合,同时,对比两条折线收敛的适应度值,KOA为最低,说明其得到了更低的适应度值。

    图  7  不同算法的优化迭代结果
    Fig.  7  Optimization iteration results of different algorithms
    下载: 全尺寸图片

    图8为KOA-LSTM和PSO-LSTM在横摇、纵摇测试数据集下的预测效果对比,相应的指标见表5表6。分析图8表5表6可得,预测指标中KOA-LSTM模型的RMSE、MAE、Std均为最低,且误差绝对值小于0.05 rad的样本点占比最高,说明其预测精度更高、预测稳定性更高、预测误差集中于较小区间内,间接证明了KOA所能够解决LSTM调参易陷入局部最优的问题。

    图  8  KOA-LSTM和PSO-LSTM预测效果对比
    Fig.  8  Comparison of prediction performance between KOA-LSTM and PSO-LSTM
    下载: 全尺寸图片
    表  5  不同模型预测横摇结果
    Table  5  Different models predict roll results
    模型 RMSE MAE Std |Error|<0.05rad
    占比/%
    PSO-LSTM 0.0932 0.0729 0.0922 44.01
    GWO-LSTM 0.0849 0.0676 0.0843 44.93
    KOA-LSTM 0.0821 0.0655 0.0772 45.21
    表  6  不同模型预测纵摇结果
    Table  6  Pitch prediction indicators
    模型 RMSE MAE Std |Error|<0.05rad
    占比/%
    PSO-LSTM 0.0375 0.0299 0.0375 79.71
    GWO-LSTM 0.0489 0.0391 0.0488 74.11
    KOA-LSTM 0.0351 0.0281 0.0353 83.57

    本节实验结果表明,KOA的参数寻优能力显著优于PSO算法,不仅收敛速度更快,寻得的最优解也更适配船舶运动姿态预测任务,能够有效解决LSTM模型超参数调优下的核心问题。

    本节实验对比所设计的D-K-LSTM预测模型与选取的一些主流模型对横摇和纵摇数据的实验效果,图9给出了横摇预测对比。

    图  9  横摇角预测对比
    Fig.  9  Comparison chart of roll prediction
    下载: 全尺寸图片

    图9可以看出虽然5种模型都能预测出大致的走向,但所设计D-K-LSTM模型(红色虚线)的预测值与真实值能够始终保持一定的贴合度,其余模型的全样本贴合度相对都较差,在曲线的波峰和波谷处最明显。

    5种模型的横摇预测指标对比如表7所示,其中D-K-LSTM模型的RMSE、MAE、Std分别为0.067130.05020.0668,均为最小,误差绝对值小于0.05 rad的预测点占比62.81%,为最高;GRU、TCN的指标相差不大,LSTM指标略稍好,而Bi-LSTM的指标最差。证明所设计的D-K-LSTM模型在进行横摇姿态数据预测时,不仅预测精度高于其他对比模型,而且误差离散程度低、集中性强。

    表  7  横摇预测指标对比
    Table  7  Comparison of roll prediction indicators
    模型 RMSE MAE Std |Error|<0.05 rad
    占比/%
    D-K-LSTM 0.0671 0.0502 0.0668 62.81
    TCN 0.0774 0.0566 0.0774 56.93
    Bi-LSTM 0.1213 0.1061 0.0674 18.23
    LSTM 0.0915 0.0690 0.0911 47.30
    GRU 0.0766 0.0600 0.0754 49.79

    图10为5种不同模型各样本点预测横摇的绝对相对误差(ARE)对比。

    图  10  绝对相对误差对比
    Fig.  10  Comparison of absolute and relative errors
    下载: 全尺寸图片

    ARE计算公式为

    $$ E_{\mathrm{AR}}=\left| \frac{{\hat{y}}_{i}-{y}_{i}}{{y}_{i}}\right| $$ (34)

    图10的全局曲线看,其中的局部区域,如样本点3000附近,出现的误差峰值并非模型精度缺陷,而是绝对相对误差的计算特性所致,当真实值接近于0时,分母的缩小会放大相对误差,从而形成“极端值”,并非预测结果与真实值的实质性偏差;3个局部放大子图范围分别对应960~10592650~27492900~2999个样本点,可以看出,D-K-LSTM模型(红色曲线)的绝对相对误差始终处于较低水平,且误差波动幅度显著小于对比模型,充分证明D-K-LSTM在横摇角预测任务中具备更优的精度与稳定性,其相对偏差的控制能力显著优于其他模型。

    5种模型对纵摇数据预测的对比如图11所示,可以看出在真实值的上升或下降阶段各模型均能预测出趋势,但是与真实值的误差有一定差异,从样本点1700~2100区间的放大子图中可以看出,在波峰、波谷处,所设计的D-K-LSTM模型(红色虚线)与真实值(黑色虚线)贴合度最好,预测效果最佳,其余模型则较差。

    图  11  纵摇预测对比
    Fig.  11  Comparison of pitch prediction
    下载: 全尺寸图片

    表8给出了5种模型在对纵摇进行预测时的4项指标值对比,观察可知,D-K-LSTM模型在纵摇姿态预测中表现最优,其RMSE(0.0291)、MAE(0.0240)、Std(0.0291)均为所有模型中最低,误差绝对值小于0.05rad的预测点占比(90.06%)为最高,显著优于TCN、Bi-LSTM、LSTM与GRU时序预测模型,体现出更精准的预测能力。

    表  8  纵摇预测指标对比
    Table  8  Comparison of pitch prediction indicators
    模型 RMSE MAE Std |Error|<0.05 rad
    占比/%
    D-K-LSTM 0.0291 0.0240 0.0291 90.06
    TCN 0.0428 0.0346 0.0424 77.22
    Bi-LSTM 0.0508 0.0417 0.0402 64.26
    LSTM 0.0546 0.0433 0.0544 62.70
    GRU 0.0509 0.0396 0.0507 71.19

    图12为5种不同模型各样本点预测纵摇的ARE对比图,虽然在图中局部区域,如样本点3600附近,同样会出现的误差的“极端值”,但从3个局部放大子图(样本点700~799、1850~1949、2100~2199)可以清晰看出,D-K-LSTM(红色曲线)的纵摇绝对相对误差始终保持较低、且波动最小,其预测精度与稳定性显著优于等对比模型,在纵摇预测任务中表现最优。

    图  12  绝对相对误差对比
    Fig.  12  Comparison of absolute and relative errors
    下载: 全尺寸图片

    为验证模型泛化性,设计了多海况对比实验,表910分别给出了5种不同模型在海况2下的横摇、纵摇预测指标,表1112分别给出了5种不同模型在海况3下的横摇、纵摇预测指标。分析表中数据可知,所提D-K-LSTM模型在海况2、海况3的横摇与纵摇预测任务中,均展现出最优的泛化性能。在不同海况场景下,其横摇、纵摇预测的RMSE、MAE、Std均显著低于对比模型,误差绝对值小于0.05 rad的预测点占比则为最高,说明D-K-LSTM模型预测的预测精度更高、更稳定、误差更波动小。

    表  9  海况2横摇预测指标对比
    Table  9  Comparison of roll prediction indicators for sea state 2
    模型 RMSE MAE Std |Error|<0.05 rad
    占比/%
    D-K-LSTM 0.0864 0.0687 0.0859 49.67
    TCN 0.1035 0.0785 0.1031 43.86
    Bi-LSTM 0.1298 0.0927 0.1277 25.43
    LSTM 0.1143 0.0853 0.1141 34.18
    GRU 0.1081 0.0816 0.1073 41.59
    表  10  海况2纵摇预测指标对比
    Table  10  Comparison of pitch prediction indicators for sea state 2
    模型 RMSE MAE Std |Error|<0.05 rad
    占比/%
    D-K-LSTM 0.0368 0.0315 0.0365 89.57
    TCN 0.0559 0.0483 0.0553 68.39
    Bi-LSTM 0.0691 0.0617 0.0688 61.74
    LSTM 0.0493 0.0425 0.0484 74.96
    GRU 0.0718 0.0598 0.0695 51.27
    表  11  海况3横摇预测指标对比
    Table  11  Comparison of roll prediction indicators for sea state 3
    模型 RMSE MAE Std |Error|<0.05 rad
    占比/%
    D-K-LSTM 0.0920 0.0734 0.0913 49.86
    TCN 0.1038 0.0785 0.1026 25.72
    Bi-LSTM 0.1302 0.1121 0.1284 16.95
    LSTM 0.1107 0.0862 0.1091 21.38
    GRU 0.1089 0.0827 0.1085 24.04
    表  12  海况3纵摇预测指标对比
    Table  12  Comparison of pitch prediction indicators for sea state 3
    模型 RMSE MAE Std |Error|<0.05 rad
    占比/%
    D-K-LSTM 0.0397 0.0364 0.0391 87.91
    TCN 0.0583 0.0537 0.0579 61.73
    Bi-LSTM 0.0716 0.0641 0.0706 52.36
    LSTM 0.0495 0.0498 0.0493 67.12
    GRU 0.0698 0.0626 0.0692 54.58

    上述结果说明,D-K-LSTM既能通过双层模态分解适配不同海况下船舶运动的特性,又借助KOA增强模型对不同海况数据的适配能力,因此在多海况预测任务中具备更稳定、更优异的泛化性能。

    综合上述分析可知,无论是对船舶的横摇还是纵摇数据进行预测,所设计D-K-LSTM模型的预测精度均高于其他模型,且在多种海况条件下均能实现较高精度的预测,体现了该模型的高精度、高稳定性和强泛化性,说明其更适用于船舶运动姿态预测的任务。

    本文针对船舶横摇和纵摇运动实测数据的非平稳性、多尺度耦合、非线性和时变等特性,为提升LSTM神经网络在船舶姿态预测上的有效性,提出一种结合双层模态分解和开普勒优化算法的船舶运动多模态预测模型(D-K-LSTM)。该模型采用双层分解模式精确提取船舶运动姿态时序中特定频段的本征模态,最大程度地利用原始时序中的信息,从而有效改善船舶运动姿态预测的效果;同时采用开普勒优化算法对LSTM的学习率和神经元数量进行优化,快速寻得最优超参数组合;实现了船舶运动姿态有效预测。就真实船舶横摇、纵摇运动数据的预测结果而言,对比其他模型,本文所提模型不仅提升了预测准确率,而且较快地寻得了最优参数组,参数选择效率得到了提升,从而提高了实际预测的有效性。该模型可为船舶航行控制安全提供保障。

  • 图  1   LSTM结构

    Fig.  1   LSTM structure diagram

    下载: 全尺寸图片

    图  2   行星沿椭圆轨道绕恒星运动

    Fig.  2   Planets move around the Sun along elliptical orbits

    下载: 全尺寸图片

    图  3   KOA流程

    Fig.  3   KOA flow chart

    下载: 全尺寸图片

    图  4   D-K-LSTM预测模型整体结构

    Fig.  4   Overall structural of D-K-LSTM prediction model

    下载: 全尺寸图片

    图  5   双层分解效果对比

    Fig.  5   Effect comparison of double-layer decomposition

    下载: 全尺寸图片

    图  6   不同分解方式下的船舶姿态预测结果

    Fig.  6   Ship attitude prediction results under different decomposition methods

    下载: 全尺寸图片

    图  7   不同算法的优化迭代结果

    Fig.  7   Optimization iteration results of different algorithms

    下载: 全尺寸图片

    图  8   KOA-LSTM和PSO-LSTM预测效果对比

    Fig.  8   Comparison of prediction performance between KOA-LSTM and PSO-LSTM

    下载: 全尺寸图片

    图  9   横摇角预测对比

    Fig.  9   Comparison chart of roll prediction

    下载: 全尺寸图片

    图  10   绝对相对误差对比

    Fig.  10   Comparison of absolute and relative errors

    下载: 全尺寸图片

    图  11   纵摇预测对比

    Fig.  11   Comparison of pitch prediction

    下载: 全尺寸图片

    图  12   绝对相对误差对比

    Fig.  12   Comparison of absolute and relative errors

    下载: 全尺寸图片

    表  1   模型参数设置

    Table  1   Model parameter settings

    模型参数数值
    LSTM层数1
    学习率0.025
    神经元数125
    激活函数tanh、Sigmoid
    优化器Adam
    批量大小32
    训练轮数100

    表  2   不同分解方式预测横摇结果

    Table  2   Predict roll results under different decomposition methods

    分解方式 RMSE MAE Std |Error|<0.05 rad
    占比%
    无分解 0.1034 0.0784 0.1029 43.35
    VMD 0.0962 0.0766 0.0948 41.08
    ICEEMDAN 0.0955 0.0744 0.0943 43.93
    DLMD 0.0924 0.0712 0.0922 46.30

    表  3   不同分解方式预测纵摇结果

    Table  3   Predict pitch results under different decomposition methods

    分解方式 RMSE MAE Std |Error|<0.05 rad
    占比/%
    无分解 0.0397 0.0317 0.0385 79.19
    VMD 0.0383 0.0301 0.0275 79.09
    ICEEMDAN 0.0378 0.0300 0.0366 80.65
    DLMD 0.0358 0.0286 0.0349 82.44

    表  4   KOA参数设置

    Table  4   KOA parameter settings

    模型参数数值
    行星群体规模15
    最大迭代次数18
    寻优维度2
    $ {\mu }_{0} $0.1
    $ \lambda $15
    $ \overline{T} $2

    表  5   不同模型预测横摇结果

    Table  5   Different models predict roll results

    模型 RMSE MAE Std |Error|<0.05rad
    占比/%
    PSO-LSTM 0.0932 0.0729 0.0922 44.01
    GWO-LSTM 0.0849 0.0676 0.0843 44.93
    KOA-LSTM 0.0821 0.0655 0.0772 45.21

    表  6   不同模型预测纵摇结果

    Table  6   Pitch prediction indicators

    模型 RMSE MAE Std |Error|<0.05rad
    占比/%
    PSO-LSTM 0.0375 0.0299 0.0375 79.71
    GWO-LSTM 0.0489 0.0391 0.0488 74.11
    KOA-LSTM 0.0351 0.0281 0.0353 83.57

    表  7   横摇预测指标对比

    Table  7   Comparison of roll prediction indicators

    模型 RMSE MAE Std |Error|<0.05 rad
    占比/%
    D-K-LSTM 0.0671 0.0502 0.0668 62.81
    TCN 0.0774 0.0566 0.0774 56.93
    Bi-LSTM 0.1213 0.1061 0.0674 18.23
    LSTM 0.0915 0.0690 0.0911 47.30
    GRU 0.0766 0.0600 0.0754 49.79

    表  8   纵摇预测指标对比

    Table  8   Comparison of pitch prediction indicators

    模型 RMSE MAE Std |Error|<0.05 rad
    占比/%
    D-K-LSTM 0.0291 0.0240 0.0291 90.06
    TCN 0.0428 0.0346 0.0424 77.22
    Bi-LSTM 0.0508 0.0417 0.0402 64.26
    LSTM 0.0546 0.0433 0.0544 62.70
    GRU 0.0509 0.0396 0.0507 71.19

    表  9   海况2横摇预测指标对比

    Table  9   Comparison of roll prediction indicators for sea state 2

    模型 RMSE MAE Std |Error|<0.05 rad
    占比/%
    D-K-LSTM 0.0864 0.0687 0.0859 49.67
    TCN 0.1035 0.0785 0.1031 43.86
    Bi-LSTM 0.1298 0.0927 0.1277 25.43
    LSTM 0.1143 0.0853 0.1141 34.18
    GRU 0.1081 0.0816 0.1073 41.59

    表  10   海况2纵摇预测指标对比

    Table  10   Comparison of pitch prediction indicators for sea state 2

    模型 RMSE MAE Std |Error|<0.05 rad
    占比/%
    D-K-LSTM 0.0368 0.0315 0.0365 89.57
    TCN 0.0559 0.0483 0.0553 68.39
    Bi-LSTM 0.0691 0.0617 0.0688 61.74
    LSTM 0.0493 0.0425 0.0484 74.96
    GRU 0.0718 0.0598 0.0695 51.27

    表  11   海况3横摇预测指标对比

    Table  11   Comparison of roll prediction indicators for sea state 3

    模型 RMSE MAE Std |Error|<0.05 rad
    占比/%
    D-K-LSTM 0.0920 0.0734 0.0913 49.86
    TCN 0.1038 0.0785 0.1026 25.72
    Bi-LSTM 0.1302 0.1121 0.1284 16.95
    LSTM 0.1107 0.0862 0.1091 21.38
    GRU 0.1089 0.0827 0.1085 24.04

    表  12   海况3纵摇预测指标对比

    Table  12   Comparison of pitch prediction indicators for sea state 3

    模型 RMSE MAE Std |Error|<0.05 rad
    占比/%
    D-K-LSTM 0.0397 0.0364 0.0391 87.91
    TCN 0.0583 0.0537 0.0579 61.73
    Bi-LSTM 0.0716 0.0641 0.0706 52.36
    LSTM 0.0495 0.0498 0.0493 67.12
    GRU 0.0698 0.0626 0.0692 54.58
  • [1] 陈航宇. 波浪中船舶运动极短期预报深度学习方法泛化性研究[D]. 哈尔滨工程大学, 2023.

    CHEN Hangyu. Research on the generalization of deep learning methods for ultra-short-term prediction of ship motion in waves[D]. Harbin Engineering University, 2023.
    [2] NAAIJEN P, Van OOSTEN K, ROOZEN K, et al. Validation of a deterministic wave and ship motion prediction system[C]//International Conference on Offshore Mechanics and Arctic Engineering. San Diego: American Society of Mechanical Engineers, 2018: 51272.
    [3] ZHANG Daiyong, CHU Xiumin, LIU Chenguang, et al. A review on motion prediction for intelligent ship navigation[J]. Journal of marine science and engineering, 2024, 12(1): 107. doi: 10.3390/jmse12010107
    [4] ZHU Dexiang, KATORY M. A time-domain prediction method of ship motions[J]. Ocean engineering, 1998, 25(9): 781−791. doi: 10.1016/S0029-8018(97)10008-7
    [5] 安瑾. 基于LSTM的船舶轨迹预测[J]. 中国储运, 2025(8): 121. doi: 10.3969/j.issn.1005-0434.2025.08.114

    AN Jin. Ship trajectory prediction based on LSTM[J]. China storage & transport, 2025(8): 121. doi: 10.3969/j.issn.1005-0434.2025.08.114
    [6] LI Guoyuan, ZHANG Houxiang, KAWAN B, et al. Analysis and modeling of sensor data for ship motion prediction[C]//OCEANS 2016. Shanghai: IEEE, 2016: 1−7.
    [7] CHENG Xu, LI Guoyuan, SKULSTAD R, et al. Data-driven uncertainty and sensitivity analysis for ship motion modeling in offshore operations[J]. Ocean engineering, 2019, 179: 261−272. doi: 10.1016/j.oceaneng.2019.03.014
    [8] LI Mingwei, GENG Jing, HAN Duanfeng, et al. Ship motion prediction using dynamic seasonal RvSVR with phase space reconstruction and the chaos adaptive efficient FOA[J]. Neurocomputing, 2016, 174: 661−680. doi: 10.1016/j.neucom.2015.09.089
    [9] SHEN Wenhe, HU Xinjue, LIU Jialun, et al. A pre-trained multi-step prediction informer for ship motion prediction with a mechanism-data dual-driven framework[J]. Engineering applications of artificial intelligence, 2025, 139: 109523. doi: 10.1016/j.engappai.2024.109523
    [10] 谷达京, 施哲源, 陈根良, 等. 基于神经网络的船体运动位姿预测方法[J]. 舰船科学技术, 2022, 44(15): 55−59. doi: 10.3404/j.issn.1672-7649.2022.15.012

    GU Dajing, SHI Zheyuan, CHEN Genliang, et al. A pose prediction method for ship hull motion based on neural network[J]. Ship science and technology, 2022, 44(15): 55−59. doi: 10.3404/j.issn.1672-7649.2022.15.012
    [11] ROBERT S, LI Guoyuan, THOR I, et al. A hybrid approach to motion prediction for ship docking-integration of a neural network model into the ship dynamic model[J]. IEEE transactions on instrumentation and measurement, 2020, 70: 1−11. doi: 10.1109/tim.2020.3018568
    [12] HU Xiong, ZHANG Boyi, TANG Gang. Research on ship motion prediction algorithm based on dual-pass long short-term memory neural network[J]. IEEE access, 2021, 9: 28429−28438. doi: 10.1109/ACCESS.2021.3055253
    [13] 张宇浩. 基于长短期记忆网络的船舶姿态预测研究[D]. 南京航空航天大学, 2023.

    ZHANG Yuhao. Research on ship attitude prediction based on long short-term memory network [D]. Nanjing University of Aeronautics and Astronautics, 2023.
    [14] ZHANG Tao, ZHENG Xiaoqing, LIU Mingxin. Multiscale attention-based LSTM for ship motion prediction[J]. Ocean engineering, 2021, 230: 109066. doi: 10.1016/j.oceaneng.2021.109066
    [15] SUN Qian, TANG Zhong, GAO Jingpeng, et al. Short-term ship motion attitude prediction based on LSTM and GPR[J]. Applied ocean research, 2022, 118: 102927. doi: 10.1016/j.apor.2021.102927
    [16] GENG Xiaoyu, LI Yibing, SUN Qian. A novel short-term ship motion prediction algorithm based on EMD and adaptive PSO-LSTM with the sliding window approach[J]. Journal of marine science and engineering, 2023, 11(3): 466. doi: 10.3390/jmse11030466
    [17] LIU Yucheng, DUAN Wenyang, HUANG Limin, et al. The input vector space optimization for LSTM deep learning model in real-time prediction of ship motions[J]. Ocean engineering, 2020, 213: 107681. doi: 10.1016/j.oceaneng.2020.107681
    [18] YAO Yuxin, HAN Liang, WANG Jiangyun. LSTM-PSO: long short-term memory ship motion prediction based on particle swarm optimization[C]//2018 IEEE CSAA Guidance, Navigation and Control Conference. Xia’men: IEEE, 2018.
    [19] JIANG Yan, HOU Xianrui, WANG Xuegang, et al. Identification modeling and prediction of ship maneuvering motion based on LSTM deep neural network[J]. Journal of marine science and technology, 2022, 27(1): 125−137. doi: 10.1007/s00773-021-00819-9
    [20] ZHANG Guoyin, TAN Feng, WU Yanxia. Ship motion attitude prediction based on an adaptive dynamic particle swarm optimization algorithm and bidirectional LSTM neural network[J]. IEEE Access, 2020, 8: 90087−90098. doi: 10.1109/ACCESS.2020.2993909
    [21] HAN Chongyang, HU Xiong. A prediction method of ship motion based on LSTM neural network with variable step-variable sampling frequency characteristics[J]. Journal of marine science and engineering, 2023, 11(5): 919. doi: 10.3390/jmse11050919
    [22] WANG Ju, ZHANG Leifeng, YANG Sanqiang, et al. Optimized LSTM based on improved whale algorithm for surface subsidence deformation prediction[J]. Electronic research archive, 2023, 31(6): 3435−3452. doi: 10.3934/era.2023174
    [23] CHOE T H, HO C S. An improvement of PM2.5 concentration prediction using optimised deep LSTM[J]. International journal of environment and pollution, 2021, 69(3−4): 249−260. doi: 10.1504/ijep.2021.10051956
    [24] SHAO Bilin, SONG Dan, BIAN Genqing, et al. Wind speed forecast based on the LSTM neural network optimized by the firework algorithm[J]. Advances in materials science and engineering, 2021, 2021(1): 4874757. doi: 10.1155/2021/4874757
    [25] MA Zhiqiang, CAI Hongyang. Research on electricity load forecasting based on EEMD-GA-LSTM[C]//2024 36th Chinese Control and Decision Conference. Xi’an: IEEE, 2024: 4434−4439.
    [26] GUNASEKAR S, KUMAR G J R, KUMAR Y D. Sustainable optimized LSTM-based intelligent system for air quality prediction in Chennai[J]. Acta geophysica, 2022, 70(6): 2889−2899. doi: 10.1007/s11600-022-00796-6
    [27] 鲜思渔, 赵泽田, 吴轩宇, 等. 基于改进红鸢优化算法与LSTM的核电换热器寿命预测方法[J]. 图学学报, 2025, 46(5):1085−1093.

    XIAN Siyu, ZHAO Zetian, WU Xuanyu, et al. A life prediction method for nuclear power heat exchangers based on improved red kite optimization algorithm and LSTM [J]. Journal of graphics, 2025, 46(5):1085−1093.
    [28] WANG Wenbo, TONG Meng, YU Min. Blood glucose prediction with VMD and LSTM optimized by improved particle swarm optimization[J]. IEEE Access, 2020, 8: 217908−217916. doi: 10.1109/ACCESS.2020.3041355
    [29] SUN Hongbin, CUI Qing, WEN Jingya, et al. Short-term wind power prediction method based on CEEMDAN-GWO-Bi-LSTM[J]. Energy reports, 2024, 11: 1487−1502. doi: 10.1016/j.egyr.2024.01.021
    [30] SEPP H, JURGEN S. Long short-term memory[J]. Neural computation, 1997, 9(8): 1735−1780. doi: 10.1162/neco.1997.9.8.1735
    [31] 王玲桃, 任宏伟, 王紫瑜, 等. 基于ICEEMDAN和改进小波阈值的输电线路故障行波信号降噪[J]. 电子设计工程, 2025, 33(12): 56−61. doi: 10.14022/j.issn1674-6236.2025.12.012

    WANG Lingtao, REN Hongwei, WANG Ziyu, et al. Denoising of fault traveling wave signals of transmission lines based on ICEEMDAN and improved wavelet threshold[J]. Electronic design engineering, 2025, 33(12): 56−61. doi: 10.14022/j.issn1674-6236.2025.12.012
    [32] 刘昕明, 吉建光, 李玮, 等. 基于双模态分解的发电站母线短期负荷预测[J]. 电气工程学报, 2024, 19(1): 124−132.

    LIU Xinming, JI Jianguang, LI Wei, et al. Short-term load prediction of power station busbars based on double-modal decomposition[J]. Transactions of China electrotechnical society, 2024, 19(1): 124−132.
    [33] MOHAMED A B, REDA M, SHAIMAA A. Kepler optimization algorithm: a new metaheuristic algorithm inspired by Kepler’s laws of planetary motion[J]. Knowledge-based systems, 2023, 268: 110454. doi: 10.1016/j.knosys.2023.110454
WeChat 点击查看大图
图(12)  /  表(12)
出版历程
  • 收稿日期:  2025-12-02

目录

    /

    返回文章
    返回