舰船科学技术  2026, Vol. 48 Issue (3): 46-52    DOI: 10.3404/j.issn.1672-7649.2026.03.007   PDF    
基于VMD-PE-GWO-LSTM的海浪波高预测模型
冷春花, 张文正     
大连民族大学 理学院,辽宁 大连 116650
摘要: 复杂的海洋环境下,船舶航行安全受波高显著影响,波高与船舶运动状态密切相关,需构建基于深度学习的波高预测模型以保障航行安全。由于海浪波高具有非平稳的特性,传统预测方法效果欠佳。本文创新提出基于灰狼优化算法下最优参数的海浪波高特征预报复合模型,采取灰狼算法(Grey Wolf Optimization,GWO)优化变分模态分解(Variational Mode Decomposition,VMD)参数中模态分量数K和惩罚因子$ \alpha $处理数据后提取波高序列固有模态函数(Intrinsic Mode Functions,IMF),以排列熵(Permutation Entropy,PE)为标准筛选信号,并将有效的模态分量作为长短时记忆神经网络(Long-Short Term Memory Network,LSTM)模型输入;构建VMD-PE-GWO-LSTM复合模型。经南海实测数据验证,该模型将波高数据分解为8个趋势项序列,预报精度达到R2=0.9857,能更精准地预报波高数据从而保障航行中的船舶安全。
关键词: 变分模态分解     排列熵     南海波高预测     长短时记忆神经网络    
Wave height prediction model based on VMD-PE-GWO-LSTM
LENG Chunhua, ZHANG Wenzheng     
School of Science, Dalian Minzu University, Dalian 116650, China
Abstract: Under complex marine conditions, wave height significantly impacts ship navigation safety and is closely correlated with vessel motion states. Establishing a deep learning-based wave height prediction model is therefore essential for ensuring navigational security. Given the non-stationary nature of ocean waves, traditional forecasting methods often yield suboptimal results. This study innovatively proposes a composite wave height prediction model based on optimal parameters derived from the Grey Wolf Optimization (GWO) algorithm. The methodology employs GWO to optimize key parameters in Variational Mode Decomposition (VMD)—specifically, the number of mode components (K) and the penalty factor ($ \alpha $). After processing the data, Intrinsic Mode Functions (IMFs) are extracted from wave height sequences, with Permutation Entropy (PE) serving as the criterion for signal screening. Effective modal components are subsequently fed into a Long Short-Term Memory (LSTM) neural network, culminating in the construction of the VMD-PE-GWO-LSTM composite model. Validated against in-situ measurements from the South China Sea, this model decomposes wave height data into eight trend components and achieves a prediction accuracy of R2=0.9857, demonstrating enhanced precision in wave height forecasting to safeguard vessel safety during navigation.
Key words: variational mode decomposition     permutation entropy     south china sea wave height prediction     long-short term memory network    
0 引 言

随着海洋行业的蓬勃发展,航运业在我国对外出口贸易中至关重要,复杂的海洋环境对船舶的航行具有严重影响,因此对极端海况安全事件的充分掌握对海洋运输货物至关重要,能够准时、准确且有效地预测海浪波高十分重要。到现在为止,来自世界各地的研究学者和专家都试图建立不同的预测模型,李贵庚等[1]提出一种通过将数值波浪模型“近岸模拟波浪”(SWAN)与时空预测网络“自注意力卷积长短期记忆网络”相结合来预测区域显著波高的方法。SWAN模型用于模拟东海的区域显著波高。为了提高模拟的准确性,对模型项中的风输入、白浪消散、四重波相互作用以及海底摩擦参数化方案进行了校准,最终模拟与实测显著波高的相关系数达到0.97。姚季等[2]提出基于原型监测数据和多步训练集扩展的长短期记忆(LSTM)神经网络建立了波高预测模型。首先,基于原型监测数据对风速和波高的相关性进行分析。然后,基于LSTM神经网络建立了一步前向波高预测方法。针对不同时间建立了不同的预测模型以验证其准确性。预测结果表明,随着时间间隔的增加(例如6 h和12 h),一步前向波高预测方法的准确性迅速下降。因此,针对大时间间隔预测精度低的问题,提出一种用于波高预测的多步训练集扩展LSTM模型。陈恒轩等[3]提出一种MAF-GWO-LSTM预测模型,首先利用滑动平均滤波器对实测海浪数据进行处理得到有效波高的光滑趋势序列,再选用LSTM作为预测浪模型,依据灰狼优化算法对滑动窗口MA及神经网络训练过程中的参数进行自适应寻优,研究结果表明,采用MAF滤波有利于提取海浪有效波高特征。罗秦瑞等[4]提出带有门注意力机制的双向叠加的长短期记忆网络模型,用于预测大西洋飓风区域的波高。预测结果涵盖了1、3、6、12 h的提前时间。发现较短的提前时间需要更大的比例。孙希闻等[5]提出一种算法优化变分模态分预测模型。使用优化算法来优化变分模态分解的参数,从而获得最优参数组合,然后使用多尺度排列熵(MPE)作为标准来筛选信号,确定并重构有效的模态分量。最后,使用长短期记忆神经网络(LSTM)来学习水坝变形特征。结果表明GVLSTM模型能够有效降低预测模型的估计偏差。

基于上述文献所考虑情况下,研究方法均未考虑既包含优化算法最佳参数下并结合VMD后根据样本熵的数值合并相同波高特征值的研究,本文的研究创新点如下:

1)使用灰狼优化VMD的最佳参数后分解海浪数据为K个IMF后,再对每个分量进行GWO参数寻优。

2)本文使用变分模态分解方法处理数据,对分解所得的不同模态函数执行独立预测并叠加。

3)在选用LSTM基础上,接入灰狼优化算法自寻优,得到适应不同模态预测的神经网络超参数构建VMD-PE-GWO-LSTM复合模型。模型的复杂度得到论证,并通过对南海海域有效波高监测数据集的训练和测试对该波高混合预测模型进行预报精度验证。

1 VMD-PE-GWO-LSTM预测研究 1.1 VMD滤波

变分模态分解(Variational Mode Decomposition,VMD)[6]能自适应地确定本征模态函数的数量和频率,无需先验知识。通过引入正则化项提高稳健性。也在众多领域凸显其理论价值,如金融安全中对股票数据的精准预报可以对股民提供帮助[7],工程中铁路桥面表现出2种紧密间隔的振动模式[8]。将使用的变分模态分解VMD技术证实其自适应性使其在捕捉局部特征、处理突变和非线性成分方面具有良好性能和作用。下面将介绍VMD的主要步骤,并以序列数据为例进行说明。

假设存在一个序列数据并表示为x(t),其中t是时间。VMD的模型可以表示为:

$ \underset{{u}_{k,}{f}_{k}}{\min }\sum \limits_{k=1}^{K}\left|\left|x-{u}_{k}-{f}_{k}\right|\right|_{2}^{2}+\alpha \sum \limits_{k=1}^{K-1}\left|\left|{f}_{k+1}-{f}_{k}\right|\right|_{2}^{2} 。$ (1)

式中:$ {u}_{k} $通过使用变分原理,可以得到关于$ {u}_{k} $以及$ {f}_{k} $的欧拉-拉格朗日方程。通过迭代求解,可以获得最优的$ {u}_{k} $$ {f}_{k} $。通过上述优化过程,得到的$ {u}_{k} $即第K个本征模态函数。这些本征模态函数描述了序列中不同时间尺度的振动模式。通过将所有本征模态函数相加,可以重构原始序列:

$ x(t)=\sum \limits_{k=1}^{K}{u}_{k}\left(t\right)。$ (2)

本文使用相应的预测模型对不同的$ {u}_{k} $采取模型参数独立分配策略的序列预测后进行数据叠加,预测模型的超参数可使用迭代优化算法获取。VMD数据处理过程独立于后续预测过程,故在此之前需要对VMD过程的主要参数予以讨论。IMF个数k和惩罚因子$ \alpha $是2个关键参数,它们分别影响着分解结果和模型的复杂性。IMF代表信号中的局部振动模式。选择适当的k可以决定分解后的模态数量,更多的IMF通常能更好地捕捉信号的细节和快速变化。然而,选择过多的IMF也可能引入噪声或过拟合。惩罚因子$ \alpha $在VMD模型中用于控制正则化项的影响,即平滑IMF的能力。较大的$ \alpha $会更强烈地抑制振动模式之间的突变,使得IMF更平滑,但存在丢失细节的风险.

基于上述算法流程,本研究采用布设于南海中央海盆(116oE,16.5oN)的深海锚系气象水文浮标所测有效波高数据swh(单位:m)。该浮标系统由中国科学院南海海洋研究所布设,数据由中国科学院海洋科学数据中心提供,配备Triaxys波浪传感器(精度±0.1 m),通过2Hz高频采样输出1 h平均数据。记录时段为2020年1月1日00:00至2020年12月31日23:59,原始时程序列如图1所示。

图 1 有效波高的时序图 Fig. 1 Time series diagram of effective wave height
1.2 灰狼优化算法(GWO)

本文选用灰狼优化算法[9](GWO)优化VMD中的参数K惩罚因子α以及LSTM参数。

图2可知,主要原因是灰狼算法在收敛程度上比粒子群算法要更好,本文采用的提取固定经纬度数据集然后利用GWO对VMD中的2个参数进行优化,其中GWO优化收敛曲线与GWO优化VMD收敛曲线分别如图3图4所示,其结论是相较于其他超参数优化方法中DBO、PSO方法,GWO算法的最佳适应度值更低,超参数寻优更精准。

图 2 GWO优化收敛曲线图 Fig. 2 Graph of convergence curve for GWO optimizing

图 3 GWO优化VMD曲线图 Fig. 3 VMD curve graph GWO optimizing

图 4 VMD分解子序列排列熵值结果图 Fig. 4 Result graph of permutation entropy values of VMD decomposed subsequences
1.3 灰狼优化算法设计

1)包围猎物。在狩猎过程中,将灰狼捕食猎物的行为定义如下:

$ \left\{\begin{aligned}&D=\left| C\cdot X_{p}^{t}-{X}^{t}\right|,\\& {X}^{t+1}=X_{p}^{t}-A\cdot D。\\ \end{aligned} \right.$ (3)

式中:D为个体与猎物之间的距离;t为当前的迭代次数;AC均为系数;XpX分别为猎物和灰狼的位置向量。

2)狩猎。灰狼能够识别猎物的位置并包围它们,同时强迫其他灰狼依据最优灰狼个体的位置来更新,逐渐逼近猎物。α、βγ狼的位置分别为Xα、Xβ、Xγ,则灰狼个体跟踪猎物的数学模型描述为:

$ \left\{\begin{aligned}&{D}_{a}=\left| {C}_{1}\cdot {X}_{\alpha }-X\right| ,\\ &{D}_{\beta }=\left| {C}_{2}\cdot {X}_{\beta }-X\right| ,\\ &{D}_{\gamma }=\left| {C}_{3}\cdot {X}_{\gamma }-X\right|。\\ \end{aligned} \right.$ (4)

式中:DαDβDγ分别为其他灰狼个体Xα、βγ为狼之间的距离;C1C2C3为狼群的开发。接着,灰狼猎杀猎物的数学模型可以表示为:

$ \left\{\begin{aligned}&{X}_{1}={X}_{\alpha }-{A}_{1}\cdot {D}_{\alpha },\\ &{X}_{2}={X}_{\beta }-{A}_{2}\cdot {D}_{\beta },\\ &{X}_{3}={X}_{\gamma }-{A}_{3}\cdot {D}_{\gamma },\\& {X}^{t+1}=\frac{{X}_{1}+{X}_{2}+{X}_{3}}{3}。\\ \end{aligned}\right. $ (5)

定义狼群中的个体朝向α、βγ狼前进的步长和方向和灰狼个体的最终位置。

3)攻击猎物。

1.4 VMD参数确定

由于在使用VMD算法[10]时,需要事先选择K。如果选择不足,则可能丢失原始波高的某些重要信息。另一方面,如果选择过大,可能会导致模态混叠。本研究中,首先运用灰狼优化算法对海浪波高数据进行VMD参数寻优,使用Matlab和灰狼迭代算法,确定进行VMD数据分解时,模态分量k值最优选择为8,最佳惩罚因子α为133,最优适应度值为7.411。得到VMD分解最佳参数后,对原始数据集进行swhIMF分解结果如图5所示。

图 5 模态分量K=8、惩罚因子α=133时的有效波高IMF分解结果 Fig. 5 The IMF decomposition results of significant wave height when K = 8 and the penalty factor is 133.

图5中,原始数据集中的有效波高值经过VMD分解得到8个子序列,其中swhIMF8表示数据的主趋势分解部分,将原始数据VMD分解为IMF数据后的GWO参数寻优得到每个swhIMF待优化参数配置如表1所示。

表 1 GWO参数寻优后swhIFM的待优化参数配置表 Tab.1 Parameter configuration table of swhIFM to be optimized after GWO parameter optimization
1.5 灰狼优化LSTM神经网络模型

以下是LSTM表示其状态的核心公式:

遗忘门:

$ f(t)=\sigma \left({W}_{f}\cdot \left[h(t-1);x(t)\right]+{b}_{f}\right),$ (6)

输入门:

$ i(t)=\sigma \left({W}_{i}\cdot \left[h(t-1);x(t)\right]+{b}_{i}\right),$ (7)

状态的更新:

$ \left\{\begin{aligned}&\overset{\sim }{C}(t)={\tanh(Wc\cdot [h(t-1);x(t)]+{b}_{c}),}\\ &C(t)=f(t)\times C(t-1)+i(t)\times \overset{\sim }{C}(t),\end{aligned}\right. $ (8)

输出与隐藏状态的更新:

$ \left\{\begin{aligned}&o(t)={\sigma \left({W}_{o}\cdot \left[h(t-1);x(t)\right]+{b}_{o}\right),}\\& h(t)=o(t)\times {\tanh \left(C(t)\right)。}\\ \end{aligned}\right. $ (9)

LSTM神经网络单个神经元的结构如图6所示。

图 6 LSTM 模型结构 Fig. 6 Structure of the LSTM model
1.6 评价指标

各种模型性能的评价指标[11]包括均方根误差(RMSE)、平均绝对百分比误差(MAPE)和决定系数(R2)。这3个水平指标为:

$ MAPE=\frac{1}{n}\sum \limits_{i=1}^{n}\left| \frac{\dot{y}{}_{i}-{y}_{i}}{{y}_{i}}\right| \times 100\text{% },$ (10)
$ RMSE=\sqrt{\frac{1}{n}\sum \limits_{i=1}^{n}{\left({\dot{y}}_{i}-{y}_{i}\right)}^{2}},$ (11)
$ {R}^{2}=1-\frac{\displaystyle\sum _{i=1}^{n}{\left({\dot{h}}_{i}- {h}_{i}\right)}^{2}}{\displaystyle\sum _{i=1}^{n}{\left({\dot{h}}_{i}-{h}_{m}\right)}^{2}}。$ (12)

式中:$ {y}_{i} $为实际值;$ \dot{y}{}_{i} $为记录波高的平均值。

2 混合模型的预测流程

将LSTM神经网络中的3个神经网络参数隐含层节点数H,迭代次数N,初始学习率lr,作为待优化搜索项,将VMD-GWO-LSTM模型流程图展示如图7所示。

图 7 模型训练过程 Fig. 7 Model training process

绘制经VMD处理后的有效波高数据再通过灰狼算法优化LSTM模型参数应用流程图如图8所示。

图 8 VMD-PE-GWO-LSTM预测模型流程 Fig. 8 VMD-PE-GWO-LSTM forecasting model process

预测模型的运行过程为:

步骤1 使用GWO算法对VMD参数进行优化,选取最优参数kα后利用VMD算法对原始海浪有效波高数据进行多频谱提取,得到不同频段的各个模态分量。

步骤2 根据排列熵数值进行筛选同时再次利用GWO为LSTM网络超参数寻优设置3种参数。

步骤3 LSTM构建并训练。

步骤4 利用经过优化的LSTM网络在划定验证集上进行预测,并基于预测结果计算其RMSE值。用测试数据对已有模型进行验证,对各分量进行反向归一化,并将各分量组合叠加预报,得到最终的预测结果,并分析误差。

步骤5 最终复合预测模型预报,从而说明预报方法的准确性和验证预测算法的合理性。

3 实验与仿真结果分析 3.1 算法复杂度分析

为了验证MAF-GWO-LSTM研究结论,本文根据已探究过GWO-LSTM的复杂度,此处继续改进VMD的时间复杂度,主要是在迭代求解过程中,单个IMF的计算复杂度可以表示为$ O(W) $,其中$ W $是数值优化的复杂度。处理$ L $个数据点的总时间复杂度是$ O(L\times W\times numIMFs) $。而VMD的空间复杂度主要于存储中间结果和每个IMF的计算。VMD需存储原始数据序列,该序列长度为L,存储原始数据序列的空间复杂度为$ O(L) $。在VMD的计算过程中,需存储每个IMF的迭代过程,包括中间的优化变量和残差等。存储空间复杂度可表示为$ O(L\times numIMFs) $,输出序列空间复杂度为$ O(L\times numIMFs) $,综上,VMD总体空间复杂度为:$ O(L)+O(2\times L\times numIMFs)= O(L\times (1+num IMFs)) $。证实复杂度分析保持一致故继续扩展在总迭代轮数为N的情况下,总时间复杂度为$ O(\text{numIMFs}\times N\times \left(t\times \left(d\times h+{h}^{2}\right)+T\times G\times D+L\times W\times numIMFs\right)) $,计算模型总空间复杂度为$ O(num IMFs\times N\times \left(d\times h+ {h}^{2}+ t\times h+G\times D+L\times (1+numIMFs)\right) $

3.2 GWO算法对LSTM超参数寻优

实验中,将种群大小依次设为30、40和50进行寻优,并默认最大迭代次数Epoch为50。对LSTM网络隐藏层维数H设定上下限分别为200和160,搜索步长为10,待寻优参数的边界值如表2所示。

表 2 待寻优参数的搜索空间与搜索步长 Tab.2 Search space and search step size of parameters to be optimized

经实验观察,狼群数的变化对模型性能提升不明显,而随着迭代次数的增加,不同狼群数下的 RMSE值均呈下降态势,这体现出灰狼优化算法在迭代中能够优化模型参数组合,进而降低 RMSE,增强模型性能。综合而言,在计算资源有限的情况下,增加迭代次数对改善模型性能的作用更为显著。通过对数据集的多次实验及RMSE值分析,确定种群数量最佳的LSTM参数寻优效率最佳时的和MAF-GWO-LSTM保持一致。

4 预测结果分析

利用灰狼优化算法寻优得到的LSTM神经网络超参数组合,针对在预测浪高时序数据,进行不同混合模型的预测。以训练后的不同模型在同一套数据序列长度下的性能变化,以确定在边缘部署训练网络模型频率的有效性。在寻优得到的8个IMF对应超参数组合,单一LSTM模型、VMD-LSTM模型、GWO-LSTM模型、VMD-GWO-LSTM模型预测结果如图9图10所示。

图 9 预测结果图 Fig. 9 Prediction results

可知,4种预测模型均存在波高预测值低于真实值的系统性偏差,且偏差模式各异。基础LSTM模型整体显著偏低,VMD-PE-LSTM模型偏差有改善但偏低。GWO-LSTM和VMD-PE-GWO-LSTM复合模型在非峰值区间表现优异,预测值与真实值基本重合,但在波峰处仍存在峰值偏低。这种选择性偏差源于训练数据分布局限:训练集波高在swh∈[0,4]范围(占93.1%),而测试集包含swh>4 m的极端样本(占35.4%),导致模型对高波强区间外推能力不足。当swh>4 m时,预测误差随波高线性增长,同时VMD模态重构中的高频特征衰减进一步限制了峰值预测精度,从而导致各模型预测值在波峰区小于真实值。各模型预测误差计算可得如表3所示。

图 10 预测结果图 Fig. 10 Prediction results

表 3 4种不同模型下的预测误差表 Tab.3 Prediction errors under five different models

图9图11等4个模型预测结果与真实值对比图可看出,单一LSTM模型、VMD-PE-LSTM模型、GWO-LSTM模型预测结果均较差,当VMD-PEGWO-LSTM的预测效果较好。为进一步比较这4种模型的预测误差如图12所示。

图 11 3种模型预测结果对比图 Fig. 11 Comparison chart of prediction results of three models

图 12 3种模型预测误差对比图 Fig. 12 Comparison chart of prediction errors for three models

可知,VMD-PE-GWO-LST模型预测与实际值、LSTM、VMD-PE-LSTM、GWO-LSTM研究预测结果更好。然而,随着测试集长度扩大,LSTM对测试集末段数据的预测性开始下降,整体的相关系数R2下移。前面本文中对各模型的预测结果已经有一定的分析,下面将从误差的角度深入分析。首先,通过比较4种模型预测误差,对各模型的误差趋势有一个宏观的把握;然后,根据4种不同模型下的预测误差表中的具体数据,细致地比较各模型的误差指标,从而全面评估各模型的预测性能更加证实了本文的研究价值和意义。

5 结 语

本文提出一种应用于南海区域波高预测的VMD-PE-GWO-LSTM算法模型,首先采用灰狼优化算法优化VMD参数并分解高海况海浪主要特征数据为8个swhIMF,然后采用灰狼优化算法对LSTM神经网络参数执行自适应优化,实验结果表明,变分模态分解(VMD)可以有效进行数据中的非线性和非平稳特征提取,论文提出的VMD-PE-GWO-LSTM预测模型比LSTM、VMD-PE-LSTM、GWO-LSTM模型都更具优势,同时船舶运动状态和波高趋势息息相关,该预测研究可以为高海况下海浪中的船舶运动的安全驾驶问题提供有力的依据。

参考文献
[1]
LI G G, ZHANG H, LV T, et al. Regional significant wave height forecast in the East China Sea based on the Self-Attention ConvLSTM with SWAN model [J]. Ocean Engineering, 2024, 312.
[2]
YAO J, WU W H. Wave height forecast method with multi-step training set extension LSTM neural network [J]. OCEAN ENGINEERING, 2022, 263.
[3]
陈恒轩, 张雷, 杜传顺, 等. 基于MAF-GWO-LSTM算法的海浪有义波高预测模型[J]. 舰船科学技术, 2024, 46(21): 33-39.
CHEN H X, ZHANG L, DU C S, et al. Prediction model of significant wave height based on MAF-GWO-LSTM algorithm[J]. Ship Science and Technology, 2024, 46(21): 33-39.
[4]
LUO Q R, XU H, BAI L. H. Prediction of significant wave height in hurricane area of the Atlantic Ocean using the Bi-LSTM with attention model [J]. Ocean Engineering, 2022, 266.
[5]
SUN X W, LU T D, HU S Q, et al. A new algorithm for predicting dam deformation using grey wolf-optimized variational mode long short-term neural network [J]. Remote Sensing, 2024, 16(21): 3978.
[6]
DING T, WU D A, SHEN L S, et al. Prediction of significant wave height using a VMD-LSTM-rolling model in the South Sea of China [J]. Frontiers in Marine Science, 2024, 11.
[7]
SASUBILLI S, VERMA M. InFi-BERT 1.0: transformer-based language model for indian financial volatility prediction [M]. Machine learning and Principles and Practice of Knowledge Discovery in Databases, Ecml Pkdd 2022, PT II. 2023: 128−138.
[8]
LIU D W, CHEN H F, TANG Y, et al. Slope micrometeorological analysis and prediction based on an ARIMA model and data-fitting system [J]. Sensors, 2022, 22(3).
[9]
SHANG S, HE K N, WANG Z B, et al. Sea clutter suppression method of HFSWR based on RBF neural network model optimized by improved GWO algorithm [J]. Computational Intelligence and Neuroscience, 2020.
[10]
SHEN W E, YING Z Q, ZHAO Y M, et al. Significant wave height prediction in monsoon regions based on the VMD-CNN-BiLSTM model [J]. Frontiers in Marine Science, 2024, 11.
[11]
ANAND P, JAIN S, SAVALIYA H. New improved wave hybrid models for short-term significant wave height foreCasting[J]. IEEE ACCESS, 2023, 11: 109841-109855. DOI:10.1109/ACCESS.2023.3309882