舰船科学技术  2025, Vol. 47 Issue (14): 173-176    DOI: 10.3404/j.issn.1672-7649.2025.14.027   PDF    
基于随机森林算法的船舶波浪载荷预测与仿真
於建伟, 周岚     
武汉船舶职业技术学院 机械工程学院,湖北 武汉 430050
摘要: 船舶波浪载荷预测对船舶结构安全与设计优化至关重要,准确获取波浪载荷面临诸多挑战。本文构建多维度影响因素特征数据集,融合实船航行、水池试验与数值仿真多源数据,经清洗预处理后,明确波高、波浪周期等关键参数构建多维特征向量,并合理划分数据集;对随机森林模型进行优化与水动力约束融合,采用网格搜索、交叉验证结合遗传算法优化算法参数,并评估参数优化效果。针对3类典型船型开展数值仿真与模型验证,研究表明,优化后的随机森林算法预测精度高、计算高效,能为船舶波浪载荷预测提供可靠方案。
关键词: 随机森林算法     波浪载荷     仿真    
Ship wave load prediction and simulation based on random forest algorithm
YU Jianwei, ZHOU Lan     
School of Mechanical Engineering, Wuhan Institute of Shipbuilding Technology, Wuhan 430050, China
Abstract: The prediction of ship wave loads is of vital importance to the structural safety and design optimization of ships. There are many challenges in accurately obtaining wave loads. This paper constructs a multi-dimensional characteristic data set of influencing factors, integrates multi-source data such as real ship navigation, pool tests and numerical simulation. After cleaning and preprocessing, key parameters such as wave height and wave period are identified to construct multi-dimensional feature vectors, and the data set is reasonably divided. The random forest model is optimized and integrated with hydrodynamic constraints. Grid search, cross-validation combined with genetic algorithm is adopted to optimize the algorithm parameters, and the optimization effect of the parameters is evaluated. Numerical simulation and model verification were carried out for three typical ship types. The research shows that the optimized random forest algorithm has high prediction accuracy and efficient calculation, and can provide a reliable solution for the prediction of ship wave loads.
Key words: random forest algorithm     wave load     simulation    
0 引 言

波浪载荷作为影响船舶安全的关键外载荷,精准预测其在不同海况下的分布与变化,是船舶设计、强度校核及智能化航行的必要前提。随着航运业向大型化与智能化发展,传统基于线性理论的预测方法在非线性海况、新型船型等场景下的局限性日益凸显,因此引入先进算法提升预测精度具有重要工程意义。传统船舶波浪载荷预测主要依赖线性势流理论(如Airy波理论)和频域分析方法,通过求解船舶运动方程和波浪力函数实现载荷估算。这类方法在规则波或小振幅波浪条件下具有较高计算效率,但面对实际海况中的非线性波浪、多自由度耦合运动及船型参数变化时,预测精度显著下降,尤其难以捕捉片体干扰、航速变化等因素引发的非线性响应。现有研究主要存在以下瓶颈[13]

1)传统方法对非线性波浪载荷的建模能力不足,难以适应极端海况或新型船型(如三体船、双体船)的预测需求;

2)单一机器学习模型在处理多源异构数据时,易受数据噪声和特征交互作用的影响,泛化能力受限;

3)缺乏结合船舶水动力理论与数据驱动方法的融合模型,导致预测结果的物理可解释性不足。

随机森林作为一种基于集成学习的机器学习算法,凭借其对高维非线性数据的强大建模能力,已在机械故障诊断、气象预测、海洋工程等领域展现出优越性能。在船舶水动力学领域,部分学者尝试将随机森林用于船舶阻力预测、运动响应建模等,但将其与船舶波浪载荷预测结合的研究仍处于起步阶段,尤其缺乏针对复杂海况下多变量耦合问题的系统性探索。

1 多维度影响因素特征数据集构建

为了实现对船舶波浪载荷的预测,需要首先明确特征数据集的具体参数,这些数据包括波高、波浪周期、船型参数等[4]

1)在船舶航行过程中,波浪载荷受多种因素共同作用,呈现复杂的变化特性。波高直接决定了波浪蕴含的能量大小,波高越高,波浪与船体碰撞时产生的冲击力越大,对船体结构造成的载荷也更为显著。

2)波浪周期影响船舶与波浪的共振效应,当船舶固有周期与波浪周期相近时,会引发剧烈的共振,导致波浪载荷急剧增加。

3)浪向角则改变了波浪作用力的方向,横浪工况下船舶承受的横摇与垂向弯矩较大,而迎浪时则主要承受纵摇与水平剪力。

4)船舶航速和吃水深度与船体运动响应存在紧密的耦合关系。航速的提升会改变船舶与波浪的相对运动状态,高速航行时,船体更容易受到波浪砰击作用,产生局部高载荷。

5)吃水深度影响船体的水下轮廓,进而改变船体的水动力特性,较深的吃水使船舶在波浪中受到的浮力变化更为平缓,而浅吃水状态下,船体更易受到波浪的扰动,导致运动响应加剧。

6)船型参数对载荷分布有重要的调制作用。船长影响着波浪与船体的作用范围,较长的船舶更容易受到多个波浪的同时作用;型宽决定了船体的横向受力面积,宽型船在横浪中会承受更大的横向载荷。对于三体船等特殊船型,片体间距会影响片体之间的兴波干扰,间距不合理时,会导致连接桥部位产生过大的应力集中。

数据集构建完成后,将其划分为训练集、验证集与测试集。采用按海况等级分层抽样的方法,根据波高、风速等指标将海况划分为不同等级(如轻浪、中浪、大浪等),在每个海况等级中按一定比例抽取数据样本,确保各数据集均能覆盖不同海况条件,使模型在训练和测试过程中能学习到各种海况下的特征规律,提高模型的泛化能力。

2 随机森林模型优化与水动力约束融合 2.1 算法参数优化策略

随机森林算法的预测性能高度依赖超参数设置,针对船舶波浪载荷预测的非线性、多变量特性,需通过系统化调优策略确定最优参数组合[5]

针对算法参数优化,采用网格搜索与交叉验证相结合的方法,对随机森林的关键超参数进行系统性调优。具体而言,树的数量(n_estimators)通过网格搜索在100~1000范围内以100为步长进行遍历,结合5折交叉验证评估不同树数量对模型泛化能力的影响;最大深度(max_depth)则设置从5~30的候选值,采用对数间隔采样以平衡模型复杂度与过拟合风险;特征采样率(max_features)探索sqrt、log2及固定比例(0.5~0.9)等多种策略,通过交叉验证选择最优特征子集采样比例。为进一步提升全局寻优效率,我们引入遗传算法(GA)作为补充优化手段,将网格搜索的局部精细搜索与遗传算法的全局探索能力相结合,通过编码超参数组合构建染色体种群,采用适应度函数评估模型性能,并实施选择、交叉、变异等遗传操作,在参数空间内实现更高效的参数组合搜索。

为了验证参数优化后的效果,采用验证集RMSE(均方根误差)以及MAE(平均绝对误差)作为评价指标。验证集RMSE是预测值与真实值误差平方的算术平方根,能体现预测值的离散程度;MAE是预测值与真实值误差绝对值的平均值,更直观反映平均误差大小。图1为验证集RMSE随迭代次数的变化曲线,优化前模型的验证集RMSE起始值超4.2,随树数量增加虽有下降,但在树数量达到600后稳定在3.0左右;而优化后模型起始RMSE约3.8,下降趋势更明显,在树数量为600时降至2.5左右并保持稳定。这表明优化后的模型在不同树数量下,预测值与真实值误差平方的算术平方根更小,离散程度更低,对验证集数据的预测准确性显著优于优化前的模型。

图 1 验证集RMSE随迭代次数的变化曲线 Fig. 1 The variation curve of the validation set RMSE with the number of iterations

图2为MAE随最大深度的变化曲线,在最大深度(max_depth)参数变化过程中,优化前的模型验证集MAE整体处于较高水平。当最大深度为5时,优化前模型的验证集MAE超过3,随着最大深度增加,虽有下降趋势,但在最大深度为20~30时,仍稳定在2.3左右。而优化后的模型,在最大深度为5时,验证集MAE约为2.7,且随着最大深度增加,下降趋势更为明显,在最大深度为25时,达到最低值约1.9,即便后续稍有上升,在最大深度为30时也仅为2。这表明优化后的模型在不同最大深度取值下,预测值与真实值的平均偏离程度都更小,能更精准地进行预测,模型的准确性得到了显著提高。

图 2 验证集MAE随最大深度的变化曲线 Fig. 2 The variation curve of the verification set MAE with the maximum depth
2.2 水动力理论约束嵌入

在水动力理论约束嵌入方面,基于切片理论的载荷分布先验知识,设计了一种物理约束增强的模型训练框架。通过将垂向弯矩极值范围等水动力领域知识转化为数学约束条件,直接融入模型的损失函数设计,其流程如图3所示,具体而言,在损失函数中引入正则化项,对预测结果超出物理合理范围的情况施加惩罚,当模型预测的垂向弯矩超过理论极值的10%时,通过调整正则化系数增强该样本的损失权重,从而引导模型输出符合物理规律的预测结果。同时,利用SHAP值分析技术,对模型预测结果进行特征重要性解释,通过量化每个输入特征对预测结果的贡献度,验证模型是否捕捉到与水动力理论一致的关键物理机制。通过对比SHAP值排序与切片理论中波浪载荷主要影响因素的优先级,可以定量评估模型特征重要性解释与物理认知的一致性程度。

图 3 水动力理论约束嵌入流程图 Fig. 3 Hydrodynamic theory constraint embedding flowchart
2.3 非线性建模能力提升

在非线性建模能力提升层面,针对水动力载荷场景中普遍存在的参数非线性耦合效应,构建了包含交互项的高阶特征空间。通过引入特征交叉项、多项式特征等高阶组合,将原始特征空间从线性可分扩展至非线性可分,使模型能够捕捉波浪频率与船体响应频率的共振效应、航速与吃水深度对载荷的协同影响等复杂非线性关系[67]。具体实施中,采用Pairwise特征交叉生成二阶交互项,并结合主成分分析(PCA)对高维特征空间进行降维处理,在保留主要非线性信息的同时避免维度灾难。通过与传统线性回归模型(如最小二乘法)在相同数据集上的拟合效果对比,随机森林在非线性场景下的优势显著:在波浪载荷峰值预测任务中,随机森林的R²分数达到0.92,而线性回归仅为0.78;在特征重要性分析中,随机森林成功识别了航速与波浪遭遇频率的交互作用对载荷的显著影响,而线性模型则完全忽略了这一关键非线性关系。这种非线性建模能力的提升,使得模型能够更准确地刻画水动力载荷的复杂动态特性,为船舶结构设计与安全评估提供更可靠的预测支持。

3 典型船型数值仿真与模型验证

采用Ansys AQWA与HydroStar联合仿真平台,针对散货船(船长150 m,型宽20 m)、集装箱船(船长200 m,型宽32 m)、三体船(主船体船长80 m,片体间距比S/L=0.3)3类典型船型,模拟不同海况下的波浪载荷。工况覆盖波高1~5 m(间隔1 m)、周期6~16 s(间隔2 s)、浪向角0°(迎浪)、90°(横浪)、135°(斜浪)及航速5、15、25 kn,共生成126组仿真样本(3船型×5波高×6周期×3浪向角×3航速)。传统方法采用线性Airy波理论与非线性Stokes波理论(二阶)计算载荷,机器学习模型为优化后的随机森林算法(RF),对比指标包括垂向弯矩(VM)、水平剪力(HS)的均方根误差(RMSE)、计算时间(样本平均运行时间)。

船舶波浪载荷预测研究中,尽管真实载荷数值难以完全精准获取,但通过对比不同算法间的误差表现,仍能有效验证算法的优劣。针对3种不同船型、2种不同工况的数值仿真结果如表1所示。在本研究以非线性Stokes波理论等传统方法为参照基准,随机森林算法在典型与极端工况下,针对散货船、集装箱船及三体船的垂向弯矩(VM RMSE)与水平剪力(HS RMSE)预测误差均显著更低。在典型工况(波高3 m,周期10 s,横浪)下,散货船采用随机森林算法的VM RMSE为1150 kN·m,较Stokes波理论的1920 kN·m降低约40.1%,HS RMSE从580 kN降至390kN,降幅达32.8%;三体船的VM RMSE更是从1210 kN·m降至680 kN·m,降低约43.8%,HS RMSE降低约38.7%。在极端工况(波高5 m,周期16 s,斜浪)下,集装箱船的随机森林算法VM RMSE较Stokes波理论降低约31.6%,HS RMSE降低约27.8%;散货船的VM RMSE较Airy波理论降低约55.9%,HS RMSE降低约56.8%,体现出随机森林算法对复杂非线性载荷特性更强的捕捉能力。同时,随机森林算法的计算时间也要显著低于其他2种算法。

表 1 数值仿真结果 Tab.1 Numerical simulation results
4 结 语

船舶波浪载荷准确预测对保障船舶结构安全、提升设计经济性意义重大。其成果可应用于船舶设计阶段的结构强度校核、航行过程中的实时安全评估等场景。通过研究得出以下结论:

1)经参数优化、嵌入水动力理论约束及提升非线性建模能力后的随机森林算法,预测精度优势显著。在典型工况(波高3 m,周期10 s,横浪)下,散货船采用随机森林算法的垂向弯矩VM RMSE为1150 kN·m,较Stokes波理论的1920 kN·m降低约40.1%,水平剪力HS RMSE从580 kN降至390 kN,降幅达32.8%;在极端工况(波高5 m,周期16 s,斜浪)下,集装箱船随机森林算法的VM RMSE较Stokes波理论降低约31.6%,HS RMSE降低约27.8%,且随机森林算法计算时间相比传统算法大幅缩短,体现其在复杂非线性载荷特性捕捉上的优势以及高效性。

2)本研究构建的多维度特征数据集及优化模型,能有效覆盖不同海况和船型。通过按海况等级分层抽样划分数据集,使模型学习到各种海况特征规律,在针对散货船、集装箱船、三体船等不同船型的数值仿真中,均展现出良好的泛化能力,为船舶波浪载荷预测提供了可靠技术方案。

参考文献
[1]
张若海, 迟少艳, 杨玥. 基于Rankine源方法的自航半潜式平台波浪载荷分析[J]. 舰船科学技术, 2025, 47(8): 139-144.
ZHANG R H, CHI S Y, YANG Y. Analysis of wave loads on self-propelled semi-submersible platforms based on Rankine source method[J]. Ship Science and Technology, 2025, 47(8): 139-144.
[2]
胡金鹏, 李争霖, 陈远明, 等. 海上风力机组高承台群桩基础上的极端波浪载荷数值模拟研究[J]. 太阳能学报, 2025, 46(3): 589-594.
[3]
焦甲龙, 陈振威, 徐文华, 等. 斜浪规则波中船舶运动与载荷的CFD-FEM模拟分析[J/OL]. 中国舰船研究, 1−11[2025-06-01].
[4]
付海涛, 张智勇, 王增辉, 等. 改进SHO算法优化随机森林模型[J]. 吉林大学学报(理学版), 2025, 63(3): 861-866.
[5]
周古辛, 胡桂开. 基于网格算法和粒子群算法的随机森林参数优化[J]. 安徽大学学报(自然科学版), 2025, 49(3): 27-34.
[6]
唐颖, 任慧龙, 吕晓军, 等. 基于规范-数值-试验手段的大型船舶波浪载荷综合分析[J]. 华中科技大学学报(自然科学版), 2024, 52(12): 112-118.
TANG Y, REN H L, LÜ X J, et al. Comprehensive analysis of wave loads on large ships based on codes, numerical methods and tests[J]. Journal of Huazhong University of Science and Technology (Natural Science Edition), 2024, 52(12): 112-118.
[7]
杨洋, 都光明, 桂满海, 等. 非对称结构形式大型半潜船波浪载荷预报[J]. 船舶设计通讯, 2024(2): 56-60.