基于自优化神经网络的船舶运动模型辨识

张浩晢; 杨智博; 焦绪国; 吕成兴; 朱齐丹

doi:10.11992/tis.202408004

基于自优化神经网络的船舶运动模型辨识

doi: 10.11992/tis.202408004

1.
青岛理工大学信息与控制工程学院, 山东青岛 266520;
2.
哈尔滨工程大学智能科学与工程学院, 黑龙江哈尔滨 150001

基金项目: 国家自然科学基金项目(62203249，61803220)；山东省重大创新工程项目(2022CXGC010608)；山东省自然科学基金项目(ZR2021QF115).

详细信息

作者简介:
张浩晢，硕士研究生，主要研究方向为船舶运动建模、智能优化算法。E-mail：qutzhz@foxmail.com;

杨智博，讲师，主要研究方向为运动控制系统、智能优化算法。E-mail：yzblsn@163.com;

焦绪国，副教授，主要研究方向为电网优化、深度学习。E-mail：jiaoxuguo@qut.edu.cn.

通讯作者:
杨智博. E-mail：yzblsn@163.com.

中图分类号: TP183; U661.3
出版历程
- 收稿日期: 2024-08-09
- 录用日期: 2025-04-25
- 网络出版日期: 2025-04-27

Identification of ship motion model based on self-optimizing neural network

1.
School of Information and Control Engineering, Qingdao University of Technology, Qingdao 266520, China;
2.
College of Intelligent Systems Science and Engineering, Harbin Engineering University, Harbin 150001, China

摘要

摘要: 精确的船舶运动模型是船舶自主系统的核心。为提高船舶运动建模精度，引入了改进的雪融优化器(improved snow ablation optimizer, ISAO)；提出一种结合双向时间卷积网络(bidirectional temporal convolutional network, Bi-TCN)与注意力机制(attention mechanism, AM)的网络模型，即BITCA。进一步地，将ISAO与BITCA相结合，建立ISAO-BITCA船舶运动辨识混合模型。该模型利用Bi-TCN深度挖掘船舶运动序列在双向时间及空间维度下的隐藏特征，并引入AM以减少信息损失；基于ISAO，自主搜索并优化了BITCA模型的超参数组合。仿真实验结果表明，经过ISAO优化的BITCA模型在船舶航向角、偏航角速度、横摇角和总速度预测上的均方根误差(root mean square error, RMSE)分别降低了54.1%、28.21%、5.88%和40%，为船舶运动模型的准确辨识提供了一种有效手段。
- 船舶运动建模 /
- 改进雪融优化器 /
- 双向时间卷积网络 /
- 注意力机制 /
- 优化 /
- 超参数 /
- 预测 /
- 辨识
Abstract: An accurate ship motion model stands as the cornerstone of autonomous ship systems. To enhance the precision of ship motion modeling, an improved snow ablation optimizer (ISAO) is first introduced. Subsequently, a network model, BITCA, which integrates a bidirectional temporal convolutional network (Bi-TCN) with the attention mechanism (AM), is proposed. Furthermore, by combining the ISAO with BITCA, a hybrid identification model for ship motion, termed ISAO-BITCA, is established. This model initially leverages the Bi-TCN to deeply explore the hidden features of ship motion sequences across both temporal and spatial dimensions, while introducing the AM to mitigate information loss. Utilizing the ISAO, the hyperparameter combination for the BITCA model is autonomously searched and optimized. Simulation results demonstrate that the BITCA model optimized by the ISAO achieves reductions in the root mean square error for ship heading angle, yaw rate, roll angle, and total speed predictions by 54.1%, 28.21%, 5.88%, and 40%, respectively, providing an effective means for the accurate identification of ship motion models.
- ship motion modeling /
- improved snow ablation optimizer /
- bidirectional temporal convolutional network /
- attention mechanism /
- optimize /
- hyperparameter /
- predict /
- identification

HTML全文

随着全球海洋贸易的蓬勃发展，航运业船舶的安全性问题越来越受到人们的重视，而自主船在安全性和可靠性方面具有显著优势^[1]。船舶运动学模型是实现船舶自主化的基础，在基于模型的运动控制器设计、轨迹规划、姿态预测等方面都有着重要应用^[2]。然而，水面环境的复杂性及船舶的强非线性对建立精确的船舶运动学模型提出了极大的挑战。

船舶的运动建模策略主要分为两大类：参数化建模和非参数化建模。其中，通过参数化建模得到的Abkowitz整体型模型和MMG(mathematical modeling group)分离型模型占据了主导地位^[3]。然而，这些模型在建立之前需要预先使用系留模型实验法、计算流体力学、经验法等方法来确定船舶的水动力参数，这对研究人员的先验知识提出了较高的要求。相比之下，非参数化建模以其卓越的效率与低成本特性，可直接利用输入和输出数据描述船舶的运动规律，无需过多依赖先验知识。因此，近年来，该方法已被广泛视为解决船舶运动建模问题的更为理想且高效的方案^[4]。

支持向量回归(support vector regression, SVR)及高斯过程回归(Gaussian process regression, GPR)等传统机器学习策略在解决小样本、高维特征数据时展现出显著的优点，因此被研究人员广泛用于辨识船舶运动模型。文献[5]在GPR的基础上，利用相似度稀疏理论降低了计算复杂度，并实现了对船舶运动信息的准确预测。为了提升SVR的性能，文献[6]提出了一种混合核函数，并利用人工蜂鸟算法优化超参数，实现了高精度船舶操纵运动建模。然而，在处理大规模数据集时，上述的传统机器学习策略泛化性能有限。

船舶的运动建模通常被视为时间序列预测问题。因此，研究人员将循环神经网络(recurrent neural network, RNN)引入到船舶运动模型辨识中。文献[7]采用具有记忆选择功能的长短期记忆网络(long short-term memory, LSTM)来学习船舶操纵的非线性映射，并通过在数据集中人为添加噪声的方式验证了该方法的鲁棒性。文献[8-9]则进一步结合了双向长短期记忆网络(bidirectional long short-term memory, Bi-LSTM)、卷积神经网络(convolutional neural networks, CNN)和注意力机制(attention mechanism, AM)，从而显著提高了模型辨识的准确性。Bai等^[10]将残差网络和扩张因果卷积相结合，提出了一种时间卷积网络(temporal convolutional network, TCN)，相较于RNN及其变体，TCN具有更优的预测效果和更快的训练速度。TCN近年来已在工业负荷预测^[11]、风力发电预测^[12]、水位预测^[13]等时间序列预测问题上展现出优越性。然而，传统TCN仅能提取序列的单向时序特征。

尽管利用深度神经网络(deep neural network, DNN)处理时间序列预测时效果优异，但其超参数的确定没有固定的方法。人工调整超参数将引入主观因素，从而影响预测效果^[14]。在自然计算领域中，智能优化算法凭借强大的全局优化性能、高度的通用性以及并行计算的优势，为求解问题的最优解提供了一种新的途径^[15]。近年来，学者们的关注点已经转向将深度学习与自然计算相结合，设计一种混合预测模型。具体而言，该混合模型利用智能优化算法自动搜索DNN的最优超参数组合。例如，文献[16]通过粒子群算法(particle swarm optimization, PSO)优化TCN结合AM的网络模型超参数，实现了锂电池电荷的高精度估计。文献[17]则通过贝叶斯优化自主设计全连接神经网络的超参数，从而避免了人为因素对船舶模型辨识准确性的影响。文献[18]改进了鲸鱼优化算法(whale optimization algorithm, WOA)，并用改进后的鲸鱼优化算法优化所提出的组合神经网络模型的超参数，最终获得了最优的船舶姿态预测效果。

Deng等^[19]在2023年提出了一种名为雪融优化器(snow ablation optimizer, SAO)的元启发式智能优化算法，该算法在数值优化和超参数寻优方面展现出了优异的性能，并因此受到了学者的广泛重视。其中，文献[20]基于SAO实现了无人车的动力分配；文献[21]则结合SAO对自主回声状态网络的超参数进行了调优；而文献[22]和[23]则分别利用SAO解决了变分模态分解和极限学习机的超参数选择问题。

受上述文献启发，本文将船舶运动建模视为端到端的序列建模问题。具体而言，首先在SAO算法的基础上，提出改进雪融优化器（improved snow ablation optimizer, ISAO），以提升深度神经网络的优化效果。其次，构建了双向时间卷积网络（bidirectional temporal convolutional network, Bi-TCN）与AM相结合的混合模型BITCA。进一步，利用ISAO对BITCA的超参数进行自主优化，形成自优化神经网络模型ISAO-BITCA，并基于实船航行数据开展实验验证。

1. 问题描述

受文献[9]的启发，本文研究聚焦于船舶的四自由度动态特性。具体而言，该系统包含4个关键状态量：航向角$\psi (^\circ )$、偏航角速度$\omega ((^\circ) /{\text{s}})$、横摇角$\phi (^\circ )$、总速度$v({\text{m/s}})$，并涉及一个控制输入量舵角$\delta (^\circ )$，从而构成了一个多输入多输出的高维度离散系统：

$$ {{{\boldsymbol{x}}(t + 1)}} = F({\boldsymbol{x}}(t),{\boldsymbol{u}}(t)) $$

(1)

式中：$F( \cdot )$表示其非线性状态空间函数，$ {\boldsymbol{x}}({{t}}) = {[ {\psi (t)} \quad {\omega (t)}\quad{\phi (t)}\quad{v(t)} ]^{\rm T}} $及${\boldsymbol{u}}({{t}}) = [\delta (t)]$分别表示$t$时刻系统的状态量和控制量。

考虑船舶运动状态具有明显的时间周期性，为帮助模型全面捕获序列的局部特征及动态特性，利用滑动时间窗算法^[24]处理原始数据，截取后，$t$时刻状态片段$ {\boldsymbol{X}}(t) $和控制片段${\boldsymbol{U}}(t)$表示为

$$ \left\{ {\begin{array}{*{20}{c}} {{\boldsymbol{X}}(t) = [ {{\boldsymbol{x}}(t - l + 1)}\quad \cdots \quad{{\boldsymbol{x}}(t - 1)}\quad{{\boldsymbol{x}}(t)} ]} \\ {{\boldsymbol{U}}(t) = [ {{\boldsymbol{u}}(t - l + 1)}\quad \cdots \quad{{\boldsymbol{u}}(t - 1)}\quad{{\boldsymbol{u}}(t)} ]} \end{array}} \right. $$

(2)

则船舶状态空间函数由式(1)改写为

$$ {\boldsymbol{Y}} (t)= {F^ * }({\boldsymbol{X}}(t),{\boldsymbol{U}}(t),{{\boldsymbol{W}}^{\boldsymbol{*}}},{{\boldsymbol{b}}^{\boldsymbol{*}}}) $$

(3)

式中：${\boldsymbol{Y}}(t) = {\boldsymbol{x}}(t + 1)$为预测$t + 1$时刻的船舶状态量， ${F^*}( \cdot )$表示本文目标预测模型，${{\boldsymbol{W}}^{\boldsymbol{*}}}$和${{\boldsymbol{b}}^{\boldsymbol{*}}}$分别表示通过网络训练得到的权重矩阵及偏置矩阵。

通过式(3)和滑动窗口循环更新，即可实现连续单步船舶状态预测，进而实现船舶运动模型辨识。

2. ISAO-BITCA混合预测模型

2.1 雪融优化器

SAO受启发于雪在自然环境中融化和升华的物理变化过程，同时考虑了液态水蒸发为水蒸气以及水蒸气冷凝为液态水的现象。基于这些物理先验知识，SAO算法构建了探索阶段、开发阶段以及双种群机制。

2.1.1 探索（布朗运动）

当雪转化为水蒸气时，水蒸气分子会呈现高度分散且不规律的运动状态。这种运动在某些情形下与布朗运动相似，即微粒在液体或气体中因分子热运动而进行的无规则运动。标准的布朗运动通常可以用均值为0、方差为1的标准正态分布来表示为

$$ {f_{{\mathrm{BM}}}}(x;0,1) = \frac{1}{{\sqrt {2 \text{π} } }} \times \exp \left( - \frac{{{x^2}}}{2}\right) $$

(4)

借助标准正态分布均匀步长的特点，有效描绘了蒸汽扩散运动的特性，从而保证了算法在搜索空间内更充分的探索。因此，探索过程中的种群个体${Z_i}$在迭代过程中的位置更新为

$$ \begin{gathered} {Z_i}(t + 1) = {Z_{{\text{elite}}}}(t) + {{\boldsymbol{B}}_i}(t) \otimes ({r_1} \times ({Z_{{\text{best}}}}(t) - {Z_i}(t))+ \\ (1 - {r_1}) \times (\overline Z (t) - {Z_i}(t))) \\ \end{gathered} $$

(5)

式中：${Z_i}(t)$表示$t$次迭代时种群中第$i$个个体，$ {{\boldsymbol{B}}_i}(t) $为代表布朗运动的一组随机数向量，$ \otimes $表示矩阵点积运算，${r_1}$表示范围0～1的随机数，${Z_{{\text{best}}}}(t)$表示第$t$次迭代时历史最优个体位置，$\overline Z (t)$表示种群质心位置，${Z_{{\text{elite}}}}(t)$表示从精英池中随机选择的个体。计算式分别为

$$ \overline Z (t) = \frac{1}{N}\sum\limits_{i = 1}^N {{Z_i}(t)} $$

(6)

$$ {Z_{{\text{elite}}}}(t) \in \left\{ {{Z_{{\text{best}}}}(t)},\;\;{{Z_{{\text{second}}}}(t)},\;\;{{Z_{{\text{third}}}}(t)},\;\;{{Z_{\mathrm{c}}}(t)} \right\} $$

(7)

$$ {Z_{\mathrm{c}}}(t) = \frac{1}{{{N_1}}}\sum\limits_{i = 1}^{{N_1}} {{Z_i}(t)} $$

(8)

式中：$ {Z_{{\text{second}}}}(t) $和$ {Z_{{\text{third}}}}(t) $分别代表种群历史第二优、第三优个体的位置，${Z_{\mathrm{c}}}(t)$表示前50%的领导者个体质心位置，$N$为种群数量，${N_1} = 0.5 \times N$表示种群中领导者的数量。

图1直观给出了在二维空间中交叉项$ {r_1} \times ({Z_{{\text{best}}}}(t) - {Z_i}(t)) $和$ (1 - {r_1}) \times (\overline Z (t) - {Z_i}(t)) $的作用。${r_1}$能够控制个体向历史最佳个体和种群领导者质心位置的移动，两组交叉项整合了个体间的相互作用。

图 1 SAO交叉项作用示意

Fig. 1 Schematic diagram of the interaction between SAO cross-terms

下载: 全尺寸图片

2.1.2 开发（度日法）

当雪融化为液态水时，种群将围绕最优个体进行位置更新，以实现更高质量解的开发。同时，利用经典的度日法模型对雪融化过程进行建模，其计算公式为

$$ M(t) = {R_{{\mathrm{DDF}}}}(t) \times T(t) = \left(0.35 + 0.25 \times \frac{{{{\mathrm{e}}^{t/T}} - 1}}{{{\mathrm{e}} - 1}}\right) \times {{\mathrm{e}}^{t/T}} $$

(9)

式中：$M(t)$表示融雪率，$T(t)$表示日均气温，$T$为最大迭代次数，${R_{{\mathrm{DDF}}}}(t)$代表范围为0.35～0.60的随迭代次数变化的度日系数。在SAO的开发阶段，种群的位置更新公式为

$$ \begin{gathered} {Z_i}(t + 1) = M(t) \times {Z_{{\text{best}}}}(t) + {{\boldsymbol{B}}_i}(t) \otimes \\ ({r_2} \times ({Z_{{\text{best}}}}(t) - {Z_i}(t))+ (1 - {r_2}) \times (\overline Z (t) - {Z_i}(t))) \\ \end{gathered} $$

(10)

式中${r_2}$为范围−1～1的随机数。

2.1.3 双种群机制

雪在融化成液态水后仍然可以转化为水蒸气，维持进一步的探索过程。这意味着随着迭代次数的增加，高度分散的不规则运动将逐渐占据主导地位，从而使算法更倾向于探索。为更好地平衡开发和探索，SAO引入了双种群机制。在初始化阶段，种群数量$N$被等分为探索种群${N_{\mathrm{a}}}$和开发种群${N_{\mathrm{b}}}$。在算法每次迭代位置更新前，${N_{\mathrm{a}}}$及${N_{\mathrm{b}}}$的数量调整公式为

$$ \begin{array}{*{20}{c}} {\left\{ {\begin{array}{*{20}{c}} {{N_{\mathrm{a}}} = {N_{\mathrm{a}}} + 1} \\ {{N_{\mathrm{b}}} = {N_{\mathrm{b}}} - 1} \end{array}} \right.},&{ \quad {{N_{\mathrm{a}}} < N} } \end{array} $$

(11)

2.2 改进雪融优化器

由于SAO提出的时间相对较短，目前关于它的应用研究和改进措施仍显不足^[25]。为显著提高SAO在DNN优化方面的效率，进而在有限的硬件资源上实现更高精度的船舶运动建模，本文在SAO的基础上，通过融入4种改进策略，创新性地提出了一种ISAO算法。

2.2.1 动态反向学习(DOL)

与其他的智能优化算法类似，SAO采用随机种群初始化策略。假设优化变量的维度为$D$，搜索空间的上下界分别为${{\boldsymbol{U}}_{\mathrm{b}}}$和${{\boldsymbol{L}}_{{{\mathrm{b}}}}}$，则整个种群的初始化位置${\boldsymbol{Z}}$的生成式为

$$ {\boldsymbol{Z}} = {{\boldsymbol{L}}_{\mathrm{b}}} + {{\boldsymbol{r}}_3} \times ({{\boldsymbol{U}}_{\mathrm{b}}} - {{\boldsymbol{L}}_{\mathrm{b}}}) $$

(12)

式中：${{\boldsymbol{r}}_3}$表示一个$N$行、$D$列的随机数矩阵，其范围为0～1。

然而，这种初始化策略虽然能使种群在搜索空间内保持一定的分散度，但由于未充分考虑解的质量，因此可能会对算法的收敛速度和搜索效率产生不利影响^[26]。文献[27]提出了一种动态反向学习(dyamic opposite learing, DOL)种群初始化策略，该策略通过在非对称的动态空间内实现种群的反向映射，极大地提高了算法获得全局最优解的概率。利用DOL策略生成的新种群：

$$ {{\boldsymbol{Z}}_{{\mathrm{new}}}} = {\boldsymbol{Z}} + {{\boldsymbol{r}}_4} \times ({{\boldsymbol{r}}_5} \times ({{\boldsymbol{L}}_{\mathrm{b}}} + {{\boldsymbol{U}}_{\mathrm{b}}} - {\boldsymbol{Z}}) - {\boldsymbol{Z}}) $$

(13)

式中：$ {{\boldsymbol{r}}_4} $及$ {{\boldsymbol{r}}_5} $分别为$N$行、$D$列范围在0～1的随机数矩阵。

将${\boldsymbol{Z}}$及$ {{\boldsymbol{Z}}_{{\mathrm{new}}}} $合并为$ {{\boldsymbol{Z}}_{{\mathrm{DOL}}}} = {{{\boldsymbol{Z}}_{{\mathrm{new}}}} \cup {\boldsymbol{Z}}} $，并通过计算${{\boldsymbol{Z}}_{{\mathrm{DOL}}}}$适应度，选择前$N$优的个体作为ISAO的初始种群。DOL策略能够有效降低ISAO对种群初始化的敏感度，并提升算法在早期迭代时的收敛速度。

2.2.2 贪心选择

SAO直接利用式(9)～(10)实现双种群的位置更新。然而，有时更新后的位置适应度值可能会比更新前更差，这导致SAO容易陷入局部最优解，从而影响算法的开发效率。贪心选择策略能够在种群更新位置时动态决定是否改变个体的位置，从而避免丢弃较优的种群位置。其数学表达式为

$$ {Z_i}(t + 1) = \left\{ \begin{array}{*{20}{c}} {{Z_i}(t)}, {{f_{\mathrm{c}}}({Z_i}(t)) \leqslant {f_{\mathrm{c}}}({Z_i}(t + 1))} \\ {{Z_i}(t + 1)}, {{f_{\mathrm{c}}}({Z_i}(t)) > {f_{\mathrm{c}}}({Z_i}(t + 1))} \end{array} \right.$$

(14)

式中${f_{\mathrm{c}}}( \cdot )$表示适应度函数。通过融入贪心选择策略，ISAO算法能够进一步平衡开发和探索能力，从而全面提升算法的寻优精度。

2.2.3 Levy飞行

Levy飞行是一种随机过程，能够产生具有大范围跳跃步长的概率分布，因此常被用于增强优化算法的全局搜索能力^[28]。在量子力学领域，Levy飞行也常被用于描述粒子复杂的运动状态。基于这一先验知识，ISAO算法引入Levy飞行来替代布朗运动在种群位置更新中的作用，从而能更准确地模拟水蒸气和液态水在搜索空间内的移动，同时避免算法陷入局部最优。Levy飞行的步长矩阵${{\boldsymbol{R}}_{{\mathrm{Le}}}}$的计算方法为

$$ {{\boldsymbol{R}}_{{\mathrm{Le}}}} = \frac{{{\boldsymbol{\mu}} \alpha }}{{{{\left| {\boldsymbol{\upsilon}} \right|}^{1/\beta }}}} $$

(15)

$$ \alpha = {\left[ {\frac{{\Gamma (1 + \beta ) \times \sin (\text{π} \beta /2)}}{{\Gamma ((1 + \beta )/2) \times \beta \times {2^{(\beta - 1)/2}}}}} \right]^{1/\beta }} $$

(16)

式中：${\boldsymbol{\mu}} $和${\boldsymbol{\upsilon}} $分别表示$N$行、$D$列服从标准正态分布的随机数矩阵，参数$\beta $本文取1.5。

2.2.4 螺旋进攻机制

为了提高ISAO算法的全局搜索能力并增加种群多样性，本文在ISAO的探索阶段融入了WOA算法的螺旋进攻机制。同时，通过概率切换实现两种位置更新策略。具体地，随机生成的范围在0～1的概率因子$P$，当$P < 0.5$时，种群的更新方式为

$$ {Z_i}(t + 1) = {Z_{{\text{elite}}}}(t) + \left| {{Z_{{\text{best}}}}(t) - {Z_i}(t)} \right| \times {{\mathrm{e}}^{bl}} \times \cos (2 \text{π} l) $$

(17)

式中：参数$b$本文取1，$l$表示−1～1的随机数。当$P \geqslant 0.5$时，ISAO根据式(5)和Levy飞行实现位置更新。

2.2.5 ISAO算法流程

综上所述，ISAO算法完整的种群位置更新方程：

$$ \begin{gathered} {Z_i}(t + 1) = {Z_{{\text{elite}}}}(t) + {{\boldsymbol{R}}_{{{{\mathrm{Le}}}}}^i}(t) \otimes ({r_1} \times ({Z_{{\text{best}}}}(t) - {Z_i}(t))+ \\ (1 - {r_1}) \times (\overline Z (t) - {Z_i}(t))) {, } \quad {P \geqslant 0.5}, \qquad i \in {i_{\mathrm{a}}} \end{gathered} $$

(18)

$$ \begin{gathered} {Z_i}(t + 1) = {Z_{{\text{elite}}}}(t) + \left| {{Z_{{\text{best}}}}(t) - {Z_i}(t)} \right| \times {{\mathrm{e}}^{bl}} \times \cos (2\pi l) \\ { }\quad {P < 0.5}, \qquad i \in {i_{\mathrm{a}}} \\ \end{gathered} $$

(19)

$$ \begin{gathered} {Z_i}(t + 1) = M(t) \times {Z_{{\text{best}}}}(t) + {{\boldsymbol{R}}_{{\rm{Le}}}^i}(t) \otimes ({r_2} \times ({Z_{{\text{best}}}}(t) - \\ {Z_i}(t)) + (1 - {r_2}) \times (\overline Z (t) - {Z_i}(t))), \qquad i{ \in i_{\mathrm{b}}} \\ \end{gathered} $$

(20)

式中${i_{\mathrm{a}}}$及${i_{\mathrm{b}}}$分别代表${N_{\mathrm{a}}}$及${N_{\mathrm{b}}}$在种群$N$中的索引。

此外，ISAO算法整体流程通过如图2。

图 2 ISAO算法流程

Fig. 2 ISAO algorithm flowchart

下载: 全尺寸图片

2.3 ISAO性能评估

2.3.1 测试环境

仿真实验在搭载Intel i7-12700H CPU、NVIDIA RTX 3060显卡、16 GB DDR5内存、512 GB硬盘的Win11 x64操作系统上实现。

鉴于文献[19]已经充分证实了SAO算法的有效性，考虑篇幅限制，本文仅将ISAO与SAO算法及WOA算法^[29]进行性能对比。为确保实验的公平性，选择CEC2017基准测试函数来全面评估算法的性能。算法分别进行30次独立实验，设置参数为：最大迭代次数$T = 500$，种群规模$N = 50$，变量维度$D = 30$。

2.3.2 性能分析

参照文献[30]的测试方法，从CEC2017函数库中选取单峰函数F₁，多峰函数F₄～F₆，混合函数F₁₇～F₁₉以及组合函数F₂₈～F₃₀作为本文的测试函数。同时，利用30次独立实验的均值及标准差，分别评估算法的寻优精度及稳定性。

表1给出了CEC2017测试函数中不同算法的测试结果，同时图3给出了部分测试函数在30次独立实验中的平均收敛曲线。通过分析实验结果，可以清晰地看到，本文提出的多策略对SAO算法的改进效果显著。其中，所采用的DOL显著提高了算法的初始解质量，并确保了算法在早期迭代时具有更快的收敛速度和更高的稳定性。这确保ISAO对DNN优化的效率。贪心选择策略和Levy飞行保证了算法在开发和探索之间取得平衡，从而避免了陷入局部最优解，同时保证了寻优的精度。ISAO算法融合了WOA算法独特的螺旋进攻机制提升了算法的全局寻优力，特别是在处理复杂函数的寻优问题时，其性能相较于WOA提升了数倍。

表 1 不同算法性能对比

Table 1 Performance comparison of different algorithms

函数	统计数量	ISAO	SAO	WOA
F₁	标准差	2.40×10³	5.10×10³	8.37×10⁸
F₁	均值	2.39×10³	5.21×10³	2.01×10⁹
F₄	标准差	1.69×10¹	1.64×10¹	2.41×10²
F₄	均值	4.96×10²	4.99×10²	9.05×10²
F₅	标准差	1.08×10¹	3.19×10¹	4.98×10¹
F₅	均值	5.41×10²	5.55×10²	8.23×10²
F₆	标准差	6.55×10⁻²	2.64×10⁻¹	1.12×10¹
F₆	均值	6.00×10²	6.00×10²	6.79×10²
F₁₇	标准差	1.63×10²	2.03×10²	2.48×10²
F₁₇	均值	1.94×10³	2.04×10³	2.70×10³
F₁₈	标准差	2.12×10⁵	5.76×10⁵	8.09×10⁶
F₁₈	均值	2.41×10⁵	6.33×10⁵	9.75×10⁶
F₁₉	标准差	2.45×10³	6.08×10³	1.34×10⁷
F₁₉	均值	5.05×10³	6.01×10³	1.23×10⁷
F₂₈	标准差	1.33×10¹	2.29×10¹	1.91×10²
F₂₈	均值	3.21×10³	3.23×10³	3.64×10³
F₂₉	标准差	1.52×10²	1.91×10²	6.73×10²
F₂₉	均值	3.51×10³	3.70×10³	5.22×10³
F₃₀	标准差	2.65×10³	5.10×10³	4.64×10⁷
F₃₀	均值	8.57×10³	1.04×10⁴	4.41×10⁷

图 3 平均收敛曲线

Fig. 3 Average convergence curves

下载: 全尺寸图片

此外，与SAO算法相比，ISAO不仅大幅提升了算法的寻优精度，还同时增强了算法的稳定性。而在DNN超参数的优化过程中，由于需要消耗大量的计算资源，ISAO确保了更稳定、更高效的优化过程。

2.4 BITCA网络模型

2.4.1 双向时间卷积网络(Bi-TCN)

TCN是Bai等^[10]在2018年基于CNN结构提出的一种全新网络结构。它融合了CNN和RNN的优点，不仅能高效提取船舶多维度的空间特征，还能记忆船舶运动的历史信息。然而，TCN的一个局限在于它只能提取船舶的前向特征，无法捕获反向的时间关联性，而船舶的运动实际上具有明显的双向时间关联性。为了克服这一局限，本文提出了Bi-TCN，旨在捕获船舶运动的隐藏特征，从而全面挖掘船舶的运动规律。

CNN获得序列感受野范围${R_{\mathrm{F}}}$：

$$ {R_{\mathrm{F}}} = 1 + {N_{\mathrm{c}}} \times ({N_k} - 1) $$

(21)

然而，这种设计存在很大的局限性。为了扩大感受野以便网络能够记忆整个序列，必须增加CNN的层数${N_{\mathrm{c}}}$或卷积核的宽度${N_{{k}}}$，但无论采取哪种方法，都会增加模型的复杂性，并可能引发网络退化或梯度消失（爆炸）等问题。因此，TCN通过利用因果膨胀卷积和残差连接来降低模型复杂性，并提高模型训练的稳定性。而Bi-TCN则在正向TCN的基础上加入了反向TCN，并将双向的TCN的计算结果进行特征融合。

1)因果膨胀卷积

因果卷积通过在序列前进行0填充，从而对输入序列${\boldsymbol{x}} = ({x_1},{x_2}, \cdots ,{x_T})$实现${\boldsymbol{y}} = ({y_1},{y_2}, \cdots ,{y_T})$的输出，在保证序列长度不变的同时，使$T$时刻的输出${y_T}$仅取决于当前时刻前的输入。而膨胀卷积能在保证感受野不变的同时降低层数，对于输入序列${\boldsymbol{x}} \in {{\bf{R}}^n}$，膨胀卷积隐藏层在$t$时刻输出为

$$ {\boldsymbol{h}}({{t}}) = \displaystyle\sum\limits_{i = 0}^{k - 1} {{f_n}(i)} \cdot {{\boldsymbol{x}}_{t - d_i^ * }} $$

(22)

式中：${f_n}( \cdot )$表示卷积运算，$k$代表卷积核大小，$d_i^* = {2^{i - 1}}$表示第$i$层的膨胀系数，$t - d_i^ * $表示过去的方向。通过结合因果膨胀卷积，TCN感受野范围大小与${N_{\mathrm{c}}}$及${N_k}$由式(21)的线性增加扩展为式(23)的指数型增长，从而简化了模型。

$$ {R_{\mathrm{F}}} = \displaystyle\sum\limits_{i = 1}^{{N_{\mathrm{c}}}} {({N_k} - 1)} \cdot d_i^ * + 1 $$

(23)

图4给出了一个${N_{\mathrm{c}}} = 3$、${N_k} = 2$、${d^ * } = [1,2,4]$的因果膨胀卷积结构，该结构确保TCN能够记忆更大范围的历史信息。

图 4 因果膨胀卷积

Fig. 4 Causal dilated convolution

下载: 全尺寸图片

2)残差连接

然而，网络过深仍然会影响模型训练的稳定性。为了解决这个问题，TCN采用了多种策略：首先，通过权重归一化来提高模型训练速度；其次，使用ReLU激活函数来增强模型的非线性表达能力；再者，利用Dropout层来避免模型过拟合；最后，通过残差连接结合因果膨胀卷积构建残差块。残差块的计算表示为

$$ {{\boldsymbol{X}}^N} = {f_{{\text{ReLU}}}}(F({{\boldsymbol{X}}^{N - 1}}) + {f_{{\mathrm{con}}1}}({{\boldsymbol{X}}^{N - 1}})) $$

(24)

式中：${{\boldsymbol{X}}^{N - 1}}$及${{\boldsymbol{X}}^N}$分别表示残差块的输入及输出，${f_{{\text{ReLU}}}}( \cdot )$表示ReLU激活函数，$F( \cdot )$为残差网络，${f_{{\mathrm{con}}1}}$表示用于调整残差张量的$1 \times 1$卷积。

3)特征融合

图5给出了Bi-TCN的结构以及残差块的细节。后向TCN首先通过序列反转操作来调换序列的顺序，并使用多个与前向TCN相同的残差块来提取后向特征。为了最大限度地保留前后向TCN提取到的信息，Bi-TCN通过深度串联层将两组序列的计算结果进行叠加，该计算过程为

图 5 Bi-TCN结构

Fig. 5 Structure of Bi-TCN

下载: 全尺寸图片

$$ {\boldsymbol{h}}(t) = {f_{{\mathrm{concat}}}}({{\boldsymbol{h}}_{\rm{f}}}{{(t)}},{{\boldsymbol{h}}_{\rm{b}}}{{(t)}}) = \left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{h}}_{\rm{f}}}{{(t)}}} \\ {{{\boldsymbol{h}}_{\rm{b}}}{{(t)}}} \end{array}} \right] $$

(25)

式中：${{\boldsymbol{h}}_{\mathrm{f}}}(t)$及${{\boldsymbol{h}}_{\mathrm{b}}}(t)$分别表示前向及后向TCN的计算结果，${\boldsymbol{h}}(t)$表示Bi-TCN层运算结果。

2.4.2 注意力机制(AM)

Bi-TCN虽然能够捕获船舶运动序列的长期依赖关系和全局信息，但其在特征选择方面的能力尚有不足，这可能导致信息的遗忘和浪费。而注意力机制^[31]则可以对特征通道进行自适应加权，使模型能够聚焦于部分关键时刻的船舶状态，从而提高对船舶的预测效果。

AM层的输出结果${{\boldsymbol{Y}}_{{\mathrm{am}}}}$：

$$ {{\boldsymbol{Y}}_{{\rm{am}}}} = {\text{Softmax}}\left(\frac{{{\boldsymbol{Q}}{{\boldsymbol{K}}^{\rm T}}}}{{\sqrt {{d_k}} }}\right){\boldsymbol{V}} $$

(26)

式中：$ {\boldsymbol{Q}} $、${\boldsymbol{K}}$、${\boldsymbol{V}}$分别表示AM中查询、键、值矩阵，其计算公式为

$$ {\boldsymbol{Q}} = {{\boldsymbol{W}}_{\rm{q}}}{{\boldsymbol{X}}_{{\mathrm{am}}}} $$

(27)

$$ {\boldsymbol{K}} = {{\boldsymbol{W}}_{\rm{k}}}{{\boldsymbol{X}}_{{\mathrm{am}}}} $$

(28)

$$ {\boldsymbol{V}} = {{\boldsymbol{W}}_{\rm{v}}}{{\boldsymbol{X}}_{{\mathrm{am}}}} $$

(29)

式中：${{\boldsymbol{X}}_{{\rm{am}}}}$为AM层的输入，$ {{\boldsymbol{W}}_{\rm{q}}} $、$ {{\boldsymbol{W}}_{\rm{k}}} $、$ {{\rm{W}}_{\mathrm{v}}} $分别为${\boldsymbol{Q}}$、${\boldsymbol{K}}$、$ {\boldsymbol{V}} $的投影矩阵，${d_k}$为矩阵维度大小。

2.4.3 整体网络结构

本文提出的BITCA模型的网络结构如图6所示，其中每层网络的具体结构描述如下。

图 6 BITCA模型结构

Fig. 6 BITCA model structure

下载: 全尺寸图片

1)输入层：使用滑动窗口算法截取船舶运动的序列片段作为输入序列，以帮助模型捕获船舶运动的周期关联性。

2)Bi-TCN层：将输入序列和反转后的输入序列分别送入前向和后向TCN中，以提取空间、时间维度下的特征。随后，它将前向和后向TCN的计算结果进行特征融合。

3)AM层：对Bi-TCN层的输出结果进行自适应加权处理，以减少在传递历史信息过程中的特征损失，并使模型能够专注于重要特征。

4)输出层：利用单层的LSTM网络传递序列片段信息，并将最后一个单元的计算结果输出至全连接层进行维度调整，输出预测结果。

2.5 ISAO-BITCA混合预测模型

在ISAO-BITCA混合预测模型中，BITCA神经网络模型被用于实现船舶运动状态的预测，而ISAO智能优化算法则用于优化其超参数。ISAO-BITCA混合模型通过将神经网络与自然计算相结合，实现了自优化神经网络的设计。图7给出了ISAO-BITCA混合模型的整体优化流程。具体步骤描述如下：

图 7 ISAO-BITCA优化流程

Fig. 7 ISAO-BITCA optimization process

下载: 全尺寸图片

1)数据预处理。将测量到的船舶运动数据进行归一化处理。

$$ x = \frac{{\hat x - {{\hat x}_\mu }}}{{{{\hat x}_\sigma }}} $$

(30)

式中；$\hat x$为原始序列，${\hat x_\mu }$及${\hat x_\sigma }$分别表示原始序列的均值及标准差。

接着将处理后的数据按比例划分为训练集、验证集和测试集。

2)初始化。对ISAO算法及BITCA模型进行初始化，并确定部分模型固定的超参数。

3)ISAO优化。将BITCA模型的训练过程嵌入到ISAO算法的优化过程中，使用训练损失$ {L_{{\mathrm{tr}}}} $和验证损失$ {L_{{\mathrm{va}}}} $的平均值作为ISAO算法的适应度函数，以避免模型过拟合。适应度函数的计算式为

$$ {f_{\mathrm{c}}}(x) = \frac{{{L_{{\mathrm{tr}}}} + {L_{{\mathrm{va}}}}}}{2} $$

(31)

当算法迭代达到设定的上限时，输出最优的超参数组合。随后，将最优超参数组合部署到BITCA模型中进行训练，以建立船舶运动学模型。

3. 船舶运动建模

3.1 数据集

本文所采用的船舶非参数化建模策略要求将数据集划分为训练集、验证集和测试集3类。其中，训练集用于训练模型，验证集则用于优化模型的超参数，测试集则用于评估模型的泛化性能。本文以国际基准船KVLCC2为研究对象，利用SIMMAN 2008会议提供的KVLCC2船在HSVA静水域水池中进行Z型操纵机动时所采集到的真实数据，作为数据集进行船舶运动建模仿真实验。具体而言，将15°/5°、25°/5°、35°/5° Z型机动数据共11573组样本作为训练集，20°/5° Z型机动数据共3531组样本作为验证集，30°/5° Z型机动数据共3991组样本作为测试集。所有样本的采样时间间隔为0.05 s。

为了量化模型的泛化性，选用了平均绝对误差${R_{{\text{MAE}}}}$(mean absolute error, MAE)和均方根误差${R_{{\text{RMSE}}}}$(root mean square error, RMSE)作为性能评价指标。其中，MAE对所有预测误差等同对待，而RMSE对异常值更为敏感，其计算式分别为

$$ {R_{{\text{MAE}}}} = \frac{1}{{{N_{\mathrm{d}}}}}\sum\limits_{i = 1}^{{N_{\mathrm{d}}}} {\left| {{y_i} - {{\hat y}_i}} \right|} $$

(32)

$$ {R_{{\text{RMSE}}}} = \sqrt {\frac{1}{{{N_{\mathrm{d}}}}}\sum\limits_{i = 1}^{{N_{\mathrm{d}}}} {{{({y_i} - {{\hat y}_i})}^2}} } $$

(33)

式中：${N_{\mathrm{d}}}$为样本数量，${y_i}$及${\hat y_i}$分别表示第$i$组样本的真实值及预测值。

3.2 超参数优化

使用Adam算法训练模型，其中学习率为0.001，最大迭代次数为100，批量大小设定为256，指数衰减率${\rho _1} = 0.9$、${\rho _2} = 0.999$。为了平衡预测精度和模型复杂性，将滑动窗口的宽度设置为10，同时设置TCN残差块的数量为2。除此之外，使用ISAO算法来自动优化BITCA模型中的其余超参数，这些超参数包括Bi-TCN层中卷积核的宽度及卷积核的数量、AM层矩阵维度大小${d_k}$以及输出层中LSTM层的单元数。

为证明ISAO的有效性，在BITCA模型的超参数优化实验中使用了SAO以及经典的PSO算法和遗传算法(genetic algorithm, GA)作为对比算法。图8给出了所有算法在优化过程中模型适应度值的变化曲线。由于DOL的初始化效果，相较于其他模型，ISAO在首次迭代时便能达到一个相对较低的适应度值。在接下来的6次迭代中，适应度值发生了显著的变化，这表明ISAO能够迅速搜索到合适的超参数组合。然而，在随后的14次迭代过程中，最优适应度值保持稳定不变，这表明模型已经达到了预测性能的峰值状态。相比之下，其他对比算法在大约11次迭代后才搜索到较优的超参数组合。当迭代次数达到上限时，ISAO相较于其他算法搜索到了更优的超参数组合，从而进一步提升了船舶的建模精度，充分发掘了BITCA模型的性能潜力。相较于其他算法，ISAO高效的优化效率确保了在计算资源受限时，能够通过相对较少的迭代次数来确定更优异的超参数组合。表2给出了超参数搜索范围以及ISAO算法最终的寻优结果。

图 8 ISAO优化过程

Fig. 8 ISAO optimization process

下载: 全尺寸图片

表 2 超参数搜索范围及结果

Table 2 Range of hyperparameter search and results

超参数	范围	最优结果
Bi-TCN卷积核宽度	[3,6]	5
Bi-TCN卷积核数量	[32,128]	35
注意力机制$ d_{k} $	[32,128]	100
LSTM单元数	[32,128]	74

3.3 对比实验

将表2中ISAO搜索到的最优超参数组合应用到BITCA模型中进行训练，得到最终的混合辨识模型ISAO-BITCA，以实现对船舶运动的建模。为了证明其对船舶运动建模的有效性和性能优越性，选用未优化的BITCA、Bi-TCN、TCN-AM^[18]、LSTM^[7]、BP(back propagation)模型^[17]作为对比模型。所有对比模型与ISAO-BITCA模型采用相同的数据集、训练参数、输入输出层设计，仅在隐藏层的结构设计上存在区别。

在BITCA模型中，TCN残差块的卷积核宽度设置为3，卷积核数量设为64，同时，注意力机制的维度大小和LSTM的单元数均被设定为64。同时Bi-TCN和BITCA模型在隐藏层的其他超参数设置上与ISAO-BITCA模型保持一致，而其他对比模型隐藏层的超参数设定则遵循参考文献中的描述。

图9(a)给出了测试集(30°/5° Z型机动)中各模型对船舶四维状态的预测结果，预测误差在图9(b)中给出。

图 9 测试集中船舶状态预测对比

Fig. 9 Comparison of ship status prediction in the test set

下载: 全尺寸图片

通过分析预测结果，可以发现，在船舶进行Z型机动的过程中，其航向角及偏航角速度呈现出明显的时间趋势。各预测模型均能准确地捕捉船舶的时序关联性，从而达到较高的预测精度。然而，当航向角及偏航角到达拐点时，TCN-AM、Bi-TCN和LSTM模型均出现了较大的预测误差。相比之下，具有合理超参数的BP模型通过利用较多的隐藏层神经元数量，表现出了精确的预测效果，并展现出了较强的非线性映射能力。本文所提出的ISAO-BITCA模型，则凭借更优的超参数组合以及独特的网络性能优势，进一步提升了船舶运动预测的精度。

在船舶进行Z型机动时，其横摇角及总速度的变化呈现出非平稳的特点，这给实现高精度预测带来了更严峻的挑战。基于TCN的4种模型均能将船舶的横摇角及总速度预测误差控制在0.15°及0.06 m/s之内，这凸显了TCN模型在特征挖掘方面的显著优势。同时，本文也注意到BP模型在横摇角及总速度的预测精度上有所降低。相比之下，LSTM模型则表现出了最差的预测精度，在横摇角及总速度的预测上，其误差分别超过了0.2°及0.1 m/s。而本文提出的ISAO-BITCA模型则将横摇角和总速度预测误差分别控制在0.06°及0.03 m/s之内，充分展现了其预测精度优势。

表3及表4分别量化对比了所有预测模型在验证集及测试集中船舶四维度运动上的性能指标。从表中可以看出，本文所提出的BITCA预测模型具有较好的稳定性，在面对船舶4种截然不同的状态变化时，均能准确地捕捉到船舶的变化规律，进而实现高精度的运动建模。而拥有最优超参数组合的ISAO-BITCA模型则进一步提高了预测准确性。在连续Z型机动预测任务中，该模型未出现极端预测值，表现出了稳定的预测性能，其RMSE及MAE性能指标相较于BITCA模型均有所降低，这体现了利用ISAO算法优化神经网络超参数的有效性和可行性。

表 3 验证集性能指标对比

Table 3 Comparison of performance metrics for validation sets

预测状态	预测模型	MAE	RMSE
航向角/(°)	ISAO-BITCA	0.053	0.065
	BITCA	0.208	0.223
	TCN-AM	0.157	0.177
	Bi-TCN	0.114	0.131
	LSTM	0.132	0.167
	BP	0.078	0.100
偏航角速度/((°)/s)	ISAO-BITCA	0.031	0.039
	BITCA	0.047	0.060
	TCN-AM	0.102	0.128
	Bi-TCN	0.081	0.099
	LSTM	0.081	0.101
	BP	0.093	0.117
横摇角/(°)	ISAO-BITCA	0.007	0.009
	BITCA	0.009	0.011
	TCN-AM	0.015	0.018
	Bi-TCN	0.012	0.015
	LSTM	0.027	0.036
	BP	0.016	0.020
总速度/(m/s)	ISAO-BITCA	0.003	0.004
	BITCA	0.007	0.009
	TCN-AM	0.004	0.005
	Bi-TCN	0.013	0.015
	LSTM	0.013	0.016
	BP	0.012	0.015

表 4 测试集性能指标对比

Table 4 Comparison of performance metrics for test sets

预测状态	预测模型	MAE	RMSE
航向角/(°)	ISAO-BITCA	0.094	0.123
	BITCA	0.228	0.268
	TCN-AM	0.165	0.195
	Bi-TCN	0.204	0.268
	LSTM	0.210	0.283
	BP	0.184	0.237
偏航角速度/((°)/s)	ISAO-BITCA	0.044	0.056
	BITCA	0.060	0.078
	TCN-AM	0.095	0.131
	Bi-TCN	0.104	0.138
	LSTM	0.129	0.174
	BP	0.135	0.187
横摇角/(°)	ISAO-BITCA	0.013	0.016
	BITCA	0.014	0.017
	TCN-AM	0.027	0.032
	Bi-TCN	0.022	0.027
	LSTM	0.051	0.061
	BP	0.029	0.035
总速度/(m/s)	ISAO-BITCA	0.005	0.006
	BITCA	0.008	0.010
	TCN-AM	0.008	0.010
	Bi-TCN	0.013	0.016
	LSTM	0.020	0.034
	BP	0.017	0.021

为了探究不同预测步长对预测精度的影响，将预测步长从1逐步增加至滑动窗口宽度10，同时预测时间也从0.05 s延长至0.5 s。在此过程中，将ISAO-BITCA模型与其他预测模型进行了全面比较。图10(a)和(b)分别给出了各预测模型在验证集和测试集上对船舶四维状态建模的平均RMSE变化情况。结果显示，随着预测步长的增加，预测误差逐渐累积，导致预测精度呈现下降趋势。虽然LSTM模型在建模数据的长期依赖性方面表现出色，从而在多步长预测方面表现较为优异，但ISAO-BITCA模型在此情况下依然保持着最优的预测精度，其性能显著高于其他对比模型，为船舶连续的机动预测提供了一种高精度的解决方案。

图 10 不同预测步长的平均RMSE对比

Fig. 10 Comparison of average RMSE for different prediction steps

下载: 全尺寸图片

为了进一步验证ISAO-BITCA模型的泛化能力，本文选用了KVLCC2在海洋中执行10°/10° Z型机动时的数据进行评估。值得注意的是，训练集中的数据来源于HSVA水池的拖拽测量，这一来源可能会引入一定的数据差异。图11给出了ISAO-BITCA模型的预测结果，结果显示：即使在海洋环境中面临更为严重的外界扰动，ISAO-BITCA模型依然能够较为准确地预测船舶的四维状态，这充分展现了其强大的泛化能力。

图 11 海洋中Z型机动预测结果

Fig. 11 Prediction results of Z-type maneuver in the ocean

下载: 全尺寸图片

4. 结束语

船舶运动序列因其非平稳、非线性的特点，极大地增加了建立准确船舶运动模型的难度。本文以KVLCC2船为研究对象，提出了一种名为ISAO-BITCA的自优化神经网络模型。该模型能够同时针对船舶的航向角、偏航角、横摇角及总速度进行高精度、高效率的运动建模。通过实验分析，得出以下结论：

1)与TCN-AM模型相比，本文提出的BITCA模型利用双向TCN进一步全面提取了船舶运动序列中的双向历史信息。因此，在测试集中，其RMSE值最多降低了46.9%。与Bi-TCN模型相比，BITCA模型通过引入AM降低了特征损失，提高了模型的表达能力，使得在测试集中，其RMSE值最多降低了43%。这充分证明了BITCA模型的有效性，能够提供更准确的船舶运动预测。

2)本文提出的ISAO算法在SAO算法的基础上进一步优化了开发与探索之间的平衡。在复杂的CEC2017基准测试函数中，ISAO算法相较于SAO算法显著提升了寻优精度及寻优稳定性。同时，利用ISAO算法优化的BITCA模型进一步提高了建模的准确性，为船舶运动建模领域提供了一种低成本、高效率、高精度的解决方案。

图 1 SAO交叉项作用示意

Fig. 1 Schematic diagram of the interaction between SAO cross-terms

下载: 全尺寸图片

图 2 ISAO算法流程

Fig. 2 ISAO algorithm flowchart

下载: 全尺寸图片

图 3 平均收敛曲线

Fig. 3 Average convergence curves

下载: 全尺寸图片

图 4 因果膨胀卷积

Fig. 4 Causal dilated convolution

下载: 全尺寸图片

图 5 Bi-TCN结构

Fig. 5 Structure of Bi-TCN

下载: 全尺寸图片

图 6 BITCA模型结构

Fig. 6 BITCA model structure

下载: 全尺寸图片

图 7 ISAO-BITCA优化流程

Fig. 7 ISAO-BITCA optimization process

下载: 全尺寸图片

图 8 ISAO优化过程

Fig. 8 ISAO optimization process

下载: 全尺寸图片

图 9 测试集中船舶状态预测对比

Fig. 9 Comparison of ship status prediction in the test set

下载: 全尺寸图片

图 10 不同预测步长的平均RMSE对比

Fig. 10 Comparison of average RMSE for different prediction steps

下载: 全尺寸图片

图 11 海洋中Z型机动预测结果

Fig. 11 Prediction results of Z-type maneuver in the ocean

下载: 全尺寸图片

表 1 不同算法性能对比

Table 1 Performance comparison of different algorithms

函数	统计数量	ISAO	SAO	WOA
F₁	标准差	2.40×10³	5.10×10³	8.37×10⁸
F₁	均值	2.39×10³	5.21×10³	2.01×10⁹
F₄	标准差	1.69×10¹	1.64×10¹	2.41×10²
F₄	均值	4.96×10²	4.99×10²	9.05×10²
F₅	标准差	1.08×10¹	3.19×10¹	4.98×10¹
F₅	均值	5.41×10²	5.55×10²	8.23×10²
F₆	标准差	6.55×10⁻²	2.64×10⁻¹	1.12×10¹
F₆	均值	6.00×10²	6.00×10²	6.79×10²
F₁₇	标准差	1.63×10²	2.03×10²	2.48×10²
F₁₇	均值	1.94×10³	2.04×10³	2.70×10³
F₁₈	标准差	2.12×10⁵	5.76×10⁵	8.09×10⁶
F₁₈	均值	2.41×10⁵	6.33×10⁵	9.75×10⁶
F₁₉	标准差	2.45×10³	6.08×10³	1.34×10⁷
F₁₉	均值	5.05×10³	6.01×10³	1.23×10⁷
F₂₈	标准差	1.33×10¹	2.29×10¹	1.91×10²
F₂₈	均值	3.21×10³	3.23×10³	3.64×10³
F₂₉	标准差	1.52×10²	1.91×10²	6.73×10²
F₂₉	均值	3.51×10³	3.70×10³	5.22×10³
F₃₀	标准差	2.65×10³	5.10×10³	4.64×10⁷
F₃₀	均值	8.57×10³	1.04×10⁴	4.41×10⁷

表 2 超参数搜索范围及结果

Table 2 Range of hyperparameter search and results

超参数	范围	最优结果
Bi-TCN卷积核宽度	[3,6]	5
Bi-TCN卷积核数量	[32,128]	35
注意力机制$ d_{k} $	[32,128]	100
LSTM单元数	[32,128]	74

表 3 验证集性能指标对比

Table 3 Comparison of performance metrics for validation sets

预测状态	预测模型	MAE	RMSE
航向角/(°)	ISAO-BITCA	0.053	0.065
	BITCA	0.208	0.223
	TCN-AM	0.157	0.177
	Bi-TCN	0.114	0.131
	LSTM	0.132	0.167
	BP	0.078	0.100
偏航角速度/((°)/s)	ISAO-BITCA	0.031	0.039
	BITCA	0.047	0.060
	TCN-AM	0.102	0.128
	Bi-TCN	0.081	0.099
	LSTM	0.081	0.101
	BP	0.093	0.117
横摇角/(°)	ISAO-BITCA	0.007	0.009
	BITCA	0.009	0.011
	TCN-AM	0.015	0.018
	Bi-TCN	0.012	0.015
	LSTM	0.027	0.036
	BP	0.016	0.020
总速度/(m/s)	ISAO-BITCA	0.003	0.004
	BITCA	0.007	0.009
	TCN-AM	0.004	0.005
	Bi-TCN	0.013	0.015
	LSTM	0.013	0.016
	BP	0.012	0.015

表 4 测试集性能指标对比

Table 4 Comparison of performance metrics for test sets

预测状态	预测模型	MAE	RMSE
航向角/(°)	ISAO-BITCA	0.094	0.123
	BITCA	0.228	0.268
	TCN-AM	0.165	0.195
	Bi-TCN	0.204	0.268
	LSTM	0.210	0.283
	BP	0.184	0.237
偏航角速度/((°)/s)	ISAO-BITCA	0.044	0.056
	BITCA	0.060	0.078
	TCN-AM	0.095	0.131
	Bi-TCN	0.104	0.138
	LSTM	0.129	0.174
	BP	0.135	0.187
横摇角/(°)	ISAO-BITCA	0.013	0.016
	BITCA	0.014	0.017
	TCN-AM	0.027	0.032
	Bi-TCN	0.022	0.027
	LSTM	0.051	0.061
	BP	0.029	0.035
总速度/(m/s)	ISAO-BITCA	0.005	0.006
	BITCA	0.008	0.010
	TCN-AM	0.008	0.010
	Bi-TCN	0.013	0.016
	LSTM	0.020	0.034
	BP	0.017	0.021

参考文献(31)

[1]	李永杰, 张瑞, 魏慕恒, 等. 船舶自主航行关键技术研究现状与展望[J]. 中国舰船研究, 2021, 16(1): 32−44. LI Yongjie, ZHANG Rui, WEI Muheng, et al. State-of-the-art research and prospects of key technologies for ship autonomous navigation[J]. Chinese journal of ship research, 2021, 16(1): 32−44.
[2]	HE H , ROSALES V J , ZWIJNSVOORDE V T , et al. Experimental assessment of speed adaptive track control of rudder-propeller-actuated ships based on model predictive control[J]. Ocean engineering, 2025, 326: 120824.
[3]	李国帅, 张显库, 张安超. 智能船舶靠泊技术研究热点与趋势[J]. 中国舰船研究, 2024, 19(1): 3−14. LI Guoshuai, ZHANG Xianku, ZHANG Anchao. Research hotspots and tendency of intelligent ship berthing technology[J]. Chinese journal of ship research, 2024, 19(1): 3−14.
[4]	OUYANG Zilu, CHEN Gang, ZOU Zaojian. Identification modeling of ship maneuvering motion based on local Gaussian process regression[J]. Ocean engineering, 2023, 267: 113251. doi: 10.1016/j.oceaneng.2022.113251
[5]	CHEN Gang, WANG Wei, XUE Yifan. Identification of ship dynamics model based on sparse Gaussian process regression with similarity[J]. Symmetry, 2021, 13(10): 1956. doi: 10.3390/sym13101956
[6]	JIANG Lichao, SHANG Xiaobing, JIN Bao, et al. Black-box modeling of ship maneuvering motion using multi-output least-squares support vector regression based on optimal mixed kernel function[J]. Ocean engineering, 2024, 293: 116663. doi: 10.1016/j.oceaneng.2023.116663
[7]	JIANG Yan, HOU Xianrui, WANG Xuegang, et al. Identification modeling and prediction of ship maneuvering motion based on LSTM deep neural network[J]. Journal of marine science and technology, 2022, 27(1): 125−137. doi: 10.1007/s00773-021-00819-9
[8]	ZHOU Xiao, ZOU Lu, OUYANG Zilu, et al. Nonparametric modeling of ship maneuvering motions in calm water and regular waves based on R-LSTM hybrid method[J]. Ocean engineering, 2023, 285: 115259. doi: 10.1016/j.oceaneng.2023.115259
[9]	WANG Ning, KONG Xiangjun, REN Boyu, et al. SeaBil: self-attention-weighted ultrashort-term deep learning prediction of ship maneuvering motion[J]. Ocean engineering, 2023, 287: 115890. doi: 10.1016/j.oceaneng.2023.115890
[10]	BAI Shaojie, KOLTER J Z, KOLTUN V, et al. An empirical evaluation of generic convolutional and recurrent networks for sequence modeling[EB/OL]. (2018−03−04)[2024−01−01]. https://arxiv.org/abs/1803.01271v2.
[11]	周思思, 李勇, 郭钇秀, 等. 考虑时序特征提取与双重注意力融合的TCN超短期负荷预测[J]. 电力系统自动化, 2023, 47(18): 193−205. doi: 10.7500/AEPS20221202003 ZHOU Sisi, LI Yong, GUO Yixiu, et al. Ultra-short-term load forecasting based on temporal convolutional network considering temporal feature extraction and dual attention fusion[J]. Automation of electric power systems, 2023, 47(18): 193−205. doi: 10.7500/AEPS20221202003
[12]	ZHANG Dongdong, CHEN Baian, ZHU Hongyu, et al. Short-term wind power prediction based on two-layer decomposition and BiTCN-BiLSTM-attention model[J]. Energy, 2023, 285: 128762. doi: 10.1016/j.energy.2023.128762
[13]	李港, 李有为, 舒章康, 等. 基于时间卷积网络的长江下荆江航道水位预测[J]. 水利水运工程学报, 2023(6): 84−92. doi: 10.12170/20220809002 LI Gang, LI Youwei, SHU Zhangkang, et al. Water level prediction of lower Jingjiang waterway in Yangtze River based on temporal convolution network[J]. Hydro-science and engineering, 2023(6): 84−92. doi: 10.12170/20220809002
[14]	LI Mingwei, XU Dongyang, GENG Jing, et al. A hybrid approach for forecasting ship motion using CNN–GRU–AM and GCWOA[J]. Applied soft computing, 2022, 114: 108084. doi: 10.1016/j.asoc.2021.108084
[15]	许德刚, 王再庆, 郭奕欣, 等. 鲸鱼优化算法研究综述[J]. 计算机应用研究, 2023, 40(2): 328−336. XU Degang, WANG Zaiqing, GUO Yixin, et al. Review of whale optimization algorithm[J]. Application research of computers, 2023, 40(2): 328−336.
[16]	LI Feng, ZUO Wei, ZHOU Kun, et al. State of charge estimation of lithium-ion batteries based on PSO-TCN-Attention neural network[J]. Journal of energy storage, 2024, 84: 110806. doi: 10.1016/j.est.2024.110806
[17]	HE Hongwei, WANG Zihao, ZOU Zaojian, et al. Nonparametric modeling of ship maneuvering motion based on self-designed fully connected neural network[J]. Ocean engineering, 2022, 251: 111113. doi: 10.1016/j.oceaneng.2022.111113
[18]	ZHANG Biao, WANG Sheng, DENG Liwei, et al. Ship motion attitude prediction model based on IWOA-TCN-Attention[J]. Ocean engineering, 2023, 272: 113911. doi: 10.1016/j.oceaneng.2023.113911
[19]	DENG Lingyun, LIU Sanyang. Snow ablation optimizer: a novel metaheuristic technique for numerical optimization and engineering design[J]. Expert systems with applications, 2023, 225: 120069. doi: 10.1016/j.eswa.2023.120069
[20]	GUO Siyuan, NING Zhi, LYU Ming. Path tracking and energy efficiency coordination control strategy for skid-steering unmanned ground vehicle[J]. Control engineering practice, 2024, 152: 106048. doi: 10.1016/j.conengprac.2024.106048
[21]	DING Lin, BAI Yulong, FAN Manhong, et al. Using a snow ablation optimizer in an autonomous echo state network for the model-free prediction of chaotic systems[J]. Nonlinear dynamics, 2024, 112(13): 11483−11500. doi: 10.1007/s11071-024-09656-y
[22]	倪晓芳, 杨桂兰, 唐晓勇. 基于SAO-VMD-FFT的激光诱导荧光光谱信号信噪比提升方法[J]. 中国无机分析化学, 2024, 14(5): 677−684. doi: 10.3969/j.issn.2095-1035.2024.05.021 NI Xiaofang, YANG Guilan, TANG Xiaoyong. The methodology for enhancing the signal-to-noise ratio of laser-induced fluorescence spectroscopy based on SAO-VMD-FFT[J]. Chinese journal of inorganic analytical chemistry, 2024, 14(5): 677−684. doi: 10.3969/j.issn.2095-1035.2024.05.021
[23]	孙世明, 岑红星, 白建民, 等. 基于集成SAO优化互相关熵极限学习机模型的变压器故障诊断方法[J]. 电测与仪表, 2024, 61(9): 56−64. SUN Shiming, CEN Hongxing, BAI Jianmin, et al. Transformer fault diagnosis method based on integrated correntropy extreme learning machine model optimized by SAO[J]. Electrical measurement & instrumentation, 2024, 61(9): 56−64.
[24]	郝志峰, 刘俊, 温雯, 等. 基于多序列隐关系的时序事件预测[J]. 计算机工程与应用, 2024, 60(7): 119−127. doi: 10.3778/j.issn.1002-8331.2211-0137 HAO Zhifeng, LIU Jun, WEN Wen, et al. Temporal event prediction based on implicit relationship of multiple sequences[J]. Computer engineering and applications, 2024, 60(7): 119−127. doi: 10.3778/j.issn.1002-8331.2211-0137
[25]	XIAO Yaning, CUI Hao, HUSSIEN A G, et al. MSAO: a multi-strategy boosted snow ablation optimizer for global optimization and real-world engineering applications[J]. Advanced engineering informatics, 2024, 61: 102464. doi: 10.1016/j.aei.2024.102464
[26]	贾鹤鸣, 刘庆鑫, 刘宇翔, 等. 融合动态反向学习的阿奎拉鹰与哈里斯鹰混合优化算法[J]. 智能系统学报, 2023, 18(1): 104−116. doi: 10.11992/tis.202108031 JIA Heming, LIU Qingxin, LIU Yuxiang, et al. Hybrid Aquila and Harris Hawks optimization algorithm with dynamic opposition-based learning[J]. CAAI transactions on intelligent systems, 2023, 18(1): 104−116. doi: 10.11992/tis.202108031
[27]	SUN Pu, LIU Hao, ZHANG Yong, et al. An improved atom search optimization with dynamic opposite learning and heterogeneous comprehensive learning[J]. Applied soft computing, 2021, 103: 107140. doi: 10.1016/j.asoc.2021.107140
[28]	景坤雷, 赵小国, 张新雨, 等. 具有Levy变异和精英自适应竞争机制的蚁狮优化算法[J]. 智能系统学报, 2018, 13(2): 236−242. doi: 10.11992/tis.201706091 JING Kunlei, ZHAO Xiaoguo, ZHANG Xinyu, et al. Ant lion optimizer with levy variation and adaptive elite competition mechanism[J]. CAAI transactions on intelligent systems, 2018, 13(2): 236−242. doi: 10.11992/tis.201706091
[29]	MIRJALILI S, LEWIS A. The whale optimization algorithm[J]. Advances in engineering software, 2016, 95: 51−67. doi: 10.1016/j.advengsoft.2016.01.008
[30]	张达敏, 王义, 张琳娜. 种群分段变异学习和S型权重变色龙群算法[J]. 系统仿真学报, 2023, 35(1): 11−26. ZHANG Damin, WANG Yi, ZHANG Linna. Chameleon swarm algorithm for segmental variation learning of population and S-type weight[J]. Journal of system simulation, 2023, 35(1): 11−26.
[31]	杨正理, 吴馥云, 陈海霞. 深度残差收缩网络的多特征锅炉炉管声波信号故障识别[J]. 智能系统学报, 2023, 18(5): 1108−1116. doi: 10.11992/tis.202207012 YANG Zhengli, WU Fuyun, CHEN Haixia. Fault identification of multi-feature boiler tube acoustic signal based on deep residual shrinkage network[J]. CAAI transactions on intelligent systems, 2023, 18(5): 1108−1116. doi: 10.11992/tis.202207012

点击查看大图

图(11) / 表(4)

摘要

基于自优化神经网络的船舶运动模型辨识

doi: 10.11992/tis.202408004

通讯作者: 杨智博. E-mail：yzblsn@163.com.

出版历程

Identification of ship motion model based on self-optimizing neural network

1. 问题描述

2. ISAO-BITCA混合预测模型

2.1 雪融优化器

2.1.1 探索（布朗运动）

2.1.2 开发（度日法）

2.1.3 双种群机制

2.2 改进雪融优化器

2.2.1 动态反向学习(DOL)

2.2.2 贪心选择

2.2.3 Levy飞行

2.2.4 螺旋进攻机制

2.2.5 ISAO算法流程

2.3 ISAO性能评估

2.3.1 测试环境

2.3.2 性能分析

2.4 BITCA网络模型

2.4.1 双向时间卷积网络(Bi-TCN)

2.4.2 注意力机制(AM)

2.4.3 整体网络结构

2.5 ISAO-BITCA混合预测模型

3. 船舶运动建模

3.1 数据集

3.2 超参数优化

3.3 对比实验

4. 结束语

出版历程

目录

通讯作者:
杨智博. E-mail：yzblsn@163.com.