基于历史数据挖掘的海上船舶交通事故预测

引用本文

张哲. 基于历史数据挖掘的海上船舶交通事故预测. 舰船科学技术, 2024, 46(14): 174-177 复制到剪切板

ZHANG Zhe. Predicting maritime ship traffic accidents based on historical data mining. Ship Science and Technology, 2024, 46(14): 174-177 复制到剪切板

基于历史数据挖掘的海上船舶交通事故预测

张哲

武汉交通职业学院，湖北武汉 430070

收稿日期: 2024-01-05.

作者简介: 张哲（1975 – ），男，硕士，副教授，研究方向为船舶航运技术、海事安全与防污染、海运物流及航运教育

摘要: 为优化船舶航行路线，减少因交通事故导致的延误和拥堵，提升海上运输效率和效益，研究基于历史数据挖掘的海上船舶交通事故预测方法。从海事机构获取海上船舶交通事故历史数据后，采用数据挖掘方法中的一维局阿尼自编码器对海上船舶交通事故历史数据展开挖掘，得到海上船舶交通事故特征，再建立灰色SCGM(1,1)_C模型，将海上船舶交通事故特征输入到该模型中，并运用当前预测状态中间值作为修正产生，对灰色SCGM(1,1)_C模型预测结果进行修正后，得到海上船舶交通事故预测结果。实验表明，该方法具备较强的海上船舶交通事故历史数据挖掘能力，灰色SCGM(1,1)_C模型输出的海上船舶交通事故预测结果DBI数值较高，预测海上船舶交通事故能力较好。

关键词: 数据挖掘海上船舶交通事故预测灰色模型自编码器预测值修正

Predicting maritime ship traffic accidents based on historical data mining

ZHANG Zhe

Wuhan Technical College of Communications, Wuhan 430070, China

Abstract: Optimize ship navigation routes, reduce delays and congestion caused by traffic accidents, improve maritime transportation efficiency and efficiency, and study a prediction method for maritime ship traffic accidents based on historical data mining. After obtaining historical data of maritime vessel traffic accidents from maritime institutions, the one-dimensional local autoencoder in data mining methods is used to mine the historical data of maritime vessel traffic accidents, obtain the characteristics of maritime vessel traffic accidents, and then establish the grey SCGM (1,1)_C model. The characteristics of maritime vessel traffic accidents are inputted into the model, and the intermediate value of the current prediction state is used as a correction. After correcting the prediction results of the grey SCGM (1,1)_C model, the prediction results of maritime vessel traffic accidents are obtained. The experiment shows that this method has strong ability to mine historical data of maritime vessel traffic accidents. The grey SCGM (1,1)_C model outputs a high DBI value for predicting maritime vessel traffic accidents, indicating a good ability to predict maritime vessel traffic accidents.

Key words: data mining maritime vessels traffic accident prediction grey model autoencoder predicted value correction

0 引　言

在全球化日益加速的今天，海上交通作为连接世界各大洲的重要纽带，其安全性与效率性备受关注。海上船舶交通事故的频繁发生^[1]，不仅严重威胁船员的生命安全，也对海洋环境造成了巨大的破坏。因此，对海上船舶交通事故进行深入研究，并探索其预测方法，具有重要的现实意义和深远的历史意义。

目前，相关领域学者均研究交通事故预测方法。刘志等^[2]提出时空图卷积网络的交通事故预测方法，该方法使用长短时记忆神经网络对当前交通事故数据进行动态演化，实现交通事故预测。但其只在特定的数据集或场景下进行训练，无法很好地适应其他场景或数据，导致模型在实际预测中的性能下降。严丽平等^[3]提出交通事故风险深度预测方法，将当前交通实况数据输入到深度神经网络模型中，通过模型迭代输出交通事故预测结果，该模型结构过于复杂或参数设置不合理，可能会导致过拟合或欠拟合问题，从而影响预测的准确性。张庆年等^[4]提出聚类分析的交通事故预测方法，使用K均值聚类方式选择导致交通事故的主要因素以后，利用Logistic模型历史交通事故数据进行回归分析，实现交通事故预测，该技术受到因子数量、旋转方法和解释方式的影响，导致交通事故的因素不够准确，进而影响该方法预测性能。

历史数据挖掘从大量的历史数据中提取有价值的信息，以支持决策制定、趋势分析或其他研究目的。因此以历史数据挖掘作为基础，设计了基于历史数据挖掘的海上船舶交通事故预测方法，为海上船舶航行安全提供有效技术支持。

1 海上船舶交通事故预测研究 1.1 海上船舶交通事故历史数据挖掘

海上船舶交通事故历史数据来自于海事机构，其中包括船舶交通事故报告、调查记录、船舶信息、航行日志以及天气数据等，海上船舶交通事故历史数据揭示了不同类型的事故（如碰撞、搁浅、火灾、爆炸、机械故障等）的发生频率和分布情况。这些数据有助于对常见的海上船舶事故进行预测，从而针对这些高风险情况采取预防措施。在众多数据挖掘方法中，神经网络模型具有非线性建模能力和并行处理能力，在神经网络模型中，一维卷积自编码器（1D Convolutional Autoencoder）是一种特殊的自编码器，它利用一维卷积神经网络（CNN）的结构来进行输入数据的编码和解码，从输入数据中提取特征^[5]。在此运用一维卷积自编码器对海上船舶交通事故历史数据进行挖掘，获得海上船舶交通事故特征，其详细过程如下：

一维卷积自编码器的编码部分由卷积层和池化层组成，解码层有隐含层、上采样层和卷积层组成。令 $x = \left\{ {{x_1},{x_2}, \cdots ,{x_n}} \right\}$ 表示海上船舶交通事故历史数据集，将其输入到一维卷积自编码器中，一维卷积自编码器的编码部分对 $x$ 进行编码处理，表达式如下：

${h_1} = {g_f}(\varpi \cdot x + {b_1}) 。$

(1)

式中：h₁为编码部分卷积层输出结果； $\varpi$ 为一维卷积核；b₁为编码部分卷积层偏置；g_f为卷积层激活函数。

一维卷积自编码器编码部分池化层输出结果如下：

$\varGamma= p({h_1}) 。$

(2)

式中： $p( \cdot )$ 为池化运算； $z$ 为池化层输出的低维度海上船舶交通事故特征。

将式(2)结果输入到一维卷积自编码器解码部分中，其表达式如下：

${h_2} = S(\varGamma ) ，$

(3)

$x' = {g_e}(\varphi \cdot {h_2} + b_2) 。$

(4)

式中：h₂为上采样层输出结果；S()为上采样函数；g_e为解码器激活函数； $\varphi$ 为解码过程一维卷积核；b₂为解码过程卷积层偏置； $x'$ 为提取到的海上船舶交通事故历史数据特征。

1.2 海上船舶交通事故预测模型构建与修正 1.2.1 灰色SCGM(1,1)_C模型构建

系统云灰色模型SCGM(1,1)_C属于灰色模型中预测能力较强的模型，其运算过程简洁，且在运算过程中可利用积分替代原有灰色模型的直接累加计算，可有效降低预测误差。在此将得到的海上船舶交通事故历史数据特征作为输入，使用灰色SCGM(1,1)_C模型实现海上船舶交通事故预测。利用 $x'$ 构建海上船舶交通事故特征原始时间序列，由 $X' = \left\{ {x'(1),x'(2), \cdots ,x'(n)} \right\}$ 表示，对该原始时间序列进行积分生成变换处理，得到序列 $\bar X' = \left\{ {\bar x'(2),\bar x'(3), \cdots ,\bar x'(n)} \right\}$ 。其中， $\bar x'(k)$ 为灰色SCGM(1,1)_C模型前 $k$ 个梯形面积，则灰色SCGM(1,1)_C模型表达式如下：

$\frac{{\partial \bar x'(k)}}{{\partial k}} = {f_1}\bar x'(k) + {f_3} ，$

(5)

${f_1} = \ln \left[ {\frac{{\displaystyle\sum\limits_{k = 3}^n {\bar x'(k - 1)\bar x'(k)} }}{{\displaystyle\sum\limits_{k = 3}^n {{{\left[ {\bar x'(k - 1)} \right]}^2}} }}} \right] ，$

(6)

$\begin{aligned}[b] {f_2} =& \frac{{(n - 1)\displaystyle\sum\limits_{k = 2}^n {{e^{{f_1}(k - 1)}}\bar x'(k)} }}{{(n - 1)\displaystyle\sum\limits_{k = 2}^n {{e^{2{f_1}(k - 1)}}} - {{\left[ {\displaystyle\sum\limits_{k = 2}^n {{e^{{f_1}(k - 1)}}} } \right]}^2}}} - \\ &\frac{{\left[ {\displaystyle\sum\limits_{k = 2}^n {{e^{{f_1}(k - 1)}}} } \right]\left[ {\displaystyle\sum\limits_{k = 2}^n {\bar x'(k)} } \right]}}{{(n - 1)\displaystyle\sum\limits_{k = 2}^n {{e^{2{f_1}(k - 1)}}} - {{\left[ {\displaystyle\sum\limits_{k = 2}^n {{e^{{f_1}(k - 1)}}} } \right]}^2}}}，\end{aligned}$

(7)

${f_3} = {f_1}{f_4} ，$

(8)

${f_4} = \frac{{\left[ {\left(\displaystyle\sum\limits_{k = 2}^n {{e^{{f_1}(k)}}} \right){f_2} - \displaystyle\sum\limits_{k = 2}^n {\bar x'(k)} } \right]}}{{n - 1}} 。$

(9)

式中：f₁、f₂、f₃、f₄均为灰色SCGM(1,1)_C模型参数； $e$ 为对数函数。

将式(6)～式(9)代入到式(5)中，即可得到海上船舶交通事故预测结果。

1.2.2 模型预测值修正

灰色SCGM(1,1)_C模型在预测海上船舶交通事故过程中，对受不确定因素导致的海上船舶交通事故预测不够敏感，为保障海上船舶交通事故预测精度，需要对灰色SCGM(1,1)_C模型的预测值进行修正处理。z(k)为灰色SCGM(1,1)_C模型预测海上船舶交通事故的残差，依据该残差计算灰色SCGM(1,1)_C模型预测海上船舶交通事故的相对误差Q，公式为：

$Q = z(k) \times \frac{1}{{\bar x'(k)}} 。$

(10)

将式(10)结果划分为 $i$ 个数值区间E_i，其中，每个数值区间均为一个海上船舶交通事故预测状态，依据不同海上船舶交通事故预测状态，构造转移概率矩阵P₁，其构造过程为：记录海上船舶交通事故预测状态由E_i转变成E_j发生次数n_ij，在计算状态E_i在相对误差中出现的次数n_i，则预测状态E_i转移到E_j的状态转移概率p_ij可由n_ij/n_i计算。依据上述步骤，得到转移概率矩阵P₁，公式为：

${P_1} = \left( {\begin{array}{*{20}{c}} {{p_{11}}}& \ldots &{{p_{1n}}} \\ \vdots & \ddots & \vdots \\ {{p_{n1}}}& \cdots &{{p_{nn}}} \end{array}} \right) 。$

(11)

利用式(11)计算每个海上船舶交通事故预测状态概率后，对比其大小，将概率最大的海上船舶交通事故作为当前预测状态E_i，选当前预测状态E_i的中间值I_i作为修正参数，将该参数引入到式(5)中，则参数修正后的灰色SCGM(1,1)_C模型表达式如下：

$\frac{{\partial \bar x'(k)}}{{\partial k}} = \left[ {{f_1}\bar x'(k) + {f_3}} \right]{I_i} 。$

(12)

利用式(12)预测值修正后的灰色SCGM(1,1)_C模型，使其输出的海上船舶交通事故预测结果更加准确。

2 实验结果分析

以我国某海域作为实验对象，该海域各个港口每日离港船舶较多，且该海域航线航程较长，是我国与南美西海岸之间海上贸易往来的重要通道。该区域中存在若干条航线，来往船舶频繁使该海域发生船舶碰撞、搁浅以及船舶火灾事故较多，为更好地规划该海域航线，保障海上运输线路畅通，使用本文方法对该海域海上船舶交通事故展开预测。

以该海域某年海上船舶交通事故历史数据作为实验对象，本文方法使用一维卷积自编码器对其进行挖掘，挖掘结果如表1所示。可知，采用一维卷积自编码器的方法能有效从海上船舶交通事故的历史数据中提取关键信息，包括事故发生时间、名称以及潜在原因。这为后续的交通事故预测提供了丰富的数据支持，有助于提升预测的准确性，并为海上交通安全监管提供有力依据。

表 1 海上船舶交通事故历史数据挖掘结果 Tab.1 Historical data mining results of maritime ship traffic accidents

DBI（Davies-Bouldin Index）指数，也被称为戴维森堡丁指数，是一种中部评价指标，该数值越小，表明数据挖掘后得到的特征类型分布越紧密。以DBI指数作为度量指标，测试本文方法挖掘海上船舶交通事故历史数据能力，同时在实验过程中设置DBI指数不得高于0.5，测试结果如图1所示。可知，采用一维卷积自编码器挖掘海上船舶历史数据时，DBI指数稳定在0.15～0.20的较低范围中，远低于预设的0.5阈值。这表明本文方法在处理船舶数据上具有高准确性，能有效捕捉数据中的关键信息，为后续的船舶交通事故预测提供了可靠的数据支持。这一成果在海洋交通管理领域具有重要的应用价值。

图 1 海上船舶历史数据挖掘DBI指数 Fig. 1 DBI index for historical data mining of offshore ships

本文对灰色SCGM(1,1)_C模型预测值进行修正后，运用该模型获得海上船舶交通事故预测结果，在此验证本文预测值修正后的灰色SCGM(1,1)_C模型与海上船舶历史数据挖掘结果的拟合能力，以R²为度量指标，测试结果如图2所示。可知，当应用于海航船舶交通事故预测时，本文提出的SCGM(1,1)_C模型在特征数据数量约3300个时，R²接近1，这显著表明模型与数据之间的高度拟合性。随着特征数量的进一步增加，R²稳定在0.96左右，证明了模型对于更多元、复杂数据的适应能力。这一结果不仅验证了模型的有效性，也反映了其在海上船舶交通事故预测中的高精度和稳定性。因此，可以确信，本文方法构建的SCGM(1,1)_C模型为海上船舶交通事故的预测提供了强有力的工具，其预测结果具有较高的可靠性。

图 2 灰色模型R²值 Fig. 2 Grey model R-²value

使用本文方法对该海域不同航线进行船舶交通事故预测，预测结果如表2所示。可知，采用本文提出的方法能精准预测该海域各航线上潜在的交通事故类型。这一方法为提升该海域的航行安全提供了重要依据，有助于减少航行风险，保障船舶和人员的安全，为海洋交通管理提供科学决策支持。

表 2 海上船舶交通事故预测结果 Tab.2 Prediction results of maritime ship traffic accidents

3 结　语

本文设计了基于历史数据挖掘的海上船舶交通事故预测研究，该方法通过对大量历史数据的深度挖掘和分析，能够揭示出事故发生的潜在规律和影响因素，为船舶航行提供更为精准的安全预警，不仅提高了航行的安全性，也促进了航运业的可持续发展。

参考文献

[1]	彭文闯, 郭晟楠, 万怀宇, 等. 面向交通事故预测的时空多模态点过程[J]. 计算机应用研究, 2023, 40(8): 2340-2345. PENG Wenchuang, GUO Shengnan, WAN Huaiyu, et al. Multimodal spatial-temporal point processes for traffic accident event prediction[J]. Application Research of Computers, 2023, 40(8): 2340-2345.
[2]	刘志, 王锦梦, 孔祥杰. 基于时空图卷积网络的交通事故预测研究[J]. 浙江工业大学学报, 2022, 50(2): 128-135,155. LIU Zhi, WANG Jinmeng, KONG Xiangjie. Research on traffic accident prediction based on spatial-temporal graph convolutional network[J]. Journal of Zhejiang University of Technology, 2022, 50(2): 128-135,155.
[3]	严丽平, 郭成源. 基于边缘计算的城市交通事故风险深度预测[J]. 计算机仿真, 2022, 39(12): 226-229,329. YAN Liping, GUO Chengyuan. Urban traffic accident risk depth prediction based on edge computing[J]. Computer Simulation, 2022, 39(12): 226-229,329.
[4]	张庆年, 张瑨, 杨杰, 等. 基于聚类分析的水上交通事故影响因素研究[J]. 重庆交通大学学报(自然科学版), 2022, 41(6): 1-7. ZHANG Qingnian, ZHANG Jin, YANG Jie, et al. Influencing factors of waterway traffic accidents based on clustering analysis[J]. Journal of Chongqing Jiaotong University (Natural Sciences), 2022, 41(6): 1-7.
[5]	王婧娟, 陈庆奎. 一种时空周期性注意力网络的交通流量预测模型[J]. 小型微型计算机系统, 2022, 43(11): 2321-2327. WANG Jingjuan, CHEN Qingkui. Traffic flow prediction model based on the spatial-temporal periodic attention network[J]. Journal of Chinese Computer Systems, 2022, 43(11): 2321-2327.


舰船科学技术 2024, Vol. 46 Issue (14): 174-177 DOI: 10.3404/j.issn.1672-7649.2024.14.030	PDF