舰船科学技术  2023, Vol. 45 Issue (12): 140-143    DOI: 10.3404/j.issn.1672-7619.2023.12.027   PDF    
基于大数据挖掘的航标作业船航行安全评估研究
任广利     
天津海运职业学院,天津 300350
摘要: 以保障航标作业船安全航行为目的,研究基于大数据挖掘的航标作业船航行安全评估方法。该方法利用大数据挖掘技术中的R聚类方法筛选航标作业船航行安全评估指标,利用大数据挖掘技术中的因子分析方法获取信息量较大的航标作业船航行安全评估指标,并构建安全评估指标体系。以该安全评估指标体系作为基础,利用模糊层次综合评估算法,通过构建评估因素集、评价集、评价矩阵等步骤得到航标作业船航行安全评估结果。实验表明,该方法具备较好的航标作业船航行安全评估指标筛选能力的同时,可有效对不同作业位置的航标作业船航行安全进行评估,具备较好的应用效果。
关键词: 大数据挖掘     R聚类     因子分析     航标作业船     安全评估    
Research on navigation safety assessment of navigation aids operation ships based on big data mining
REN Guang-li     
Tianjin Maritime College, Tianjin 300350, China
Abstract: With the aim of ensuring the safe navigation of navigation aids operation ships, this paper studies the navigation safety evaluation method of navigation aids operation ships based on big data mining. This method uses the R clustering method in big data mining technology to screen the navigation safety evaluation indicators of navigation aids operation ships, and then uses the factor analysis method in big data mining technology to obtain the navigation safety evaluation indicators of navigation aids operation ships with a large amount of information, and constructs a safety evaluation index system. Based on the safety evaluation index system, the fuzzy hierarchical comprehensive evaluation algorithm is used to construct an evaluation factor set, evaluation set. The evaluation matrix and other steps are used to obtain the navigation safety evaluation results of the navigation aid operation ship. The experiment shows that this method has good screening ability for navigation safety evaluation indicators of navigation aids operation ships, and can effectively evaluate the navigation safety of navigation aids operation ships at different operation positions, with good application effects.
Key words: big data mining     R clustering     factor analysis     navigation mark operation vessel     safety assessment    
0 引 言

航标作业船也被称为布标船,是用于布设和维护航标基地的勤务船,也可用于海洋石油开采、海沙开采、海洋水文地质探查等区域标记[1]。航标作业船在海上布设航标时,其附近存在暗礁、浅滩以及岩石,是作业时安全风险较高,且航标作业船上搭载起重机、大量浮标以及航标仪等设备,一旦触及暗礁、岩石或距离浅滩较近,航标作业船会出现碰撞、搁浅的风险[2],威胁航标作业船航行安全,因此对航标作业船航行安全进行评估意义重大。目前有学者研究船航行安全评估方法,张叶等[3]提出基于KNN算法的船舶评估方法,该方法采集船舶操纵姿态数据后,使用KNN算法得到船舶风险评估结果。杜沛等[4]则通过分析船舶航行的海洋环境要素,建立评估指标体系后,利用层次分析方法得到船航行风险评估结果。上述2种方法虽可实现船航行风险评估结果,但前者仅从船航行姿态角度其航行风险进行分析,而后者则仅从船航行海洋环境角度对其风险进行评估,二者方法均存在一定的片面性。大数据挖掘方法是利用分析处理算法、机器学习算法等从海量大数据内挖掘隐含信息的数据处理方法,目前该方法在交通、医疗、航海等多个领域应用极为广泛[5]。本文研究基于大数据挖掘的航标作业船航行安全评估方法,为保障航标作业船安全航行提供技术支持。

1 航标作业船航行安全评估方法 1.1 大数据挖掘的航行安全评估指标体系构建 1.1.1 R聚类算法的航行安全评估指标定量筛选

对航标作业船航行安全评估指标定量聚类的目的是将反映相同或相近的指标归为一类,保障航标作业船航行安全评估指标的全面性。使用大数据挖掘算法中的R聚类算法筛选航标作业船航行安全评估指标定量,其过程如下:

令存在 $ n $ 个航标作业船航行安全评估指标,将该 $ n $ 个指标划分为 $ P $ 类,则第 $ i $ 类指标离差平方和表达式为:

$ {Y_i} = \sum\limits_{j = 1}^{{n_i}} {(x_i^{(j)} - {{\bar x}_i})'(x_i^{(j)} - {{\bar x}_i})}。$ (1)

式中: $ {Y_i} $ 为第 $ i $ 类指标离差平方和; $ {n_i} $ 为第 $ i $ 类指标个数; $ x_i^{(j)} $ 为第 $ i $ 个评估指标的第 $ j $ 个样本值向量; $ {\bar x_i} $ 为第 $ i $ 个评估指标的平均样本值向量。

依据式(1)对航标作业船航行安全评估指标进行聚类,每合并一个类别[6],离差平方和的数值就要增大,依据最小原则对航标作业船航行安全评估指标进行聚类,则 $ k $ 类的总离差平方和表达式如下:

$ Y = \sum\limits_{i = 1}^k {\sum\limits_{j = 1}^{{n_i}} {(x_i^{(j)} - {{\bar x}_i})'(x_i^{(j)} - {{\bar x}_i})} },$ (2)

式中, $ Y $ $ k $ 类的总离差平方和。

经过上述步骤反复迭代,即可得到 $ P $ 个航标作业船航行安全评估指标类别,完成航行安全评估指标定量筛选。

1.1.2 因子分析的最大信息含量评估指标遴选

筛选完航标作业船航行安全评估指标后,利用因子分析方法遴选最大信息含量的指标,并建立航标作业船航行安全评估体系。因子分析的本质是利用少数具有实际意义的公因子线性组合的方式描述评估目标[7],因子分析表达式如下:

$ {x_i} = {a_{i1}}{q_1} + {a_{i2}}{q_2} + \cdots + {a_{ik}}{q_k} + {\varepsilon _i}。$ (3)

式中: $ {x_i} $ 为第 $ i $ 个航标作业船航行安全评估指标,其中 $ i = 1,2, \cdots ,p $ $ p $ 为指标总数; $ {\varepsilon _i} $ $ {x_i} $ 的特殊因子; $ {q_j} $ 为第 $ j $ 个公因子,且 $ j = 1,2, \cdots ,k $ $ k $ 为公因子数量; $ {a_{ij}} $ 为第 $ i $ 个指标在第 $ j $ 个公因子上的负载数值。

利用筛选的航标作业船航行安全评估指标建立相关系数矩阵,该矩阵由 $ {\boldsymbol{Z}} $ 表示,矩阵的特征值由 $ {\eta _j} $ 表示,该特征值是公因子 $ {q_j} $ 解释航标作业船航行安全评估指标的总方差,则 $ {q_j} $ 对航标作业船航行安全评估指标数值方差贡献计算式如下:

$ {w_j} = \frac{{{\eta _j}}}{{\displaystyle\sum\limits_{j = 1}^k {{\eta _j}} }},$ (4)

式中, $ {w_j} $ $ {q_j} $ 对航标作业船航行安全评估指标数值方差贡献值。

对式(4)结果进行排序处理,当累积方差贡献超过80%以上,说明其提取到的公因子可代表几乎全部的航标作业船航行安全评估原始信息。然后选择前 $ K $ 个特征值对应的公因子,使用主成分分析方法计算其因子荷载阵,则因子正交旋转时, $ {\eta _j} $ $ {a_{ij}} $ 的关系表达式如下:

$ {\eta _j} = \sum\limits_{i = 1}^K {a_{ij}^2}。$ (5)

式中: $ \left| {{a_{ij}}} \right| $ 数值越大,则该指标涵盖的信息越多。

将式(5)代入式(4)内,通过式(4)选取累积方差超过80%的公因子,再利用式(3)进行计算,记得遴选到最大信息含量的航标作业船航行安全评估指标,利用该指标建立的航标作业船航行安全评估指标体系,如表1所示。对航标作业船航行安全评估指标体系进行赋值量化处理,数值>7为高风险,数值位于5~6区间时为中风险,数值位于3~4为低风险,数值<3为无风险。

表 1 航标作业船航行安全评估指标体系 Tab.1 Navigation safety assessment index system for aids to navigation operation ships
1.2 基于模糊层次综合评估算法的航标作业船航行安全评估

依据表1内的航标作业船航行安全评估指标体系,使用大数据挖掘算法中的模糊层次综合评估算法实现航标作业船航行安全评估,其过程如下:

利用航标作业船航行安全评估指标体系建立航标作业船航行安全评估因素集,该因素集可将航标作业船航行安全评估因素划分为多个层次,则航标作业船的航行安全评估因素集表达式如下:

$ U = \left\{ {{U_1},{U_2}, \cdots ,{U_m}} \right\} 。$ (6)

式中: $ U $ 表示航标作业船的航行安全评估因素集; $ m $ 为评价因素个数。

建立航标作业船的航行安全评估的评价集,其表达式如下:

$ V = \left\{ {{v_1},{v_2}, \cdots ,{v_m}} \right\}。$ (7)

式中: $ V $ 为航标作业船的航行安全评估的评价集, $ {v_i} \in V $

依据式(7)结果,可得到航标作业船航行安全评估指标体系内二级指标的评估模糊隶属度,对该隶属度进行量化后,得到二级指标影响因素评价矩阵表达式如下:

$ {G_i} = \left( {\begin{array}{*{20}{c}} {{g_{11}}}& \ldots &{{g_{1n}}} \\ \vdots & \ddots & \vdots \\ {{g_{m1}}}& \cdots &{{g_{mn}}} \end{array}} \right)。$ (8)

式中: $ {G_i} $ 为第 $ i $ 个二级指标影响因素评价矩阵。

依据式(8),则航标作业船航行安全评估一级指标的因素评估矩阵表达式如下:

$ {H_i} = {W_i} \circ {G_i}。$ (9)

式中, $ {H_i} $ 为一级指标的因素评估矩阵; ${W_i} = ({w_{i1}},{w_{i2}}, \cdots , {w_{im}})$ 为指标权重集; $ \circ $ 为模糊运算符。

依据上述公式结果,建立航标作业船航行安全评估综合评价矩阵,表达式如下:

$ R' = \left[ \begin{gathered} {H_1} \\ {H_2} \\ \vdots \\ {H_m} \\ \end{gathered} \right] 。$ (10)

利用式(10)即可得到航标作业船航行安全评估结果。

2 实验结果与分析

以10艘同型号航标作业船作为实验对象,该航标作业船满载排水量为2000 t,航速为14.5 kn,续航力为3500 n mile,自持力为40昼夜。船上配置2台起重机和绞盘,起重机起吊能力为10 t,航标位于甲板位置,搭载8个,利用本文方法对该航标作业船航行安全进行评估。

验证本文方法对航标作业船航行安全评估指标定量筛选能力,以归一化互信息指标作为衡量指标,测试在本文方法筛选指标数量不同时的归一化互信息数值,结果如图1所示。分析图1可知,本文方法在筛选航标作业船航行安全评估指标时,其归一化互信息数值随着筛选指标数量的增加而降低,在指标数量为20个之前时,其归一化互信息数值接近1.0,指标数量持续增加,本文方法归一化互信息数值呈现小幅度下降趋势。指标数量为50个时,本文方法删选航标作业船航行安全评估指标的归一化互信息数值依然高达0.95。上述结果说明:本文方法筛选航标作业船航行安全评估指标时的归一化互信息数值较高,筛选的航标作业船航行安全评估指标精度较高。

图 1 评估指标筛选归一化互信息数值 Fig. 1 Normalized mutual information value of evaluation index screening

进一步验证本文方法建立航标作业船航行安全评估指标体系能力,以航标作业船航行安全评估指标体系的信息贡献率作为衡量指标,以二级评估指标作为实验对象,以统计方式计算其信息贡献率,测试结果如表2所示。分析表2可知,本文方法建立的航标作业船航行安全评估指标二级指标的信息贡献率数值最大值为0.9611,最小值为0.9269,上述信息贡献率数值较大,均超过0.9,其说明本文方法建立的航标作业船航行安全评估指标体系可充分描述航标作业船航行安全状态。

表 2 二级评估指标信息贡献率 Tab.2 Contribution rate of secondary evaluation indicator information

利用本文方法对该10艘航标作业船在其作业区域的航行安全进行评估,其评价结果如表3所示。综合分析表2表3可知,应用本文方法可有效评估航标作业船在航行过程中的安全风险等级,为航标作业船航线规划和作业提供安全等级提醒,有效保障航标作业船航行的安全性。

表 3 航标作业船航行安全评估结果 Tab.3 Navigation safety assessment results of navigation aids operation ship

以一艘航标作业船作为实验对象,将其安全评估一级指标作为衡量指标,评估其在航行作业中的安全风险,结果如表4所示。分析可知,使用本文方法评估航标作业船的航行安全风险等级中,来自一级指标航标作业船和安全数据信息内的二级指标均为无风险状态,而其人为因素的安全风险等级则较高,尤其工作强度,其为高风险状态。综上结果,利用本文方法儿可评估航标作业船航行安全风险等级,依据其航行安全风险,可对航标作业船的人为因素加强管理和调整,有效保障航标作业船的航行安全性。

表 4 航标作业船航行安全评估结果 Tab.4 Navigation safety assessment results of navigation aids operation ship
3 结 语

本文提出基于大数据挖掘的航标作业船航行安全评估方法,利用大数据挖掘技术建立航标作业船航行安全评估指标体系,并利用大数据挖掘技术中的模糊层次综合评估方法实现航标作业船航行安全评估。经过实验验证,本文方法具备较好的可行性,可用于航标作业船航行安全评估。

参考文献
[1]
黄耀倞, 许拴梅, 姜苗苗, 等. 基于博弈论组合赋权的航道水域通航安全评价[J]. 安全与环境学报, 2021, 21(6): 2430-2437.
HUANG Yao-liang, XU Shuan-mei, JIANG Miao-miao, et al. Evaluation for the channel waters navigation safety based on the synthetic weighing of the game theory[J]. Journal of Safety and Environment, 2021, 21(6): 2430-2437. DOI:10.13637/j.issn.1009-6094.2020.0639
[2]
周建文, 赵炎平, 席永涛. 冰区船舶模拟航行设计与自动评估方案[J]. 中国航海, 2021, 44(1): 1-7.
ZHOU Jianwen, ZHAO Yanping, XI Yongtao. Design of Teaching Program and Intelligent Operation Assessment for Polar Waters Navigation Training[J]. Navigation of China, 2021, 44(1): 1-7. DOI:10.3969/j.issn.1000-4653.2021.01.001
[3]
张叶, 任鸿翔, 王德龙. 基于KNN算法的船舶操纵智能评估系统[J]. 上海海事大学学报, 2021, 42(4): 33-38.
ZHANG Ye, REN Hongxiang, WANG Delong. Intelligent evaluation system for ship maneuvering based on KNN algorithm[J]. Journal of Shanghai Maritime University, 2021, 42(4): 33-38. DOI:10.13340/j.jsmu.2021.04.006
[4]
杜沛, 任利锋, 刘善伟, 等. 基于海洋环境要素的动态航行风险评估[J]. 中国安全生产科学技术, 2021, 17(2): 171-176.
DU Pei, REN Lifeng, LIU Shanwei, et al. Dynamic navigation risk assessment based on marine environmental elements[J]. Journal of Safety Science and Technology, 2021, 17(2): 171-176.
[5]
赵龙飞, 姜晓轶, 孙苗, 等. 面向海运统计的AIS大数据挖掘分析研究[J]. 海洋科学, 2021, 45(12): 55-64.
[6]
刘一帆, 曹辉, 郑卓, 等. 船舶主海水系统智能状态评估模型[J]. 船舶工程, 2021, 43(8): 4-9,72. DOI:10.13788/j.cnki.cbgc.2021.08.02
[7]
薛彦卓, 周莹, 鲁阳, 等. 基于模糊AHP-DEMATEL的北极冰区船舶冰困风险评价[J]. 哈尔滨工程大学学报, 2022, 43(7): 944-949,992.
XUE Yanzhuo, ZHOU Ying, LU Yang, et al. Risk assessment of ships stuck in ice in Arctic ice area based on fuzzy AHP-DEMATEL[J]. Journal of Harbin Engineering University, 2022, 43(7): 944-949,992.