舰船科学技术  2024, Vol. 46 Issue (17): 146-149    DOI: 10.3404/j.issn.1672-7649.2024.17.025   PDF    
基于数据挖掘的船舶主推进机械装置可靠性评估
仲崇丽1, 刘华2     
1. 西安明德理工学院 信息工程学院,陕西 西安 710100;
2. 西安邮电大学 网络信息中心,陕西 西安 710100
摘要: 为分析评估指标间的相关性,构建科学的评估指标体系,基于多维评估指标获取准确的可靠性评估结果,提出基于数据挖掘的船舶主推进机械装置可靠性评估方法。采集海量船舶主推进机械装置运行相关数据,获取初始评估指标;采用数据挖掘技术中的因子分析法分析初始指标间的相关性,选取相互独立的评估指标构建最终的船舶主推进机械装置可靠性评估指标体系。利用数据挖掘技术中的支持向量机构建可靠性评估模型,将多维评估指标数据输入评估模型内,通过核函数将多维评估指标数据映射至高维空间内进行分类,输出可靠性评估等级。实验结果显示:选择的评估指标的方差解释均在0.8以上,说明所选评估指标信息量保全较多;评估结果与其研究对象实际运行情况完全一致,说明该方法的有效性。
关键词: 数据挖掘     推进机械装置     可靠性评估     因子分析法     指标体系     支持向量机    
Reliability assessment of ship propulsion machinery based on data mining
ZHONG Chongli1, LIU Hua2     
1. Information Engineering College, Xi’an Mingde Institute of Technology, Xi’an 710100, China;
2. Network Information Center, Xi’an University of Posts & Telecommunications, Xi’an 710100, China
Abstract: To analyze the correlation between evaluation indicators, construct a scientific evaluation indicator system, obtain accurate reliability evaluation results based on multidimensional evaluation indicators, and propose a reliability evaluation method for ship main propulsion machinery based on data mining. Collect massive amounts of data related to the operation of ship propulsion machinery and obtain initial evaluation indicators; The factor analysis method in data mining technology is used to analyze the correlation between initial indicators, and independent evaluation indicators are selected to construct the final reliability evaluation index system for ship main propulsion machinery. Using support vector mechanism in data mining technology to build a reliability evaluation model, inputting multidimensional evaluation index data into the evaluation model, mapping the multidimensional evaluation index data to a high-dimensional space through a kernel function for classification, and outputting the reliability evaluation level. The experimental results show that the variance explanations of the selected evaluation indicators are all above 0.8, indicating that the information preservation of the selected evaluation indicators is relatively high, the evaluation results are completely consistent with the actual operation of the research object, indicating the effectiveness of this method.
Key words: data mining     promote mechanical devices     reliability assessment     factor analysis method     indicator system     support vector machine    
0 引 言

船舶作为连接全球贸易的重要纽带,其安全性、可靠性和效率性直接关系到全球经济的稳定运行和海上人员的生命安全。船舶主推进机械装置作为船舶动力系统的核心部件[1],其性能的优劣直接影响到船舶的整体性能和航行安全。因此,评估船舶主推进机械装置可靠性,对于提高船舶的整体性能、降低故障率、保障航行安全具有重要意义。

王明洋等[2]提出基于自诊断的设备可靠度评估模型,收集设备相关信息后,根据设备特点选择合适的自诊断方法设计并实现自诊断系统,根据设备类型和特点选择马尔科夫模型作为可靠性评估模型,通过自诊断系统实时获取设备状态数据,利用训练好的评估模型对设备可靠度进行实时评估。该方法的准确性和有效性高度依赖于数据的完整性和准确性。如果数据收集不全或存在错误,将直接影响评估结果的可信度。任洲洋等[3]提出基于多状态模型的设备可靠性评估模型,依照设备实际情况,定义设备不同运行状态,确定各状态之间的转移概率和条件,利用马尔可夫链表达设备在不同状态下的动态变化。基于设备历史数据,利用统计方法估计各状态之间的转移概率,利用模型对设备的可靠性进行评估,预测设备的剩余寿命、故障风险等。该方法应用过程中,评估指标数据之间存在显著相关性,由此导致评估结果产生偏差。这增加了建模和求解的难度,也增加了计算资源的消耗。赵启等[4]提出基于广义比例故障率模型的设备可靠性评估模型,根据设备运行状态参数定义协变量,利用广义比例故障率模型(GPHM)的形式,构建故障率函数 ,通过拟合方式计算威布尔分布的参数,求解设备可靠性。广义比例故障率模型基于一定的假设条件,如故障率函数成比例等。这些假设条件可能不完全符合实际情况,导致评估结果存在偏差。

针对上述问题,提出基于数据挖掘的船舶主推进机械装置可靠性评估方法,利用数据挖掘技术中的因子分析法和支持向量机选取评估指标、构建评估模型,获取最终的评估结果,实现对船舶主推进机械装置可靠性的科学评估。

1 主推进机械装置可靠性评估方法 1.1 基于数据挖掘的评估指标体系构建

船舶主推进机械装置可靠性评估指标体系的构建是基于数据挖掘的船舶主推进机械装置可靠性评估方法的基础。采集海量船舶主推进机械装置运行相关数据,获取初始船舶主推进机械装置可靠性评估指标;采用数据挖掘技术中的因子分析法分析初始指标间的相关性[5],构建最终的船舶主推进机械装置可靠性评估指标体系。船舶主推进机械装置是一个复杂体系,对其可靠度进行评估不仅要从多维度角度出发选取评估指标构建评估指标体系,还需考虑不同指标间的相关性。因此,分析法作为数据挖掘技术中一种普遍使用的多元统计分析法,能够在海量包含复杂相关性的初始评估指标间确定少量不具相关性的总和因子,由此实现抑制评估指标间相关性的目的。因子分析法应用过程中依照初始评估指标数据的相关性进行组别划分,令相关性较为显著的评估值指标聚合在同一组别内。不同组别的评估指标具有一个公共因子,其作为该组别内全部评估指标的线性表出,保留不同组别评估指标的主要信息,能够简化成数据波动特征一致的评估指标的线性组合。通过因子分析法获取不同公用因子同指标的系数相关性,并以此为基础筛选出最终使用的评估指标,构建评估指标体系。基于因子分析法的船舶主推进机械装置可靠性评估指标体系的构建过程描述如下:

1)对所采集的海量船舶主推进机械装置运行相关数据实施预处理,令指标的方差与均值分别为1和0,在此基础上确定指标间的相关系数矩阵。

2)采用主成分分析法在所构建的相关系数矩阵内提取特征值与特征向量,并将其作为初始因子。当所确定因子的累计方差贡献率满足85%时,即可说明所提出的因此能够解释初始评估指标85%以上的信息。

3)$ p $为最终提取的因子数量,因子可通过$ {F_1}, {F_2}, \cdots , {F_p} $表示。初始船舶主推进机械装置可靠性评估指标内包含m个评估指标,以$ {X_1},{X_2}, \cdots ,{X_m} $表示。$ {\varepsilon _1}, {\varepsilon _2}, \cdots , {\varepsilon _p} $为公共因子无法解释的因子,由此可通过式(1)描述船舶主推进机械装置可靠性评估指标的因子分析数学模型:

$ \left\{ \begin{gathered} {F_1} = {a_{11}}{X_1} + {a_{12}}{X_2} + \cdots + {a_{1m}} + {\varepsilon _1} ,\\ {F_2} = {a_{21}}{X_1} + {a_{22}}{X_2} + \cdots + {a_{2m}} + {\varepsilon _2} ,\\ {F_p} = {a_{p1}}{X_1} + {a_{p2}}{X_2} + \cdots + {a_{pm}} + {\varepsilon _p} 。\\ \end{gathered} \right. $ (1)

4)如果所提出的$ p $个因子与不同评估指标的系数差异并不显著,无法准确定义含义,则需对因子实施旋转,令公共因子能够被解释。选取方差极大正交旋转法,令不同公共因子具备最大载荷的评估指标数据最小。通过旋转过程能够将公共因子描述为评估指标的线性组合。载荷因子与公共因子同评估指标间的相关性之间呈正比例相关,同时共同因子对评估指标的解释水平也越高,评估指标对于因子的贡献越大。采用因子分析法对初始船舶主推进机械装置可靠性评估指标进行相关性分析后,利用所选的因子构建船舶主推进机械装置可靠性评估指标体系,如表1所示。

表 1 可靠性评估指标体系 Tab.1 Reliability evaluation index system
1.2 基于数据挖掘的评估模型构建

采用数据挖掘技术中的因子分析法对初始船舶主推进机械装置可靠性评估指标进行相关性分析,构建船舶主推进机械装置可靠性评估指标体系后,采用数据挖掘技术中的支持向量机模型构建船舶主推进机械装置可靠性评估模型。$ \left\{ {{x_i},{y_i}} \right\},i = 1,2, \cdots ,p $为船舶主推进机械装置可靠性评估指标数据集,其中$ {x_i} $$ {y_i} $分别为船舶主推进机械装置可靠性评估指标和船舶主推进机械装置可靠性值,$ p $为评估指标数据样本数量。依照风险最小的原则能够得到:

$ {w^{\mathrm{T}}}\Phi \left( x \right) + b = 0。$ (2)

式中:$ w $$ \Phi \left( x \right) $分别为法向量和将评估指标$ {x_i} $映射至高维特征空间的映射函数;$ b $为偏置。

考虑船舶主推进机械装置工作状态具有复杂变化特征,以优化船舶主推进机械装置可靠性评估训练过程为目的,将式(2)转换为二次优化问题,描述为:

$ \begin{gathered} \min J\left( {w,\xi } \right) = \frac{1}{2}{\left\| w \right\|^2} + c\sum\limits_{i = 1}^n {{\xi _i}} ,\\ s.t. \\ {y_i}\left( {w\Phi \left( {{x_i}} \right) + b} \right) \geqslant 1 - {\xi _i} ,\\ \xi \geqslant 0,i = 1,2, \cdots ,p。\\ \end{gathered} $ (3)

式中:$ c $$ \xi $分别为船舶主推进机械装置可靠性评估错误的惩罚系数和松弛变量。

以提升船舶主推进机械装置可靠性评估效率为目的,在式(3)内引入拉格朗日乘子$ \alpha $。由此可将式(3)转换成对偶问题,获取船舶主推进机械装置可靠性评估的决策函数:

$ f\left( x \right) = \sum\limits_{i = 1}^l {{\alpha _i}{y_i}} \left( {\Phi \left( x \right)\Phi \left( {{x_i}} \right) + b} \right)。$ (4)

考虑泛函原理,通过核函数$ k\left( {x,{x_i}} \right) $能够描述点积操作$ \left( {\Phi \left( x \right)\Phi \left( {{x_i}} \right)} \right) $,由此船舶主推进机械装置可靠性评估的决策函数变为:

$ f\left( x \right) = \sum\limits_{i = 1}^l {{\alpha _i}{y_i}} \left( {k\left( {x,{x_i}} \right) + b} \right)。$ (5)

通过核函数能够建构性能有所差异的船舶主推进机械装置可靠性评估模型,普遍使用的核函数包括多项式核函数、Sigmoid核函数以及高斯核函数,考虑高斯核函数在实际应用过程中的非线性映射能力与参数调节的灵活性,选取高斯核函数构建船舶主推进机械装置可靠性评估模型,其表达式为:

$ k\left( {x,{x_i}} \right) = \exp \left( {\frac{{{{\left\| {x - {x_i}} \right\|}^2}}}{{2{\delta ^2}}}} \right) 。$ (6)

式中:$ \delta $为方差。

由此可将式(5)可转变为:

$ f\left( x \right) = \sum\limits_{i = 1}^p {{\alpha _i}{y_i}} \exp \left( {\frac{{{{\left\| {x - {x_i}} \right\|}^2}}}{{2{\delta ^2}}} + b} \right) 。$ (7)
2 实验结果与分析

本文研究基于数据挖掘的船舶主推进机械装置可靠性评估方法,为验证本文方法的评估性能,选取某型号船舶主推进机械装置为研究对象。

表 2 研究对象相关参数 Tab.2 Research object related parameters
2.1 指标选取结果分析

本文方法采用数据挖掘技术中的因子分析法提取评估指标。评估指标集样本的因子方差分析结果如表3所示。分析表3能够得到,本文方法所构建的评估指标集内不同因子的初始方差均为1,也就是全部评估指标的方差均可以被解释。提取相关系数矩阵特征值后,公共因子数量相较于初始评估指标数量有所减少,所以不同评估指标的方差解释均有所下降,但所选择的评估指标的方差解释均在0.8以上。由此说明本文方法所选的评估指标信息量保全较多,也就是因子分析法是科学的。

表 3 因子方差分析结果 Tab.3 Results of Factor ANOVA
2.2 评估结果

采集研究对象2024年4月份30天的运行信息,在其中随机抽取10天的运行信息作为研究数据,采用本文方法对研究对象这10天的可靠性等级进行评估,将评估结果划分为4个等级,分别是极度可靠、较为可靠、一般可靠、不可靠,本文方法所得结果如表4所示。分析可知,采用本文方法评估研究对象可靠性等级,基于研究对象10天的运行数据所得评估结果与其研究对象实际运行情况完全一致,由此说明采用本文方法能够有效实现研究对象的可靠性评估。

表 4 研究对象可靠性评估结果 Tab.4 Reliability assessment results of research objects
3 结 语

基于数据挖掘的船舶主推进机械装置可靠性评估方法是一种科学、系统且有效的评估手段。它充分利用了船舶建造、运行和维护过程中产生的大量数据资源,通过数据挖掘技术中的因子分析法选取评估指标,并通过支持向量机构建评估模型,实现对机械装置可靠性的深入分析和评估。该方法不仅提高了评估的准确性和可靠性,还为船舶运营和维护提供了有力的决策支持。

参考文献
[1]
安理会, 王建礼, 刘意, 等. 航空发动机燃油控制装置可靠性研究综述[J]. 推进技术, 2024, 45(1): 6-22.
[2]
王明洋, 张蔚, 徐冬苓, 等. 考虑自诊断的反应堆保护系统停堆功能可靠度评估模型研究[J]. 核动力工程, 2023, 44(2): 159-165.
[3]
任洲洋, 王皓, 李文沅, 等. 基于氢能设备多状态模型的电氢区域综合能源系统可靠性评估[J]. 电工技术学报, 2023, 38(24): 6744-6759.
[4]
赵启, 王开科, 郭小龙, 等. 基于广义比例故障率模型的电网安控装置可靠性评估方法[J]. 电工电能新技术, 2023, 42(8): 87-94. DOI:10.12067/ATEEE2209001
[5]
王彦快, 米根锁, 张玉, 等. 基于CHMM和SSA-SVM模型的高速铁路道岔设备健康状态评估方法[J]. 铁道学报, 2023, 45(11): 107-116. DOI:10.3969/j.issn.1001-8360.2023.11.013