舰船科学技术  2022, Vol. 44 Issue (4): 156-160    DOI: 10.3404/j.issn.1672-7649.2022.04.033   PDF    
模糊聚类算法在舰船电气系统故障远程检测中的应用
林航1, 方宁2     
1. 中国船级社青岛分社, 山东 青岛 266034;
2. 山东广域科技有限责任公司, 山东 东营 257000
摘要: 依据模糊均值聚类故障检测原理,对舰船电气系统初始状态数据样本归一化后,构建舰船电气系统状态数据模糊相似矩阵,依据该矩阵分析系统状态数据亲疏度;利用亲疏度结果获取状态数据的最佳权值指数,并对状态数据样本进行加权处理,降低系统状态数据聚类稀疏度;将最佳权值指数赋予到状态数据中,同时更新模糊C-均值聚类目标函数。通过设置聚类类别数量、停止阈值和迭代次数后,求解更新模糊C-均值聚类目标函数并输出聚类隶属度和聚类中心,完成舰船电气系统初始状态数据聚类,得到舰船电气系统故障类别。实验结果表明,模糊C-均值聚类钻粉在舰船电气系统故障类型检测过程中具备较低的稀疏度,可有效检测舰船电气系统故障类型的同时其检测结果贴近度数值最高接近1.0。
关键词: 模糊聚类算法     舰船电气系统     故障远程检测     贴近度     故障类型     加权处理    
Application of fuzzy clustering algorithm in remote fault detection of ship electrical system
LIN Hang1, FANG Ning2     
1. Qingdao Branch of China Classification Society, Qingdao 266034, China;
2. Shandong Wide Area Technology Co., Ltd., Dongying 257000, China
Abstract: Based on the fault detection principle of fuzzy C-means clustering, the initial state data samples of ship electrical system were normalized, and the fuzzy similarity matrix of ship electrical system state data was constructed, and the affinity degree of system state data was analyzed according to the matrix. The optimal weight index of the state data was obtained by using the results of affinity and affinity, and the state data samples were weighted to reduce the clustering sparsity of the system state data. The optimal weight index was assigned to the state data, and the fuzzy C-mean clustering objective function was updated. After setting the number of clustering categories, stop threshold and iteration times, the fuzzy C-mean clustering objective function was solved and updated, and the clustering membership degree and clustering center were output. The initial state data clustering of ship electrical system was completed, and the fault categories of ship electrical system were obtained. The experimental results show that the fuzzy C-means clustering drill powder has a low sparsity in the detection process of warship electrical system fault type, and can effectively detect the warship electrical system fault type, while the highest value of the detection result proximity is close to 1.0.
Key words: fuzzy clustering algorithm     ship electrical system     remote fault detection     closeness     fault type     weighted processing    
0 引 言

舰船电气设备在长期运行过程中受工作环境或者设备的自然损耗等因素导致其出现不同程度的故障[1-2],轻微故障影响舰船电气设备正常运行,而严重的故障则会形成区域性的故障。舰船在行船过程中出现故障维修难度较大,维修成本也较高。针对上述情况,史丽萍等[3]使用加权模糊聚类算法和人工鱼群算法对舰船的变压器故障类型进行聚类的形式实现舰船变压器故障识别,但该算法在迭代运算时受人工鱼群算法全局寻优的局限性影响,使其聚类舰船变压器故障样本存在分散性,因此识别效果不够精准。杨帆等[4]构建舰船小电流单相故障识别模型,将当前舰船单相节点数据传输至该模型内,经过模型反复迭代实现其故障识别,但该方法对舰船实时录波数据要求较高,当该数据未能及时传输到识别模型内时,则无法及时识别舰船小电流单相故障。模糊聚类算法是依据事物之间界限对其进行分类的数学统计算法,且具备多元性[5],可依据数据样本的亲疏关系客观对其类别进行划分,当类别的边界模糊时可使用逐步聚类步骤实现目标识别。本文将该方法应用到舰船电气系统故障远程检测过程中,研究模糊聚类算法在舰船电气系统故障远程检测中的应用,提升舰船电气系统故障远程检测能力。

1 基于模糊聚类算法的舰船电气系统故障远程检测 1.1 模糊C-均值聚类故障检测原理

在众多聚类算法中,模糊C-均值聚类算法可有效划分样本边界存在模糊问题[6]。模糊C-均值聚类算法是通过硬C均值聚类算法改进而来,其检测的基本思路如下:

由舰船电气系统运行实时数据组成待检测样本集,其表达式为:

$ X = \left\{ {{X_1},{X_2}, \cdots ,{X_n}} \right\}。$ (1)

将式(1)的样本集划分 $ C $ 个类别,且每个类别内样本的隶属度均属于 $ C $ 个类别的聚类中心,通过不断变更样本的隶属度矩阵,将同一个类别内相似度最大的样本对象划分为一类,且保证各个类别之间的相似度数值最小[7]。依据上述理论,建立模糊C-均值聚类算法目标函数。令UE分别表示样本的隶属度矩阵和聚类中心矩阵,则模糊C-均值聚类算法目标函数表达式为:

$ J(F,E) = \sum\limits_{j = 1}^n {\sum\limits_{i = 1}^C {{{({f_{ij}})}^\omega }{{({\varphi _{ij}})}^2}} }{\text{。}} $ (2)

式中: $ \omega $ 表示权重指数,其取值范围为1至正无穷; $ {\varphi _{ij}} $ 表示所有样本与聚类中心的距离; $ {f_{ij}} $ 表示第 $ j $ 个样本隶属于第 $ i $ 类的隶属度。 $ n $ 表示样本数量, $ J(F,E) $ 是模糊C-均值聚类算法的聚类中心加权距离平方和,该数值越小越好。

1.2 初始舰船状态数据样本归一化

使用依据粗糙集理论对原始样本进行归一化处理,过程如下:

令待归一化处理的舰船电气系统数据 $X =\{ {X_1}, $ $ {X_2}, \cdots ,{X_n}\}$ 的决策属性集由 $ D = \left\{ d \right\} $ 表示,其条件属性集由 $ Q = \left\{ {{q_1},{q_2}, \cdots ,{q_b}} \right\} $ 表示,其中 $ b $ 表示条件数量。当样本类别为 $ k $ 时,样本的平均能量表达式为:

$ {W_k} = \frac{1}{m}\sum\limits_{j = 1}^m {\sum\limits_{i = 1}^n {\tilde M_{{k_j}{q_i}}^2} }{\text{。}} $ (3)

式中: $ \tilde M_{{k_j}{q_i}}^{} $ 表示第 $ k $ 类内的第 $ j $ 个样本 $ {o_i} $ 的输入量属性值; $ m $ 表示数据样本数量。

对于条件属性集内的样本距离,其表达式为:

$ {d_{{p_j}{o_k}}} = {\left(\sum\limits_{i = 1}^n {{{\left({{\tilde M}_{{p_j}{q_i}}} - {{\tilde M}_{{o_k}{q_i}}}\right)}^2}} \right)^{\frac{1}{2}}}{\text{。}} $ (4)

式中: $ {d_{{p_j}{o_k}}} $ 表示第 $ p $ 个类别内第 $ j $ 个样本与第 $ o $ 个类别内第 $ k $ 个样本间的距离,且 $ p \ne o $

$ p $ 个类别内的第 $ j $ 个样本到第 $ o $ 个类别内所有样本间最小距离表达式为:

$ {d_{{p_j}{o_k}}} = \min {d_{{p_j}{o_k}}},$ (5)

式中, $ p \ne o $

依据式(4)和式(5)结果,将舰船电气系统初始数据样本进行伸缩处理。当数据样本 $ p $ $ q $ 的平均能量符合 $ {W_p} > {W_o} $ 时,则归一化处理后的舰船电气系统初始数据样本表达式为:

$ {x_{{p_j}i}} = {x_{{p_j}i}}\cdot\left(1 + \frac{{{S_1}}}{{{d_{{p_j}o}}}}\right)。$ (6)

当数据样本 $ p $ $ o $ 的平均能量符合 $ {W_p} < {W_o} $ 时,则归一化处理后的舰船电气系统初始数据样本表达式为:

$ {x_{{p_j}i}} = {x_{{p_j}i}}\cdot\left(1 - \frac{{{S_1}}}{{{d_{{p_j}o}}}}\right),$ (7)

式中, $ S $ 表示标准化长度,其数值为1。

1.3 基于模糊相似矩阵的系统状态数据亲疏度分析

$ {X_i} $ $ {X_j} $ 均表示舰船电气系统状态数据样本,其归一化处理后分别由 $ X{'_i} $ $ X{'_j} $ 表示,二者之间的亲疏关系由 $ {\vartheta _{ij}} $ 表示。使用夹角余弦算法计算舰船电气系统状态数据样本间的亲疏关系,其表达式为:

$ {\vartheta _{ij}} = \frac{\displaystyle\sum\limits_{k = 1}^m {x'_{ik}x'_{jk}} }{\sqrt {\displaystyle\sum\limits_{k = 1}^m x'^2_{ik} } \sqrt {\displaystyle\sum\limits_{k = 1}^m x'^2_{jk} } }。$ (8)

构建模糊相似矩阵,表达式为:

$ R = {({\vartheta _{ij}})_{n \times n}}。$ (9)
1.4 降低系统状态数据聚类稀疏度

构建舰船电气系统状态数据样本模糊矩阵后,为使其在检测故障过程中的聚类稀疏度降低[8-9],需要获取最佳权值指数,并对状态数据样本进行加权处理。

选取聚类权重指数,其过程如下:

假设 $ G $ 表示模糊聚类目标,模糊约束为 $ \zeta $ ,二者之间的决策受其交集计算得到,其表达式为:

$ Y = G \cap \zeta,$ (10)

式中, $ Y $ 表示模糊聚类目标和模糊约束之间的决策。

当模糊目标依据模糊约束进行模糊处理时,需依据二者间的隶属度函数来决定[10-11],因此模糊决策隶属度表达式为:

$ {\mu _Y}(x) = {\text {min}R} \left\{ {{\mu _G}(x),{\mu _\zeta }(x)} \right\}, $ (11)

式中, $ {\mu _C}(x) $ $ {\mu _\zeta }(x) $ 分别表示模糊聚类目标和约束的隶属度。

设置式(11)的模糊决策空间最优备用解:

$ {\mu _Y}({A_i}) = \max \left\{ {{\mu _Y}({A_j}),\forall j} \right\}{\text{。}} $ (12)

式中: $ {\mu _Y}({A_i}) $ 表示模糊聚类目标内备用决策 $ A $ 的第 $ i $ 个聚类类别的隶属度; $ {\mu _Y}({A_j}) $ 表示模糊聚类目标内备用决策 $ A $ 的第 $ j $ 个数据样本。式(11)的最终结果需符合式(12)条件。

在舰船电气系统状态数据样本内存在若干目标和约束条件时[12],需设置最优决策给定目标和约束条件,依据其获取最优决策。

$ {G_i}(\forall i) $ $ {\zeta _j}(\forall j) $ 分别表示最优决策给定目标和约束条件,此时聚类的最优决策表达式如下:

$ Y = ( \cap {G_i}) \cap ( \cap {\zeta _j})。$ (13)

将式(13)代入到式(11)内,得到隶属度最优函数表达式为:

$ {\mu _Y}(x) = \min \left\{ {( \wedge {\mu _{{G_i}}}),( \wedge {\mu _{{\zeta _j}}})} \right\}。$ (14)

依据式(14)结果,计算模糊聚类的最佳权重指数,表达式为:

$ \tau = {\rm{arg}} \left\{ {{\rm max }\left[ {{\rm{min}} \left[ {{\mu _G}(m),{\mu _\zeta }(m)} \right]} \right]} \right\}。$ (15)

式中, $ \tau $ 表示最优权重数值。

依据式(15)可得到舰船电气系统状态数据样本聚类的最佳权值指数。

模糊C-均值在聚类舰船电气系统状态数据时,样本位置与其他样本间的距离越小说明其为同一类的机率较大[13]。为使聚类舰船电气系统状态数据样本时样本周围点较多,将模糊聚类的最佳权重指数赋予到舰船电气系统状态数据样本内,则样本的权值表达式为:

$ {\omega _k} = \tau \frac{{\displaystyle\sum\limits_{k = 1}^n {{\omega _k}'} }}{{{\omega _k}'}},$ (16)
$ {\omega _k}' = \frac{1}{n}\sum\limits_{j = 1}^n {d({x_k},{x_j})}{\text{。}} $ (17)

式中: $ {\omega _k}' $ 表示舰船电气系统状态数据样本的平均相似度,数据样本 $ {x_k} $ $ {x_j} $ 的欧式距离为 $ d({x_k},{x_j}) $ 。当数据样本 $ {x_k} $ 与其他样本相似度数值较高时,数据样本的平均相似度数值越小,此时样本的权值数值越高[14]

1.5 舰船电气系统故障类别聚类检测

将式(16)结果代入到式(2)内,得到舰船新聚类目标函数:

$ {J_m}(F,E) = \sum\limits_{k = 1}^n {\sum\limits_{i = 1}^c {{\omega _k}({f_{ik}})m{{({d_{ik}})}^2}} }。$ (18)

利用式(18)对舰船电气系统状态数据进行聚类处理,其流程如下:

步骤1 设置聚类类别数量 $ c $ 、停止阈值 $ \varepsilon $ 和迭代次数 $ I $ 后,初始化聚类隶属度矩阵。

步骤2 初始状态数据样本归一化处理后,构建模糊相似矩阵。

步骤3 利用式(16)计算样本权值。

步骤4 更新聚类中心矩阵,表达式为:

$ {E}_{i}^{(I)}=\frac{{\displaystyle \sum _{k=1}^{n}{\omega }_{k}{({f}_{ik}^{(I)})}^{m}{x}_{k}}}{{\displaystyle \sum _{k=1}^{n}{\omega }_{k}{({f}_{ik}^{(I)})}^{m}}}{\text{。}} $ (19)

式中: $ {E_i} $ 表示第 $ i $ 个聚类中心矩阵; $ I $ 表示迭代次数。

步骤5 更新舰船电气系统状态数据样本聚类隶属度 $ {E^{(I + 1)}} $ ,表达式为:

$ f_{ik}^{(I + 1)} = {\left\{ {\sum\limits_{j = 1}^c {\left[ {{{\left(\frac{{{\rm{d}}_{ik}^{(I + 1)}}}{{{\rm{d}}_{jk}^{(I + 1)}}}\right)}^{\frac{2}{{m - 1}}}}} \right]} } \right\}^{ - 1}}。$ (20)

步骤6 判断更新前后的隶属度矩阵是否符合下述条件:

$ \left\| {{F^{(I)}} - {F^{(I + 1)}}} \right\| < \varepsilon。$ (21)

若更新前后的隶属度矩阵符合公式(21)条件,则停止迭代,输出聚类中心矩阵和隶属度矩阵。反之返回步骤4。

当模糊C-均值聚类舰船电气系统状态数据样本完成后,输出其隶属度和聚类中心:

$ {f_{ik}} = \frac{1}{{\displaystyle\sum\limits_{j = 1}^c {{{\left(\dfrac{{{d_{ik}}}}{{{d_{jk}}}}\right)}^{\frac{2}{{m - 1}}}}} }},$ (22)
$ {E_i} = \frac{{\displaystyle\sum\limits_{k = 1}^n {{\omega _k}{{({f_{ik}})}^m}} {x_k}}}{{\displaystyle\sum\limits_{k = 1}^n {{\omega _k}{{({f_{ik}})}^m}} }}。$ (23)

通过上述公式获得舰船电气系统状态数据样本聚类的隶属度和聚类中心后,完成数据样本聚类,获得舰船电气系统故障类别。

2 实验分析

以某舰船电气系统为实验对象,取其近一年内故障样本构成不同类别的数据集,数据集属性如表1所示。采用Matlab仿真软件搭建仿真平台,使用本文方法对其故障类型进行检测。

表 1 舰船电气系统数据集属性 Tab.1 Attributes of ship electrical system data set
2.1 聚类松散度测试

以A-2数据集作为实验样本,该样本内共包含3种故障类型,分别为断线故障、接地故障和混淆交直流故障,对5000故障样本进行分类处理,分析其聚类松散度,结果如图1所示。

图 1 聚类松散度测试结果 Fig. 1 Cluster looseness test results

分析可知,本文方法在聚类舰船电气系统故障时,不同类型故障点均被聚集在一起,且同类故障数据点间的间距较为密集,聚类松散度较低。虽然同类故障数据点内存在分布分散情况,但与其他故障点类别距离较远,聚类后的故障类别不受其数据点分散影响,表明本文方法聚类松散度较低,从侧面说明其对舰船电气故障类型识别能力强。

2.2 收敛性测试

模糊C-均值聚类算法在检测舰船电气系统故障时,其收敛速度是影响故障检测效果的重要因素,测试在不同数据样本量情况下的迭代次数变化情况,结果如图2所示。

图 2 收敛性测试结果 Fig. 2 Convergence test results

分析可知,本文方法在检测舰船电气系统故障时的迭代次数随着样本数量的增加而降低,当其降低到一定次数后便不受样本数量的影响。在样本数量为40个之前,其迭代次数呈现大幅度降低趋势,而当样本数量超过40个之后,迭代次数曲线反而保持较平缓状态,表明本文方法在检测舰船电气系统故障时具备良好的收敛性。

2.3 故障检测效果测试

以高维数据集A-3和类别数量较多的数据集A-8为实验对象,测试本文方法检测舰船电气系统故障能力,结果如图3所示。

图 3 舰船电气系统故障类别检测结果 Fig. 3 Fault category detection results of ship electrical system

分析可知,在检测高维数据集和故障类别较多的数据集时,可有效将数据集内的故障类型检测出来,不受维度和故障类型数量影响。

为更清楚呈现本文方法检测舰船电气系统故障类型,以检测故障类型的贴近度为衡量指标,设置其阈值不低于0.9,统计多类别数据集A-8故障类型的贴近度,结果如图4所示。

图 4 故障类型贴近度 Fig. 4 Fault type closeness

分析可知,本文方法检测多故障类型数据集内故障类型时的贴近度呈现波动趋势,但波动幅度不大。其中最大贴近度数值出现在轴向碰磨合油膜震荡故障类型检测中,贴近度数值接近1.0。贴近度数值最小出现在轴承偏心和不平衡故障类型时,其数值约为0.94,表明本文方法在检测舰船电气系统故障类型时的贴近度数值均高于所设贴近度阈值,检测结果较为准确。

3 结 语

模糊C-均值聚类算法是无监督机器学习算法之一,其是依据模糊原理对数据进行分析和处理的方法。模糊C-均值聚类算法可依据数据结构对其内部包含的不确定性数据进行描述,被应用在图像处理、数据挖掘以及检测识别等领域。本文将模糊C-均值聚类算法应用到舰船电气系统故障类型识别过程中,并通过实验证明其在该应用中具备较高精确度的检测能力,且不受数据样本的维度和多类别影响,具备良好的实用性。

参考文献
[1]
王印松, 商丹丹, 王艳飞, 等. 改进的模糊聚类在控制系统故障诊断中的应用[J]. 计算机工程与科学, 2018, 40(2): 326-330. DOI:10.3969/j.issn.1007-130X.2018.02.019
[2]
邢瑞康, 李成海. 改进的聚类算法在入侵检测系统中的应用[J]. 火力与指挥控制, 2019, 44(2): 124-128. DOI:10.3969/j.issn.1002-0640.2019.02.025
[3]
史丽萍, 宋朝鹏, 李明泽, 等. 基于SAAFSA优化加权模糊聚类算法的变压器故障诊断[J]. 电测与仪表, 2018, 55(11): 12-18. DOI:10.3969/j.issn.1001-1390.2018.11.003
[4]
杨帆, 金鑫, 沈煜, 等. 小电流接地故障多层次分类及其识别模型[J]. 电力系统自动化, 2018, 42(15): 186-191. DOI:10.7500/AEPS20171227009
[5]
郑丽丽, 王志国, 刘飞. 模糊聚类下气动阀门粘滞检测方法的改进[J]. 机械科学与技术, 2018, 37(2): 300-305.
[6]
宿强, 杨景玉, 王阳萍. 基于直觉模糊C核均值聚类算法的合成孔径雷达图像变化检测[J]. 激光与光电子学进展, 2019, 56(19): 270-277.
[7]
王玲, 徐培培. 基于自适应增量学习的时间序列模糊聚类算法[J]. 电子学报, 2019, 47(5): 983-991. DOI:10.3969/j.issn.0372-2112.2019.05.002
[8]
杜明洋, 毕大平, 王树亮, 等. 基于模糊聚类的群分离与合并跟踪算法[J]. 探测与控制学报, 2018, 40(6): 121-127.
[9]
HU Hong-qian, SHI Wei-feng, LAN Ying, et al. Design of dynamic power quality monitoring and fault diagnosis system of ship- power system based on Ethernet[J]. Chinese Journal of Ship Research, 2018, 13(1): 120-126.
[10]
贾鑫, 张惊雷, 温显斌. 双监督信号深度学习的电气设备红外故障识别[J]. 红外与激光工程, 2018, 47(07): 32-38.
[11]
刘齐, 王茂军, 高强, 等. 基于红外成像技术的电气设备故障检测[J]. 电测与仪表, 2019, 56(10): 122-126+152.
[12]
ZHOU Zheng-qin, FENG Zhen-xin, ZHOU Dong-guo, et al. Fault region extraction of electrical equipment in infrared image by using an extended mean shift method[J]. Infrared Technology, 2019, 41(1): 78-83.
[13]
谭阳红, 蒋鹏, 罗研彬, 等. 基于电流动态偏差值的MMC-MTDC直流侧故障识别[J]. 电力系统及其自动化学报, 2019, 31(11): 1-9.
[14]
ZHANG Hao-yu,YAO Gang,YIN Zhi-zhu, et al. Faul tstate perception method for six-phase PMSM based on wavelet neural network and KNN machine learning algorithm[J]. Electrical Measurement & Instrumentation, 2019, 56(2): 1-9.
[15]
刘鑫, 李珉, 郭锐强. 基于宽频特性测量的电气设备局部放电检测[J]. 计算机仿真, 2020, 37(5): 379-383. DOI:10.3969/j.issn.1006-9348.2020.05.078