«上一篇
文章快速检索     高级检索
下一篇»
  哈尔滨工程大学学报  2018, Vol. 39 Issue (8): 1422-1430  DOI: 10.11990/jheu.201709002
0

引用本文  

李兵, 刘明亮, 杨平. EWT与GS-SVM在断路器机械故障诊断中的应用[J]. 哈尔滨工程大学学报, 2018, 39(8): 1422-1430. DOI: 10.11990/jheu.201709002.
LI Bing, LIU Mingliang, YANG Ping. Application of EWT and GS-SVM in mechanical fault diagnosis of circuit breakers[J]. Journal of Harbin Engineering University, 2018, 39(8): 1422-1430. DOI: 10.11990/jheu.201709002.

基金项目

黑龙江省自然科学基金面上项目(E201233);哈尔滨市科技创新人才研究专项资金项目(2015RQQXJ022)

通信作者

刘明亮, E-mail:mll_0608@163.com

作者简介

李兵(1991-), 男, 硕士研究生;
刘明亮(1980-), 男, 教授

文章历史

收稿日期:2017-09-01
网络出版日期:2018-04-24
EWT与GS-SVM在断路器机械故障诊断中的应用
李兵, 刘明亮, 杨平    
黑龙江大学 电子工程黑龙江省高校重点实验室, 黑龙江 哈尔滨 150080
摘要:针对高压断路器故障诊断中振动信号识别的难点,提出了经验小波变换与支持向量机相结合的故障诊断方法,并在k折交叉验证(k-fold cross-validation,k-CV)思想下采用网格搜索寻找SVM分类器的最优内部参数。首先通过EWT将原始多分量振动信号分解得到一组单分量的固有模态函数(intrinsic modal functions,IMF),然后结合希尔伯特变换与信息熵理论计算信号的特征熵向量,最后在训练集上利用GS与k-CV得到最佳SVM分类器,并用测试集评价该分类器,测试集识别率达100%。实验表明,相对于EWT-PSO-SVM、EMD-GS-SVM故障诊断模型,在小样本数据下EWT-GS-SVM具有模型健壮、识别率高、收敛速度快的综合性能。
关键词经验小波变换    支持向量机    网格搜索    k折交叉验证    粒子群优化    故障诊断    
Application of EWT and GS-SVM in mechanical fault diagnosis of circuit breakers
LI Bing, LIU Mingliang, YANG Ping    
Heilongjiang Key Lab of Senior-Education for Electronic Engineering, Heilongjiang University, Harbin 150080, China
Abstract: Aiming at the difficulties of identifying vibration signals in the fault diagnosis of high-voltage circuit breakers, a fault diagnosis method based on a combination of empirical wavelet transform (EWT) and support vector machine (SVM) is proposed. In addition, based on the k-fold cross-validation (k-CV), grid search (GS) was applied to seek for the optimal internal parameters of the SVM classifier. First, EWT was used to decompose the original multicomponent vibration signal into a group of single-component intrinsic modal functions (IMF). Subsequently, Hilbert transform and information entropy theory were combined to calculate the feature entropy vector. Finally, in the training set, GS and k-CV were used to obtain the optimal SVM classifier; it was evaluated using the test set, and the recognition rate reached 100%. Compared with the EWT-PSO-SVM and EMD-GS-SVM fault diagnosis models, the experiments show that for small sample data, the EWT-GS-SVM model has comprehensive advantages such as robustness, high recognition rate, and fast convergence.
Keywords: empirical wavelet transform    support vector machine    grid search    k-fold cross-validation    particle swarm optimization    fault diagnosis    

高压断路器担负着保护电网设备、隔离故障的重要职责。随着人们对用电的需求越来越高,对高压断路器运行的可靠性要求也越来越高,因此高压断路器的机械运行状况受到工程技术人员的高度重视,相继开展了对高压断路器故障诊断的研究。

采集到的高压断路器振动信号为短时非平稳非线性的时间序列,现阶段的高压断路器故障诊断通常用时频法处理此类信号。文献[1]采用经验模态分解法(empirical mode decomposition, EMD)分解高压断路器振动信号,并用“二叉树”多分类SVM识别状态。该方法提供了SVM在多分类问题中的解决思路,但EMD方法存在严重的模态混叠,且“二叉树”SVM的性能受二叉树结构的影响[2]。文献[3]采用完全总体经验模态分解(complete ensemble empirical mode decomposition, CEEMD)的方法处理高压断路器振动信号,虽能减轻模态混叠现象,但算法成对加入了高斯白噪声,且需要迭代多次。文献[4-6]分析了经验小波变换(empirical wavelet transform,EWT)的时频分析方法在机械故障领域的应用,与EMD方法相比,EWT能有效减轻端点效应、模态混叠现象,并且EWT还具有小波变换的理论框架与EMD的自适应性特点。文献[7]采用RBF神经网络对高压断路器每种状态20组数据进行识别。但神经网络的训练需要大量的样本,而高压断路器动作次数少之又少,样本数据极为珍贵, 小样本数据下很难训练出健壮的神经网络。文献[8]每组状态采集了100~300组数据,采用BP神经网络对离心泵空化状态进行训练识别,反映出了神经网络的训练往往需要成百上千的训练样本。文献[9]利用改进的粒子群优化(particle swarm optimization, PSO)算法训练BP神经网络,指出了PSO算法容易陷入局部极值的缺点,进而提出改进算法。

针对高压断路器小样本振动数据,建立了EWT-GS-SVM故障诊断模型。该模型采用EWT分解振动信号,减轻了目前信号分解存在的模态混叠,采用了libsvm工具箱的“一对一”多分类SVM又能很好处理小样本数据的多分类问题,并且在小样本数据下采用网格搜索不仅能找到全局最优点(C, g),而且模型收敛速度也很乐观。本实验与EWT-PSO-SVM模型、EMD-GS-SVM模型性能作对比。

1 经验小波变换

Gilles[10]结合小波变换的理论框架与EMD的自适应性优点,2013年提出了EWT的新型信号处理方法。其核心思想是:通过提取傅里叶频域的极值点,对振动信号的傅里叶谱进行自适应性划分,并构造一组正交的小波滤波器组对分割的频谱滤波,以提取出信号不同特征时间尺度的固有模态函数(IMF)分量, 将这些IMF进行希尔伯特变换(Hibert变换)可得到瞬时的时频谱。

首先将原始信号傅里叶谱的频率范围归一化到[0, π] rad/s,再将其频率轴连续的划分为N个带宽不相等的子区间, 则需要N+1条分割线,其中分割线的选取为傅里叶频谱两个相邻极大值的中点。现设wn为相邻子区间的分割线,n=0, 1, 2…N,且令w0=0,wN=π,则每个子区间可表示为Λλ=[wλ-1, wλ], λ=1, 2…N, 即有[0, π]= $\bigcup\limits_{\lambda =1}^{N}{{{\mathit{\Lambda }}_{\lambda }}}$。具体分割情况如图 1所示:阴影部分定义为以wn为中心、宽度为2τn的过渡段Tn,考虑到τn的选择有很多种,最简单的是让τnwn成比例,即τn=γwnγ为系数,且0<γ<1。

Download:
图 1 傅里叶轴的划分 Fig. 1 Division of the Fourier spectrum

在确定划分区间Λλ后,经验小波定义为每个Λλ区间上的带通滤波器,为了实现这个构想,根据Meyer小波的构造方法,定义经验尺度函数${{{\hat{\phi }}}_{n}}$(w)与经验小波函数${{{\hat{\psi }}}_{n}} $(w)分别为

$ {{\hat \phi }_n}\left( w \right) = \left\{ \begin{array}{l} 1,\;\;\;\;\;\;\;\;\;\;\;\left| w \right| \le {w_n} - {\tau _n}\\ \cos \left[ {\frac{{\rm{ \mathsf{ π} }}}{2}\beta \left( {\frac{1}{{2{\tau _n}}}\left( {\left| w \right| - {w_n} + {\tau _n}} \right)} \right)} \right],\\ \;\;\;{w_n} - {\tau _n} \le \left| w \right| \le {w_n} + {\tau _n}\\ 0,\;\;\;\;\;\;\;\;\;\;\;\;\;\;其他 \end{array} \right. $ (1)
$ {{\hat \psi }_n}\left( w \right) = \left\{ \begin{array}{l} 1,\;\;\;\;\;\;\;\;\;{w_n} + {\tau _n} \le \left| w \right| \le {w_{n + 1}} + {\tau _{n + 1}}\\ \cos \left[ {\frac{{\rm{ \mathsf{ π} }}}{2}\beta \left( {\frac{1}{{2{\tau _{n + 1}}}}\left( {\left| w \right| - {w_{n + 1}} + {\tau _{n + 1}}} \right)} \right)} \right],\\ \;\;\;{w_{n + 1}} - {\tau _{n + 1}} \le \left| w \right| \le {w_{n + 1}} + {\tau _{n + 1}}\\ \sin \left[ {\frac{{\rm{ \mathsf{ π} }}}{2}\beta \left( {\frac{1}{{2{\tau _n}}}\left( {\left| w \right| - {w_n} + {\tau _n}} \right)} \right)} \right],\\ \;\;\;{w_n} - {\tau _n} \le \left| w \right| \le {w_n} + {\tau _n}\\ 0,\;\;\;\;\;\;\;\;\;其他 \end{array} \right. $ (2)

式中:函数β(x)是一个任意的Ck([0, 1])函数, 对∀x∈[0, 1]满足:β(x)+β(1-x)=1,通常取β(x)=x4(35-84x+70x2-20x3);式中τn=γwn;且γ<minn[(wn+1-wn)/(wn+1+wn)]以满足获取紧支撑的条件。

根据${{{\hat{\phi }}}_{n}}$(w)和${{{\hat{\psi }}}_{n}}$(w)的定义,可根据经典小波变换的构造方法来构造经验小波变换,细节系数定义为信号f(t)与经验小波函数ψn(t)的内积:

$ \begin{array}{*{20}{c}} {w_f^\varepsilon \left( {n,t} \right) = \left\langle {f\left( t \right),{\psi _n}\left( t \right)} \right\rangle = \int {f\left( \tau \right)\overline {{\psi _n}\left( {\tau - t} \right)} {\rm{d}}\tau } = }\\ {{\mathit{\Gamma }^{ - 1}}\left[ {f\left( w \right),{{{\hat{\psi }}}_n}\left( w \right)} \right]} \end{array} $ (3)

近似系数定义为信号f(t)与尺度函数ϕ1(t)的内积:

$ \begin{array}{*{20}{c}} {w_f^\varepsilon \left( {0,t} \right) = \left\langle {f\left( t \right),{\phi _1}\left( t \right)} \right\rangle = \int {f\left( \tau \right)\overline {{\phi _1}\left( {\tau - t} \right)} {\rm{d}}\tau } = }\\ {{\mathit{\Gamma }^{ - 1}}\left[ {f\left( w \right),{{\hat \phi }_1}\left( w \right)} \right]} \end{array} $ (4)

式中:${{{\hat{\psi }}}_{n}}$(w)与${{{\hat{\phi }}}_{1}}$(w)分别是式(2)、(1)所定义的函数,ψn(t)与ϕ1(t)的傅里叶变换分别为${{{\hat{\psi }}}_{n}}$(w)与${{{\hat{\phi }}}_{n}}$(w);且$\overline{{{\psi }_{n}}\left( \tau -t \right)}$$\overline{{{\phi }_{1}}\left( \tau -t \right)}$分别是ψn(τ-t)与ϕ1(τ-t)的复共轭。

现由细节系数与近似系数可重构信号为

$ \begin{array}{*{20}{c}} {f\left( t \right) = w_f^\varepsilon \left( {0,t} \right) * {\phi _1}\left( t \right) + \sum\limits_{n = 1}^N {w_f^\varepsilon \left( {n,t} \right) * {\psi _n}\left( t \right)} = }\\ {{\mathit{\Gamma }^{ - 1}}\left[ {\hat \omega _f^\varepsilon \left( {0,w} \right){{\hat \phi }_1}\left( w \right) + \sum\limits_{n = 1}^N {\hat w_f^\varepsilon \left( {n,w} \right){{\hat \psi }_n}\left( w \right)} } \right]} \end{array} $ (5)

式中:$\hat{w}_{f}^{\varepsilon }$(0, w)与$\hat{w}_{f}^{\varepsilon }$(n, w)分别表示wfε(0, t)与wfε(n, t)的傅里叶变换,根据重构信号的数学形式,经验模态fk, (k=0, 1, 2, …, N)为

$ {f_k}\left( t \right) = \left\{ \begin{array}{l} w_f^\varepsilon \left( {0,t} \right) * {\phi _1}\left( t \right),\;\;\;\;k = 0\\ w_f^\varepsilon \left( {k,t} \right) * {\psi _k}\left( t \right),\;\;\;k = 1,2, \cdots N \end{array} \right. $ (6)
2 特征提取

振动信号特征提取主要分为5步骤:

1) EWT分解,提取经验模态分量fk(t),其中k=0, 1, 2…, N

2) 对提取的N个经验模态分量fk(t)分别进行希尔伯特变换提取它们的包络函数Ak(t)。

3) 将包络函数Ak(t)沿时间轴均分为M段,然后使每段信号分别对时间积分计算分段能量Qk(i), 其中i=1, 2…, M,且Qk(i)表示包络Ak(t)的第i段的能量;

4) 归一化Qk(i),并利用信息熵理论计算fk(t)的特征熵为Hk

5) 重复步骤1)~4),分别计算某信号N个模态分量的特征熵,并构成特征向量T =(H0, H1, …, Hk)作为某振动信号的特征向量。

分割段数N决定着频率分辨率。N的选择主要依据原始振动信号所包含的振动事件个数(即频率成分)决定的,N选取过小,则对波动较小的振动事件不敏感,不能完全反应真实存在的频率成分,N选取过大,则不但增加了计算量,且对振动事件反应过于敏感,容易出现误判。高压断路器合闸过程中,操动机构各部件的一次撞击或摩擦将产生一个振动事件,文献[11]给出了高压断路器合闸振动信号的理想数学模型:

$ \begin{array}{*{20}{c}} {f\left( t \right) = \sum\limits_{i = 1}^n {{A_i}\exp \left( { - {a_i}\left( {t - {t_i}} \right)} \right)} \cdot }\\ {\sin \left[ {2{\rm{ \mathsf{ π} }}{f_i}\left( {t - {t_i}} \right)} \right]u\left( {t - {t_i}} \right)} \end{array} $ (7)

式中:Ai为第i个子振动分量的最大幅值,ai为幅值的衰减系数,u(t)为单位阶跃信号,ti为子振动分量的起始时间,fi为各子分量的主振动频率。各子事件参数设置如表 1所示。

表 1 仿真振动信号参数 Tab.1 Parameters of the simulated vibration signal

用Matlab仿真生成由m1~m5主要子振动事件组成断路器的仿真振动信号(未加噪声),断路器仿真振动信号与其各子振动信号发生时刻对应关系如图 2所示。图中由上到下第一个信号为仿真振动信号,其余5个为子振动事件。

Download:
图 2 仿真信号及仿真信号的子事件 Fig. 2 The simulation signal and it's subevent

研究表明,断路器合闸过程中各个部件的撞击主要有5次[5, 11],因此主要有5个振动事件产生。实验首先考虑采用N=4来进行EWT分解,并得到5个IMF分量,最后根据实验的具体情况取舍主分量。

分段数M决定着时间分辨率。其选择主要依据振动信号包含的各事件的正常波动时间范围来确定的,M选取过小则难以检测出波动时间较短的振动事件,M选取过大时则时间分辨率太高,容易将微小时间偏移的正常振动事件也识别为故障状态。参考振动信号的主要子事件发生的时间,并根据多次的实验结果,选取M=16作为包络的分段数。

2.1 包络的求取

信号的突变信息往往体现在信号的包络里,在机械故障诊断领域经常用到Hibert变换的方法提取信号包络。对于某信号x(t),其希尔伯特变换定义为x(t)与1/πt的卷积:

$ \hat x\left( t \right) = \frac{1}{{{\rm{ \mathsf{ π} }}t}} * x\left( t \right) = \frac{1}{{\rm{ \mathsf{ π} }}}\int_{ - \infty }^{ + \infty } {\frac{{x\left( \tau \right)}}{{t - \tau }}{\rm{d}}\tau } $ (8)

如式(8)所示,在傅里叶频域,$\hat{x}\left( t \right)$x(t)仅在相位上相差π/2。

现定义信号x(t)的解析信号为

$ \begin{array}{*{20}{c}} {g\left( t \right) = x\left( t \right) + {\rm{j}}\hat x\left( t \right) = A\left( t \right)\exp \left( {{\rm{j}}\phi \left( t \right)} \right) = }\\ {A\left( t \right)\exp \left( {{\rm{j}}\int_0^{\rm{T}} {w\left( t \right){\rm{d}}t} } \right)} \end{array} $ (9)

可以看出g(t)是一个复值信号。其中:A(t)= $\sqrt{x{{\left( t \right)}^{2}}+\hat{x}{{\left( t \right)}^{2}}}$,为瞬时幅值,也称为信号x(t)的包络;w(t)为信号的瞬时频率, 其对时间积分便可得到角度ϕ(t)。

对EWT分解得到的每一个分量fk(t)进行Hilbert变换,且Ak(t)与gk(t)分别表示对应的包络信号与解析信号,类似于经验模态分解,原始振动信号f(t)可表示为[10]

$ \begin{array}{*{20}{c}} {f\left( t \right) = \sum\limits_{k = 0}^N {{f_k}\left( t \right)} = {\mathop{\rm Re}\nolimits} \sum\limits_{k = 0}^N {{g_k}\left( t \right)} = }\\ {{\mathop{\rm Re}\nolimits} \sum\limits_{k = 0}^N {{A_k}\left( t \right)\exp \left( {{\rm{j}}{\varphi _k}\left( t \right)} \right)} = }\\ {{\mathop{\rm Re}\nolimits} \sum\limits_{k = 0}^N {{A_k}\left( t \right)\exp \left( {{\rm{j}}\int_0^{\rm{T}} {{w_k}\left( t \right){\rm{d}}t} } \right)} } \end{array} $ (10)

式中N也表示分割的段数。由式(10)可知原始信号f(t)的幅值可以表示成时间t与瞬时频率w的二元函数,记为H(w, t),从而得到了振动信号幅值的时频分布平面(时频矩阵),也称作Hilbert谱。数学表达方式为

$ H\left( {w,t} \right) = {\mathop{\rm Re}\nolimits} \sum\limits_{k = 0}^N {{A_k}\left( t \right)\exp \left( {{\rm{j}}\int_0^{\rm{T}} {{w_k}\left( t \right){\rm{d}}t} } \right)} $ (11)
2.2 能量熵的求取

信息熵是准确描述非线性非平稳信号内部特征的一种手段,一个系统越是有序,信息熵就越低,反之一个系统越混乱(信息不确定程度越高),熵值就越高(需要更多信息弄清事实)。信号能量熵的提取方法是利用信号的包络的分段能量计算的,首先将包络信号沿时间轴均分为M段, 然后使每段信号对时间积分计算能量:

$ Q\left( i \right) = \int_{{t_i}}^{{t_{i + T/M}}} {{{\left| {A\left( t \right)} \right|}^2}{\rm{d}}t} $ (12)

其中i=1, 2, …, M; titi+T/M分别为第i段的起止时间点。将包络信号各段能量用如式(13)进行归一化处理:

$ \varepsilon \left( i \right) = Q\left( i \right)/\sum\limits_{i = 1}^M {Q\left( i \right)} $ (13)

根据熵的定义,定义信号x(t)的能量熵值如下

$ H = - \sum\limits_{i = 1}^M {\varepsilon \left( i \right)\lg \varepsilon \left( i \right)} $ (14)

结合前面特征提取的五个步骤,便能求出信号的特征向量T =(H0, H1, …, Hk)。采用信息熵理论对信号包络的时间轴分段去能量熵值,可以在各频段内检测撞击事件发生的时刻偏移,使得能量熵值可以同时反应时域与频域内信号的突变。

3 信号的EWT仿真分析

采集平台采用NI USB6002数据采集卡实现AD转换, 并由相关触发电路实现对瞬时、非平稳信号的实时采集,采样频率fs设置为40 kS/s (断路器合闸振动信号频率最高可达10 kS/s,采集卡的最大采样频率为50 kS/s),以满足香浓采样定理,采样点数n设置为8 000,用Excel表格储存采样点数据。图 3为采集平台在0.2 s内采集到的一组正常合闸时域波形(未经去噪处理)。

Download:
图 3 正常状态采集的时域波形(fs=40 kS/s) Fig. 3 Time domain waveform of normal state (fs=40 kS/s)

采集平台还采集了3种故障状态振动数据,基座螺丝松动(Fault Ⅰ)、延时动作(Fault Ⅱ)、1支储能弹簧脱落(Fault Ⅲ),每种状态采集30组数据,且为使实验结果更具一般性,随机的在每种状态中选取20组作为训练样本,10组作为测试样本。

首先将所有采集到的数据导入到Matlab的“当前文件夹”中,以尽可能使信噪比大的原则, 对信号逐个进行小波软阈值去噪,阈值取thr=0.203 4 V左右(没产生振动信号时,实际观察到的噪声信号的最大幅值在200 mV左右),图 4为原始信号采用db6小波去噪后的时域波形图。

Download:
图 4 去噪后的时域波形 Fig. 4 Time domain waves after de-noising

将去噪的模态信号通过EWT工具箱进行时频分析, 分解出各个模态,也就得到了式(6)所定义的fk(t)。为了与EMD方法作对比,以一正常信号为例,图 5显示了对同一信号, 当EWT的分割段数N取4时,分别采用EMD方法与EWT方法分解得到的IMF分量。可以发现相同条件下, EMD自适应分解出来的IMF分量多达14个。但断路器实际合闸过程中,操动机构各部件的撞击、摩擦次数远小于14个,且大量研究[5, 11-13]表明高压断路器的主要频率成分也不足14个,反映出EMD方法分解的IMF分量存在虚假模态,即同一模态可能含有两种及以上的主频成分,或者两个模态同时拥有同一种主频成分,这些虚假模态不能反映信号的本质。

Download:
图 5 EWT与EMD分解的IMF分量对比 Fig. 5 Comparison of IMFs of EWT and EMD decomposition

为了进一步说明EWT的有效性与EMD模态混叠现象,对EMD与EWT两种方法得到的每一个IMF进行希尔伯特变换,并由式(11)可得到振动信号的Hilbert谱,即信号的时频平面,时频平面得到的瞬时频率是具有真实的物理意义的,而原始振动信号某点处的频率是几个振动事件的叠加,不是信号真实存在的频率成分。为了清楚的比较两者的时频平面,分别对EMD与EWT时频平面中幅值贡献最大的区域作局部放大,如图 6所示,其中幅值贡献的大小可由时频平面中黑点的颜色深浅来衡量。

Download:
图 6 两种方法的时频平面比较 Fig. 6 Comparison of time frequency planes of two methods

图 6中黑点的分布代表原始信号频带的分布情况,从图中可以观察到EWT方法能较清楚的分离出几个主要的频带,图中黑点分布层次较分明,然而在EMD方法所显示的频带较EWT显得模糊不清,高频段黑点分布无层次感,而低频段为残余分量却细分为多个层次,很难区分各个主要的频带。反映出EMD得到的IMFs不是单一成分。根据实测数据进一步说明了EWT在一定程度上减轻了EMD存在的模态混叠问题,验证了EWT在高压断路器振动信号时频分析中可以取得比EMD更好的效果。为了再进一步比较两种时频分析方法,根据第2节信号的特征提取步骤将做进一步识别比较,并选择SVM作为分类器。

4 多分类SVM及其参数设计

专家系统过于依赖先验知识,神经网络需要大量的训练样本,且容易陷入局部极值,遗传算法收敛结果稳定性差且容易早熟。而支持向量机[14-15]是一种基于统计学习理论的机器学习算法,是结构风险最小化的近似实现,能很好的解决小样本、非线性问题。SVM最初是为二分类问题设计的,对二分类SVM的最优分类超平面的讨论,可分为线性可分、线性不可分、非线性三种情况。处理多分类问题时,可以通过组合多个二分类器来实现多分类器的构造,常见的有“一对一”、“一对多”、“二叉树”等多分类SVM。

4.1 两类线性可分情况

图 7中黑点与白点代表两类样本,实线代表最优分类面,两根虚线分别过两类样本点中离最优分类面最近的点,且平行于最优分类面,两虚线之间的间隔称为分类间隔。所谓的最优分类线是指不仅能将样本无错误地分开,而且要使分类间隔达到最大。推广到高维空间,最优分类线就是最优分类面。

Download:
图 7 最优分类面示意图 Fig. 7 Diagram of the optimal classification surface

设线性可分样本(xi, yi), i=1, 2, …, n, xiRn, yi∈{-1, 1}是类别标号,n维空间中线性判别函数一般形式为g(x)=w·x+b,分类面方程为:w·x+b=0。将判别函数作归一化处理使得|g(x)|≥1,并且使离分类面最近的样本点满足|g(x)|=1,这样分类间隔就是2/‖w‖,要使其最大就是使‖w‖或‖w2最小。要使分类线对所有样本正确分类,则它应满足:

$ \begin{array}{*{20}{c}} {{y_i}\left[ {\left( {\mathit{\boldsymbol{w}} \cdot {\mathit{\boldsymbol{x}}_i} + b} \right)} \right] \ge 1,}&{i = 1,2, \cdots ,n} \end{array} $ (15)

使式(15)等号成立的样本点就是两根虚线所过的点,称这些点为支持向量,因为它们支撑了最优分类面。上述问题就可以建模成:在约束条件(15)下求‖w2最小,为此可以定义Lagrange函数:

$ L\left( {\mathit{\boldsymbol{w}},b,a} \right) = \frac{1}{2}\left( {\mathit{\boldsymbol{w}} \cdot \mathit{\boldsymbol{w}}} \right) - \sum\limits_{i = 1}^n {{a_i}\left\{ {{y_i}\left[ {\left( {\mathit{\boldsymbol{w}} \cdot {\mathit{\boldsymbol{x}}_i} + b} \right)} \right] - 1} \right\}} $ (16)

式中:ai>0为拉格朗日系数,分别对wb求偏导并令它们偏导等于0,可把原问题化为如下较简单的对偶问题:

在约束条件:

$ \left\{ \begin{array}{l} \sum\limits_{i = 1}^n {{a_i}{y_i}} = 0\\ {a_i} \ge 0,\;\;\;\;i = 1,2, \cdots ,n \end{array} \right. $ (17)

下求解

$ Q\left( a \right) = \sum\limits_{i = 1}^n {{a_i}} - \frac{1}{2}\sum\limits_{i,j = 1}^n {{a_i}{a_j}{y_i}{y_j}\left( {{\mathit{\boldsymbol{x}}_i} \cdot {\mathit{\boldsymbol{x}}_j}} \right)} $ (18)

的最大值。若ai*为最优解,则

$ {\mathit{\boldsymbol{w}}^ * } = \sum\limits_{i = 1}^n {a_i^ * {\mathit{\boldsymbol{x}}_i}} $ (19)

为最优分类面的权系数向量,是训练样本的线性组合。求解上述问题后得到最优分类函数:

$ \begin{array}{*{20}{c}} {f\left( \mathit{\boldsymbol{x}} \right) = {\mathop{\rm sgn}} \left( {{\mathit{\boldsymbol{w}}^ * } \cdot \mathit{\boldsymbol{x}} + {b^ * }} \right) = }\\ {{\mathop{\rm sgn}} \left( {\sum\limits_{i = 1}^n {a_i^ * {y_i}\left( {{\mathit{\boldsymbol{x}}_i} \cdot \mathit{\boldsymbol{x}}} \right)} + {b^ * }} \right)} \end{array} $ (20)

式中:sgn为符号函数,b*是分类的阈值,x为待分类样本,xi为训练样本,对于不是支持向量的点xi=0,故式(20)只对支持向量进行。

4.2 线性不可分情况

线性不可分情况下,某些训练样本不满足式(15),因此在条件中加入松弛项εi≥0,式(15)则变为

$ \begin{array}{*{20}{c}} {{y_i}\left[ {\left( {\mathit{\boldsymbol{w}} \cdot {\mathit{\boldsymbol{x}}_i} + b} \right)} \right] \ge 1 - {\varepsilon _i},}&{i = 1,2, \cdots ,n} \end{array} $ (21)

且求‖w2的最小值将变为

$ \varphi \left( {\mathit{\boldsymbol{w}},\varepsilon } \right) = \frac{1}{2}\left( {\mathit{\boldsymbol{w}} \cdot \mathit{\boldsymbol{w}}} \right) + C\sum\limits_{i = 1}^n {{\varepsilon _i}} $ (22)

的最小值。这里C为惩罚系数,控制着对错份样本惩罚的程度。用与求解线性可分样本的同样方法,可以得到其结果与式(17)~(20)几乎一样的结果,只是式(17)的条件中,ai≥0, i=1, 2, …, n变为

$ 0 \le {a_i} \le C,i = 1,2, \cdots ,n $ (23)
4.3 非线性情况

通过非线性变换将输入空间变换到一个高维空间,然后在这个新空间求取最优线性分类面,而这种非线性变换则通过适当的内积函数实现。通常用径向基内积函数:

$ K\left( {{\mathit{\boldsymbol{x}}_i} \cdot \mathit{\boldsymbol{x}}} \right) = \exp \left( { - \frac{{{{\left\| {{\mathit{\boldsymbol{x}}_i} -\mathit{\boldsymbol{x}}} \right\|}^2}}}{{2{g^2}}}} \right) $ (24)

且此时相应的判别函数变为

$ f\left( x \right) = {\mathop{\rm sgn}} \left( {\sum\limits_{i = 1}^n {a_i^ * {y_i}K\left( {{\mathit{\boldsymbol{x}}_i} \cdot \mathit{\boldsymbol{x}}} \right)} + {b^ * }} \right) $ (25)

这就是SVM,即将式(20)中的xi·x变为K(xi·x),其中g为核函数参数, xi为训练样本, x为测试样本。

4.4 多分类SVM的选择

Libsvm默认提供了“一对一”多分类SVM,“一对一”的方式就是在每两个类别之间建立一个SVM分类器,这样k个类别就需要Ck2个分类器, 对未知样本分类时,投票最多的类别即为该未知样本的类别。在样本比较多的情况下此方法要训练k(k-1)/2个二分类SVM分类器,模型复杂,计算量大。而“一对多”的多分类SVM在训练时依次把某一个类别归为一类,剩余所有样本归为另一类,这样k个类别需要组合k个二分类SVM。“二叉树”的多分类SVM首先将所有样本分为两个子类, 然后再将这两个子类进一步分为两个次级子类,是一种“二叉树”的结构,通常两个子类的大小会采取“一对余”的分配方法, 这样k个类别每次可识别出一个类别,全部类别识别则需要组合k-1个二分类SVM。“二叉树”支持向量机的缺点是其性能受“二叉树”结构的影响,即每次分离出类别的次序对每个类别的分割区域大小有影响[2]。通常“二叉树”多分类SVM用的比较多,但考虑到其缺点,在小样本数据下, 可采用Libsvm的“一对一”多分类SVM。

4.5 SVM参数的优化思想

惩罚系数C与核函数参数g的选取将直接影响到分类器的性能,常采用网格搜索(GS)、启发式算法寻优。在海量数据下采用启发式寻优算法如PSO能提高模型的收敛速度,通过自适应更新粒子(这里粒子指SVM的内部参数点(C, g)。)的位置来寻找最优参数,而不必遍历所有的参数点。在小样本下,PSO的收敛速度优势较GS将不是很明显,并且PSO还容易陷入局部极值[9]

网格搜索法[16]是将Cg在一定范围内划分网格,通过遍历网格内所有的点(Cg)来找到最优参数组合。因而在大数据下GS方法将很费时,但通常能找到全局最优解。GS一般会结合k-CV来寻优参数,即在k-CV思想下采用GS搜索方法。k-CV是将原始训练样本集划分(通常是均分)为k个子集,让每个子集做一次验证集,其余k-1个子集作为训练集,这样会得到k个模型,用这k个模型的分类准确率的平均值作为此k-CV下分类器的性能指标。k-CV的优点在于可以避免模型过度拟合测试集数据,这是由于k-CV依靠的是训练集数据,而没有将测试集的分类准确率作为评价模型的标准。

5 分类结果与分析

对每种机械状态采集到的30组样本数据分别采用EWT与EMD方法分解,并提取信号特征。由于EMD分解的IMF分量在图 5中第6阶IMF分量的能量已很小(幅值不到1.5 V,频率也很小),于是只采用EMD分解的前5阶IMF做特征提取。表 2表 3中每种机械状态分别列举了4组EWT-特征熵与EMD-特征熵。随机的从特征向量中抽取80组做为训练集(每种状态20组),余下的40组做为测试集,并用k-CV再将测试集随机均分为4个子集,建立最优SVM分类器。最后以测试集的识别率、识别时间作为评价模型的性能指标。为了验证在小样本数据下模型EWT-GS-SVM的综合性能,在相同实验条件下采用EMD-GS-SVM与EWT-PSO-SVM模型做了对比试验。图 8(a)(b)分别采用GS、PSO两种参数寻优算法的寻优过程。

表 2 部分信号的特征熵(EWT) Tab.2 Characteristic entropy of partial signals (EWT)
表 3 部分信号的特征熵(EMD) Tab.3 Characteristic entropy of partial signals (EMD)
Download:
图 8 搜索最优参数 Fig. 8 Find the best parameters

其中图 8(a)寻优结果为:Cbest=22.884 5,gbest=0.999 86,采用交叉验证后训练集平均识别率为98.75%,测试集识别率为97.5%。图 8(b)寻优结果为:Cbest=0.435 28,gbest=12.125 7,用交叉验证后训练集平均识别率也为98.75%,测试集识别率为100%。可以看出PSO寻优能很快在第3代种群中出现最佳位置的粒子,即最优解(C, g),对应的适应度值为98.75%,而在随后的第121代粒子群中适应度值为100%,陷入了局部最优解,使得测试集的识别率并不是100%。网格搜索采用网格遍历所有的点(C, g)也能找最优的解。网格搜索方法往往是先在大范围内搜索最优解的范围,然后再精细的定位到最优解。采用EMD-GS-SVM模型的识别率如图 9, 可发现模型容易将正常与故障Ⅲ混淆,可知两种状态之间特征不明显,以至难以区分。最后将三种模型的综合表现总结如表 4所示。表中“识别时间”是指读取全部训练样本数据到识别出全部测试集数据的过程。在小样本数据下,GS寻优收敛速度慢的缺点并不明显,而PSO寻优随时可能寻找到局部最优解,使得测试集的识别效果达不到最佳识别率,具体的与PSO第一代粒子的初始值的设置有关。

Download:
图 9 EMD-GS-PSO模型识别结果 Fig. 9 Recognition results of EMD-GS-PSO model
表 4 模型性能比较 Tab.4 Comparison of model performance
6 结论

1) EWT能有效减轻EMD模态混叠的缺点,得到的特征比EMD明显,更适于非平稳信号的分析;

2) SVM不像神经网络需要大量的训练样本也能取得较好的识别效果,更适合高压断路器的故障诊断;

3) GS方法在高压断路器故障诊断的表现要优于PSO方法,且其更适合小样本数据下的参数寻优,不会有PSO寻优陷入局部极值的风险;

本研究描述了非平稳信号的时频分析方法与分类器模型的建立过程,取得了较好的故障识别效果,为高压断路器故障诊断提供了一种新思路。

参考文献
[1]
HUANG Jian, HU Xiaoguang, GENG Xin. An intelligent fault diagnosis method of high voltage circuit breaker based on improved EMD energy entropy and multi-class support vector machine[J]. Electric power systems research, 2011, 81(2): 400-407. DOI:10.1016/j.epsr.2010.10.029 (0)
[2]
唐发明, 王仲东, 陈绵云. 支持向量机多类分类算法研究[J]. 控制与决策, 2005, 20(7): 746-749, 754.
TANG Faming, WANG Zhongdong, CHEN Mianyun. On multiclass classification methods for support vector machines[J]. Control and decision, 2005, 20(7): 746-749, 754. DOI:10.3321/j.issn:1001-0920.2005.07.006 (0)
[3]
孙曙光, 于晗, 杜太行, 等. 基于多特征融合与改进QPSO-RVM的万能式断路器故障振声诊断方法[J]. 电工技术学报, 2017, 32(19): 107-117.
SUN Shuguang, YU Han, DU Taihang, et al. Vibration and acoustic joint fault diagnosis of conventional circuit breaker based on multi-feature fusion and improved QPSO-RVM[J]. Transactions of China electrotechnical society, 2017, 32(19): 107-117. (0)
[4]
李志农, 朱明, 褚福磊, 等. 基于经验小波变换的机械故障诊断方法研究[J]. 仪器仪表学报, 2014, 35(11): 2413-2432.
LI Zhinong, ZHU Ming, CHU Fulei, et al. Mechanical fault diagnosis method based on empirical wavelet transform[J]. Chinese journal of scientific instrument, 2014, 35(11): 2413-2432. (0)
[5]
黄南天, 张书鑫, 蔡国伟, 等. 采用EWT和OCSVM的高压断路器机械故障诊断[J]. 仪器仪表学报, 2015, 36(12): 2773-2781.
HUANG Nantian, ZHANG Shuxin, CAI Guowei, et al. Mechanical fault diagnosis of high voltage circuit breakers utilizing empirical wavelet transform and one-class support vector machine[J]. Chinese journal of scientific instrument, 2015, 36(12): 2773-2781. DOI:10.3969/j.issn.0254-3087.2015.12.017 (0)
[6]
向玲, 李媛媛. 经验小波变换在旋转机械故障诊断中的应用[J]. 动力工程学报, 2015, 35(12): 975-981.
XIANG Ling, LI Yuanyuan. Application of empirical wavelet transform in fault diagnosis of rotary mechanisms[J]. Journal of Chinese society of power engineering, 2015, 35(12): 975-981. DOI:10.3969/j.issn.1674-7607.2015.12.005 (0)
[7]
徐建源, 张彬, 林莘, 等. 能谱熵向量法及粒子群优化的RBF神经网络在高压断路器机械故障诊断中的应用[J]. 高电压技术, 2012, 38(6): 1299-1306.
XU Jianyuan, ZHANG Bin, LIN Xin, et al. Application of energy spectrum entropy vector method and RBF neural networks optimized by the particle swarm in high-voltage circuit breaker mechanical fault diagnosis[J]. High voltage engineering, 2012, 38(6): 1299-1306. (0)
[8]
贺国, 曹玉良, 明廷锋, 等. 基于改进倍频带特征的离心泵空化状态识别[J]. 哈尔滨工程大学学报, 2017, 38(8): 1263-1267, 1302.
HE Guo, CAO Yuliang, MING Tingfeng, et al. Cavitation state recognition of centrifugal pump based on features of modified octave bands[J]. Journal of Harbin Engineering University, 2017, 38(8): 1263-1267, 1302. (0)
[9]
张海鹏, 韩端锋, 郭春雨. 改进PSO训练的BPNN方法的舰船主尺度建模[J]. 哈尔滨工程大学学报, 2012, 33(7): 806-810.
ZHANG Haipeng, HAN Duanfeng, GUO Chunyu. Modeling of the principal dimensions of large vessels based on a BPNN trained by an improved PSO[J]. Journal of Harbin Engineering University, 2012, 33(7): 806-810. DOI:10.3969/j.issn.1006-7043.201108006 (0)
[10]
GILLES J. Empirical wavelet transform[J]. IEEE transactions on signal processing, 2013, 61(16): 3999-4010. DOI:10.1109/TSP.2013.2265222 (0)
[11]
常广, 王毅, 王玮. 采用振动信号零相位滤波时频熵的高压断路器机械故障诊断[J]. 中国电机工程学报, 2013, 33(3): 155-162.
CHANG Guang, WANG Yi, WANG Wei. Mechanical fault diagnosis of high voltage circuit breakers utilizing zero-phase filter time-frequency entropy of vibration signal[J]. Proceedings of the CSEE, 2013, 33(3): 155-162. (0)
[12]
LIU Mingliang, WANG Keqi, SUN Laijun, et al. Fault diagnosis method of HV circuit breaker based on wavelets neural network[J]. The open automation and control systems journal, 2015, 7: 126-134. DOI:10.2174/1874444301507010126 (0)
[13]
孙来军, 胡晓光, 纪延超. 改进的小波包-特征熵在高压断路器故障诊断中的应用[J]. 中国电机工程学报, 2007, 27(12): 103-108.
SUN Laijun, HU Xiaoguang, JI Yanchao. Fault diagnosis for high voltage circuit breakers with improved characteristic entropy of wavelet packet[J]. Proceedings of the CSEE, 2007, 27(12): 103-108. DOI:10.3321/j.issn:0258-8013.2007.12.019 (0)
[14]
CHERKASSKY V. The nature of statistical learning theory[J]. IEEE transactions on neural networks, 1997, 8(6): 1564. DOI:10.1109/TNN.1997.641482 (0)
[15]
MOORTHY Y K, CHANDRAN P S, RISHIDAS S. Motor current signature analysis by multi-resolution methods using Support Vector Machine[C]//Proceedings of 2011 IEEE Recent Advances in Intelligent Computational Systems. Trivandrum, Kerala, India, 2011: 65-69. (0)
[16]
TAN Wenyi, SUN Laijun, YANG Fei, et al. Study on bruising degree classification of apples using hyperspectral imaging and GS-SVM[J]. Optik-international journal for light and electron optics, 2018, 154: 581-592. DOI:10.1016/j.ijleo.2017.10.090 (0)