2. 中国石油大学(北京)机械与储运工程学院;
3. 中国石油大学(北京)理学院
2. College of Mechanical and Transportation Engineering, China University of Petroleum(Beijing);
3. College of Science, China University of Petroleum(Beijing)
0 引言
往复压缩机故障多发部位集中于动力传递部分、气体进出及密封部分和辅助部分[1]。气阀造成的压缩机故障比例高达36%[2]。气阀主要的故障形式有阀片断裂、阀片磨损及弹簧断裂等。
目前,针对压缩机气阀故障最有效的检测方法是分析振动信号,时域、频域及时频域分析方法是常用的分析手段。时域分析方法[3-4]直观地从波形上提取特征信息,却无法揭示频率内在规律;以傅里叶变换[5-6]为代表的频域分析方法揭示了时间与频率之间的规律,但不能恰当地反映非平稳信号特征;时频分析方法[7-13]是目前最常用的分析手段,包括短时傅里叶变换、维格纳-威尔分布、小波分析和经验模态分析等。这些方法都是基于整个数据时间点变换分析,忽略了某一小段数据变化规律,没有考虑其波形特征,不能有效提取特征。
针对以上不足,笔者提出了基于SAX[14]算法的特征提取方法。该特征提取方法首先对振动信号符号化近似表示,之后通过滑动窗口统计一定长度的符号串频数作为特征值,排列各个特征值得到向量,最后归一化,作为该数据样本的特征向量。该方法针对周期序列中一小段数据进行分析,描述其变化规律,挖掘内在信息,形成故障模态,然后对各类模态统计分析。从定性与定量2个角度有效提取了原始序列的变化趋势和信息特征,克服了现有方法的不足,同时实现了数据压缩,提高了运算效率。对油田现场往复压缩机气阀振动数据用提出的方法进行分析处理,提取出特征向量后输入网格优化的SVM分类器进行了训练分类,与基于信息熵的特征提取方法[14-17]进行对比,比较两者故障类型分类的准确率。结果表明,笔者提出的特征提取方法可以准确有效地提取故障特征,具有更高的故障识别率,基于SAX的往复压缩机气阀故障诊断方法具有可行性。所得结论可为压缩机气阀故障信号的进一步分析提供参考。
1 方法原理 1.1 符号聚合近似算法(SAX)SAX算法由J.LIN等[14]于2003年提出,作为一种符号化表示方法。其实现过程可以分为以下几步[18]:①时间序列标准化为均值为0、方差为1的序列,使其具有高斯分布特性;②利用滑动聚合近似方法(Piecewise Aggregate Approximation, PAA)把标准化后的序列划分为等长子序列,求出每段子序列的均值,由于标准化后的序列服从高斯分布,可以把序列对应的概率分布等面积划分;③对每个子序列区段用一个符号来编码,最后查找每个子序列均值所对应的区域,并用该区域对应的字符来代替这个子序列。
具体地,如图 1a所示,标准化后长度为N=128的时间序列应用PAA算法分成等长的16段,每段求均值,均值落在纵向的值域区间,每个区间用一个符号来表示。在图 1b中,整个区域在纵向分为4个区间,用符号a、b、c、d来表示,即符号集α=4,根据均值与符号对应关系,时间序列转化为符号序列“S=ddaaddaaddaadcab”。这样,长度为N=128的时间序列转换为长度为N/w=16的符号序列,在此过程中实现了数据压缩,提高了计算机运算效率。w为数据的压缩率,一般w < N,α与w的选择不固定,选取合适的参数组合,可以更准确地表示原始时间序列所含信息。
1.2 信息熵
信息熵[19]用来描述数据紊乱的程度。通过对信息熵的比较,可以判断时间序列间确定性程度的差异,信息熵为信号处理方法与信息论搭建了桥梁。
结合符号序列,计算长为l的符号串出现的概率p(l):
(1) |
对其求信息熵:
(2) |
式中:C(l)为符号串出现频数,N为符号序列长度,l为符号串长度。
2 提出方法 2.1 特征提取特征提取是状态监测与故障诊断的重要环节,好的特征提取算法可以快速有效地提取故障特征,准确表征故障状态。笔者基于SAX算法提出一种有效的特征提取方法。传感器获取振动数据后,截取定长的一段数据作为数据样本,为了消除变量间的量纲关系,使数据具有可比性的标准化指标,对数据进行标准化处理,先计算数据样本的标准差s与均值x。
(3) |
(4) |
式中:n是样本数据点数。
标准化之后的样本数据点可以表示为:
(5) |
机械设备故障信号往往表现出周期性,例如往复压缩机气阀故障信号随着活塞往复运动呈现周期性波形,并且同一设备不同类型的故障周期性波形各异。故障信号经过SAX算法处理为符号序列,符号序列也相应表现出周期性规律。图 2a为压缩机气阀某故障振动信号时域波形。从图可以看出,波形具有周期性特征,波形相似的这些段数据所蕴含的特征信息称之为故障模态。故障模态可以定性表示为符号串“cbd”。在一段故障数据中可以存在多个故障模态,不同故障类型故障模态不同,因此对应的符号串也不同。对于周期性故障信号来说,准确捕捉其符号序列的不同故障模态,就可有效地判断故障类型。进一步说,对不同的符号串进行定量分析,就可以分析设备故障类型。
令符号集合为γ=(a, b, c, d),对标准化后的数据样本SAX符号化表示,得到符号序列A。选取一定长度l的字符串作为研究对象,当l=2时,所有符号串集合可以表示为:
(6) |
当l=3时,所有符号串集合为:
(7) |
由此可推出,符号串个数β与符号集元素个数α、符号串长度l之间的关系为:
(8) |
设定l值,统计各个符号串出现的次数,构成向量c。例如在图 2b中,用长度l=2的窗口滑过符号序列,符号串aa、ba、bb出现次数分别为α1=0,α2=1,α3=1,统计结果构成向量c。
(9) |
此向量可以定量和定性地表征故障特征,因为特征需要机器学习算法进行训练分类。为了加快训练速度,保证所有特征的范围一致,加快收敛速度,对向量c归一化:
(10) |
(11) |
(12) |
(13) |
归一化后构成特征向量e,此向量作为该数据样本点的特征向量。
(14) |
该方法针对故障数据周期性特性,定性提取故障信号中故障模态,定量统计故障模态频数。从定性与定量2个角度有效分析了原始序列的变化趋势、信息特征,描述了一小段序列变化规律,捕捉不同数据波形特性,有效区分故障类型,克服了现有方法的不足。
2.2 基于SAX的机械故障诊断获得振动信号后,取一定长度数据作为样本,利用SAX算法对数据样本符号化近似表达:先对数据标准化,之后用滑动聚合近似算法对标准化后的数据等长划分;最后取每段的均值,用对应的符号来表示,这样振动数据就转换成了符号序列。之后按照上述提取特征的方法,选取一定的l值,对符号串出现的次数进行统计,数据归一化后得到特征向量。最后把特征向量输入参数优化SVM分类器进行训练分类,根据分类结果进行设备状态评估,诊断步骤如图 3所示。
3 应用实例
为了验证方法的有效性,用提出的方法对油田现场往复压缩机气阀振动信号进行分析。采用西部某油田Cooper公司生产的WH64型往复式压缩机,在2005年到2010年期间气阀正常、弹簧失效、阀片断裂及阀片磨损4种状态下采集的振动数据进行分析。4种状态时域图如图 4所示。压缩机额定功率为1 305 kW,额定转速为993 r/min,信号采集频率为16 kHz,数据样本长度为4 000点。每一类数据取20个样本作为训练集,20个样本作为测试集,共得到80个训练样本,80个测试样本。
利用SAX算法对提取的数据样本进行符号化处理,令α=2,w=2,l=2,提取出气阀4种状态部分特征向量,如表 1所示。
运行状态 | T1 | T2 | T3 | T4 |
1.000 | 0.206 | 0.000 | 0.214 | |
1.000 | 0.219 | 0.000 | 0.202 | |
气阀正常 | 1.000 | 0.211 | 0.000 | 0.206 |
1.000 | 0.214 | 0.000 | 0.219 | |
1.000 | 0.207 | 0.000 | 0.207 | |
1.000 | 0.559 | 0.030 | 0.563 | |
1.000 | 0.588 | 0.012 | 0.580 | |
弹簧失效 | 1.000 | 0.603 | 0.008 | 0.618 |
1.000 | 0.613 | 0.002 | 0.612 | |
1.000 | 0.558 | 0.006 | 0.566 | |
1.000 | 0.559 | 0.000 | 0.531 | |
1.000 | 0.525 | 0.000 | 0.531 | |
阀片断裂 | 1.000 | 0.580 | 0.000 | 0.530 |
1.000 | 0.658 | 0.000 | 0.554 | |
1.000 | 0.615 | 0.000 | 0.547 | |
1.000 | 0.648 | 0.000 | 0.634 | |
1.000 | 0.630 | 0.000 | 0.618 | |
阀片磨损 | 1.000 | 0.616 | 0.000 | 0.596 |
1.000 | 0.618 | 0.000 | 0.603 | |
1.000 | 0.620 | 0.000 | 0.605 |
共有160个样本,每个样本提取出的1个特征向量含有4个特征值,这样就构成160×4矩阵。对特征向量进行多维尺度分析(multidimensional scaling, MDS),4种状态数据聚类效果如图 5所示。
由图 5可以看出,不同运行状态的数据样本对应的特征向量得到了明显区分,测试样本被分为4类,符合4类气阀状态,说明提取的气阀特征向量具有很好的差异性。
接着,将160×4特征矩阵输入SVM分类器进行分类训练,输出结果如图 6a所示。由图可以看出,前20号样本被分为第1类,第21~40号样本被分为第2类,第41~60号样本被分为第3类,第61~80号样本被分为第4类,测试集被分为4类,测试集的实际分类与预测分类结果一致,准确率为100%。由此可见笔者提出的故障诊断方法能准确识别压缩机气阀故障模式。
通过计算每个符号串的概率,将式(1)和式(2)得出的样本信息熵值作为样本不同状态的特征值。部分特征值如表 2所示。
气阀正常 | 弹簧失效 | 阀片断裂 | 阀片磨损 |
0.145 | 0.180 | 0.148 | 0.160 |
0.148 | 0.170 | 0.144 | 0.157 |
0.143 | 0.184 | 0.148 | 0.163 |
0.145 | 0.172 | 0.145 | 0.155 |
0.146 | 0.181 | 0.148 | 0.161 |
0.146 | 0.189 | 0.140 | 0.155 |
0.151 | 0.183 | 0.140 | 0.158 |
0.153 | 0.180 | 0.141 | 0.154 |
0.150 | 0.182 | 0.142 | 0.157 |
0.149 | 0.178 | 0.141 | 0.155 |
为了进一步说明方法的优越性,用基于信息熵的特征提取方法对相同样本数据进行分析对比。结果如图 6b所示。由图可知,前20号、41~60号、61~80号样本分类错误个数分别为4、10和1个,分类准确率为81.25%。由此可见,笔者提出的方法可以有效提取故障特征,具有明显的优势。
故障信息往往具有周期性,转换后的符号序列也具有周期性特点。笔者提出的方法针对原始数据波形中多种故障模态进行捕捉分析,保留了各类符号串蕴含信息,得出多维的特征向量。本方法原理简单,计算高效,可以有效提取特征。而基于信息熵的特征提取方法对符号串统计数据进行简单代数运算,仅仅得出一个特征值,忽略了不同符号串蕴含信息的差异性。并且有可能在不同符号串统计数据情况下,得出相同的熵值,不能准确有效地反映原始序列信息。因此,笔者提出的方法比基于熵的特征提取方法更能准确捕捉不同状态下气阀数据信息,准确实现故障分类。
4 结论(1) SAX是一种符号化近似表达算法,分析发现SAX符号压缩后形成的符号序列,选取一定长度的符号串进行频率统计,可以很好地捕捉原始信号蕴含的变化规律和信息特征。
(2) 提出了一种基于SAX算法的故障特征提取方法。该方法能够准确有效地提取序列故障信息,优于基于信息熵的故障特征提取方法。
(3) 将SAX算法应用于故障诊断领域,可以有效识别往复压缩机气阀的运行状态。试验结果表明气阀运行状态分类准确率达到100%。
[1] |
毕文阳, 江志农, 刘锦南. 往复压缩机气阀故障模拟实验与诊断研究[J].
流体机械, 2013, 41(6): 6-10.
BI W Y, JIANG Z N, LIU J N. Research on reciprocating compressor valve fault simulation experiments and diagnosis[J]. Fluid Machinery, 2013, 41(6): 6-10. |
[2] | HEHENBER M, NILSSON J O. A stress analysis of bending fatigue specimens using the finite element method[C]. Indiana: Purdue University, 2003: 56-65. |
[3] |
王金福, 李富才. 机械故障诊断技术中的信号处理方法:时域分析[J].
噪声与振动控制, 2013(2): 128-132.
WANG J F, LI F C. Review of signal processing methods in fault diagnosis for machinery[J]. Noise and Vibration Control, 2013(2): 128-132. |
[4] | MARTIN H R. Statistical moment analysis as a means of surface damage detection[C]//Proceedings of the 7th International Modal Analysis Conference. Las Vegas, Nevada, USA, 1989: 1016-1021. |
[5] | TSE P W, PENG R Y, YAM R. Wavelet analysis and envelope detection for rolling element bearing for rolling element bearing fault diagnosis-their effectiveness and flexibilities[J]. Journal of Vibration and Acoustics, 2001, 123(3): 303-310. DOI: 10.1115/1.1379745 |
[6] |
杨梅, 张振文, 孙宏强, 等. 小波分析与傅里叶分析的比较及其在故障诊断中的应用[J].
中国测试技术, 2005, 31(2): 58-59, 61.
YANG M, ZHANG Z W, SUN H Q, et al. The comparison of wavelet and Fourier analysis and their application to fault diagnosis[J]. China Measurement Technology, 2005, 31(2): 58-59, 61. |
[7] |
钟先友. 旋转机械故障诊断的时频分析方法及其应用研究[D]. 武汉: 武汉科技大学, 2014. ZHONG X Y. Research on time-frequency analysis methods and its applications to rotating machinery fault diagnosis[D]. Wuhan: Wuhan University of Science and Technology, 2014. |
[8] |
肖瑛, 殷福亮. 解相关EMD:消除模态混叠的新方法[J].
振动与冲击, 2015, 34(4): 25-29.
XIAO Y, YIN F L. Decorrelation EMD:A new method of eliminating mode mixing[J]. Journal of Vibration and Shock, 2015, 34(4): 25-29. |
[9] |
杨仁树, 高祥涛, 车玉龙, 等. 基于HHT方法的爆炸应变波时频分析[J].
振动与冲击, 2014, 33(10): 17-21.
YANG R S, GAO X T, CHE Y L, et al. Joint time-frequency analysis of blast strain wave based on Hilbert-Huang Transform[J]. Journal of Vibration and Shock, 2014, 33(10): 17-21. |
[10] | WALKER R B, VAYANAT R, PERINPANAYAGAM S, et al. Unbalance localization through machine nonlinearities using an artificial neural network approach[J]. Mechanism and Machine Theory, 2014, 75: 54-66. DOI: 10.1016/j.mechmachtheory.2014.01.006 |
[11] | XIE H, LIN J, LEI Y G, et al. Fast-varying AM-FM components extraction based on an adaptive STFT[J]. Digital Signal Processing, 2012, 22(4): 664-670. DOI: 10.1016/j.dsp.2012.02.007 |
[12] | CHEN B H, WANG X Z, YANG S H, et al. Application of wavelets and neural networks to diagnostic system development, 1, feature extraction[J]. Computers & Chemical Engineering, 1999, 23(7): 899-906. |
[13] | YEN G G, LIN K C. Wavelet packet feature extraction for vibration monitoring[J]. IEEE Transactions on Industrial Electronics, 2000, 47(3): 650-667. DOI: 10.1109/41.847906 |
[14] | LIN J, KEOGH E, LONARDI S, et al. A symbolic representation of time series, with implications for streaming algorithms[C]//Proceedings of the 8th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery. San Diego, California: ACM, 2003: 2-11. |
[15] |
张雨. 汽油机瞬态排放量的符号树Shannon熵分析[J].
车用发动机, 2004(3): 26-31.
ZHANG Y. The analysis for transient exhaust of gasoline engine by the Shannon entropy of symbolic tree[J]. Vehicle Engine, 2004(3): 26-31. |
[16] |
王松岭, 许小刚, 刘锦廉, 等. 基于符号动力学信息熵与改进神经网络的风机故障诊断研究[J].
华北电力大学学报, 2013, 40(4): 51-58.
WANG S L, XU X G, LIU J L, et al. Fault diagnosis of fan based on symbolic dynamics entropy and improved neural network[J]. Journal of North China Electric Power University, 2013, 40(4): 51-58. |
[17] |
邬再新, 刘涛, 黄成东. 基于信息熵的涡旋压缩机振动信号分析[J].
振动、测试与诊断, 2014, 34(1): 168-172.
WU Z X, LIU T, HUANG C D. Analysis of vibration signals of scroll compressor based on information entropy[J]. Journal of Vibration, Measurement & Diagnosis, 2014, 34(1): 168-172. |
[18] |
何晓旭. 时间序列数据挖掘若干关键问题研究[D]. 合肥: 中国科学技术大学, 2014. HE X X. Research on key issues in time series data mining[D]. Hefei: University of Science and Technology of China, 2014. |
[19] |
谢平. 故障诊断中信息熵特征提取及融合方法研究[D]. 秦皇岛: 燕山大学, 2006. XIE P. Study on information entropy feature extraction and fusion methods in fault diagnosis[D]. Qinhuangdao: Yanshan University, 2006. |