基于改进CNN的阀门泄漏超声信号识别方法
宁方立1,2, 韩鹏程1,2, 段爽1,2, 李航1,2, 韦娟3    
1. 西北工业大学 机电学院, 西安 710072;
2. 东莞市三航军民融合创新研究院, 东莞 523808;
3. 西安电子科技大学 通信工程学院, 西安 710071
摘要

为了检测输气管道阀门泄漏,对改进AlexNet网络结构进行了研究,提出了基于改进卷积神经网络(CNN)的阀门泄漏超声信号识别方法.针对泄漏信号短时稳定的窄带线谱特征,从图像邻域信息密度角度出发,将卷积核形状由图像识别领域通常使用的"正方形"改进为"扁横状".同时,对AlexNet层数进行优化,重新确定卷积核和全连接层神经元数目,并选择小尺寸卷积核,在减少参数量的同时增加网络容量和模型复杂度,防止模型出现过拟合.分别建立二分类和不同泄漏量下的多分类模型,通过输气管道实验平台采集阀门泄漏数据集,生成对应时频图样本,包括不同阀门开度、不同管道压力下的泄漏及背景声信号.结果表明,对比传统的CNN分类模型,改进CNN分类模型在测试集上取得了更高的识别性能.

关键词: 卷积核     短时傅里叶变换     卷积神经网络     阀门     泄漏检测    
中图分类号:TP391 文献标志码:A 文章编号:1007-5321(2020)03-0038-07 DOI:10.13190/j.jbupt.2019-127
Identification Method of Valve Leakage Ultrasonic Signal Based on Improved CNN
NING Fang-li1,2, HAN Peng-cheng1,2, DUAN Shuang1,2, LI Hang1,2, WEI Juan3    
1. School of Mechanical Engineering, Northwestern Polytechnical University, Xi'an 710072, China;
2. Dongguan Sanhang Civil-military Integration Innovation Institute, Dongguan 523808, China;
3. School of Telecommunications Engineering, Xidian University, Xi'an 710071, China
Abstract

In order to detect valve leakage in gas pipelines, an improved AlexNet network architecture is studied, an ultrasonic signal recognition method for valve leakage based on an improved convolutional neural network (CNN) is proposed. Due to short-term and narrow-band line spectrum features of the leakage signals, the "square" convolution kernel, commonly used in image recognition, is changed to "flat" based on the perspective of image neighborhood information density. At the same time, the AlexNet layers are optimized, the number of convolution kernel and neurons in the fully connected layers are re-determined, and the small-scale convolution kernel is selected to increase the network capacity and model complexity while reducing the number of parameters to prevent model overfitting. The two-class and multi-class models with different leakages are established respectively, and the data set is collected through experiments to generate corresponding time-frequency diagram samples as well, including leakage signals at different valve openings and pipeline pressures and background acoustic signals. It is shown that the improved CNN classifier achieves higher recognition performance on the test set than the traditional CNN classifier.

Key words: convolution kernel     short-time Fourier transform     convolutional neural network     valve     leakage detection    

高压输气管道阀门在使用过程中会受到气体压力、温度和振动腐蚀影响,不可避免地产生泄漏,造成重大经济损失和人员伤亡.目前,输气管道气体泄漏检测技术的研究对于防止阀门泄漏事故发生具有重大工程意义[1-3].其中,音波法[4]具有不受限于气体类型、灵敏度高等优点,可在线连续地检测管道运行状态.但是音波法采集的信号频率在可听声范围内,容易受到其他环境声信号干扰而发生虚警.超声检测法[5]使用38~42kHz频带范围内的声压幅值阈值作为泄漏发生的判别准则,该方法使用的超声波检测设备已商业化,但其效率低、实时性差.阀门气体泄漏还会在空气中产生不同于环境背景声的宽频超声信号,可用于对阀门泄漏进行识别.

卷积神经网络(CNN, convolutional neural network)是一种有监督的深度学习算法,广泛应用于语音识别、文本分类、图像处理等领域[6].随着深度学习不断发展,基于CNN的智能故障诊断[7]逐渐成为设备状态监测研究主流,因此可以应用CNN对阀门气体泄漏产生的超声信号进行特征提取,识别出泄漏源. CNN中卷积核通过模拟人类视野感受野,依次与输入不同位置的图像块做卷积提取特征,基于邻域信息密度假设,卷积核形状一般设计为“正方形”,如AlexNet[8]和VGGNet[9]等经典网络均采用n×n的卷积核提取特征,n为卷积核尺寸.目前,一些学者对卷积核尺寸大小和模型性能之间的关系做了研究. Simonyan等[9]通过反复堆叠3×3小尺寸卷积核,减少参数的同时增加了网络深度,提高了模型性能;Szegedy等[10]提出将大尺寸卷积核分解为小尺寸卷积核,减小运算量,加速模型训练.

笔者在对AlexNet网络结构优化的基础上,提出对卷积核形状进行改进,更好地提取阀门气体泄漏超声信号时频域特征,建立基于改进CNN的阀门气体泄漏超声信号分类模型.通过和传统基于“正方形”卷积核的CNN分类模型进行比较,验证基于“扁横状”卷积核的CNN分类模型在阀门气体泄漏超声信号识别方面的优势.

1 阀门泄漏超声信号表征

短时傅里叶变换(STFT, short-time Fourier transform)通过时频联合分析,将阀门气体泄漏信号转化为保留了原始时频域信息的二维时频图.

STFT将原始时域信号和窗函数相乘,进行一维傅里叶变换,通过窗函数的滑动得到一系列傅里叶变换结果,具体运算为

$ {{\mathop{\rm STFT}\nolimits} _z}(t, f) = \int_{ - \infty }^\infty {\left[ {z(t)g(t - \tau ){{\rm{e}}^{ - {\rm{j}}2\pi ft}}{\rm{d}}t} \right]} $ (1)

其中:z(t)为原始信号,g(tτ)为中心位于τ时刻的窗函数.

在STFT过程中,窗函数长度和窗口重叠宽度决定了时间分辨率和频率分辨率,具体运算为

$ T = \left\lfloor {\frac{{{N_x} - {N_0}}}{{{N_w} - {N_0}}}} \right\rfloor $ (2)
$ F=\left\{\begin{array}{ll} \frac{N_{w}}{2}+1, & N_{w} \text { 是偶数 } \\ \frac{N_{w}+1}{2}, & N_{u} \text { 是奇数 } \end{array}\right. $ (3)

其中:T为时间分辨率,F为频率分辨率,$\left\lfloor \cdot \right\rfloor $表示向下取整运算,Nx为参与STFT的样本长度,Nw为窗函数长度,N0为窗口重叠宽度.

将时频图分辨率P定义为

$ P=T \times F $ (4)

P值大小即是CNN分类模型输入特征图的大小.通过阀门气体泄漏超声信号样本长度选择合适的窗长和窗口重叠长度,可以更清晰地表征出其时频域信息.图 1所示为阀门气体泄漏超声信号时频图.分析可知,在20~40kHz超声频率段内,原始信号被表征为具有窄带线谱特征的时频图.在不同管道压力和阀门开度泄漏条件下,同样频率位置也存在类似的呈横向纹理的窄带线谱特征.

图 1 阀门气体泄漏超声信号时频图
2 改进CNN的信号分类模型 2.1 改进卷积核的CNN

CNN在图像处理方面有很大优势,卷积层可以对阀门气体泄漏超声信号特征进行自适应提取.假设第l层为卷积层,第l-1层为池化层或输入层,则

$ x_{n}^{l}=f\left(\sum\limits_{m} x_{m}^{l-1} \otimes k_{m, n}^{l}+b_{n}^{l}\right) $ (5)

其中:xnl为第l层输出的n个特征图,xml-1为第l层输入的m个特征图,k为卷积核,b为偏置项,$ \otimes $表示卷积操作,f(·)为激活函数.

卷积核尺寸大于1×1时,提取特征需要邻域信息.在图像识别任务中,通常提取的纹理种类比较丰富,横向邻域信息密度和纵向邻域信息密度相当,因此卷积核形状设计为“正方形”.而阀门气体泄漏超声信号时频图呈横向纹理的窄带线谱特征,横向邻域信息密度比纵向邻域信息密度高,因此,笔者提出采用“扁横状”卷积核进行阀门气体泄漏超声信号特征提取.即每一个卷积层中,卷积核在特征图频域上的尺寸要小于在时域上的尺寸.

CNN以损失函数作为误差,采用误差反向传播和优化算法最小化损失函数更新卷积层和全连接层的权重和偏置值,建立分类模型.

选择交叉熵函数作为损失函数,定义为

$ L = - \sum\limits_{i = 1}^N {{y_i}} \lg {{\hat y}_i} + \left( {1 - {y_i}} \right)\lg \left( {1 - {{\hat y}_i}} \right) $ (6)

其中:N为某批次样本数,yi为真实的类别标签,$ \hat{y}_{i}$为预测的类别概率值.

2.2 分类模型建立

在参考AlexNet等经典网络设计思路基础上,对模型超参数调整,通过多次预训练确定卷积层和池化层中的核尺寸和数目、全连接层的神经元数目和层数,建立基于CNN的阀门气体泄漏超声信号分类模型.具体结构如表 1所示.

表 1 “扁横状”卷积核的CNN分类模型结构

3个卷积层中,“扁横状”卷积核在时域和频域使用不同尺寸,分别为5×3、3×1和3×1.这样一种小尺寸卷积核处理参考了VGGNet设计思路:减小卷积核尺寸,增加网络容量和模型复杂度. Conv-1层卷积核滑动步长和卷积核尺寸保持一致,有效地减小输出特征图尺寸,并选择Relu函数[11]作为激活函数.

为了更多地保留输入层纹理信息,采用最大池化[12]进行池化操作. 3个池化层中,池化核尺寸均为3×3.同样地,池化核滑动步长和尺寸保持一致,因此输出特征图尺寸为原来的1/3.

卷积层和池化层进行特征提取和降维,观察输出特征图的尺寸,当Pool-3层输出特征图的尺寸为4×7×64时,不再加深卷积层和池化层,而是把4×7×64的二维特征图拉伸为一维向量和全连接层连接.

设计2个全连接层,第1个全连接层把提取的局部特征通过权值矩阵重新组合,第2个全连接层输出预测的类别.

2.3 信号识别流程

基于CNN的阀门气体泄漏超声信号识别方法将原始信号表征、特征提取和识别统一到1个框架下,如图 2所示.首先将样本划分为“泄漏”类和“正常”类,“泄漏”类包括输气管道各泄漏条件下的实验样本,“正常”类包括实验室环境背景样本,对“泄漏”类样本和“正常”类样本进行STFT得到时频图,建立输气管道阀门气体泄漏数据集.数据集划分为训练集、验证集和测试集,将训练集输入基于“扁横状”卷积核的CNN中,不断地更新权重和偏置值学习阀门气体泄漏超声信号特征,根据验证集结果对模型超参数进行调整,多次预训练后建立最优分类模型,通过计算测试集在最优分类模型上的指标,评估模型性能.

图 2 阀门气体泄漏超声信号识别方法流程
3 实验及结果分析 3.1 阀门泄漏频谱分析

在实验室搭建阀门气体泄漏实验平台,如图 3所示.实验平台主要针对次高压燃气管道,设计管道最大压力为1.2MPa.

图 3 阀门气体泄漏实验平台

主管道和支管道末端装有6个法兰球阀,实验时手动打开法兰球阀至某一开度,模拟不同位置、不同流量的泄漏,流量计记录阀门气体泄漏过程中流量大小.通过实验室已有的16通道超声传声器阵列采集信号,采样频率为96kHz.

图 4(a)为流量在0.4m3/h时,不同管道压力下阀门气体泄漏超声信号频谱图.图 4(b)为管道压力在0.7MPa时,不同阀门开度下阀门气体泄漏超声信号频谱图,以流量计显示流量表示阀门开度大小.为了消除可听声范围内环境噪声的影响,只对20~40kHz超声频率段进行分析.

图 4 阀门气体泄漏实验频谱分析

图 4可知,管道压力和阀门开度越大,泄漏流量越大,泄漏产生的超声信号声压级幅值越大.在不同管道压力、阀门开度下,虽然声压级幅值大小不同,但频谱基本走势相同,表现出超声锁频特性.

3.2 数据集建立

利用STFT对样本长度为1s的阀门气体泄漏超声信号进行表征,选择窗长为1024个采样点,窗口重叠宽度为838个采样点,根据式(4)得到分辨率为513×513的时频图.图 5为流量在0.4m3/h、管道压力在0.7MPa条件下阀门气体泄漏和某时刻实验室环境超声信号时频图.

图 5 阀门气体泄漏和实验室环境超声信号时频图

由3.1小节频谱分析和图 5(a)可知,阀门气体泄漏超声信号在频域上主要包括宽带连续谱和窄带线谱,宽带连续谱声压级幅值会随着不同泄漏条件发生变化,但是幅值较高的窄带线谱出现位置是一样的,而在时域上窄带线谱具有连续性,贯穿了整个短时域. “扁横状”卷积核CNN分类模型可以提取这种稳定的窄带线谱进行识别.

图 5(b)可知,虽然可听声范围内实验室环境声已经被截掉,但是在20~40kHz超声频率段内,由于电路噪声和其他环境中超声信号的影响,在时频图上会存在窄带线谱噪声,这些噪声具有时变性和不稳定性,对模型的抗干扰能力有了更高要求.

分别采集6个法兰球阀在阀门开度为0.4m3/h、0.2m3/h、0.15m3/h,管道压力为0.9MPa、0.7MPa、0.5MPa下的泄漏信号,进行时频图表征作为“泄漏”类样本,采集不同时刻实验室环境声作为“正常”类样本,构建输气管道阀门气体泄漏数据集.数据集包括7970(4208个“泄漏”类和3762个“正常”类)个训练集样本,以及同分布的500个验证集样本和1500个测试集样本.其中,训练集和验证集包含5个阀门的泄漏数据,测试集包含另外1个阀门的泄漏数据,可以有效地评估模型泛化能力.保证训练集、验证集和测试集无交叉,处理的为非同批次数据集样本.

3.3 性能对比分析

为了验证“扁横状”卷积核CNN分类模型在阀门气体泄漏超声信号识别方面的优势,建立传统“正方形”卷积核的CNN分类模型进行比较.除了每一个卷积层中均采用3×3的“正方形”卷积核,其他结构参数和基于“扁横状”卷积核的CNN分类模型设计思路一致.

图 6(a)(b)分别为训练集在2个CNN分类模型上损失函数和准确率随训练步数变化的情况.

图 6 训练集在2个CNN分类模型上的训练过程

图 6可知,在“扁横状”卷积核作用下,训练步数增加到5456步时,模型收敛;在“正方形”卷积核作用下,训练步数增加到3534步时,模型收敛.此时,2个模型的损失函数稳定在0.05左右,准确率稳定在97%左右.

分别计算测试集在2个分类模型上的指标,如表 2所示.

表 2 CNN分类模型性能比较

相比于传统“正方形”卷积核的CNN分类模型,在“扁横状”卷积核作用下,召回率由0.947提高到1.000,而精度由1.000下降到0.988,但是精度和召回率的调和平均数F1-score由0.973提高到0.994,模型性能有了很大提高.

虽然在“扁横状”卷积核作用下,CNN分类模型虚警率由0上升到0.018,但是漏警率由0.053下降到0,这也更加满足实际工程需要,因为发生漏警的代价更大.除此之外,测试集识别准确率由96.90%提高到99.25%.因此,通过设计“扁横状”卷积核,能更好地学习到阀门气体泄漏超声信号窄带线谱特征.

表 3为2个CNN分类模型训练过程、测试过程和识别过程的计算时间对比.其中,测试过程即计算测试集准确率和F1-score,识别过程是对单个样本识别,判断其是“泄漏”类还是“正常”类.

表 3 CNN分类模型的计算效率对比

在训练过程中,“扁横状”卷积核的CNN分类模型用时2897s,“正方形”卷积核的CNN分类模型用时1967s.前者在提高模型性能的同时,牺牲了计算效率.

在测试过程中,“扁横状”卷积核和“正方形”卷积核的CNN分类模型用时都在8.6s左右,同样地,在识别过程中2个模型用时都在2.7s左右.因为测试过程和识别过程都是加载训练好的模型,通过一次前向传播输出测试结果和识别结果,其计算效率主要和计算机性能有关.

在实际的阀门气体泄漏检测中,训练过程和测试过程都是离线完成的,应该以识别过程时间作为评价CNN分类模型计算效率的标准.即2个模型对单个样本识别时间基本一样,均在2.7s左右.

3.4 多分类模型建立

对所建立的数据集重新划分为6个类别,包括0.5、0.4、0.3、0.2、0.15m3/h不同流量下泄漏和背景声信号.分别将“扁横状”卷积核和“正方形”卷积核作用在重新划分的数据集上,对模型超参数调整,建立基于CNN的阀门气体泄漏超声信号多分类模型.

图 7(a)7(b)分别为训练集在2个CNN多分类模型上损失函数和准确率随训练步数变化的情况.

图 7 训练集在2个CNN多分类模型上的训练过程

图 7可知,在“扁横状”卷积核作用下,训练步数增加到16306步时,模型收敛;在“正方形”卷积核作用下,训练步数增加到14880步时,模型收敛.此时,2个模型的损失函数稳定在0.15左右,准确率稳定在95%左右.

分别计算测试集在2个多分类模型上的总体识别准确率和每一类的识别准确率,如表 4所示.

表 4 CNN多分类模型的识别准确率比较 

相比于二分类模型,多分类模型识别准确率有所降低.因为不同管道压力和阀门开度下,阀门气体泄漏超声信号的多分类是一种细粒度分类,类别数更多,分类情况更复杂.

在“扁横状”卷积核作用下,虽然无法提高每一类的识别准确率,但是总体识别准确率由92.49%提高到94.56%,因此在二分类模型和多分类模型中,“扁横状”卷积核都能更好地学习到阀门气体泄漏超声信号窄带线谱特征.

4 结束语

通过分析不同管道压力和阀门开度下阀门气体泄漏超声信号的频谱特点,利用STFT对其进行表征.针对阀门气体泄漏超声信号时频域特征,提出对AlexNet网络结构进行优化,对卷积核形状进行改进,建立改进CNN的分类模型对阀门气体泄漏超声信号进行识别,得出以下结论.

1) 阀门气体泄漏超声信号具有短时稳定的窄带线谱特征,基于STFT的方法能够很好地对其进行时频图表征.

2) 相比于传统“正方形”卷积核,“扁横状”卷积核的CNN分类模型可以有效地提取阀门气体泄漏超声信号窄带线谱特征.测试集在“扁横状”卷积核的CNN二分类和多分类模型上,取得了更高的识别性能,为输气管道阀门气体泄漏检测领域提供了一种高识别率的新方法.

参考文献
[1]
Murvay P S, Silea I. A survey on gas leak detection and localization techniques[J]. Journal of Loss Prevention in the Process Industries, 2012, 25(6): 966-973. DOI:10.1016/j.jlp.2012.05.010
[2]
Sheltami T R, Bala A, Shakshuki E M. Wireless sensor networks for leak detection in pipelines:a survey[J]. Journal of Ambient Intelligence and Humanized Computing, 2016, 7(3): 347-356. DOI:10.1007/s12652-016-0362-7
[3]
Liu Cuiwei, Li Yuxing, Yan Yukun, et al. A new leak location method based on leakage acoustic waves for oil and gas pipelines[J]. Journal of Loss Prevention in the Process Industries, 2015, 35: 236-246. DOI:10.1016/j.jlp.2015.05.006
[4]
刘翠伟, 李雪洁, 李玉星, 等. 基于音波法的输气管道泄漏检测与定位[J]. 化工学报, 2014, 65(11): 4633-4642.
Liu Cuiwei, Li Xuejie, Li Yuxing, et al. Leak detection and location for natural gas pipelines based on acoustic waves[J]. Journal of Chemical Industry and Engineering, 2014, 65(11): 4633-4642.
[5]
Liao Pingping, Cai Maolin. Study on compressed air leak detection using ultrasonic detection technology and instrument[C]//Conference on Industrial Electronics and Applications. Beijing: IEEE, 2011: 1690-1693.
[6]
Zhou F, Jin L, Dong J. Review of convolutional neural network[J]. Chinese Journal of Computers, 2017, 40(6): 1229-1251.
[7]
Lu Chen, Zhou Bo, Wang Zhenya. Intelligent fault diagnosis of rolling bearing using hierarchical convolutional network based health state classification[J]. Advanced Engineering Informatics, 2017, 32(2): 139-151.
[8]
Krizhevsky A, Sutskever I, Hinton G E, et al. Imagenet classification with deep convolutional neural networks[J]. Communications of the ACM, 2017, 60(6): 84-90. DOI:10.1145/3065386
[9]
Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition[C]//Computer Vision and Pattern Recognition. Columbus: [s.n.], 2014: 1-14.
[10]
Szegedy C, Vanhoucke V, Ioffe S, et al. Rethinking the inception architecture for computer vision[C]//Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016: 2818-2826.
[11]
Nair V, Hinton G E. Rectified linear units improve restricted boltzmann machines[C]//International Conference on Machine Learning. Haifa: [s.n.], 2010: 807-814.
[12]
Boureau Y, Ponce J, Lecun Y, et al. A theoretical analysis of feature pooling in visual recognition[C]//International Conference on Machine learning. Haifa: [s.n.], 2010: 111-118.