文章快速检索  
  高级检索
K-均值聚类在CCERT系统流型辨识中的应用
李凯锋, 王保良, 黄志尧, 冀海峰, 李海青     
浙江大学 控制科学与工程学院 工业控制技术国家重点实验室, 杭州 310027
摘要: 流型是气水两相流的重要参数之一,对气水两相流的流动影响很大。基于电容耦合电阻层析成像(CCERT)系统,以水平管道气水两相流流型为研究对象,利用主成分分析(PCA)方法提取不同流型下采集到的电导率信息的主成分,消除不同电极对之间信号的冗余,进而结合K-均值聚类算法实现流型辨识。实验结果表明,该方法具有较高准确度,对于水平管道泡状流、层状流和环状流3种典型的气水两相流流型的静态辨识准确率可以分别达到97%、96%和99%,动态辨识准确率可以分别达到92%、90%和87%。
关键词: 气水两相流     CCERT系统     流型辨识     K-均值聚类     主成分分析(PCA)    
Application of K-means clustering in flow pattern identification of CCERT system
LI Kaifeng, WANG Baoliang, HUANG Zhiyao, JI Haifeng, LI Haiqing     
State Key Laboratory of Industrial Control Technology, College of Control Science and Engineering, Zhejiang University, Hangzhou 310027, China
Received: 2017-02-15; Accepted: 2017-04-24; Published online: 2017-06-07 10:09
Foundation item: National Natural Science Foundation of China (61371161)
Corresponding author. WANG Baoliang, E-mail:wangbl@zju.edu.cn
Abstract: Flow pattern is one of the most important parameters of gas-liquid two-phase flow and has great influence on the flow of gas-liquid two-phase flow. In this paper, gas-liquid two-phase flow patterns in a horizontal pipe are analyzed with capacitively coupled electrical resistance tomography (CCERT) system. Principal component analysis (PCA) method is used to extract the principal components of the electrical conductivity information under different flow patterns, and thus the redundancy of signal between different electrode pairs can be eliminated. The three flow patterns are recognized by using K-means clustering algorithm. The experimental results show that this method has high accuracy. The static identification accuracy for bubble flow, stratified flow and annular flow is 97%, 96% and 99%, respectively, and the dynamic identification accuracy is 92%, 90% and 87%, respectively.
Key words: gas-liquid two-phase flow     CCERT system     flow pattern identification     K-means clustering     principal component analysis (PCA)    

两相流广泛存在于航空航天、化工和石油等领域中,例如航空发动机轴承腔中的油液则是以油气两相流的形式存在,其流动状态对航空发动机的工作影响很大[1]。流型是影响两相流的流动特性和传热、传质性能的重要因素[2]。因此,对于两相流流型的准确辨识具有重要意义。

现有的两相流流型辨识方法大多基于图像重建法和目测法,图像重建耗时较长[3]而且精度较低,目测法容易受到观察者主观认识的影响。基于分类算法的两相流流型辨识方法可以回避图像重建和直接目测等方法的缺点,例如基于支持向量机[4]和人工神经网络[5]的气水两相流流型辨识方法,但是分类算法属于“有指导学习”的范畴,分类效果容易受到人为主观因素的影响。K-均值聚类算法是一种“无监督学习”算法,可以避免常规分类方法中人为选取分类代表点存在的主观性,同时避免图像重建带来的误差。电容耦合电阻层析成像技术是一种非接触式的多相流检测方法,可以有效避免传统电阻层析成像(Electrical Resistance Tomography, ERT)传感器电极与被测液体直接接触造成的电极极化和电化学腐蚀等现象。因此,本文基于电容耦合电阻层析成像(Capacitively Coupled Electrical Resistance Tomography, CCERT)系统,结合K-均值聚类算法实现气水两相流流型辨识。

实验基于12电极CCERT系统开展,以管道内的气液两相流为研究对象,利用主成分分析(Principal Component Analysis,PCA)方法对实验采集到的电导率信息进行PCA,提取主成分;然后利用K-均值聚类算法实现流型辨识。实验结果表明,该方法对水平管道泡状流、层状流和环状流的流型均具有较高的辨识准确度。

1 CCERT系统 1.1 CCERT系统结构

图 1所示,CCERT系统主要由CCERT传感器(包括绝缘管道和金属电极)、激励与检测模块、数据采集模块和上位机组成。其中激励与检测模块由正弦激励模块和相敏解调(Phase Sensitive Demodulation,PSD)模块[6]组成。当系统进行数据采集时,上位机首先发出采集命令,数据采集系统在接收到命令后控制正弦激励模块在激励电极上施加正弦激励信号,同时数据采集模块采集检测电极端相敏解调模块上的输出信号,经过信号放大、AD转换等处理之后以数据帧的形式发送到上位机并进行数据的后续处理工作[7]

图 1 CCERT系统结构图 Fig. 1 Structure diagram of CCERT system
1.2 CCERT传感器

CCERT技术是将电容耦合非接触电导检测(Capacitively Coupled Contactless Conductivity Detection,C4D)技术[8-9]与传统ERT技术相结合提出的新型非接触式多相流检测方法,CCERT传感器的结构如图 2所示,主要包括绝缘管道和等间距地紧贴在绝缘管道外壁的金属电极(电极编号1~12);图 3为其等效电路图,其中的电阻为传感器任意2个电极之间的被测液体的等效电阻,电容为各电极通过绝缘管壁与管道内被测液体耦合形成的耦合电容,通过在任意一个电极上施加正弦激励信号,同时在另外一个电极上检测流出的电信号,可以获得反映被测管道截面介质分布的一组电导率信息,采用相对激励模式一共可以获得66个反映管道截面介质分布的电导率信息,进而可以通过这66个电导率信息获取管道内的介质分布情况[10-11]

图 2 CCERT传感器结构示意图 Fig. 2 Structure diagram of CCERT sensor
图 3 CCERT传感器等效电路图 Fig. 3 Equivalent circuit diagram of CCERT sensor
2 主成分分析

PCA是数理统计分析、特征提取和数据降维的经典工具,其主要思想是通过分析各个变量之间的相关关系,用较少的新变量代替原来较多的变量,同时使较少的新变量尽可能多地包含原有变量的信息,从而达到数据简化和降维的目的[12-14]

由于CCERT系统的12个电极之间存在相关性,导致采集到的66个电阻值之间存在冗余,这不仅会增加计算的复杂度,而且还会对实验结果产生影响;因此,在进行聚类分析之前,先利用PCA方法对实验数据进行降维,消除信号间的冗余。

PCA的输入变量为系统采集到的66个电阻值构成的矩阵,通过线性变换矩阵lij(i=1, 2, …, 66;j=1, 2, …, 66),将输入变量矩阵X=(x1, x2, …, x66)转换为新变量矩阵Z=(z1, z2, …, z66),其中:

(1)

li(i=1, 2, …, 66)为X的相关矩阵R的特征向量,可以通过求解如下方程得到:

(2)

式中:I为单位矩阵;λi为对应于特征向量li的特征值。按照特征值由大到小进行排列λ1>λ2>…>λ66,则特征值λ1对应于第一主成分z1,满足z1=l1TX,以此类推。在实际操作时可以根据各个主成分的累积贡献率和实际需求进行选取,累积贡献率的计算公式为

(3)

计算时设定当ρ大于等于99%时,认为选取的主成分包含原有电阻值的绝大部分信息,则选取前m个新变量作为特征提取后的新数据[15],从而对电阻值进行降维,消除不同电极对之间信号的冗余,有效对数据进行简化。

3 K-均值聚类算法

聚类就是将物理或抽象对象的集合分成相似的对象类的过程,同一类的对象之间具有较高的相似性,而不同类的对象之间具有较高的相异性。在聚类中,因为预先不知道目标数据有关类的信息,所用的数据是没有类别的,所以聚类分析通常被称为“无监督学习”[16]

K-均值聚类算法是一种典型的聚类分析算法,它首先假定所有的数据对象可被分为k个类,根据最小距离原则将数据分配到k个类中,然后不断迭代计算各个类的新的聚类中心并依据新的聚类中心调整聚类情况,其收敛准则为误差平方和准则,其含义如下:

(4)

其中:

(5)

式中:Nx为第x个类Cx中的对象数目;mx为其均值;o为某个类中的所有对象。误差平方和J就是所有类中的各个对象与各自类均值间的误差平方和之和。

经过PCA处理之后得到的数据矩阵为Y=(y1, y2, …, yn)T(n×m)(n为数据组数,m为每组数据的个数,即提取的主成分数),Y中包含有k个待进行聚类分析的数据类,即kCx,将该矩阵作为K-均值聚类算法的训练集输入,先从中随机选取k组数据作为初始聚类中心点,经过迭代计算之后求取误差平方和J,当前后2次计算得到的J值之间的差值小于等于设定的误差容限ε时,算法收敛并停止迭代过程,否则进行下一次迭代[17-19]。其中ε的值根据实际需求选定,本实验中取ε= 0.01。当算法收敛时,得到的k个最终聚类中心点即为各流型的代表点,然后将待测试数据通过与训练集相同的变换矩阵lij进行线性变换之后,分别求取其与各个代表点之间的欧氏距离,并根据最小距离原则进行分类,从而实现流型辨识。

4 气水两相流流型辨识实验 4.1 静态实验

管截面流型辨识是气水两相流流型辨识的关键环节,其辨识效果直接影响流型辨识的准确度。由于管道内的两相流流型较易通过静态实验进行模拟,因此本文先进行两相流流型辨识静态实验,以验证所提出的流型辨识方法的可行性,再将该流型辨识方法应用于水平管道两相流流型辨识动态实验中。

气水两相流流型辨识静态实验在外径为50 mm、内径为47 mm的CCERT系统样机中进行,实验介质为自来水和空心有机玻璃管(模拟气相)。实验中将多根小管径的有机玻璃管置于传感器中,采用自来水填充有机玻璃管外壁与传感器内壁之间的空隙来模拟泡状流。通过水平放置传感器,调节传感器内部自来水的水面高度来模拟层状流。将一根大管径的有机玻璃管以轴线为中心放置在传感器内部,用自来水填充有机玻璃管外壁与传感器内壁之间的空隙来模拟环状流。

静态实验中分别采集了泡状流、层状流和环状流3种典型流型下的实验数据,图 4为根据不同流型下采集到的不同电极对之间的电阻值绘制的柱状图。由柱状图可知,不同流型下采集到的电阻值在数值大小和变化规律上存在明显的差异,表明不同流型下采集到的电阻值数据属于不同的“类”,可以采用聚类算法进行分析。

图 4 静态实验中不同流型下的电阻测量值 Fig. 4 Resistance measurement results under different flow patterns in static experiments

静态实验分别选取5种不同管径的细有机玻璃管模拟泡状流,5种不同管径的粗有机玻璃管模拟环状流,调节5种不同的水面高度模拟层状流,共得到不同流型下的静态实验数据15批,分别从得到的15批静态实验数据中各选取5组数据,组成训练集数据共75组,对其进行PCA降维之后,将得到的数据利用K-均值聚类算法进行聚类分析,得到各流型的代表点。由于待辨识的流型分为3类,所以在选取初始聚类中心点时取k=3。基于所得到的代表点,从训练集之外的数据中分别取3种流型下的待测实验数据各100组,经过线性变换之后,根据最小距离原则对其进行分类,得到的静态流型辨识结果如表 1所示。

表 1 K-均值聚类静态流型辨识结果 Table 1 Static flow pattern identification results of K-means clustering
流型测试组数正确组数准确率/%
泡状流1009797
层状流1009696
环状流1009999

表 1中两相流流型辨识的静态实验结果可知,该流型辨识方法对于管道内泡状流、层状流和环状流的静态流型辨识准确率可分别达到97%、96%和99%,具有较高的准确度,表明将该方法应用于气水两相流流型辨识中是可行的。

4.2 动态实验

利用浙江大学水平管道油气水多相流动实验平台进行气水两相流流型辨识动态实验,空气经过空压机送入管道,水通过水泵进入管道,二者在混相器中混合后送入测量管段,如图 5所示。测量管段前端安装有透明管段,可以通过高速摄影装置实时拍摄管道内流型。测量管段为外径50 mm的PVC管,管道外壁均匀安装有传感器阵列。在实验中通过调节气、水的分相流量,从而在管道中产生不同的流型,利用CCERT系统采集动态实验数据,同时使用高速摄影装置获得参考图像。

图 5 气水两相流动态实验装置实物图 Fig. 5 Picture of gas-water two-phase flow's dynamic experimental device

动态实验中分别采集了泡状流、段塞流、层状流和环状流4种典型流型下的实验数据并利用高速摄影装置拍摄参考图像。图 6(a)6(b)分别为不同流型的照片和管截面流型的示意图。图 7为根据不同流型下采集到的不同电极对之间的电阻值绘制的柱状图。由图 7可知,动态实验中不同流型下采集到的电阻值在数值和变化规律上同样存在明显差异。

图 6 流型照片和管截面流型示意图 Fig. 6 Photographs of different flow patterns and sketch map of different flow patterns at pipe section
图 7 动态实验中不同流型下的电阻测量值 Fig. 7 Resistance measurement results under different flow patterns in dynamic experiments

由于段塞流可以看做是泡状流和层状流交替出现的流型,所以在管道截面只存在泡状流、层状流和环状流3种典型流型[20]。实验中通过调节不同的气水流量,共得到动态实验数据25批,从采集到的每批动态实验数据中选取3组数据,组成训练集数据共75组,对其进行PCA降维之后,将得到的数据利用K-均值聚类算法进行聚类分析,得到各流型的代表点。由于待辨识的管截面流型分为3类,所以在选取初始聚类中心点时取k=3。基于所得到的代表点,分别取训练集之外的3种流型下的待测试实验数据各100组,经过线性变换之后,根据最小距离原则对其进行分类,得到的动态流型辨识结果如表 2所示。

表 2 K-均值聚类动态流型辨识结果 Table 2 Dynamic flow pattern identification results of K-means clustering
流型测试组数正确组数准确率/%
泡状流1009292
层状流1009090
环状流1008787

表 2中的流型辨识结果可知,该流型辨识方法对水平管道泡状流、层状流和环状流的动态流型辨识准确率分别可达到92%、90%和87%。其中环状流在静态流型辨识中的准确率高达99%,而在动态流型辨识中的准确率只有87%,其原因是在环状流动态实验中,气相流量很大,液相流量很小,导致实验管路内两相流的流动界面剧烈波动,流型不稳定,进而对采集到的实验数据产生影响,使采集到的实验数据中噪声点较多;而静态实验中对于环状流的模拟是将一根大管径的有机玻璃管以轴线为中心放置在传感器内部的,因此较为稳定,采集到的数据质量较好。实验中采用随机选取的方式选取初始聚类中心点,由于K-均值聚类算法的聚类效果受初始聚类中心点的选取影响较大,如果实验数据中噪声点较多,则会对聚类效果产生影响,从而导致环状流的静、动态流型辨识准确率差别较大。

需要说明的是,上述的流型辨识实验只针对于泡状流、层状流和环状流等典型流型进行,没有考虑非典型的流型,例如在管道截面上泡状流向层状流、层状流向环状流的过渡流型等。对于过渡流型的流型辨识仍有待于进一步研究。

5 结论

1) 基于CCERT系统,利用K-均值聚类算法可以实现对管道截面泡状流、层状流和环状流的静、动态流型辨识,具有较高准确度。

2) K-均值聚类算法还具有原理简单、实现容易、聚类效果好等优点,具有良好的应用前景。

参考文献
[1] FARRALL M, HIBBERD S, SIMMONS K, et al. Prediction of air/oil exit flows in a commercial aero-engine bearing chamber[J]. Proceedings of the Institution of Mechanical Engineers Part G:Journal of Aerospace Engineering, 2006, 220 (3): 197–202. DOI:10.1243/09544100JAERO40
[2] 李海青. 两相流参数检测及应用[M]. 杭州: 浙江大学出版社, 1991: 9-12.
LI H Q. Two-phase flow parameter measurement and applications[M]. Hangzhou: Zhejiang University Press, 1991: 9-12. (in Chinese)
[3] 张彦俊. 电阻层析成像图像重建及流型辨识[D]. 哈尔滨: 哈尔滨理工大学, 2011.
ZHANG Y J.Image reconstruction and flow regime identification of electrical resistance tomography[D].Harbin:Harbin University of Science and Technology, 2011(in Chinese). http://cdmd.cnki.com.cn/Article/CDMD-11914-1012256404.htm
[4] 孙斌, 周云龙. 基于支持向量机的气液两相流流型识别新方法[J]. 应用基础与工程科学学报, 2007, 15 (2): 209–216.
SUN B, ZHOU Y L. A novel identification method of gas-liquid two-phase flow regimes based on support vector machine[J]. Journal of Basic Science and Engineering, 2007, 15 (2): 209–216. (in Chinese)
[5] ROMAN A J, KREITZER P J, ERVIN J S, et al. Flow pattern identification of horizontal two-phase refrigerant flow using neural networks[J]. International Communications in Heat & Mass Transfer, 2016, 71 : 254–264.
[6] CHEN D X, YANG W Q, PAN M C. Design of impedance measuring circuits based on phase-sensitive demodulation technique[J]. IEEE Transactions on Instrumentation & Measurement, 2011, 60 (4): 1276–1282.
[7] WANG B L, HU Y Y, JI H F, et al. A novel electrical resistance tomography system based on C4D technique[J]. IEEE Transactions on Instrumentation & Measurement, 2013, 62 (5): 1017–1024.
[8] ZEMANN A J, SCHNELL E, VOLGGER D, et al. Contactless conductivity detection for capillary electrophoresis[J]. Analytical Chemistry, 1998, 70 (3): 563–567. DOI:10.1021/ac9707592
[9] JI H F, LI Z Z, WANG B L, et al. Design and implementation of an industrial C4D sensor for conductivity detection[J]. Sensors & Actuators A Physical, 2014, 213 : 1–8.
[10] 王保良, 张伟波, 黄志尧, 等. 电容耦合电阻层析成像传感器结构优化设计研究[J]. 传感技术学报, 2012, 25 (2): 206–211.
WANG B L, ZHANG W B, HUANG Z Y, et al. Optimum design for capacitively coupled electrical resistance tomography sensor configuration[J]. Chinese Journal of Sensors and Actuators, 2012, 25 (2): 206–211. (in Chinese)
[11] 王保良, 徐升继, 冀海峰, 等. 电容耦合电阻层析成像并行电阻测量原理研究[J]. 传感技术学报, 2013, 26 (5): 660–665.
WANG B L, XU S J, JI H F, et al. Research on parallel resistance measurement principle for capacitively coupled electrical resistance tomography[J]. Chinese Journal of Sensors and Actuators, 2013, 26 (5): 660–665. (in Chinese)
[12] HOTELLING H. Analysis of a complex of statistical variables into principal components[J]. Journal of Educational Psychology, 2010, 24 (6): 417–441.
[13] 赵广社, 张希仁. 基于主成分分析的支持向量机分类方法研究[J]. 计算机工程与应用, 2004, 40 (3): 37–38.
ZHAO G S, ZHANG X R. Research of support vector machine classified method based on principal component analysis[J]. Computer Engineering and Applications, 2004, 40 (3): 37–38. (in Chinese)
[14] 汪阳, 黄天戍, 杜广宇. 一种基于聚类和主成分分析的异常检测方法[J]. 计算机工程与应用, 2006, 42 (21): 21–24.
WANG Y, HUANG T S, DU G Y. An anomaly detection method based on clustering and principal component analysis[J]. Computer Engineering and Applications, 2006, 42 (21): 21–24. DOI:10.3321/j.issn:1002-8331.2006.21.006 (in Chinese)
[15] QIN S J, DUNIA R. Determining the number of principal components for best reconstruction[J]. Journal of Process Control, 2000, 10 (10): 245–250.
[16] 王丽珍. 数据仓库与数据挖掘原理及应用[M]. 北京: 科学出版社, 2005: 106-108.
WANG L Z. Theory and application of data warehouse and data mining[M]. Beijing: Science Press, 2005: 106-108. (in Chinese)
[17] 周爱武, 于亚飞. K-means聚类算法的研究[J]. 计算机技术与发展, 2011, 21 (2): 62–65.
ZHOU A W, YU Y F. The research about clustering algorithm of K-means[J]. Computer Technology and Development, 2011, 21 (2): 62–65. (in Chinese)
[18] 王涛, 陈国定, 张永红. 基于聚类分析的航空发动机轴承腔油气两相流型辨识[J]. 机械科学与技术, 2013, 32 (3): 328–332.
WANG T, CHEN G D, ZHANG Y H. The oil/air two phase flow pattern recognition in bearing chamber of aircraft engine based on clustering analysis[J]. Mechanical Science and Technology for Aerospace Engineering, 2013, 32 (3): 328–332. (in Chinese)
[19] 黄韬, 刘胜辉, 谭艳娜. 基于K-means聚类算法的研究[J]. 计算机技术与发展, 2011, 21 (7): 54–57.
HUANG T, LIU S H, TAN Y N. Research of clustering algorithm based on K-means[J]. Computer Technology and Development, 2011, 21 (7): 54–57. (in Chinese)
[20] 李霞. 基于数据挖掘的两相流参数测量新方法研究[D]. 杭州: 浙江大学, 2009.
LI X.Study on new measurement methods of two-phase flow parameters based on data mining[D].Hangzhou:Zhejiang University, 2009(in Chinese). http://cdmd.cnki.com.cn/Article/CDMD-10335-2010067774.htm
http://dx.doi.org/10.13700/j.bh.1001-5965.2017.0070
北京航空航天大学主办。
0

文章信息

李凯锋, 王保良, 黄志尧, 冀海峰, 李海青
LI Kaifeng, WANG Baoliang, HUANG Zhiyao, JI Haifeng, LI Haiqing
K-均值聚类在CCERT系统流型辨识中的应用
Application of K-means clustering in flow pattern identification of CCERT system
北京航空航天大学学报, 2017, 43(11): 2280-2285
Journal of Beijing University of Aeronautics and Astronsutics, 2017, 43(11): 2280-2285
http://dx.doi.org/10.13700/j.bh.1001-5965.2017.0070

文章历史

收稿日期: 2017-02-15
录用日期: 2017-04-24
网络出版时间: 2017-06-07 10:09

相关文章

工作空间