内蒙古电力技术  2014, Vol. 32 Issue (4): 28-32,36   PDF    
数据挖掘技术在输电线路状态检修中的应用分析
郭雅丽, 赵宝柱, 罗畅    
华北电力大学经济与管理学院, 北京 102206
摘要:输电线路作为电网的重要组成部分,易受外界环境的影响而发生故障,严重威胁电网的安全运行。本文采用数据挖掘技术对输电线路的运行状态进行分析,建立基于主成分分析的输电线路状态评价的模型及以贝叶斯方法为基础的输电线路故障预测简要模型和基于聚类分析判别分析的线路检修策略选择模型,实现对输电线路的状态评估、故障诊断及检修策略的选择,为及时发现线路运行的异常状况,提高输电线路运行的安全可靠性提供技术手段。
关键词输电线路     数据挖掘     状态检修     状态评价     故障诊断    
Application Research of Data Mining in the Condition-based Maintenance of Transmission Line
Guo Yali, Zhao Baozhu, Luo Chang    
North China Electric Power University, Beijing 102206
Abstract:Transmission line as an important part of the grid is inclined to be affected by the external condition, which leads to the frequent failure and the serious threat to the power grid. So, this thesis analyzes the operating status of transmission line based on data mining method, and establishes the evaluation of operation state model based on principal component analysis, the fault diagnosis model based on bayesian methods and line maintenance strategy choice model based on cluster analysis and discriminant analysis. It can realize transmission line condition evaluation, fault diagnosis and maintenance strategy selection, timely detection of line operation potential risks, in order to take measures in advance.
Key words: transmission line     data acquisition     condition-based maintenance     state evaluation     fault diagnosis    
0 引言

近年来,信息技术飞速发展,各单位通过其内 部的业务处理系统、管理信息系统以及外部网络系 统积累了数量庞大且繁杂的数据,处理大数据的数 据挖掘技术应运而生。随着工业生产的复杂化、产 品的多样化以及人们对检修科学性认识的不断深 入,设备检修模式不断发展,状态检修已成为一种 新型的检修模式。在国家电网公司深入推进状态 检修和大力应用数据挖掘技术之际,将数据挖掘和 输电线路状态检修结合起来进行研究,具有重要的 现实意义和应用价值。 1 数据挖掘技术的功能及方法

数据挖掘旨在从大量不完全的、有噪声的且模 糊的随机数据中,提取隐含其中的、事先未知的而 又有潜在作用的信息和知识[1]1.1 数据挖掘的功能

数据挖掘所能发现的知识模式与其功能是密 切相关的。数据挖掘综合多门学科技术,其主要功 能如下[2]

(1)概念描述:通过比较、对比和分析某类对 象的属性数据,用简练概括的语言描述该对象的本 质含义;

(2)关联模式:在看似无关的大量数据中,发 现信息之间隐含的相关性;

(3)分类:把看似无规律的对象按照一定的规 则对其进行归类处理;

(4)聚类分析:按照分类的思想,利用不同计 算距离的算法,对研究对象进行划归聚集处理;

(5)预测:根据事物的过去和现在的状况推度 其未来发展趋势;

(6)时间序列:利用事物发展的连续性及不与 过去割裂发展的性质,推断事物未来的发展状况;

(7)偏差分析:探测数据现状、历史记录或标 准之间的显著变化和偏离情况,以发现隐含的有趣 知识。 1.2 数据挖掘的方法

数据挖掘的方法大致可以分为统计、机器学 习、神经网络和数据库。统计方法主要有回归分 析、判别方法、聚类分析、灰色统计法、模糊集等;机 器学习方法可细分为决策树、基于范例的推理、贝 叶斯方法等;神经网络方法包括前向神经网络法和 自组织神经网络法;数据库方法主要是多维数据分 析和面向属性的归纳方法。

本文采用的方法有主成分分析、贝叶斯分析、 聚类分析和判别分析[3]

主成分分析是在保证信息损失较少的前提下, 把多个指标变量转化为几个综合指标变量的统计 方法;贝叶斯方法是一种研究不确定性和非完整性 问题的决策方法,通过贝叶斯公式描述不确定性, 引用效用函数选择使期望效用最大的最优决策,实 现对不确定性问题的推理;聚类分析是依据分类思 想,研究归类问题的多变量统计方法;判别分析是 在已知类别的前提条件下,通过研究某一对象的多 个指标变量的特征,找出分类规则,进而判别新的 样品被分为何类的一种方法。其中,贝叶斯方法中 用到的贝叶斯概率公式如下:

式中x1,x2,…,xn —n个输入变量,它们可以是离散 分类型,也可以是连续数值型; y—分类型输出变量,有k个可能取 值,其取值集合记为y={y1,y2,…,yk}。 2 数据挖掘在输电线路状态检修中的方法

分析 输电线路的状态检修工作基本包括6个环节: 状态检测、状态评价、故障诊断、预测评估、风险评 价以及决策建议,每个环节都应依据相应的技术标 准和准则进行[4]。本文仅对状态评价、预测评估和 故障诊断3个环节可采用的数据挖掘方法进行分 析。 2.1 状态评价

输电线路状态评价是一项复杂的系统工程,涉 及多层次、多系统问题,它是借鉴以往发现的缺陷 和故障的经验,通过巡视检修、停电检查、带电测 量、在线监控等技术手段获取状态信息,依据相应 的数学模型对状态信息进行分析计算,最终得出线 路总体状态等级的过程[5-7]。 2.1.1 灰色评价法

灰色评价法的思想是以状态量与其组成要素 之间的层次结构为基础,根据少量的信息,运用灰 色理论构建完善的数学模型,得出对系统的总体评 价,同时还可以得出不同评价对象的排序。输电线 路的状态信息比较少且不容易获取,因此可利用灰 色评价法对输电线路的状态进行评价。评价后,可 以选择相应的检修策略。 2.1.2 贝叶斯网络法

贝叶斯网络法是人工智能领域不确定知识表 达和推理技术的主流方法,它将数学中的概率理论 与图论相结合,能较好地量化复杂系统中普遍存在 的不确定性因素。该网络可以得出更加精确的结 论,所建模型具有良好的智能性。 2.2 预测评估

输电线路预测评估主要是预测输电线路运行 状态的未来发展趋势,并根据预测结果确定是否调整线路的运行方式,或确定线路的检修时间、检修 类型及检修范围。输电线路预测评估基于状态评 价的预测。输电线路的预测状态量呈现一定的规 律性,在较短的时间内,变化量均不会太大。 输电线路的预测评估可以采用2种方式:一种 是对线路的整体状态分值进行预测,不再对单一预 测状态量进行预测计算;另一种是分别对预测状态 量进行预测,在其他状态量保持不变的情况下对线 路状态进行预测评估[8]。常用的预测模型有以下2 种。 2.2.1 时间序列预测模型

时间序列是社会经济现象或自然现象的某种 指标按照时间先后顺序排列的数字序列,包含2个 要素:对应的指标值及现象所具有的时间属性。 2.2.2 回归分析预测模型

回归分析预测方法是一种因果分析预测,分析 因变量与自变量之间的相互关系,并用回归方程表 示,根据自变量的数值变化预测因变量的数值变 化。 2.3 故障诊断

输电线路的故障诊断是通过对输电线路运行 中的状态量进行测量,判断故障原因和损伤程度, 确定缺陷部位。输电线路故障诊断的核心是掌握 线路状态量的变化、建立合理的数学模型和提出科 学的判断边界条件[9]。故障诊断主要有以下几种方 法。 2.3.1 故障树分析法

故障树分析法是通过对可能造成线路故障的 各种因素进行分析,再画出逻辑框图,从而确定故 障原因的发生概率及各种可能组合,并采取相应的 措施,以提高线路运行的可靠性。 2.3.2 人工神经网络分析法

人工神经网络是模仿人的大脑神经元结构特 性而建立的一种非线性动力学系统。它由大量简 单的非线性单元互联、并联而成,作为1种新的模式 识别技术方法,在故障诊断领域中有广阔的前景。 2.3.3 粗糙集故障诊断

粗糙集故障诊断方法不需要任何附加的数据 及初始信息,通过对不精确、不完整数据进行分析, 发现其中的特征关系,得到简明扼要的知识表达形 式[10]。利用粗糙集进行输电线路故障诊断时,先对 输电线路大量故障征兆及故障类型进行分析汇总, 以故障类型和故障征兆作为决策的基础;粗分故障 类型后,做出故障决策表,再运用粗糙集进行约简, 获得细分的诊断规则,形成相应的规则集;最后在 规则集中进行查询,得到细分诊断结论。 3 数据挖掘在输电线路状态检修中的应用

本文即采用相应的数据挖掘方法对线路进行 状态评价、故障预测及检修策略选择。 3.1 线路运行状态评价 3.1.1 状态评价方法

线路单元由8个单元模块构成,即基础、杆塔、 导地线、绝缘子、金具、接地装置、附属设施、通道环 境,分别表示为X1,X2,…,X8。依据国家电网发行 的《110(66)kV~500kV架空输电线路评价标准(试 行)》的内容[11],对每条线路的各个单元进行评分。 各个单元作为输电线路的属性变量,其评分即为属 性变量的属性值。运用主成分分析法来降低维数, 可得出各条线路的主成分得分,通过排序来确定线 路维修的重点。

各条线路各单元模块的得分是以权重得分率 来衡量的。得分率和标准分值的计算过程如下: 标准分值的计算以100分/百基为单位。首先 必须根据线路实际杆塔数量计算出各单元模块的 标准分值,即:

各单元模块标准分值=线路杆塔数量×100分/百基。 实际得分采用扣分形式来取得。评价标准中 各小项累加扣分,但累加扣分不得超过该项的标准 分值,即无负分。未参加评价的项目(即无相关内 容)以满分计入。各设备单元在线路评价中所占的 权重比例见表 1(总权重为100),其中杆塔、导地线、 通道环境为核心单元。

表 1 各单元模块权重

各单元模块得分率=(实际得分/标准分值)×100%;

各单元模块权重得分率=权重×(实际得分/标准分值)×100%。 3.1.2 状态评价实例

通过对运行检修班的巡检和检修记录、资料进 行分类和整理,根据线路各单元模块评价标准和评价内容,得出鄂尔多斯电业局15条线路的得分率情况,作为建立模型的源数据。建模工具采用IBM SPSS软件。源数据见表 2所示。

表 2 15条线路的得分情况

在软件中依次选择分析变量、成分抽取方法、 主成分选择原则、因子旋转方法和成分得分的特性 后,输出模型结果,如表 3—6所示。

表 3 标准化处理前、后公因子方差

表 3解释了主成分分析模型中从每个原始变量 中提取到的信息,并用方差来度量信息量的大小。 提取的方差越接近初始方差,说明提取的信息越充 分。从表 3标准化处理后的两列可以看出,除个别 变量提取的信息不充分外,其他变量提取的信息都 比较充分。

表 4显示了各主成分解释原始变量总方差的情 况,从表 4可以看出,主成分1解释了总方差的 68.874%,可以解释大部分信息,解释力是比较强 的。

表 4 总方差的解释

表 5显示的是主成分的系数矩阵,由该表可以 得到主成分和各变量关系的表达式。每条线路的 各单元模块的属性值代入关系式时,就可以得到每 条线路各成分的得分。

表 5 各成分得分系数

根据表 6可以对各个线路进行排序,主成分1 提取了大部分信息,因此对线路按照主成分1得分 从小到大排序。排列顺序依次为13、14、15、12、11、 9、8、10、7、4、5、3、l2、6、1。得分越小,说明该线路各 单元模块的得分率相对越小,线路运行状态越不 好,出现问题的概率比较大;得分越高,说明线路运 行状态越好。主成分分析排名较前的线路各个单 元模块的得分率比较低,说明线路故障点比较多。 线路巡检人员需要根据经验将排名前几位的线路作为巡检的重点。

表 6 主成分得分
3.2 线路故障预测

为了方便分析,对模型进行了简化,只考虑2个 指标变量:X1和X2,Y为结果变量。X1有2类取值0 和1,分别代表“好”和“差”;X2有3类取值,A、B、C, 分别表示“优”、“良”、“差”;Y有2类取值,S和N,S表 示有故障,N表示无故障。可以根据实际需要增加 变量及变量分类值。数据如表 7所示。

表 7 线路故障情况

利用朴素贝叶斯分类法可以预测X1和X2的所 有组合的Y的类型,如X1为1,X2为A时,Y的值为S 还是N。这样的不确定性就需要通过收集数据来消 除,得到后验概率。

根据贝叶斯公式可得:

P(Y=S|X1=1,X2=A)=10/37,

P(Y=N|X1=1,X2=A)=27/37。

根据最大后验概率原则,在X1=1且X2=A时,Y 的值为S。

同理,把每条线路各单元模块和线路状态分等 级后,也可以根据上述类似的过程求出各组合的线 路运行状况。对于判定为线路运行状态差的组合, 其各单元模块的组合即作为可能的故障点加以重 视。

此外,一般情况下,可通过贝叶斯网络判定特 定的组合属于哪类;按照逆向思维,还可进一步判 断哪个属性值出现的可能性最大。应用于线路故 障预测中,即在线路运行状态为不良的条件下,对 故障点发生在基础、杆塔、导地线、绝缘子、金具、接 地装置、附设设备、通道环境8个单元模块的概率进 行逆推,进而排序,可进一步诊断出故障点的位置。 3.3 线路检修策略的选择

根据表 1中输电线路各单元模块评价结果的源 数据,通过SAS软件的Cluster过程对输电线路进行 聚类分析,聚类结果如图 1所示。

图 1 15条线路聚类图

由聚类结果把输电线路分为4类,再结合源数 据中的数据可以将4类分别命名为:

(1)第1类(正常状态):线路1、3、6、4、2;

(2)第2类(注意状态):线路7、14、11、12、10;

(3)第3类(异常状态):线路5、8、9、和15;

(4)第4类(严重状态):线路13。

正常状态表示线路的各状态量稳定,且在标准 限值内,设备可以正常运行。注意状态表示线路的 各状态量接近标准限值,应加强线路的运行监测。 异常状态就是线路的重要状态量略超标准限值,应 采取措施,适时停电检修。严重状况即线路的重要 运行状态量严重超过标准限值,设备应尽快安排停 电检修。

进行输电线路的聚类分析后,可以将每条线路 分组,在源数据的基础上增加1个分类变量,利用 SAS软件的Discrim过程可以对新的线路进行判别 分析,确定线路属于第几类。

用SAS软件对编号16的线路进行判别分析。 利用和上述15条线路同样的评分标准和计算公式, 得出线路16各单元模块得分,分别为X1=5.34,X2= 16.56,X3=12.39,X4=3.21,X5=9.78,X6=3.45,X7= 2.78,X8=14.13),然后进行判别分析,结果见图 2。 从图 2可知,线路16被分入第2类,即注意状态类。因此,对线路16应 加强各单元模块的检测,可以结合源数据,对得分 低的模块进行重点检查。

图 2 线路16判别分析图
4 结论

本文利用SPSS软件对输电线路状态进行评价 分析,借助贝叶斯公式建立线路故障预测的简要模 型,并通过SAS软件建立了选择线路检修策略的模 型。将数据挖掘技术与输电线路状态检修的某些 环节相结合,对线路进行状态评价,从而确定检修 的重点;通过预测线路在相应运行状态下发生故障 的可能性及确定相应状态下线路的检修策略,可实 现对输电线路由事后检修到事前预防的转变,从而 提高输电线路的管理效率,降低故障损失。

参考文献
[1] Mehmed Kantardzic.数据挖掘—概念、模型、方法和算法[M].北京:清华大学出版社,2003.
[2] J.W.Han,K.Mieheline. Data Mining:Concepts and Techniques[M]. British Columbia:Morgan Kaufmann Publishers, 2000:185-218.
[3] 牛自强.数据挖掘技术综述[J].安阳大学学报,2004,10 (2):43-45.
[4] 郇嘉嘉.电网设备状态检修策略的研究[D].广州:华南理工大学,2012.
[5] 冯剑飞,王臻卓.基于正态云模型的架空输电线路状态评估[J].电器工程与自动化,2011(24):66-67.
[6] 韩富春,张宁,童国力,等.架空输电线路运行状态评估的 FTA 法研究[J].太原:太原理工大学学报,2007,38(1): 45-47.
[7] 王友富.输变电设备状态评价办法及应用分析[J].安徽电气工程职业技术学院学报,2007,12(3):46-49.
[8] 方玉群.基于可靠性的输电设备状态检修体系研究[D]. 杭州:浙江大学,2011.
[9] 朱德恒,严璋,谭克雄,等.电气设备状态监测与故障诊断技术[M].北京:中国电力出版社,2009.
[10] 姜涛,韩富春,范卫星.基于粗糙集理论的架空输电线路运行状态评估[J].电器技术,2007(4):58-60.
[11] 国家电网公司.110(66)kV~500 kV架空输电线路评价标准(试行)[R].北京:国家电网公司,2005.