近年来,信息技术飞速发展,各单位通过其内 部的业务处理系统、管理信息系统以及外部网络系 统积累了数量庞大且繁杂的数据,处理大数据的数 据挖掘技术应运而生。随着工业生产的复杂化、产 品的多样化以及人们对检修科学性认识的不断深 入,设备检修模式不断发展,状态检修已成为一种 新型的检修模式。在国家电网公司深入推进状态 检修和大力应用数据挖掘技术之际,将数据挖掘和 输电线路状态检修结合起来进行研究,具有重要的 现实意义和应用价值。 1 数据挖掘技术的功能及方法
数据挖掘旨在从大量不完全的、有噪声的且模 糊的随机数据中,提取隐含其中的、事先未知的而 又有潜在作用的信息和知识[1]。 1.1 数据挖掘的功能
数据挖掘所能发现的知识模式与其功能是密 切相关的。数据挖掘综合多门学科技术,其主要功 能如下[2]。
(1)概念描述:通过比较、对比和分析某类对 象的属性数据,用简练概括的语言描述该对象的本 质含义;
(2)关联模式:在看似无关的大量数据中,发 现信息之间隐含的相关性;
(3)分类:把看似无规律的对象按照一定的规 则对其进行归类处理;
(4)聚类分析:按照分类的思想,利用不同计 算距离的算法,对研究对象进行划归聚集处理;
(5)预测:根据事物的过去和现在的状况推度 其未来发展趋势;
(6)时间序列:利用事物发展的连续性及不与 过去割裂发展的性质,推断事物未来的发展状况;
(7)偏差分析:探测数据现状、历史记录或标 准之间的显著变化和偏离情况,以发现隐含的有趣 知识。 1.2 数据挖掘的方法
数据挖掘的方法大致可以分为统计、机器学 习、神经网络和数据库。统计方法主要有回归分 析、判别方法、聚类分析、灰色统计法、模糊集等;机 器学习方法可细分为决策树、基于范例的推理、贝 叶斯方法等;神经网络方法包括前向神经网络法和 自组织神经网络法;数据库方法主要是多维数据分 析和面向属性的归纳方法。
本文采用的方法有主成分分析、贝叶斯分析、 聚类分析和判别分析[3]。
主成分分析是在保证信息损失较少的前提下, 把多个指标变量转化为几个综合指标变量的统计 方法;贝叶斯方法是一种研究不确定性和非完整性 问题的决策方法,通过贝叶斯公式描述不确定性, 引用效用函数选择使期望效用最大的最优决策,实 现对不确定性问题的推理;聚类分析是依据分类思 想,研究归类问题的多变量统计方法;判别分析是 在已知类别的前提条件下,通过研究某一对象的多 个指标变量的特征,找出分类规则,进而判别新的 样品被分为何类的一种方法。其中,贝叶斯方法中 用到的贝叶斯概率公式如下:

分析 输电线路的状态检修工作基本包括6个环节: 状态检测、状态评价、故障诊断、预测评估、风险评 价以及决策建议,每个环节都应依据相应的技术标 准和准则进行[4]。本文仅对状态评价、预测评估和 故障诊断3个环节可采用的数据挖掘方法进行分 析。 2.1 状态评价
输电线路状态评价是一项复杂的系统工程,涉 及多层次、多系统问题,它是借鉴以往发现的缺陷 和故障的经验,通过巡视检修、停电检查、带电测 量、在线监控等技术手段获取状态信息,依据相应 的数学模型对状态信息进行分析计算,最终得出线 路总体状态等级的过程[5-7]。 2.1.1 灰色评价法
灰色评价法的思想是以状态量与其组成要素 之间的层次结构为基础,根据少量的信息,运用灰 色理论构建完善的数学模型,得出对系统的总体评 价,同时还可以得出不同评价对象的排序。输电线 路的状态信息比较少且不容易获取,因此可利用灰 色评价法对输电线路的状态进行评价。评价后,可 以选择相应的检修策略。 2.1.2 贝叶斯网络法
贝叶斯网络法是人工智能领域不确定知识表 达和推理技术的主流方法,它将数学中的概率理论 与图论相结合,能较好地量化复杂系统中普遍存在 的不确定性因素。该网络可以得出更加精确的结 论,所建模型具有良好的智能性。 2.2 预测评估
输电线路预测评估主要是预测输电线路运行 状态的未来发展趋势,并根据预测结果确定是否调整线路的运行方式,或确定线路的检修时间、检修 类型及检修范围。输电线路预测评估基于状态评 价的预测。输电线路的预测状态量呈现一定的规 律性,在较短的时间内,变化量均不会太大。 输电线路的预测评估可以采用2种方式:一种 是对线路的整体状态分值进行预测,不再对单一预 测状态量进行预测计算;另一种是分别对预测状态 量进行预测,在其他状态量保持不变的情况下对线 路状态进行预测评估[8]。常用的预测模型有以下2 种。 2.2.1 时间序列预测模型
时间序列是社会经济现象或自然现象的某种 指标按照时间先后顺序排列的数字序列,包含2个 要素:对应的指标值及现象所具有的时间属性。 2.2.2 回归分析预测模型
回归分析预测方法是一种因果分析预测,分析 因变量与自变量之间的相互关系,并用回归方程表 示,根据自变量的数值变化预测因变量的数值变 化。 2.3 故障诊断
输电线路的故障诊断是通过对输电线路运行 中的状态量进行测量,判断故障原因和损伤程度, 确定缺陷部位。输电线路故障诊断的核心是掌握 线路状态量的变化、建立合理的数学模型和提出科 学的判断边界条件[9]。故障诊断主要有以下几种方 法。 2.3.1 故障树分析法
故障树分析法是通过对可能造成线路故障的 各种因素进行分析,再画出逻辑框图,从而确定故 障原因的发生概率及各种可能组合,并采取相应的 措施,以提高线路运行的可靠性。 2.3.2 人工神经网络分析法
人工神经网络是模仿人的大脑神经元结构特 性而建立的一种非线性动力学系统。它由大量简 单的非线性单元互联、并联而成,作为1种新的模式 识别技术方法,在故障诊断领域中有广阔的前景。 2.3.3 粗糙集故障诊断
粗糙集故障诊断方法不需要任何附加的数据 及初始信息,通过对不精确、不完整数据进行分析, 发现其中的特征关系,得到简明扼要的知识表达形 式[10]。利用粗糙集进行输电线路故障诊断时,先对 输电线路大量故障征兆及故障类型进行分析汇总, 以故障类型和故障征兆作为决策的基础;粗分故障 类型后,做出故障决策表,再运用粗糙集进行约简, 获得细分的诊断规则,形成相应的规则集;最后在 规则集中进行查询,得到细分诊断结论。 3 数据挖掘在输电线路状态检修中的应用
本文即采用相应的数据挖掘方法对线路进行 状态评价、故障预测及检修策略选择。 3.1 线路运行状态评价 3.1.1 状态评价方法
线路单元由8个单元模块构成,即基础、杆塔、 导地线、绝缘子、金具、接地装置、附属设施、通道环 境,分别表示为X1,X2,…,X8。依据国家电网发行 的《110(66)kV~500kV架空输电线路评价标准(试 行)》的内容[11],对每条线路的各个单元进行评分。 各个单元作为输电线路的属性变量,其评分即为属 性变量的属性值。运用主成分分析法来降低维数, 可得出各条线路的主成分得分,通过排序来确定线 路维修的重点。
各条线路各单元模块的得分是以权重得分率 来衡量的。得分率和标准分值的计算过程如下: 标准分值的计算以100分/百基为单位。首先 必须根据线路实际杆塔数量计算出各单元模块的 标准分值,即:
各单元模块标准分值=线路杆塔数量×100分/百基。 实际得分采用扣分形式来取得。评价标准中 各小项累加扣分,但累加扣分不得超过该项的标准 分值,即无负分。未参加评价的项目(即无相关内 容)以满分计入。各设备单元在线路评价中所占的 权重比例见表 1(总权重为100),其中杆塔、导地线、 通道环境为核心单元。
| 表 1 各单元模块权重 |
各单元模块得分率=(实际得分/标准分值)×100%;
各单元模块权重得分率=权重×(实际得分/标准分值)×100%。 3.1.2 状态评价实例
通过对运行检修班的巡检和检修记录、资料进 行分类和整理,根据线路各单元模块评价标准和评价内容,得出鄂尔多斯电业局15条线路的得分率情况,作为建立模型的源数据。建模工具采用IBM SPSS软件。源数据见表 2所示。
| 表 2 15条线路的得分情况 |
在软件中依次选择分析变量、成分抽取方法、 主成分选择原则、因子旋转方法和成分得分的特性 后,输出模型结果,如表 3—6所示。
| 表 3 标准化处理前、后公因子方差 |
表 3解释了主成分分析模型中从每个原始变量 中提取到的信息,并用方差来度量信息量的大小。 提取的方差越接近初始方差,说明提取的信息越充 分。从表 3标准化处理后的两列可以看出,除个别 变量提取的信息不充分外,其他变量提取的信息都 比较充分。
表 4显示了各主成分解释原始变量总方差的情 况,从表 4可以看出,主成分1解释了总方差的 68.874%,可以解释大部分信息,解释力是比较强 的。
| 表 4 总方差的解释 |
表 5显示的是主成分的系数矩阵,由该表可以 得到主成分和各变量关系的表达式。每条线路的 各单元模块的属性值代入关系式时,就可以得到每 条线路各成分的得分。
| 表 5 各成分得分系数 |
根据表 6可以对各个线路进行排序,主成分1 提取了大部分信息,因此对线路按照主成分1得分 从小到大排序。排列顺序依次为13、14、15、12、11、 9、8、10、7、4、5、3、l2、6、1。得分越小,说明该线路各 单元模块的得分率相对越小,线路运行状态越不 好,出现问题的概率比较大;得分越高,说明线路运 行状态越好。主成分分析排名较前的线路各个单 元模块的得分率比较低,说明线路故障点比较多。 线路巡检人员需要根据经验将排名前几位的线路作为巡检的重点。
| 表 6 主成分得分 |
为了方便分析,对模型进行了简化,只考虑2个 指标变量:X1和X2,Y为结果变量。X1有2类取值0 和1,分别代表“好”和“差”;X2有3类取值,A、B、C, 分别表示“优”、“良”、“差”;Y有2类取值,S和N,S表 示有故障,N表示无故障。可以根据实际需要增加 变量及变量分类值。数据如表 7所示。
| 表 7 线路故障情况 |
利用朴素贝叶斯分类法可以预测X1和X2的所 有组合的Y的类型,如X1为1,X2为A时,Y的值为S 还是N。这样的不确定性就需要通过收集数据来消 除,得到后验概率。
根据贝叶斯公式可得:
P(Y=S|X1=1,X2=A)=10/37,
P(Y=N|X1=1,X2=A)=27/37。
根据最大后验概率原则,在X1=1且X2=A时,Y 的值为S。
同理,把每条线路各单元模块和线路状态分等 级后,也可以根据上述类似的过程求出各组合的线 路运行状况。对于判定为线路运行状态差的组合, 其各单元模块的组合即作为可能的故障点加以重 视。
此外,一般情况下,可通过贝叶斯网络判定特 定的组合属于哪类;按照逆向思维,还可进一步判 断哪个属性值出现的可能性最大。应用于线路故 障预测中,即在线路运行状态为不良的条件下,对 故障点发生在基础、杆塔、导地线、绝缘子、金具、接 地装置、附设设备、通道环境8个单元模块的概率进 行逆推,进而排序,可进一步诊断出故障点的位置。 3.3 线路检修策略的选择
根据表 1中输电线路各单元模块评价结果的源 数据,通过SAS软件的Cluster过程对输电线路进行 聚类分析,聚类结果如图 1所示。
![]() |
图 1 15条线路聚类图 |
由聚类结果把输电线路分为4类,再结合源数 据中的数据可以将4类分别命名为:
(1)第1类(正常状态):线路1、3、6、4、2;
(2)第2类(注意状态):线路7、14、11、12、10;
(3)第3类(异常状态):线路5、8、9、和15;
(4)第4类(严重状态):线路13。
正常状态表示线路的各状态量稳定,且在标准 限值内,设备可以正常运行。注意状态表示线路的 各状态量接近标准限值,应加强线路的运行监测。 异常状态就是线路的重要状态量略超标准限值,应 采取措施,适时停电检修。严重状况即线路的重要 运行状态量严重超过标准限值,设备应尽快安排停 电检修。
进行输电线路的聚类分析后,可以将每条线路 分组,在源数据的基础上增加1个分类变量,利用 SAS软件的Discrim过程可以对新的线路进行判别 分析,确定线路属于第几类。
用SAS软件对编号16的线路进行判别分析。 利用和上述15条线路同样的评分标准和计算公式, 得出线路16各单元模块得分,分别为X1=5.34,X2= 16.56,X3=12.39,X4=3.21,X5=9.78,X6=3.45,X7= 2.78,X8=14.13),然后进行判别分析,结果见图 2。 从图 2可知,线路16被分入第2类,即注意状态类。因此,对线路16应 加强各单元模块的检测,可以结合源数据,对得分 低的模块进行重点检查。
![]() |
图 2 线路16判别分析图 |
本文利用SPSS软件对输电线路状态进行评价 分析,借助贝叶斯公式建立线路故障预测的简要模 型,并通过SAS软件建立了选择线路检修策略的模 型。将数据挖掘技术与输电线路状态检修的某些 环节相结合,对线路进行状态评价,从而确定检修 的重点;通过预测线路在相应运行状态下发生故障 的可能性及确定相应状态下线路的检修策略,可实 现对输电线路由事后检修到事前预防的转变,从而 提高输电线路的管理效率,降低故障损失。
| [1] | Mehmed Kantardzic.数据挖掘—概念、模型、方法和算法[M].北京:清华大学出版社,2003. |
| [2] | J.W.Han,K.Mieheline. Data Mining:Concepts and Techniques[M]. British Columbia:Morgan Kaufmann Publishers, 2000:185-218. |
| [3] | 牛自强.数据挖掘技术综述[J].安阳大学学报,2004,10 (2):43-45. |
| [4] | 郇嘉嘉.电网设备状态检修策略的研究[D].广州:华南理工大学,2012. |
| [5] | 冯剑飞,王臻卓.基于正态云模型的架空输电线路状态评估[J].电器工程与自动化,2011(24):66-67. |
| [6] | 韩富春,张宁,童国力,等.架空输电线路运行状态评估的 FTA 法研究[J].太原:太原理工大学学报,2007,38(1): 45-47. |
| [7] | 王友富.输变电设备状态评价办法及应用分析[J].安徽电气工程职业技术学院学报,2007,12(3):46-49. |
| [8] | 方玉群.基于可靠性的输电设备状态检修体系研究[D]. 杭州:浙江大学,2011. |
| [9] | 朱德恒,严璋,谭克雄,等.电气设备状态监测与故障诊断技术[M].北京:中国电力出版社,2009. |
| [10] | 姜涛,韩富春,范卫星.基于粗糙集理论的架空输电线路运行状态评估[J].电器技术,2007(4):58-60. |
| [11] | 国家电网公司.110(66)kV~500 kV架空输电线路评价标准(试行)[R].北京:国家电网公司,2005. |
2014, Vol. 32 








