2. 辽宁工程技术大学 工商管理学院,辽宁 葫芦岛 125105
2. School of business administration, Liaoning Technical University, Huludao 125105, China
面对无人化、智能化、信息化和数据化的复杂系统,目前系统故障分析方法存在明显不足,特别是智能科学和技术涌现后问题更加严重。首先是故障数据分析。故障数据特点在于难以提取、存在较多的冗余和错误,通过数理统计方法不易获得准确而深入的故障因果关系;其次是在故障数据基础上只能通过分析数据得到故障因果关系。但这种关系完全基于数据,虽然能广泛了解故障因果关系,但深入研究基本影响因素较为困难。这将进一步导致故障预测、预防和治理的困难;三是面向复杂系统故障的智能管控系统的基础数学理论不充分。单纯基于故障大数据和因素,而不考虑数据与因素关系和人的假设条件,难以通过智能系统管控分析复杂系统故障。
目前关于系统故障数据的智能处理及因果关系研究的文献不多,较新的研究包括:光纤通信故障数据智能检测[1];故障因果信息的故障智能诊断[2];空间故障树与因素空间融合的智能可靠性分析[3];自适应选择融合智能故障分类技术[4];智能变电站网络设备故障定位[5];智能电表运行故障监控[6]与预测[7];智能电网监控大数据模型构建[8]等。这些研究在各自领域取得了较好成果,但并没有解决故障数据处理和故障因果关系分析等本质理论问题。
作者根据对故障信息转换[9]、故障状态[10]、故障对象分类[11-12],故障的因素影响[13-15]及故障演化[16]等的研究,对上述3个问题提出了解决方案。对上述3个问题提出了一些看法。论述了通过数理统计方法分析故障数据的弊端;给出了系统故障原因及结果的相关性和关联性区别;最后论述了智能系统对故障因果关系分析的4个层次。希望能为复杂系统故障分析提供智能方法。
1 故障数据的数理统计广义的数据包含了各种数据形式。系统存在对人而言就是能获得系统发散出来的数据。数据是系统存在的表现形式。但人受限于技术方法,在不能获得数据时将难以判断系统存在,更难以了解系统特性。这是系统层面的问题,但专业技术领域可能更加严重。
安全科学相对而言较新,涉及到社会的方方面面。与其他科学相同,其基础理论的建立需要大量数据支持。虽然安全理论多数来源于相关学科但也需要这些数据。人们对系统的要求是在规定时间内、规定条件下完成预定功能,即系统的可靠性;与之对应的是系统失效性。通常情况在给定条件下,系统都具有可靠性。那么系统的可靠状态是一种通常状态;当系统遇到意外作用时可能出现失效状态。这种失效是人们关心的问题,因此研究系统安全主要关注于系统失效状态。
如上所述,对系统失效的研究也立足于数据。系统运行时散发的数据可分为正常数据和异常数据。可靠性和失效性就蕴含在这些数据之中。失效性特征蕴含在异常数据,即故障数据中,正常数据也有作用但不直接。因此研究系统安全的主要基础就是故障数据。那么问题是如何监测、收集、筛选、分析和处理故障数据。
本文不论述监测和收集问题,因为这些偏重于硬件。当获得故障数据后如何处理才是关键问题。系统故障一般具有因果关系,即哪些事件导致了故障,故障又导致了哪些事件发生。因此安全科学,特别是故障研究最终需要揭示故障之间的因果关系。另一方面,处理故障数据的方法很多,但目前最常用的是数理统计。数理统计之父Karl Pearson热衷于从基础数据归类得到表征变量,然后使用这些变量研究事物的关系[16]。通过2个随机变量的联合分布表达它们之间的联系。这当然取得了极大成功,奠定了数理统计基础。但这种联系说明了何种问题?例如交通事故和时间的对应分布关系,6:00~8:00和17:00~19:00时间范围内交通事故达到峰值,并正态分布。说明交通事故与时间存在联系,但这种关系并非因果关系。因为联合分布得到的因果关系具有双向性[16]。即由甲推断乙,同时由乙也可以推断甲。那么这个例子就变成了时间与交通事故存在联系,这显然难以解释。在数理统计发展中也有类似争论。以父亲身高推断儿子身高,发展相关椭圆的主轴向自变量轴偏转说明具有遗传回归性,即儿子身高与父亲身高相关;有人用儿子身高推断父亲身高,得到了同样现象[16],说明儿子身高与父亲身高互为因果。这使得Pearson的追随者们难以理解,并从此在数理统计研究中回避这类问题,一直影响到现在。
正如上述问题,交通事故与时间之间有一个人流的因素,上班时间人流多,而人流多造成交通事故多;父亲与儿子存在内在的基因联系,他们的身高也与环境相关。因此只用数理统计方法研究故障数据中的各种原因和故障关系是不充分的。这将直接导致故障原因控制不当,甚至原因本身就是错误的。正如本文提出的空间故障网络理论描述系统故障演化过程得到的结论,原因和结果之间可能存在多条通路,错误的因果分析将造成通路上事件控制不能阻止结果发生。这是由于没有分析故障发生的本质原因。
2 系统故障的相关性和关联性相关性和关联性在日常生活中是相近甚至相同的,但本文要进行区分。汪培庄教授[17]提出的因素空间理论是智能科学的数学基础。该理论认为,关联性层次要高,存在于概念层面;而相关性较低,存在于变量层面。因素空间中的“因”不是原因而是影响因果关系的因素。故障的原因和结果实际上是笼统的,其中蕴含了很多影响原因和结果的因素。
关联性存在于概念,是很多知识,包括本能、经验、规范和常识等的集合。它可以独立于数据通过人或是人工智能直接得到,是对象状态或属性层面的事物。比如甲的A状态增加,乙的B状态增加,因此它们是关联的。最通俗的例子是鸡鸣和天亮的关系。鸡鸣可推天亮,天亮可推鸡鸣。前者说明鸡鸣是鸡的本能因素,天亮则是条件因素;可以说成天亮是原因,鸡鸣是结果。后者则不能说成鸡鸣是原因,天亮是结果。但因素空间在广义上承认后者的因果关系,即广义因果关系。后者在人工智能方面可能更具效用,是人们对自然界规律的总结。人们不会关心天亮了鸡为什么打鸣,而会关心鸡打鸣预示着天亮。因此关联性取决于知识和概念层面的意义。基于状态和因素层面的关联性是广义因果论。
相关性在于具体的数据层面,是通过数据分析得到的不同类型数据之间的关系。最简单的例子,在线性代数中2组数据有联系称为线性相关。正如上节提到的交通事故与时间存在正态分布关系,即为两者相关。相关性分析往往用于比较复杂和数据量较大且经验不足情况下的两事物关系分析。如上节使用数理统计方法的不足一样,只能得到数据分布的相关性。可能根本不具有因果关系或者有中间事件传递了因果关系。基于数据层面得到的相关性是狭义因果论。
因素空间承认狭义因果论和广义因果论,在因素层面上讨论因果关系。因素是表征事物和区别事物的特征要素,因果关系可能存在众多因素的影响。这将导致同因不同果,或者同果不同因,甚至因果相同时经历完全不同的发展过程。这使因果关系存在多样性,即使在表面上是相似的。所以因果分析应基于数据的狭义因果论和基于状态的广义因果论,即从因素的关联性和相关性两方面寻找对结果最有影响的因素,进而找到基本原因。
3 故障因果分析的4个驱动层次图灵奖得主珀尔于2018年出版的《为什么—关于因果关系的新科学》[16]中提到:因果性研究有3个层次:1)研究关联与相关,是统计学和人工智能现行的广义因果性研究;2)干预研究,当有第3方因素影响时,研究剔除该因素后两者之间的关系;3)反事实推理,认为数据是事实记录,机器学习把学习和推理局限在事实世界,但人脑思维能跳出事实进行假想。基于作者对故障数据及因果分析,特别是智能分析的研究[9-15],认为故障因果分析可分为4个层次,它们是数据驱动、因素驱动、数据−因素驱动、数据−因素−假设驱动。如图1所示[18-19],左侧为系统运动空间和系统映射论的表示,右侧为4个层次关系。
Download:
|
|
目前各门类科学一般以数据作为基础建立理论体系。在提出各种理论的同时也需要找到相应的数据进行验证,因此数据成为现代科学发展的基础。但正如第1节所述,数据本身就是难以解决的问题。因为系统存在是通过数据的波动表现出来的。如果系统数据恒定则很难被认知,比如存在于宇宙中的微波背景辐射。这类数据一直存在,人类无从分辨。或者另一情况,系统散发数据且不断变化,但人的现有技术无法探测。这对于人而言系统是不存在的,因为没有对应的数据。如黑洞,光无法逃离因此看不到,但它确实存在。第3种情况,数据变化且能被探测,但可能无法处理,即无法通过现有方法进行处理或得不到需要的科学结果。这种情况是目前最普遍的,正如数理统计理论。它是基于现有数据,通过数据分析找到不同因素之间的关系。这种关系通常只是数据层面的现象关系,既不是因果逻辑关系,也不是推理得到的关系,甚至是假象。目前的智能科学大数据技术也是基于数据的,相较于数理统计其数据量规模更大,可区分和挖掘的结果更多。但大数据技术是否有效取决于其数据完整性和因素的全面性。如果数据不完整、冗余和错误,或因素不完整、不相关或冗余,大数据分析也无法得到真实的因果关系。
这些对安全领域的故障研究十分不利,无论是使用数理统计、智能或者大数据技术,只依赖于数据而不重视因素都难以分析故障的因果关系。因此数据驱动是故障因果分析的第1阶段。
3.2 因素驱动因素是区分事物状态的基本要素,从因素角度可划分事物。方法一般是定性分析,如主成分分析、差分分析、分解分析等。因素驱动的分析以因素作为基础,对同一系统,通过分析因素及其量值差异可获得该系统的状态、发展趋势、发生故障的可能性等;对多个不同系统,可通过区分因素及其量值来区分系统,进行聚类分析;也可通过因素的合取与析取,将因素进一步拆分或合成,前者细化因素增加系统特征,后者减少因素形成关键字以示区别。基于因素驱动的方法很多,因素空间理论是其中之一[20-22]。将安全科学与因素空间结合,特别是空间故障树理论与因素空间的结合,为安全理论的智能化发展提供了一条途径。目前基于因素空间分析了矿业、机械、人因和电气系统故障过程,研究得到了原因与系统故障之间的关系[9-15]。提出了针对故障数据的因素分析法。作为因果故障分析的第2阶段。
3.3 数据−因素驱动文献[18-19]给出了更为抽象的系统故障变化过程表述,提出了系统运动空间及系统映射论。系统运动空间用于度量系统运动,即系统运动的特征和趋势等。系统映射论是在系统运动空间中,研究数据流和因素流之间的关系。认为人工系统,包括人工智能都是在实现自然系统的功能。即人设计、建造和运行的系统都是在完成人设定条件下的预定功能,而这种基本是替代人了解自然和改造自然的功能。那么将人工智能系统与自然系统对应,自然系统客观存在,同时在变化过程中发散数据,这些数据体现了自然系统的特征;另一方面人工智能是后天产物,是基于人的意识创造的,只能被动接受自然散发出来的数据。人工智能的工作在于分析数据,将数据分类形成对应的因素;分析改变这些因素后自然系统的反应,即得到自然规律;然后人工智能根据目标调整因素进而调整自然系统达到人的要求。进一步的,人工智能实际上实现了数据到因素的映射。这里的数据是人们能感知、能检测、能处理的数据;因素则是人们通过现有技术能改变量值的因素。对应地,自然系统作用是在变化过程中发散数据,然后接受人工智能系统通过改变因素对自然的干预。自然系统实际上是从因素到数据的映射。表面上人工智能系统与自然系统的映射应该相同,但实则存在区别。人工智能系统与自然系统对于数据和因素的映射方向是相反的,因此得到的结构是逆结构;另外人工智能系统得到的数据是自然系统数据的子集甚至很少一部分,人工智能系统可调节的因素也是自然因素的子集。所以人工智能系统得到的系统映射结构完成的功能只是自然系统功能的一部分,功能只能无限接近但不能达到。
因此基于数据−因素驱动的分析方法所得因果关系仍是不全面的,但也较数据驱动和因素驱动更全面。数据驱动依赖于现实,大数据能体现最广泛的相关性,但不具备深入了解本质原因的能力。因素驱动能从现象了解本质,进行逻辑推理,基于因素的不同了解系统的不同,但缺少广泛的现象联系。因此数据-因素驱动更能发现广泛的故障联系并深入分析故障因果关系。
3.4 数据−因素−假设驱动数据驱动基于事实的广泛数据,因素驱动解释内在因果联系,数据−因素驱动结合了2种优势,更适合系统故障分析和故障因果关系推理。但人对自然的理解与目前人工智能处理问题的一个区别在于人可以假设。人可假设未来可能出现的因素及其变化,判定系统故障的可能性。基于人知识的假设可加入到系统故障分析过程中,即是Pearl提出的反事实推理。至于如何让智能系统具有假设能力是人工智能领域的任务。在安全领域分析系统故障时,这种假设是重要的。假设也体现在系统设计阶段给定的运行条件,即在给定的假设条件下系统是安全的,不发生事故或概率很低。假设是高级智能,合理给定假设将有效地收集数据并判别因素。更进一步的,如果人工智能能在假设数据和因素情况下分析系统故障的因果关系,那么将更接近于人。因为故障数据是实际产生的,不是所有故障都能发生并产生数据;即使发生人们也不可能识别和记录所有数据。所以理论上的数据假设是必要的,以分析更为广泛的故障数据和情况。因素更是有限的,实际缺少和出现新的因素都将导致系统故障及因果关系变化。人工智能应该较人更为全面和深入地分析系统故障,其全面性来源于数据及数据假设,深入性来源于因素和因素假设。因此数据−因素−假设的方式是目前较优的人工智能系统故障数据及故障因果关系分析方法。
这4个层次对系统故障数据和因果关系分析的能力逐次提升,表示的因果关系越来越广泛和深入,也越来越智能。因素空间理论作为人工智能的数学基础,目前仍有较大发展空间。特别是在安全科学领域对于故障数据及故障因果关系分析方面拥有巨大的发展潜力。
4 结束语1)论述了目前分析系统故障数据面临的问题。基于数理统计的故障数据分析应用广泛,但只能得到数据层面的因果关系。可能只是表面关系,不是本质关系,也可能是经过了多次因果传递后表现出来的关系。这不利于系统故障的预测、预防与治理。
2)论述了系统故障因果关系的关联性和相关性。关联性存在于概念,取决于知识和概念层面的意义,是广义因果论。相关性在于具体的数据层面,通过数据分析得到不同类型数据之间的关系,是狭义因果论。因素空间承认狭义因果论和广义因果论,并在因素层面上讨论因果关系。
3)将系统故障分析的智能系统划分为4个层次,数据驱动、因素驱动、数据−因素驱动、数据−因素−假设驱动。数据驱动能获得广泛的故障因果关系,因素驱动深入了解故障因果关系,数据−因素驱动兼顾两者,数据−因素−假设驱动更接近于人的思维。
[1] |
魏爽. 光纤通信故障数据智能检测算法设计[J]. 激光杂志, 2019, 40(11): 118-122. WEI Shuang. Design of intelligent detection algorithm for fault data of optical fiber communication[J]. Laser journal, 2019, 40(11): 118-122. (0) |
[2] |
顾煜炯, 杨楠, 陈东超, 等. 利用故障因果信息的汽轮机故障智能诊断研究[J]. 噪声与振动控制, 2019, 39(4): 12-19. GU Yujiong, YANG Nan, CHEN Dongchao, et al. Study on intelligent fault diagnosis of steam turbines using fault causality information[J]. Noise and vibration control, 2019, 39(4): 12-19. DOI:10.3969/j.issn.1006-1355.2019.04.003 (0) |
[3] |
崔铁军, 汪培庄. 空间故障树与因素空间融合的智能可靠性分析方法[J]. 智能系统学报, 2019, 14(5): 853-864. CUI Tiejun, WANG Peizhuang. Intelligent reliability analysis method based on space fault tree and factor space[J]. CAAI transactions on intelligent systems, 2019, 14(5): 853-864. (0) |
[4] |
高欣, 刁新平, 刘婧, 等. 基于模型自适应选择融合的智能电表故障多分类方法[J]. 电网技术, 2019, 43(6): 1955-1961. GAO Xin, DIAO Xinping, LIU Jing, et al. A multi-classification method of smart meter fault type based on model adaptive selection fusion[J]. Power system technology, 2019, 43(6): 1955-1961. (0) |
[5] |
姜学朴, 吴港, 孙婷, 等. 智能变电站网络设备故障的快速准确定位技术[J]. 电测与仪表, 2019, 56(8): 94-98. JIANG Xuepu, WU Gang, SUN Ting, et al. Fast and accurate location technology of network equipment fault in smart substation[J]. Electrical measurement and instrumentation, 2019, 56(8): 94-98. (0) |
[6] |
岑华. 基于PLC的智能电表运行故障监控系统设计[J]. 制造业自动化, 2018, 40(11): 138-141. CEN Hua. Design of intelligent meter operation fault monitoring system based on PLC[J]. Manufacturing automation, 2018, 40(11): 138-141. DOI:10.3969/j.issn.1009-0134.2018.11.034 (0) |
[7] |
郑安刚, 张密, 曲明钰, 等. 基于贝叶斯网络的智能电能表故障类型预测[J]. 电测与仪表, 2018, 55(21): 143-147. ZHENG Angang, ZHANG Mi, QU Mingyu, et al. Prediction of the fault type of smart meters based on the bayesian network[J]. Electrical measurement and instrumentation, 2018, 55(21): 143-147. DOI:10.3969/j.issn.1001-1390.2018.21.024 (0) |
[8] |
冷喜武, 陈国平, 蒋宇, 等. 智能电网监控运行大数据应用模型构建方法[J]. 电力系统自动化, 2018, 42(20): 115-123. LENG Xiwu, CHEN Guoping, JIANG Yu, et al. Model construction method of big data application for monitoring and control of smart grid[J]. Automation of electric power systems, 2018, 42(20): 115-123. DOI:10.7500/AEPS20170928003 (0) |
[9] |
崔铁军, 李莎莎. 安全科学中的故障信息转换定律[J]. 智能系统学报, 2020, 15(2): 360–366. CUI Tiejun, LI Shasha. The conversion law of fault information in safety science[J]. CAAI transactions on intelligent systems, 2020, 15(2): 360–366. (0) |
[10] |
崔铁军, 马云东. 基于因素空间的煤矿安全情况区分方法的研究[J]. 系统工程理论与实践, 2015, 35(11): 2891-2897. CUI Tiejun, MA Yundong. Research on the classification method about coal mine safety situation based on the factor space[J]. Systems engineering theory and practice, 2015, 35(11): 2891-2897. DOI:10.12011/1000-6788(2015)11-2891 (0) |
[11] |
崔铁军, 马云东. 因素空间的属性圆定义及其在对象分类中的应用[J]. 计算机工程与科学, 2015, 37(11): 2169-2174. CUI Tiejun, MA Yundong. Definition of attribute circle in factor space and its application in object classification[J]. Computer engineering and science, 2015, 37(11): 2169-2174. DOI:10.3969/j.issn.1007-130X.2015.11.026 (0) |
[12] |
崔铁军, 马云东. 基于因素空间中属性圆对象分类的相似度研究及应用[J]. 模糊系统与数学, 2015, 29(6): 56-63. CUI Teijun, MA Yundong. Research on the similarity of object classification of attribute circular and application based on factors space[J]. Fuzzy system and mathematics, 2015, 29(6): 56-63. (0) |
[13] |
崔铁军, 李莎莎, 王来贵. 完备与不完备背景关系中蕴含的系统功能结构分析[J]. 计算机科学, 2017, 44(3): 268-273,306. CUI Tiejun, LI Shasha, WANG Laigui. System function structure analysis in the complete and incomplete background relationship[J]. Computer science, 2017, 44(3): 268-273,306. DOI:10.11896/j.issn.1002-137X.2017.03.055 (0) |
[14] |
崔铁军, 马云东. 多维空间故障树构建及应用研究[J]. 中国安全科学学报, 2013, 23(4): 32-37,62. CUI Tiejun, MA Yundong. Research on multi-dimensional space fault tree construction and application[J]. China safety science journal, 2013, 23(4): 32-37,62. (0) |
[15] |
崔铁军, 汪培庄, 马云东. 01SFT中的系统因素结构反分析方法研究[J]. 系统工程理论与实践, 2016, 36(8): 2152-2160. CUI Tiejun, WANG Peizhuang, MA Yundong. Inward analysis of system factor structure in 01 space fault tree[J]. Systems engineering theory and practice, 2016, 36(8): 2152-2160. DOI:10.12011/1000-6788(2016)08-2152-09 (0) |
[16] |
崔铁军, 李莎莎. 空间故障树与空间故障网络理论综述[J]. 安全与环境学报, 2019, 19(2): 399-405. CUI Tiejun, LI Shasha. Revision of the space fault tree and the space fault network system[J]. Journal of safety and environment, 2019, 19(2): 399-405. (0) |
[17] | PEARL J, MACKENZIE D. The book of why: the new science of cause and effect[M]. New York: Basic Books, 2018. (0) |
[18] | WANG P Z, SUGENO M. The factors field and background structure for fuzzy subsets[J]. Fuzzy mathematics, 1982, 2(2): 45-54. (0) |
[19] | CUI Tiejun, LI Shasha. System movement space and system mapping theory for reliability of IoT[J]. Future generation computer systems, 2020, 107: 70-81. DOI:10.1016/j.future.2020.01.040 (0) |
[20] |
崔铁军, 李莎莎. 系统运动空间与系统映射论的初步探讨[J]. 智能系统学报, 2020, 15(3): 445-451. CUI Tiejun, LI Shasha. Preliminary study of system movement space and system mapping theory[J]. CAAI transactions on intelligent systems, 2020, 15(3): 445-451. (0) |
[21] |
汪培庄. 因素空间理论——机制主义人工智能理论的数学基础[J]. 智能系统学报, 2018, 13(1): 37-54. WANG Peizhuang. Factor space-mathematical basis of mechanism based artificial intelligence theory[J]. CAAI transactions on intelligent systems, 2018, 13(1): 37-54. (0) |
[22] |
汪培庄. 因素空间与数据科学[J]. 辽宁工程技术大学学报(自然科学版), 2015, 34(2): 273-280. WANG Peizhuang. Factor spaces and data science[J]. Journal of Liaoning Technical University(Natural Science), 2015, 34(2): 273-280. (0) |
[23] |
汪培庄, 郭嗣琮, 包研科, 等. 因素空间中的因素分析法[J]. 辽宁工程技术大学学报(自然科学版), 2014, 33(7): 865-870. WANG Peizhuang, GUO Sicong, BAO Yanke, et al. Causality analysis in factor spaces[J]. Journal of Liaoning Technical University(Natural Science), 2014, 33(7): 865-870. (0) |