基于最大信息系数和深度残差图卷积的工业过程故障诊断方法

引用本文

任佳, 孙思宇, 鲍克. 基于最大信息系数和深度残差图卷积的工业过程故障诊断方法[J]. 高校化学工程学报, 2023, 37(1): 111-119. DOI: 10.3969/j.issn.1003-9015.2023.01.014.

REN Jia, SUN Si-yu, BAO Ke. Fault diagnosis method in industrial processes based on maximal information coefficient and depth residual graph convolution[J]. Journal of Chemical Engineering of Chinese Universities, 2023, 37(1): 111-119. DOI: 10.3969/j.issn.1003-9015.2023.01.014.

基金项目

国家自然科学基金(51876194)；浙江省公益技术研究项目(LGG20F030007)；浙江省电子信息产品检验研究院(浙江省信息安全重点实验室)开放课题; 浙江省智能制造质量大数据溯源与应用重点实验室开放课题(ZNZZSZ-CJLU2022-01)。

通讯联系人

鲍克，E-mail：bk@zdjy.org.cn

作者简介

任佳(1977-)，女，浙江杭州人，浙江理工大学副教授，博士。

文章历史

收稿日期：2021-12-14;
修订日期：2022-04-11。

Contents Abstract Full text Figures/Tables PDF

基于最大信息系数和深度残差图卷积的工业过程故障诊断方法

任佳 ^1,3, 孙思宇 ¹, 鲍克 ²

1. 浙江理工大学信息科学与工程学院, 浙江杭州 310018;
2. 浙江省电子信息产品检验研究院, 浙江杭州 310007;
3. 中国计量大学浙江省智能制造质量大数据溯源与应用重点实验室, 浙江杭州 310018

收稿日期：2021-12-14；修订日期：2022-04-11。

基金项目：国家自然科学基金(51876194)；浙江省公益技术研究项目(LGG20F030007)；浙江省电子信息产品检验研究院(浙江省信息安全重点实验室)开放课题; 浙江省智能制造质量大数据溯源与应用重点实验室开放课题(ZNZZSZ-CJLU2022-01)。

作者简介：任佳(1977-)，女，浙江杭州人，浙江理工大学副教授，博士。

通讯联系人：鲍克，E-mail：bk@zdjy.org.cn

摘要：针对工业数据非线性、时变性、时空特征耦合的特点，提出一种基于最大信息系数和残差图卷积网络的工业过程故障诊断算法(MIC-RGCN)。引入最大信息系数(MIC)挖掘变量之间的相关关系，将高维变量之间的相关信息转换为空间距离信息，构建相关性矩阵作为图卷积层的邻接矩阵输入；构建改进的深度残差图卷积网络(GCN)模型对数据的时空特征进行深度融合提取并精准分类。在田纳西-伊斯曼过程和三相流过程数据集上将该算法与4种典型机器学习和深度学习算法进行对比测试。实验结果表明，该算法有效地提升了故障诊断的准确率。

关键词：故障诊断最大信息系数图卷积网络田纳西-伊斯曼过程三相流过程

Fault diagnosis method in industrial processes based on maximal information coefficient and depth residual graph convolution

REN Jia ^1,3, SUN Si-yu ¹, BAO Ke ²

1. School of Information Science and Engineering, Zhejiang Sci-Tech University, Hangzhou 310018, China;
2. Zhejiang Electronic Information Products Inspection and Research Institute, Hangzhou 310007, China;
3. Key Laboratory of Intelligent Manufacturing Quality Big Data Tracing and Analysis of Zhejiang Province, China Jiliang University, Hangzhou 310018, China

Abstract: Aiming at the nonlinear, time-varying, and spatiotemporal characteristics of industrial data, a fault diagnosis algorithm (MIC-RGCN) for industrial processes was proposed based on maximal information coefficient and residual graph convolutional network. The maximal information coefficient (MIC) was introduced to mine the correlation between variables, the correlation information between high-dimensional variables was converted into spatial distance information, so as to construct a correlation matrix as the adjacency matrix of graph convolutional layers. An improved deep residual graph convolutional network (GCN) was designed to perform deep fusion extraction and accurate classification of the spatiotemporal features in data. The algorithm was compared with four typical machine learning and deep learning algorithms on Tennessee Eastman process and three-phase flow process datasets. The results showed that the algorithm improves the accuracy of fault diagnosis effectively.

Key words: fault diagnosis maximal information coefficient(MIC) graph convolutional network(GCN) Tennessee Eastman process three-phase flow process

1 前言

近年来，随着工业生产设备不断向大型化、自动化、智能化方向发展，设备的安全稳定运行变得愈发重要：生产过程一旦发生事故，轻则对产品质量和生产效率造成不良影响，重则造成非常严重的人员伤亡和财产损失^[1]。因此，研发安全高效的故障检测和诊断方法一直是该领域关注的热点^[2]。

根据不同的建模方式，可以将故障诊断方法分为机理建模^[3-5]、知识驱动建模^[6-7]和数据驱动建模^[8-9]三大类。机理建模和知识驱动建模需要大量的先验知识和工业背景知识，较难直接应用于复杂工业过程。随着工业过程数据储备的日益丰富和人工智能技术的迅猛发展，基于数据驱动的故障诊断算法受到越来越多的关注^[10-11]，数据驱动建模基于过程历史数据进行模型构建与参数学习。常用的数据驱动建模方法有主成分分析^[12]、支持向量机^[13]、人工神经网络^[14]等。这些浅层的数据驱动建模方法在故障诊断中取得了不错的成果，但对于高维非线性数据的特征提取效果有限。近年来，深度学习在许多领域表现出强大的性能，因此越来越多的专家学者将深度学习应用工业过程故障诊断中^[15-17]。深度学习通过堆叠多层的非线性函数映射层来挖掘数据的深层关系，从而实现更高层、更抽象的数据表达^[18]。深度学习的兴起使时空序列的研究取得了进一步的发展，现有时空序列算法主要从序列生成模型和空间关系建模2个角度并行发展。序列生成模型以循环神经网络(recurrent neural network，RNN)为基础，并在RNN基础上提出了长短期记忆单元(long short-term memory，LSTM)^[19]和门控循环单元(gated recurrent unit，GRU)^[20]。空间关系建模以卷积神经网络(convolutional neural network，CNN)^[21]为基础，在此基础上提出了处理非欧几里得关系的图神经网络(graph neural network，GNN)^[22]、图卷积网络(graph convolutional network，GCN)等图分析方法。通过将序列模型和空间模型相结合构建时空融合模型可以很好地解决时空序列问题。Shi等^[23]提出了一种卷积LSTM，将CNN和LSTM相结合，有效地解决了LSTM的数据冗余问题。随后，为了更好地捕捉时空相关性，提出了轨迹GRU^[24]。Yu等^[25]提出的时空图卷积网络和Guo等^[26]提出的基于注意力机制的时空图卷积网络将图卷积和时间卷积相结合，在时空序列预测中取得了很好的效果。

现有时空序列算法的输入通常为图像序列或具有空间距离关系的物理变量。但是工业过程变量之间的相关关系更为复杂，因此现有算法无法直接推广应用到工业过程故障诊断中，如何找到准确衡量变量之间相关性的表示方法至关重要。针对此问题，本研究提出一种基于最大信息系数和残差图卷积网络(maximal information coefficient - residual graph convolutional network, MIC-RGCN)的工业过程故障诊断方法。采用基于最大信息系数的图邻接矩阵生成方法，实现对不同类型变量之间空间关系的提取，有效地解决了工业过程变量之间的相关性难以表示的问题；提出改进的深度残差图卷积模型，该模型能够自动提取、深度挖掘数据的时空融合特征，并精准分类，有效地提高了故障识别的准确率。

2 MIC-RGCN算法实现

MIC-RGCN算法的整体结构如图 1所示，由数据预处理及邻接矩阵构建和深度残差图卷积模型2部分组成。数据预处理及表示部分包括样本数据标准化处理和邻接矩阵的获取。深度残差图卷积模型部分引入图卷积网络对数据的时空信息进行融合提取，引入残差结构提升模型的学习能力和传播能力，通过分类网络对提取的特征进行分类，最终输出故障类别。

图 1 MIC-RGCN算法的整体结构 Fig.1 Framework of the MIC-RGCN algorithm

2.1 数据预处理及表示 2.1.1 数据预处理

本步骤对原始故障数据进行标准化、移动滑窗截取，以产生用于模型的训练和测试数据。

给定数据集$\mathbf{D a t a}_1 \in \mathbf{R}^{N \times T}$，其中，R为实数集合，$N$为变量数，$T$为数据的时序长度。首先按照式(1)对其进行标准化处理，使不同尺度的变量处于同一数量级。

$ \mathbf{ Data }_1^*=\frac{\mathbf{ Data }_1-\mu}{\sqrt{s}}$

(1)

式中：$\mu $为数据的均值，$s$为数据的方差，$ \mathbf{ Data }_1^{\text{*}} $为归一化的$ \mathbf{ Data }_1 $。

然后用宽度为$t$，步长为1的移动窗口沿时序方向进行滑动截取，得到$T - t + 1$组$N \times t$结构的数据集$X = \{ {x_1}, {x_2}, \cdots , {x_i}, \cdots , {x_{T - t + 1}}\} $，其中，${x_i} \in {\mathbf{R}^{N \times t}}$，$i = 1, 2, \cdots , T - t + 1$。

2.1.2 基于最大信息系数的邻接矩阵构建

互信息(mutual information，MI)是信息论中一种用来度量变量间相互信赖性的手段。设2个随机变量$(X, Y)$的联合分布为$p(x, y)$，边缘分布分别为$p(x)$、$p(y)$，则随机变量$(X, Y)$的互信息$I(X;Y)$为联合分布$p(x, y)$与边缘分布$p(x)$、$p(y)$的相对熵，其公式为

$ I(X;Y) = \int {p(x, y){{\log }_2}\frac{{p(x, y)}}{{p(x)p(y)}}{\text{d}}x{\text{d}}y} $

(2)

最大信息系数^[27](maximal information coefficient, MIC)于2011年提出，以信息论和互信息为基础，可以衡量2个变量之间线性或非线性的关联程度，相较互信息拥有更高的准确度。当拥有足够的统计样本时，MIC可以捕获更为广泛的关系，而不限定特定的函数类型(如线性、指数型、周期型等)。对于相同噪声水平的函数关系或非函数关系，MIC具有近似的值。所以MIC不仅可以用来纵向比较同一相关关系的强度，还可以用来横向比较不同关系的强度。

对于连续变量，MIC的计算方法如下：将随机变量$(X, Y)$的取值分别依序划分至$a$和$b$个格子中，得到$a$行$b$列的$a \times b$的网格划分，使落在第$(x, y)$个格子的数据点的频率作为$p(x, y)$的估计，落在第$x$行的数据点的频率作为$p(x)$的估计，落在第$y$列的数据点的频率作为$p(y)$的估计，然后根据式(2)计算$(X, Y)$的互信息。遍历给定范围内不同的$a \times b$网格划分，得到其中互信息的最大值即为随机变量$(X, Y)$的最大信息系数。其计算如式(3)所示，MIC的计算实例如图 2所示，从图中可以看出MIC能很好地识别变量之间的非线性关系，且能够抵抗噪声干扰，对于明显的非线性关系，MIC值接近1。

图 2 MIC计算实例 Fig.2 Examples of MIC

$ \text{MIC}(X;Y) = \mathop {\max }\limits_{a \times b < B} \frac{{I(X;Y)}}{{{{\log }_2}(\min (a, b))}} $

(3)

式中：a、b为网格的划分数量；$B$为网格上限，通常取$B = {n^{0.6}}$，$n$为样本数量。

本步骤基于正常工况数据依次进行两两变量间的MIC值计算，最终得到所有变量之间相关程度的MIC矩阵表示，计算过程如下：

Step 1: 数据截取：给定正常工况数据集$Dat{a_2} \in {\mathbf{R}^{N \times T}}$，对其进行标准化处理，然后选取$l$长度的时序数据，得到数据集$S \in {\mathbf{R}^{N \times l}}$。其中，$S = \{ {s_1}, {s_2}, \cdots , {s_i}, \cdots , {s_N}\} $，${s_i} \in {\mathbf{R}^l}$，$i = 1, 2, \cdots , N$。

Step 2: MIC值计算：依次选取数据集$S$中的2条时序数据${s_i}, {s_j} \in S$，利用式(3)计算2条数据之间的MIC值。

Step 3: 邻接矩阵计算：对数据集$S$中所有$N$个变量，按照Step 2两两之间进行MIC值计算，可得到对称的$N \times N$矩阵。在此基础上，为了减少低相关性变量可能造成的干扰，经过验证比对法选择一个合适的阈值$\lambda $，将矩阵中小于$\lambda $的MIC值替换为0，其他值保持不变。

综上，通过上述步骤得到MIC矩阵$A \in {\mathbf{R}^{N \times N}}$，作为后续GCN层的邻接矩阵使用。

2.2 深度残差图卷积模型及GCN实现

深度残差图卷积模型的内部结构如图 3所示，模型由3层GCN层，3层归一化层(batch normalization layer，BN)，2层卷积层(convolutional layer，Conv)，3层全连接层(dense layer，Dense)和1层丢弃层(dropout layer，Dropout)组成。模型运行的过程如下：输入$X$为经过预处理的数据集，输入$A$为经过MIC计算得到的邻接矩阵；之后，采用3层GCN+BN网络对数据的时空特征进行提取，并选择线性整流函数(linear rectification function，ReLU)作为激活函数；接着，采用2层Conv网络对特征进一步深度提取；然后，经过3层Dense网络，对特征进行更加细化的提取和分类；同时，加入Dropout层减少模型过拟合；最后，输出故障分类结果。

图 3 深度残差图卷积模型结构 Fig.3 Model structure of deep residual graph convolution

下面对GCN的工作原理进行描述：GCN由Kipf等^[28]提出，它将深度学习的卷积应用图数据，为图结构数据的处理提供了一种崭新的思路。GCN能够充分整合节点信息，同时根据邻居节点的信息实现对数据特征的嵌入，挖掘特征之间潜在的相关关系。基于上述特点，本研究尝试将GCN网络应用工业过程故障诊断模型中，文中所提出的深度残差图卷积模型引入3层GCN层进行信息提取，具体描述如下：

GCN的输入包括节点特征矩阵X和邻接矩阵A，节点特征矩阵X为图网络中所有节点的特征集合，邻接矩阵A为图网络中所有节点之间的相关关系，每一层GCN可以用一个非线性函数表示，公式为

$ {H^{(L + 1)}} = f({H^{(L)}}, \boldsymbol{A}) $

(4)

式中：${H^{(L)}}$和${H^{(L + 1)}}$分别为第$L$层和第$L + 1$层的输出。

GCN模仿图像上的卷积操作，对邻接矩阵加入自循环得到新的邻接矩阵，并进行归一化，GCN的计算公式为

$ f({H^{(L)}}, \boldsymbol{A}) = \sigma \left( {{ \boldsymbol{D}^{ - 1/2}}\left( { \boldsymbol{A} + I} \right){ \boldsymbol{D}^{ - 1/2}}{H^{(L)}}{W^{(L)}}} \right) $

(5)

式中：I为单位矩阵；D是A的对角度矩阵，其对角线元素为A的行和，其余元素为0；${W^{(L)}}$为第$L$层的权重；$\sigma $为激活函数。

因此可以得到深度残差图卷积模型中3层GCN层的计算过程分别为

$ {H^{(1)}} = {Re} {\text{LU}}\left( {{ \boldsymbol{D}^{ - 1/2}}\left( { \boldsymbol{A} + \boldsymbol{I}} \right){ \boldsymbol{D}^{ - 1/2}}\boldsymbol{X}{W^{(1)}}} \right) $

(6)

$ {H^{(3)}} = {Re} {\text{LU}}\left( {{ \boldsymbol{D}^{ - 1/2}}\left( { \boldsymbol{A} + \boldsymbol{I}} \right){ \boldsymbol{D}^{ - 1/2}}{H^{(2)}}{W^{(3)}}} \right) + {H^{(2)}} $

(7)

$ {H^{(5)}} = {Re} {\text{LU}}\left( {{ \boldsymbol{D}^{ - 1/2}}\left( { \boldsymbol{A} + \boldsymbol{I}} \right){ \boldsymbol{D}^{ - 1/2}}{H^{(4)}}{W^{(5)}}} \right) + {H^{(4)}} $

(8)

式中：${H^{(1)}}$、${H^{(3)}}$、${H^{(5)}}$为(1)、(3)、(5)层GCN层的输出；${W^{(1)}}$、${W^{(3)}}$、${W^{(5)}}$为(1)、(3)、(5)层GCN层的权重；${H^{(2)}}$、${H^{(4)}}$为(2)、(4)层BN层的输出，$ {H^{(2)}} = {\text{BN}}({H^{(1)}}) $，$ {H^{(4)}} = {\text{BN}}({H^{(3)}}) $。

由上可知，采用MIC方法计算变量之间的相关关系，并设定阈值来生成GCN的邻接矩阵，解决了常规方法无法得到特征变量之间相关性参数的问题；并且，GCN网络结构的引入，可以有效地对数据的时空信息进行融合提取，比其他以CNN为代表的深度网络结构更加高效，能够很好地提升实际应用时的诊断准确率。

2.3 MIC-RGCN算法的运行流程

基于MIC-RGCN的故障诊断算法的运行框架如图 4所示，包含离线训练、在线诊断2个阶段。离线训练阶段：历史数据预处理后分别经过MIC计算得到邻接矩阵、经过移动滑窗截取得到模型的数据集，然后进行深度残差图卷积模型的训练和测试，如果测试结果符合要求就保存模型用于在线诊断的使用，如果不符合要求则重新设计模型并验证。在线诊断阶段：将采集的实时数据经过相同的预处理过程输入训练好的深度残差图卷积模型中，将得到的结果用于实际的故障分类，当识别故障时及时发出故障报警，同时将采集的数据保存，用于模型的维护和更新。

图 4 基于MIC-RGCN的故障诊断框架 Fig.4 Fault diagnosis framework based on MIC-RGCN

3 实验仿真及分析 3.1 田纳西-伊斯曼过程

田纳西-伊斯曼过程(Tennessee Eastman process，TEP)是Downs和Vogel建立的基于真实化学反应过程的仿真系统，被广泛应用于过程控制、故障诊断等各领域^[29]。TEP生成的数据具有非线性、强耦合和较强的动态特性，因此常常被用来评估不同算法在实际工业控制中的应用效果。

通用TEP数据集包含52个变量和21种故障。52个变量中包含11个操纵变量、22个连续过程测量变量和19个成分变量。正常和21种故障的训练集均在25 h仿真下获得，每3 min采集1次，其中，正常样本为500组数据，故障样本在仿真1 h后引入故障，共包含20组正常工况数据和480组故障数据，文中采用480组故障数据作为训练集，训练集中取10% 作为验证集。测试集的仿真时长为48 h，其中，正常样本为960组数据，故障样本在8 h后引入故障，共包含160组正常工况数据和800组故障数据，文中采用800组故障数据作为测试集。

为验证本研究所提算法的有效性及具体性，与4种代表性算法SVM、LSTMs、CNN(1D)、CNN(2D)进行对比，对比算法的结构如表 1所示。本研究测试基于Python语言在Sklearn和Keras框架完成。通过十折交叉验证方法计算不同MIC阈值下验证集的平均准确率，取最优的MIC阈值0.8。5种算法采用相同的参数设置：滑动窗口长度为20，训练周期为100，单次训练批量数128，优化算法采用自适应动量估计(adaptive momentum estimation, Adam)算法，算法学习率0.001，增加早停机制防止过拟合，采用误报率(false positive rate, FPR)、错误率error(E)和F1分数(F1 score，F)作为评价指标。

表 1 4种对比算法结构 Table 1 Structure of 4 comparison algorithms

$ E = 1 - A _{c} $

(9)

$ F{\text{ = 2}} \times \frac{{P \times R}}{{P + R}} $

(10)

式中：A_c为准确率，P为精确率，R为召回率。

表 2、3分别给出了5种算法对每种故障进行单独分类的二元分类和对所有故障同时分类的多分类的实验结果。从表 2可以看出，在二元分类实验结果上，MIC-RGCN算法的平均FPR为9%，平均F1 score为91%，比CNN(2D)分别降低8% 和提升9%，比CNN(1D)分别降低9% 和提升12%，比LSTMs分别降低8% 和提升12%，比SVM分别降低17% 和提升22%，且在绝大部分故障中取得了最优的结果。从表 3可以看出，在多分类实验结果上，MIC-RGCN算法的平均错误率为14%，平均F1 score为86%，比CNN(2D)分别降低20% 和提升20%，比CNN(1D)分别降低20% 和提升21%，比LSTMs分别降低21% 和提升22%，比SVM分别降低42% 和提升45%，且在绝大部分故障中取得了最优的结果。可见，MIC-RGCN算法的整体故障识别率明显优于其他几种深度学习和机器学习算法。

表 2 5种算法在TEP数据集上的二元分类实验结果 Table 2 Binary classification experimental results of 5 algorithms on TEP dataset

表 3 5种算法在TEP数据集上的多分类实验结果 Table 3 Multi-classification experimental results of 5 algorithms on TEP dataset

3.2 三相流过程

三相流过程是Cranfield大学设计开发的仿真系统，将油、空气、水的混合物通过分离器进行分离^[30]，是复杂的工业过程实现装置。该过程以一定的速率分别输入油、空气和水，模拟真实的工作状态和故障发生时的情况变化。

三相流过程一共包含24个过程变量和6种故障。三相流过程的数据集包含在模拟实际的不同操作条件下，引入故障和解除故障过程中各个过程变量的变化情况。将故障数据集的前50% 作为训练集，后50% 作为测试集，训练集中取10% 作为验证集，与3种代表性算法LSTMs、CNN(1D)、CNN(2D)进行对比，基于Python语言在Keras框架完成。通过十折交叉验证方法计算不同MIC阈值下验证集的平均准确率，取最优的MIC阈值0.7。4种算法采用相同的参数设置：滑动窗口长度为20，训练周期为100，单次训练批量数为64，优化算法采用Adam算法，算法学习率为0.001，增加早停机制防止过拟合，采用FPR、error和F1 score作为评价指标。

表 4、5分别给出了4种算法对每种故障进行单独分类的二元分类和对所有故障同时分类的多分类的实验结果。从表 4、5可以看出，本研究所提的MIC-RGCN算法在二元分类和多分类实验中均在4个模型中达到了最好的平均识别性能，特别是对于Fault 01和Fault 02，MIC-RGCN算法表现出明显的优势，说明了该算法的有效性。

表 4 4种算法在三相流数据集上的二元分类实验结果 Table 4 Binary classification experimental results of 4 algorithms on three-phase flow process dataset

表 5 4种算法在三相流数据集上的多分类实验结果 Table 5 Multi-classification experimental results of 4 algorithms on three-phase flow process dataset

3.3 可视化分析

本节以TEP数据集为例，通过可视化分析进一步考察模型各部分的作用及有效性。

首先，将实验中得到的MIC矩阵呈现如图 5所示(未计算自身的MIC值)。图中颜色深代表对应位置的2个变量相关性强，颜色浅代表对应位置的2个变量相关性弱。例如变量12-变量48和变量14-变量49两对变量在MIC矩阵上显示相关性强，同时可以计算得到，这2对变量的皮尔逊相关系数同样均为1，两者具有一致性。可见，利用MIC进行邻接矩阵的获取，不仅可以有效地提取变量之间的复杂相关信息，而且可以方便地将其转换为图卷积网络的空间信息，为后续图卷积网络的特征提取奠定基础。

图 5 MIC矩阵的可视化显示 Fig.5 Visual display of MIC matrix

为进一步考察MIC-RGCN算法的特征提取能力，采用t分布随机邻域嵌入(t-distributed stochastic neighbor embedding，t-SNE)^[31]方法对模型各层的输出进行可视化显示。图 6为TEP数据集在不同网络层的t-SNE可视化结果，图(a)~(f)分别为预处理后的输入数据、第1层GCN层输出、第2层GCN层输出、第3层GCN层输出、全局池化层输出和模型的最终输出，图中显示的故障样本从数据集随机选取，每层的输出通过t-SNE转化为二维向量表示在二维坐标中，每个点代表一个样本，不同故障的样本用不同颜色表示以示区分。

图 6 t-SNE可视化 Fig.6 t-SNE visualization

从图 6可以看出对于模型输入数据，不同类型的故障数据表现为杂乱无章的分布，个别差异稍明显外，其他数据之间看不出明显的分隔界限；经过3层GCN网络的特征提取后，相同类型的故障数据逐层地聚集起来，故障类别已现雏形，说明GCN网络逐层地提取故障数据的时空融合特征；之后，经过全局池化，不同类别的间隔进一步扩大，不同类型的故障数据之间的分界间隔更加明显；最终的模型输出结果表明，同一故障类型内部聚集更加紧密，类别之间的间隔非常分明，模型分类效果显著。

从t-SNE可视化结果可以得到如下结论：MIC-RGCN算法是一种可以充分提取时空融合信息的有效手段。通过MIC方法构建邻接矩阵，巧妙地将变量之间的相关性转化为空间距离，为后续网络的应用提供了数据基础；同时3层GCN层的引入，高效地提取出数据时间、空间的深层融合信息；最后，Dropout层的应用进一步避免模型过拟合，增强模型的泛化预测能力。

4 结论

本研究通过将最大信息系数引入图卷积邻接矩阵的生成中，提出一种新颖的基于最大信息系数和残差图卷积网络的故障诊断算法，该算法能够对数据的时空特征进行充分提取并精确分类。TEP和三相流过程数据集的实验结果表明，其故障诊断能力优于其他几种主流的机器学习和深度学习算法，为图卷积在工业时序数据故障诊断的实现提供一种行之有效的解决思路。

参考文献

[1]	KANO M, NAKAGAWA Y. Data-based process monitoring, process control, and quality improvement: Recent developments and applications in steel industry[J]. Computers & Chemical Engineering, 2008, 32(1/2): 12-24.
[2]	ZHAO H T. Neural component analysis for fault detection[J]. Chemometrics and Intelligent Laboratory Systems, 2018, 176: 11-21. DOI:10.1016/j.chemolab.2018.02.001
[3]	ISERMANN R. Fault-diagnosis applications: Model-based condition monitoring actuators, drives, machinery, plants, sensors, and fault-tolerant systems[M]. Berlin: Springer-Verlag, 2011.
[4]	DING S. Model-based fault diagnosis techniques: Design schemes, algorithms, and tools[M]. London: Springer-Verlag, 2013.
[5]	LIU J Y, SHI D L, LI G N, et al. Data-driven and association rule mining-based fault diagnosis and action mechanism analysis for building chillers[J]. Energy and Buildings, 2020, 216: 109957. DOI:10.1016/j.enbuild.2020.109957
[6]	LIU Q, ZHANG Y F, YANG S R, et al. A self-learning and self-optimizing framework for the fault diagnosis knowledge base in a workshop[J]. Robotics and Computer-Integrated Manufacturing, 2020, 65: 101975. DOI:10.1016/j.rcim.2020.101975
[7]	KOU L, LIU C, CAI G W, et al. Fault diagnosis for open-circuit faults in NPC inverter based on knowledge-driven and data-driven approaches[J]. IET Power Electronics, 2020, 13(6): 1236-1245. DOI:10.1049/iet-pel.2019.0835
[8]	TARIQ F, KHAN A Q, ABID M, et al. Data-driven robust fault detection and isolation of three-phase induction motor[J]. IEEE Transactions on Industrial Electronics, 2019, 66(6): 4707-4715. DOI:10.1109/TIE.2018.2866104
[9]	WEN L, LI X Y, GAO L, et al. A new convolutional neural network-based data-driven fault diagnosis method[J]. IEEE Transactions on Industrial Electronics, 2018, 65(7): 5990-5998. DOI:10.1109/TIE.2017.2774777
[10]	YIN Z, HOU J. Recent advances on SVM based fault diagnosis and process monitoring in complicated industrial processes[J]. Neurocomputing, 2016, 174: 643-650. DOI:10.1016/j.neucom.2015.09.081
[11]	SUN S Y, REN J. GASF-MSNN: A new fault diagnosis model for spatiotemporal information extraction[J]. Industrial & Engineering Chemistry Research, 2021, 60(17): 6235-6248.
[12]	JIANG Q C, YAN X F, LI J. PCA-ICA integrated with Bayesian method for non-Gaussian fault diagnosis[J]. Industrial & Engineering Chemistry Research, 2016, 55(17): 4979-4986.
[13]	冀丰偲, 余云松, 张早校. LDA_SVM方法在化工过程故障诊断中的应用[J]. 高校化学工程学报, 2020, 34(2): 487-494. JI F C, YU Y S, ZHANG Z X. Application of LDA and SVM method in fault diagnosis of chemical process[J]. Journal of Chemical Engineering of Chinese Universities, 2020, 34(2): 487-494. DOI:10.3969/j.issn.1003-9015.2020.02.025
[14]	GAO X R, YANG F, FENG E B. A process fault diagnosis method using multi-time scale dynamic feature extraction based on convolutional neural network[J]. The Canadian Journal of Chemical Engineering, 2020, 98(6): 1280-1291. DOI:10.1002/cjce.23740
[15]	YU J B, YAN X F. Layer-by-layer enhancement strategy of favorable features of the deep belief network for industrial process monitoring[J]. Industrial & Engineering Chemistry Research, 2018, 57(45): 15479-15490.
[16]	ZHANG Z P, ZHAO J S. A deep belief network based fault diagnosis model for complex chemical processes[J]. Computers & Chemical Engineering, 2017, 107: 395-407.
[17]	高学金, 刘爽爽, 高慧慧. 基于多变量卷积神经网络的发酵过程故障监测[J]. 高校化学工程学报, 2020, 34(6): 1511-1519. GAO X J, LIU S S, GAO H H. Fault monitoring of fermentation processes based on multivariable convolution neural network[J]. Journal of Chemical Engineering of Chinese Universities, 2020, 34(6): 1511-1519. DOI:10.3969/j.issn.1003-9015.2020.06.023
[18]	LECUN Y, BENGIO Y, HINTON G. Deep learning[J]. Nature, 2015, 521(7553): 436-444. DOI:10.1038/nature14539
[19]	HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780. DOI:10.1162/neco.1997.9.8.1735
[20]	CHO K, VAN MERRIENBOER B, GULCEHRE C, et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation: Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing [C]. Stroudsburg, Pennsylvania: Association for Computational Linguistics, 2014.
[21]	LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324. DOI:10.1109/5.726791
[22]	BATTAGLIA P W, HAMRICK J B, BAPST V, et al. Relational inductive biases, deep learning, and graph networks [EB/OL]. 2018-06-04 [2022-03-25]. https://arxiv.org/abs/1806.01261.
[23]	SHI X J, CHEN Z R, WANG H, et al. Convolutional LSTM network: A machine learning approach for precipitation nowcasting: Proceedings of the 28th International Conference on Neural Information Processing Systems [C]. Montreal, Canada: NIPS, 2015.
[24]	SHI X J, GAO Z H, LAUSEN L, et al. Deep learning for precipitation nowcasting: A benchmark and a new model: Proceedings of the 31st International Conference on Neural Information Processing [C]. Red Hook, New York: Curran Associates Inc, 2017.
[25]	YU B, YIN H T, ZHU Z X. Spatio-temporal graph convolutional neural network: A deep learning framework for traffic forecasting: Proceedings of the 27th International Joint Conference on Artificial Intelligence [C]. Stockholm, Sweden: AAAI Press, 2018.
[26]	GUO S N, LIN Y F, FENG N, et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting: Proceedings of the AAAI Conference on Artificial Intelligence [C]. Honolulu, Hawaii: AAAI Press, 2019.
[27]	RESHEF D N, RESHEF Y A, FINUCANE H K, et al. Detection novel associations in large data sets[J]. Science, 2001, 334(6062): 1518-1524.
[28]	KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks: Proceedings of the 5th International Conference on Learning Representations [C]. Toulon, France: ICLR, 2017.
[29]	DOWNS J J, VOGEL E F. A plant-wide industrial process control problem[J]. Computers & Chemical Engineering, 1993, 17(3): 245-255.
[30]	RUIZ-CARCEL C, CAO Y, MBA D, et al. Statistical process monitoring of a multiphase flow facility[J]. Control Engineering Practice, 2015, 42: 74-88. DOI:10.1016/j.conengprac.2015.04.012
[31]	VAN DER MAATEN L, HINTON G. Visualizing data using t-SNE[J]. Journal of Machine Learning Research, 2008, 9(86): 2579-2605.