2. 江南大学 轻工过程先进控制教育部重点实验室,江苏 无锡 214122
2. Key Laboratory of Advanced Process Control for Light Industry Jiangnan University, Ministry of Education, Wuxi 214122, China
在某些复杂、环境恶劣的工业生产过程中,由于产品可靠性要求的不断提高,因此需要严格地监控一些直接或间接影响产品质量的关键变量。然而考虑到测量成本或者一些技术条件的制约,导致这些关键变量无法采用在线仪器测量获得。为了实时精确地预测这些难以测得的变量,基于数据驱动的软测量技术[1-3]得到了快速的发展,并逐渐地应用到了化工、制药等工业过程中。
针对某些工况容易随时间发生变化的工业过程,传统的全局软测量模型难以满足工业过程的实时性要求且外推能力差[4],比较普遍的一种解决方案是采用即时学习[5-6](just-in-time learning,JITL)策略,对于JITL相似度准则这一核心,学者们做出了大量的研究。Chen等[7]考虑到常见的相似度准则仅将样本的输入信息联系起来,没有综合样本的输出信息,因此其把输入和输出信息共同考虑构造自适应加权距离作为相似度指标;Niu等[8]结合模糊C-均值和传统的JITL这两种方法,首先采用模糊C-均值方法重构收集的历史样本,然后采用JITL方法在重构的历史样本集中选取当前的局部相似样本建立软测量模型。然而,该类方法没有考虑到JITL的耗时问题,在一些实时性要求较高的工业过程中无法有效运用。
针对上述提出的问题,Ge等[9]首先计算相邻待测样本之间的一阶相似度,然后与相似度阈值比较判断是否更新当前时刻模型,仿真结果表明可以有效地解决模型耗时问题。但是,此方法忽略了过程变化较慢时产生的累计误差问题,文献[10]将计算相邻两待测数据之间的相似度改进为计算当前时刻待测样本与前一模型更新时刻待测样本之间的相似度,可以很好地解决累计误差问题。但是,上述方法在选择局部样本建模时均采用的是一阶相似度(first-order similarity, FOS)准则,若只在FOS的基础上降低模型更新频率,那么可以很好地解决模型的耗时问题,但是局部模型的精度会有所降低。牛大鹏等[11]在文献[9]的框架上增加时序性,同时将投影算法用于估计模型未更新时刻的输出,取得了良好的成果。
综上,本文在FOS选取局部样本建模的基础上,提出一种二阶相似度(second-order similarity, SOS)准则,SOS准则既考虑到样本总体分布特性,同时可以更有效地判断当前模型是否需要更新。对于当前到来的待测样本,采用给定的相似度阈值判定模型是否更新,若更新,采用所提的SOS策略选择与待测样本邻居最多的二阶相似数据,同时采用累积相似度因子自适应的确定局部建模样本的个数,并将得到的二阶相似样本代入高斯过程回归 (Gaussian process regress, GPR)建立当前模型,否则,继续采用前一更新之初的模型估计当前待测样本,最后,采用青霉素发酵过程对所提方法进行验证,结果表明该方法既解决JITL耗时问题,且提高了模型精度。
1 基于二阶相似度的即时学习方法 1.1 传统的即时学习方法JITL是根据相似输入产生相似输出的思想,假设有N个历史训练样本的数据集
${\rm SI} = \gamma \sqrt {\exp ( - {d^2})} + (1 - \gamma ) \cos\; \theta $ | (1) |
式中:SI表示某一时刻待测数据
$d{\rm{ = }}{\left\| {{{ x}_q} - {{ x}_i}} \right\|_2}$ | (2) |
$\theta = {\rm{arc}}\cos \frac{{{ x}_q^{\rm{T}}{{ x}_i}}}{{{{\left\| {{{ x}_q}} \right\|}_2} \cdot {{\left\| {{{ x}_i}} \right\|}_2}}}$ | (3) |
SOS[12]定义为:如果两样本的一阶相似样本大多相同,那么认为两样本拥有较高的二阶相似性。FOS准则仅关注单独两样本之间的相似度,忽略了样本集总体的二阶相似性。如图1所示,数据1与2的FOS很高,数据1和8的近邻大多数相同,因此,二者的SOS很高,同理数据2与8的二阶相似性也较高。假设当前到来待测数据1,若采用FOS准则选取相似集,仅仅选择到数据2;但改用SOS策略时,不仅可以选择到数据2,还能选择到数据8。
Download:
|
|
SOS算法的伪代码如下:
输入 训练样本集
for
for
通过式(1)计算训练样本
end for
end for
得到训练样本两两之间的相似度矩阵
对列方向上进行降序排序,得到对应的索引值矩阵
for
通过式(1)计算测试样本
end for
得到
for
计算
end for
输出 索引值的个数,即是
采用二维空间中的数值仿真,进一步探讨FOS、SOS准则的区别及特点。图2为二维空间中以3个类别中心随机产生的三类数据集。对于“星型”标记类上一点(3,2.3),图3(a)、(b)中正方形标记框标记的样本分别是通过FOS与SOS准则选择到的,与FOS准则相比,SOS准则选择到的相似数据全是同类数据集,这是由于SOS准则在选择相似数据时不仅考虑数据单点间的相似性,而且充分考虑了数据集总体分布特征。选择同类别数据建立的局部模型更合理,精度更高。
Download:
|
|
Download:
|
|
如图3(a)所示,假设当前时刻到来椭圆中“叉号”标记类的数据点,使用FOS方法计算其与数据点(3,2.3)之间的相似度,那么计算出来的FOS很高,致使模型不会更新,仍采用更新之初模型估计会使模型精度下降;而将SOS准则用于计算其与点(3,2.3)的相似度,二者的SOS较低,使得模型会更新,进而选择到的局部相似数据更合理。因此,无论从数据集选取的角度还是从更新模型角度考虑,SOS在某种程度上都具有优势。
1.3 累计相似度因子建立局部模型时,数据集个数的选取也是影响JITL模型精度的一个重要因素。若选择的数据过多会导致信息的冗余,失去了JITL相似输入产生相似输出的本意;过少会引起信息的丢失,这两种情况都不利于模型精度的提升。常用的解决方式是根据经验选取局部模型的数据个数,然而这样的选取方式具有盲目性。为了有效解决这一问题,本文引用累积相似度因子[13-14]自适应的选取相似数据的数量,其计算公式为
${s_k} = \frac{{\displaystyle\sum\limits_{i = 1}^k {{s_{qi}}} }}{{\displaystyle\sum\limits_{i = 1}^N {{s_{qi}}} }},0 \leqslant k \leqslant N$ | (4) |
式中:
针对每个新来的待测数据,JITL都是通过选择到的相似样本建立局部模型,并对待测数据进行估计。但是,一般的工业生产过程不会频繁发生工况变化。因此,可以继续采用之前建立好的的局部模型预测工况变化较小时刻的待测样本,从而减少模型耗时。
通常通过比较两相邻样本相似度与当前阈值(THR)的大小来降低模型更新频率,若小于THR,则更新模型估计当前待测数据;否则,沿用之前建立的局部模型进行估计输出。然而,当生产过程的工况变化较为缓慢时,如果仅计算相邻数据之间的相似度,可能会一直大于THR,从而使模型未及时更新引起累计误差问题。所以,可以改进为计算当前时刻与前一模型更新时刻数据间的相似度来克服累计误差问题。详细描述如下:
1) 若当前为q时刻,经过计算且模型需要更新,当来到新的测试数据
2) 当
3) 如果
GPR是一种非参数概率模型,已经成为机器学习领域的一种重要的建模方法,并在近些年来得到广泛关注与应用[15-17],其基本原理描述如下。
现有历史训练数据集
${y_i} = f({{ x}_i}) + \varepsilon $ | (5) |
式中:
对于某一待测数据
${y_q}({{ x}_q}) = {{ c}^{\rm T}}({{ x}_q}){{ C}^{ - 1}}{ Y}$ | (6) |
$\sigma _{{y_q}}^2({{ x}_q}) = c({{ x}_q},{{ x}_q}) - {{ c}^{\rm T}}({{ x}_q}){{ C}^{ - 1}}{ c}({{ x}_q})$ | (7) |
其中,
GPR有不同的协方差函数可以选择,本文选取径向基协方差函数,其详细描述如下:
$c({{ x}_i},{{ x}_j}) = v\exp \left[ { - \frac{1}{2}\sum\limits_{{{t}} = 1}^m {{\omega _t}{{({{ x}_{it}} - {{ x}_{jt}})}^2}} } \right] + \sigma _N^2{\delta _{ij}}$ | (8) |
其中,
通常采用极大似然估计计算式(8)中的参数
$L({ \theta }) = - \frac{1}{2}\log (\det ({ C})) - \frac{1}{2}{{ Y}^{\rm T}}{{ C}^{ - 1}}{ Y} - \frac{N}{2}\log (2\pi )$ | (9) |
首先对超参
基于SOS-JITL软测量建模流程图如图4,具体建模步骤如下:
Download:
|
|
1)采用式(1)计算历史数据相互间的FOS,得到相似度矩阵,同时将其降序排序返回索引值矩阵
2)假如当前q时刻模型需要更新,针对待测数据xq,计算其与历史数据之间的FOS,并返回索引值向量
3)通过1.2节计算
4)若
5)对于
青霉素产生菌在适当的温度、pH值等外部环境条件下生长与抗生素合成这一过程称为青霉素发酵过程,此过程分为3个阶段,即产生菌生长阶段、青霉素合成阶段与产生菌的自溶阶段[19]。作为模拟青霉素发酵过程的Pensim仿真平台,其包含了众多的输入变量与输出变量,其中青霉素这一重要产物的浓度在实际发酵过程中难以测得,因此可以采用软测量建模进行在线预测。本文采用通气速率、CO2浓度和pH值等6个变量作为输入变量,青霉素浓度作为输出变量,建立软测量模型。采用Pensim仿真平台产生400组样本,选取其中200组作为训练数据,剩余的作为测试数据来验证所提方法。
为了对比建模方法的性能,分别采用SVM、PLS、ANN、GPR建模方法预测青霉素浓度。其中定义ANN的网络层为3层、隐藏层节点数为20、步长为0.01、迭代次数为100次、训练目标最小误差为0.001;SVM采用高斯核函数。图5给出了4种方法的预测结果,图中实线表示青霉素浓度的实际值,虚线表示各方法的预测值。从图中可以得到,GPR方法的预测值更逼近于实际真值,表明GPR建模方法的精度更高。
Download:
|
|
为了进一步分析GPR方法的优势,采用均方根误差[20](RMSE)这一指标对比各种建模方法,其计算公式为
${\rm{RMSE}}{ = }\sqrt {\frac{{\displaystyle\sum\limits_{j = 1}^M {{{({y_j} - y_j^ * )}^2}} }}{M}} $ | (10) |
式中:
表1给出了4种方法的RMSE,从表中可以清晰地看出本文所采用GPR方法的RMSE最小,进一步表明该方法建立的模型估计精度更高,跟踪能力更强。
为了验证本文所提方法的预测性能,分别选取GPR方法、一阶相似度的GPR方法(简写为JITL-GPR)、减少模型耗时的一阶相似度GPR方法(简写为RJITL-GPR)3种方法与本文方法(proposed)对比,且JITL在选取局部相似样本数目时均采用累积相似度因子。4种方法预测曲线如图6所示,将样本130~190的预测曲线进行放大,可以直观的看出,与前3种方法相比,所提方法的跟踪性能更好。4种方法的预测误差如图7所示,其中,图7(d)中的误差曲线在0处抖动幅度更小,表明该方的预测精度更高。
Download:
|
|
Download:
|
|
为了进一步分析所提方法的优越性,采用RMSE和模型时耗作为评价标准。表2给出了4种方法的RMSE和建模耗时。由表中的信息可以得到,与单一GPR方法相比,JITL-GPR尽管提高了模型的精度,但是建模所花费的时间太长,对于一些实时性要求较高的生产过程,该方法可能无法满足实际要求;RJITL-GPR由于降低了模型的更新频率使得建模时间大大缩短,与此同时降低了模型精度;与前3种方法对比,所提方法不仅降低了模型的时耗,同时提高了模型的精度。这是由于SOS在选择局部相似数据时,可以更合理地选取到相似数据,同时也更准确地判断模型是否更新,使当前选取的二阶相似样本建立的局部模型更适用于模型未更新时刻的数据。
从工业过程实时性角度出发,提出一种基于SOS的JITL-GPR方法,在自适应模型更新机制的框架下,采用SOS方法从历史数据中选取与当前待测数据用于更多邻居的样本建立此时的局部GPR模型,同时引入累计相似度因子优化局部模型的样本数目。与FOS准则相比,SOS准则在选取相似样本时,既关注了两数据单点间的相似度,同时也考虑了单个数据与历史集总体分布特征之间的关系。因此,所提方法在选择相似样本时更合理,同时也可以更为准确地判断模型是否更新。采用青霉素发酵过程中青霉素浓度对所提方法进行验证,结果表明该方法不仅减少模型的时耗,同时提高了模型的精度。
[1] |
汤健, 柴天佑, 刘卓, 等. 基于更新样本智能识别算法的自适应集成建模[J]. 自动化学报, 2016, 42(7): 1040-1052. TANG Jian, CHAI Tianyou, LIU Zhuo, et al. Adaptive ensemble modelling approach based on updating sample intelligent identification[J]. Acta automatica sinica, 2016, 42(7): 1040-1052. (0) |
[2] | ZHENG Junhua, SONG Zhihuan. Semisupervised learning for probabilistic partial least squares regression model and soft sensor application[J]. Journal of process control, 2018, 64: 123-131. DOI:10.1016/j.jprocont.2018.01.008 (0) |
[3] | LI Han, YOU Shijun, ZHANG Huan, et al. Analyzing the impact of heating emissions on air quality index based on principal component regression[J]. Journal of cleaner production, 2018, 171: 1577-1592. DOI:10.1016/j.jclepro.2017.10.106 (0) |
[4] | ZHENG Jianqiao, WANG Hongfang, ZHOU Hongpeng, et al. A using of just-in-time learning based data driven method in continuous stirred tank heater[C]//Proceedings of the 7th International Conference on Intelligent Control and Information Processing. Siem Reap, Cambodia, 2016: 98-104. (0) |
[5] | PENG Xin, TANG Yang, HE Wangli, et al. A just-in-time learning based monitoring and classification method for hyper/hypocalcemia diagnosis[J]. IEEE/ACM transactions on computational biology and bioinformatics, 2018, 15(3): 788-801. DOI:10.1109/TCBB.2017.2655522 (0) |
[6] | YIN Shen, GAO Huijun, QIU Jianbin, et al. Fault detection for nonlinear process with deterministic disturbances: a just-in-time learning based data driven method[J]. IEEE transactions on cybernetics, 2017, 47(11): 3649-3657. DOI:10.1109/TCYB.2016.2574754 (0) |
[7] | CHEN Kun, LIU Yi. Adaptive weighting just-in-time-learning quality prediction model for an industrial blast furnace[J]. ISIJ international, 2017, 57(1): 107-113. DOI:10.2355/isijinternational.ISIJINT-2016-292 (0) |
[8] | NIU Dapeng, GAO Huiyuan, LIU Yuanqing. Modeling of penicillin fermentation process based on FCM and improved Just-in-Time learning algorithm[C]//Proceedings of the 36th Chinese Control Conference. Dalian, China, 2017: 10328-10332. (0) |
[9] | GE Zhiqiang, SONG Zhihuan. A comparative study of just-in-time-learning based methods for online soft sensor modeling[J]. Chemometrics and intelligent laboratory systems, 2010, 104(2): 306-317. DOI:10.1016/j.chemolab.2010.09.008 (0) |
[10] |
张宏伟, 李鹏飞, 景军锋, 等. 基于即时学习的软测量建模实时性改进[J]. 西安工程大学学报, 2014, 28(6): 750-754. ZHANG Hongwei, LI Pengfei, JING Junfeng, et al. A real-time performance improvement strategy of Just-In-Time-Learning based on soft sensor[J]. Journal of Xi’an Polytechnic University, 2014, 28(6): 750-754. DOI:10.3969/j.issn.1674-649X.2014.06.022 (0) |
[11] |
牛大鹏, 刘元清. 基于改进即时学习算法的湿法冶金浸出过程建模[J]. 化工学报, 2017, 68(7): 2873-2879. NIU Dapeng, LIU Yuanqing. Modeling hydrometallurgical leaching process based on improved just-in-time learning algorithm[J]. CIESC journal, 2017, 68(7): 2873-2879. (0) |
[12] | CRIBBIN T. Discovering latent topical structure by second-order similarity analysis[J]. Journal of the American society for information science and technology, 2011, 62(6): 1188-1207. DOI:10.1002/asi.v62.6 (0) |
[13] |
刘毅, 金福江, 高增梁. 时变过程在线辨识的即时递推核学习方法研究[J]. 自动化学报, 2013, 39(5): 602-609. LIU Yi, JIN Fujiang, GAO Zengliang. Online identification of time-varying processes using just-in-time recursive kernel learning approach[J]. Acta automatica sinica, 2013, 39(5): 602-609. (0) |
[14] | LIU Yi, GAO Zengliang. Industrial melt index prediction with the ensemble anti-outlier just-in-time Gaussian process regression modeling method[J]. Journal of applied polymer science, 2015, 132(22): 41958. (0) |
[15] | WANG Haijun, GAO Xinbo, ZHANG Kaibing, et al. Single image super-resolution using Gaussian process regression with dictionary-based sampling and student-t likelihood[J]. IEEE transactions on image processing, 2017, 26(7): 3556-3568. (0) |
[16] | HAN Jianan, ZHANG Xiaoping, WANG Fang. Gaussian process regression stochastic volatility model for financial time series[J]. IEEE journal of selected topics in signal processing, 2016, 10(6): 1015-1028. DOI:10.1109/JSTSP.2016.2570738 (0) |
[17] | XIONG Weili, SHI Xudong. Soft sensor modeling with a selective updating strategy for Gaussian process regression based on probabilistic principle component analysis[J]. Journal of the franklin institute, 2018, 355(12): 5336-5349. DOI:10.1016/j.jfranklin.2018.05.017 (0) |
[18] |
何志昆, 刘光斌, 赵曦晶, 等. 高斯过程回归方法综述[J]. 控制与决策, 2013, 28(8): 1121-1129, 1137. HE Zhikun, LIU Guangbin, ZHAO Xijing, et al. Overview of Gaussian process regression[J]. Control and decision, 2013, 28(8): 1121-1129, 1137. (0) |
[19] | YU Jie. Multiway Gaussian mixture model based adaptive kernel partial least squares regression method for soft sensor estimation and reliable quality prediction of nonlinear multiphase batch processes[J]. Industrial & engineering chemistry research, 2012, 51(40): 13227-13237. (0) |
[20] | LIU Ziwei, GE Zhiqiang, CHEN Guangjie, et al. Adaptive soft sensors for quality prediction under the framework of Bayesian network[J]. Control engineering practice, 2018, 72: 19-28. DOI:10.1016/j.conengprac.2017.10.018 (0) |