首页 关于本刊 编 委 会 期刊动态 作者中心 审者中心 读者中心 下载中心 联系我们 English
 自动化学报  2018, Vol. 44 Issue (2): 216-227 PDF

1. 火箭军工程大学控制工程系 西安 710025;
2. 中国航天科工二院25所 北京 100854

Data Driven Reliability Assessment and Life-time Prognostics: A Review on Covariate Models
YU Yong1,2, SI Xiao-Sheng1, HU Chang-Hua1, CUI Zhong-Ma2, LI Hong-Peng2
1. Department of Automation Technology, Xi'an Institute of High Technology, Xi'an 710025;
2. Institute No. 25, The Second Academy of China Aerospace Science and Industry Corporation, Beijing 100854
Manuscript received : January 4, 2017, accepted: June 12, 2017.
Foundation Item: Supported by National Natural Science Foundation of China (61174030, 61374120, 61374126, 61473094, 61573365, 61773386), National Science Fund for Distinguished Youth Scholars of China (61025014), and Young Elite Scientists Sponsorship Program of China Association for Science and Technology (2016QNRC001)
Corresponding author. HU Chang-Hua Professor in the Department of Automation Technology, Xi$'$an Institute of High-Technology. His research interest covers fault diagnosis and reliability engineering. Corresponding author of this paper
Recommended by Associate Editor WEN Cheng-Lin
Abstract: Reliability assessment and life-time prognostics have been widely concerned and developed fast in the past decades for their importance in industrial processes. Data driven approaches have been popular due to the complexity of failure mechanism about the reliable complex system. With the development of auto-monitoring and sensor technology, it is easy to obtain degradation data and environment information. A large number of methods based on hazard models with covariates have emerged. In this paper we review the state-of-the-art covariate models in the literature. We classify the approaches into three broad types of models, that is, constant models, time-dependent models and stochastic models. We systematically discuss these models and approaches and finally highlight future research challenges.
Key words: Life-time prognostics     data driven     reliability     covariate

1 基于协变量的可靠性评估与寿命预测方法分类

 图 1 基于协变量方法的分类 Figure 1 Classification of Covariate Models
2 基于协变量的可靠性评估与寿命预测方法进展 2.1 固定协变量模型 2.1.1 比例风险模型

 $$${h}({t};\boldsymbol{z}) = {h}_{0}({t})\Psi(\boldsymbol{\gamma}\boldsymbol{z})$$$ (1)

 \begin{align*} &\frac{{h}({t};\boldsymbol{z}_{{x}})}{{h}({t};\boldsymbol{z}_{{y}})}= \frac{{h}_{0}({t})\exp(\boldsymbol{z}_{{x}}\boldsymbol{\gamma})} {{h}_{0}({t})\exp(\boldsymbol{z}_{{y}}\boldsymbol{\gamma})} =\\ &\qquad\exp[\boldsymbol{\gamma}(\boldsymbol{z}_{{x}}-\boldsymbol{z}_{{y}})]\end{align*}

Cox[8, 32]针对模型中回归系数$\boldsymbol{\gamma}$的估计, 提出了条件似然方法; Kalbfleisch等[33]提出了与条件似然类似的边缘似然方法. Makis等[34-35]对比例风险模型进行了广泛深入研究, 并成功地开发出基于比例风险模型的决策优化商用软件EXAKT[36-37]. Sun等[18]为了减少协变量的数目, 采用主元分析对协变量预先进行降维处理, 再利用处理后的数据结合比例风险模型进行寿命预测.此外, 受比例风险模型的启发, 相继出现了比例强度模型[8, 38]和比例协变量模型[18]用来估计系统寿命, 实现维护决策优化.

2.1.2 分层比例风险模型

Kumar等[9]为了解决比例风险模型要求不同协变量情况下失效率函数成比例的问题, 提出了分层比例风险模型.分层比例风险模型要求整个样本集能够根据协变量状态分为${q}$层, 比如根据系统的工作环境温度(低、中、高)将待评估系统的工作环境情况分为三种.在分层比例风险模型中只假设在同一分层中的风险函数是成比例的, 各层之间的风险函数无需成比例, 其中第$j$层的风险函数[9]可以表示为

 $$${h}_{{j}}({t};\boldsymbol{z})={h}_{0{j}}({t})\exp(\boldsymbol{\gamma}\boldsymbol{z})$$$ (2)

Kay[39]将该模型用于处理临床实验中的截止数据, 并使用拟合优度法对其进行了评估. Kumar[40]将分层比例风险模型用于处理可维修系统的可靠性评估, 并且根据监测数据得到了各层之间的不同基准失效率. Hanson等[41]为了更好地评估协变量对系统退化的影响, 在进行协变量分层时, 把协变量从时间与空间上进行联合分层, 从而更为准确地分析各协变量对样本失效率的影响. Fibrinogen studies collaboration[42]这个团队则较为全面地总结了评估分层比例风险模型预测性能的方法, 提出了三种可用于模型效果评估的策略, 同时讨论了三种评估策略的适用范围, 明确了各评估方法的优缺点.

2.1.3 两步退化模型

Anderson等[10]为了分析固定协变量对系统退化影响具有时变特性时的情况, 将Cox比例风险模型进行拓展, 于1982年提出了两步退化模型(Two-step regression model, TSRM).该模型假设, 在系统运行中协变量固定, 协变量对系统退化的影响会随着系统运行时间的不断增加而逐渐减弱, 即各协变量对应的回归系数逐渐减小, 比如回归系数$\boldsymbol{\beta}_{{j}}$随时间的变化为$\boldsymbol{\beta}_{{j}}({t})=\boldsymbol{\beta}_{{j}}^{\ast}{\rm e}^{-\gamma_{{j}}{t}}$, $\boldsymbol{\beta}_{{j}}^{\ast}$为初始时刻回归系数.两步退化模型则为上述随时间变化的$\boldsymbol{\beta}_{{j}}$提出了一种简单的表示方法[10], 其假设如下:

 $$$\boldsymbol{\beta}_{{j}}({t})=\boldsymbol{\alpha}_{{j}}, t\leq{B};\quad \boldsymbol{\beta}_{{j}}({t})=\boldsymbol{\gamma}_{{j}}, t>{B}$$$ (3)

Louzada[60]通过仿真研究发现, 在小样本条件下也可使用最大似然方法估计扩展风险回归模型的参数. Tseng等[61]通过利用蒙特卡洛EM算法, 提出了一种伪联合似然方法来估计扩展风险退化模型中的未知参数.此外, Tseng等[62]还通过仿真实验, 检验了一些扩展风险退化模型参数估计方法的有效性, 并从运算量大小和参数估计偏差、一致性等方面比较了估计算法的优缺点, 最后还通过两个数据实例证明了扩展风险退化模型的有效性. Shyur等[63]为了保证客机飞行的可靠性, 利用扩展风险回归模型处理了民航飞机的事故数据与状态监测数据, 并得出了客机动力系统的工作可靠性曲线.

2.1.7 比例优势模型

Mccullagh通过在多样本可靠性评估中提出恒定优势比的概念[15], 形成了比例优势模型(Proportional odds model, POM).该模型假设协变量函数对系统可靠性具有乘法性质的影响[64], 其具体表达形式为[15-16]

 $$$\frac{{F}_{{i}}({t};\boldsymbol{z})}{1-{F}_{{i}}({t};\boldsymbol{z})}= \frac{{F}_{0}({t})}{1-{F}_{0}({t})}\Psi(\boldsymbol{\gamma}\boldsymbol{z})$$$ (9)

Bennett[16]推导了可用于估计比例优势模型中未知参数的极大似然函数, 并将该模型用于肺癌病人死亡的预测分析.针对当观测数据量小于参数维度情况时, 无法使用最大似然估计法进行参数估计的情况, Faisal等[65]提出了一种利用伪观测数据进行参数估计的方法; 该方法能够更大限度放宽使用比例优势模型时的观测数据量要求. Sinha等[66]提出了一种可以不假设协变量的具体分布类型就可进行参数估计的方法, 该方法仅通过协变量的测量误差分布来建立估计量函数, 从而能够在协变量分布未知的情况下提高参数估计精度. Liao等[17]假设比例优势模型中系统的失效时间分布为Log-Logistic分布, 提出了Log-Logistic回归模型; 该模型中各样本的失效率函数是依时间收敛的, 能够克服威布尔比例风险模型在对失效数据进行建模时需要失效率函数必须为单调函数的缺陷. Faisal等[67]讨论了在高维情况下, 比例优势模型参数估计的问题, 提出了Boosting算法.

2.2 时变协变量模型 2.2.1 比例强度模型

 ${\kern 10pt} {h}({t}|{N}({t}), \boldsymbol{z}({t}))= {h}_{0{j}}({t})\exp(\boldsymbol{z}({t})\boldsymbol{\gamma}_{{j}}) \\ {\kern 10pt}{h}({t}|{N}({t}), \boldsymbol{z}({t}))= {h}_{0{j}}({t}-{t}_{{n}({t})})\exp(\boldsymbol{z}({t})\boldsymbol{\gamma}_{{j}})$ (10)

 $$${R}({t}|\boldsymbol{z}({t}))=\frac{\exp(\boldsymbol{\alpha}+\boldsymbol{\gamma}\boldsymbol{z}({t}))} {1-\exp(\boldsymbol{\alpha}+\boldsymbol{\gamma}\boldsymbol{z}({t}))}$$$ (12)

Liao等[17]提出通过利用Nelder-Mead算法来获取对数极大似然函数, 从而估计出模型参数的最大似然值. Wu[77]针对具有线性约束的Logistic回归模型提出了修正受限的Liu估计量, 并利用蒙特卡洛仿真证明了该参数估计方法的有效性. Li等[78]提出了一种半参数Logistic回归模型, 并针对模型中非参数部分的线性度提出了一种惩罚性似然率测试方法, 用以检验模型的有效性.

2.2.3 比例协变量模型

 $$$Z_{\boldsymbol{\gamma}}({t})=C({t}){h}({t})$$$ (13)

2.2.4 威布尔比例风险模型

 $$${h}({t};\boldsymbol{z}({t}))=\frac{\beta}{\eta}\left(\frac{{t}}{\eta}\right)^{\beta-1} \Psi(\boldsymbol{\gamma}\boldsymbol{z}({t}))$$$ (14)

2.2.5 显式风险模型

 $$${h}({t};\boldsymbol{z}_{1}({t}), \boldsymbol{z}_{2}({t}))= {h}_{0}(\exp(\boldsymbol{\gamma}_{1}\boldsymbol{z}_{1}({t})))\exp(\boldsymbol{\gamma}_{2}\boldsymbol{z}_{2}({t}))$$$ (15)