2. 航空机电综合航空科技重点实验室 电子工程部,江苏 南京 211106
2. Electronic Engineering Department, Aviation Key Laboratory of Science and Technology on Aero Electromechanical System Integration, Nanjing 211106, China
剩余使用寿命(remaining useful life,RUL)估计是设备预测与健康管理(prognostic and health management,PHM)的主要内容之一。准确估计设备RUL可以为维修决策提供基础数据,及时发现潜在威胁,从而采取相应措施有效避免故障的发生,对延长设备使用寿命、降低维护成本有重要意义[1]。RUL估计方法可以分为基于模型、数据驱动方法2类。基于模型方法通过建立物理模型精确描述设备退化过程完成预测,由于需要掌握设备退化机理并对零部件精确建模,大多数情况下实现困难或代价极高[2];数据驱动方法从已失效设备的历史数据中,捕获传感器数据与设备退化水平之间的关系,完成RUL估计,在难以得到设备物理模型时依然可以实现RUL估计,通用性强。目前神经网络、支持向量回归、贝叶斯学习、隐马尔科夫模型[3-8]等机器学习和统计学方法已经广泛应用于数据驱动的RUL估计。
1 基于退化曲线的RUL估计概述基于相似性的方法属于数据驱动的RUL估计,其主要思想可以表述为:如果测试样本与参考样本有相似的退化性能,则它们可能有相似的RUL[1]。测试样本指从尚未失效的设备(测试单元)中提取的样本,参考样本指从运行在相同工作条件下已经失效的设备(训练单元)中提取的历史样本。
图1描述了基于相似形状匹配的RUL估计总体框架。离线阶段,首先对训练单元传感器数据进行噪声滤波与信息融合,将其映射为一维健康度(health indicator,HI),拟合各训练单元随时间变化的HI轨迹以表示退化过程。然后从HI轨迹中提取曲线放入参考样本库中供在线RUL估计使用。在线阶段,对测试单元传感器数据进行相同的处理提取测试样本,将测试样本与参考样本库匹配,估计RUL。
Download:
|
|
参考样本的提取方法多样,文献[7]使用训练单元整个生命周期的HI轨迹作为参考样本匹配计算测试单元RUL;考虑到随着运行时间的增加,设备退化特征逐步明显,文献[8]使用末端HI轨迹作为参考样本进行剩余寿命估计。本文提取HI轨迹上固定时间长度的曲线作为参考样本,RUL估计不是基于测试单元HI轨迹的全部或末端,而是基于测试单元HI轨迹的某一部分,与传统相似性样本提取方法有显著差异。
2 曲线提取本文所述剩余寿命估计方法需要处理训练单元和测试单元数据,为了减少计算量,在离散时间下进行数据处理,在整数时间点采样,间隔为1。假设有训练集合中含有N个训练单元,每个训练单元包含m类传感器数据,运行时间长度为
通用的健康度一般要求
${\delta _{{\rm{HI}}}}({t}) = (l - t)/{R_{{\rm{th}}}},1 \leqslant t \leqslant l$ | (1) |
对N个训练单元所有时间点传感器数据和实际健康度进行线性回归处理[2],计算回归参数。各时间点健康度可由式(1)估计得出:
${\hat \delta _{{\rm{HI}}}} = \alpha + {{\beta}} {{{x}}^{\rm{T}}} = \alpha + \sum {_1^m} {\beta _i}{x_i}$ | (2) |
式中
参考曲线
首先按照步进方式,从各训练单元中提取长度
${ {\mathcal {{T}}^i}}= {[{{t}}_1^i,{t}_2^i, \cdots ,{t}_{{l_i} - {l_s} + {\rm{1}}}^i]^{\rm{T}}} = \left[ {\begin{array}{*{20}{c}} {t_1^i}& \ldots &{t_{{l_s}}^i} \\ \vdots & \vdots & \vdots \\ {t_{{l_i} - {l_s} + 1}^i}& \cdots &{t_{{l_i}}^i} \end{array}} \right]$ |
式中:矩阵
K-means聚类是一种基于划分的聚类方法,其目的是将n个点划分到K个聚类,使得每个点都属于离它最近的均值点对应的聚类,算法过程如下:
1)从数据集中随机选择K个点作为初始聚类中心;
2)计算剩余数据到各聚类中心之间的距离,并将其分配给最近的类;
3)计算上一步得到聚类中每一类的图心,作为新的聚类中心;
4)重复步骤2)~3)直到新的聚类中心等于原聚类中心。
上述算法存在的问题是其聚类效果很大程度上依赖于初始均值点的选取,容易陷入局部最优,往往需要进行多次聚类选取满意的结果[11]。2007年由D.Arthur等[12]提出K-Means++算法对上述过程的第1步进行了改进,算法过程如下:
1)从数据集中随机选择1个点作为聚类中心;
2)计算剩余数据到已有均值点之间的最小距离
3)增选剩余数据中
4)重复步骤2)~3)直到选择出共K个聚类中心。
K-Means++算法提高了聚类效果的稳定性,本文使用此算法将HI子轨迹聚为
通过以上步骤获得了参考曲线的参数
$\left\{ \begin{gathered} d = \mathop {\min }\limits_{1 \leqslant i \leqslant l - {l_s} + 1} {\left\| {{{s}} - {{{t}}_i}} \right\|_2} \hfill \\ \rho = l - \arg \mathop {\min }\limits_{1 \leqslant i \leqslant l - {l_s} + 1} {\left\| {{{s}} - {{{t}}_i}} \right\|_2} \hfill \\ \end{gathered} \right.$ | (3) |
参考曲线
${{B}} = {[{{b}}_1 ,{{b}}_2 ,...,{{b}}_N ]^{\rm T}} = \left[ {\begin{array}{*{20}{c}} {d_1 } \\ \vdots \\ {d_N } \end{array}\begin{array}{*{20}{c}} {\rho _1 } \\ \vdots \\ {\rho _N } \end{array}} \right]$ | (4) |
对式(4)第2列元素进行零均值归一化,并按照第1列增序进行行排列后变为
${{B}} = \left[ {\begin{array}{*{20}{c}} {d_{1'} } \\ \vdots \\ {d_{N'} } \end{array}\begin{array}{*{20}{c}} {\rho _{1'} } \\ \vdots \\ {\rho _{N'} } \end{array}} \right]$ |
定义参数
$k = \arg \mathop {\min }\limits_{2 \leqslant j \leqslant N} \operatorname{var} [\rho _{1'} ,...,\rho _{j'} ]$ |
则参考曲线
每个测试单元同样包含m类传感器信息,运行时间长度为
在对传感器数据做干扰均值滤波处理后,由式(2)计算各时间点健康度,并拟合HI轨迹,测试单元的HI轨迹可表示为
${{E}} = \left[ {\begin{array}{*{20}{c}} {{e_{1,1}}}& \ldots &{{e_{1,{l_t} - {l_s} + 1}}} \\ \vdots & \vdots & \vdots \\ {{e_{q,1}}}& \cdots &{{e_{q,{l_t} - {l_s} + 1}}} \end{array}} \right]$ |
式中
${{E'}} = \left[ {\begin{array}{*{20}{c}} {{e_1}} \\ \vdots \\ {{e_q}} \end{array}\begin{array}{*{20}{c}} {{c_1}} \\ \vdots \\ {{c_q}} \end{array}} \right]$ |
若
$\left\{ \begin{gathered} {{\hat t}_e} = \sum\limits_{i = 1}^k {\frac{{{\tau _i}}}{{\sum\limits_{j = 1}^k {{\tau _j}} }}({c_i} + } {\mu _i}) \hfill \\ \hat r = {t_e} - {l_t} \hfill \\ \end{gathered} \right.$ |
定义预测性能评价标准:
$\begin{gathered} {\varepsilon _i} = {{\hat r}_i} - {r_i} \hfill \\ {\eta _i} = \left\{ \begin{gathered} \exp [({r_i} - {{\hat r}_i})/13] - 1,\;{\rm{ }}{{\hat r}_i} - {r_i} \leqslant 0 \hfill \\ \exp [({{\hat r}_i} - {r_i})/10] - 1,\;{\rm{ }}{{\hat r}_i} - {r_i} > 0 \hfill \\ \end{gathered} \right. \hfill \\ \bar \eta = \sum\limits_{i = 1}^n {{\eta _i}} /n \hfill \\ \end{gathered} $ |
式中:
为验证本文提出方法的有效性,使用NASA预测数据资源库中的航空涡扇发动机数据集的FD001子集进行RUL预测。FD001模拟了单工况条件下、高压压气机退化导致的发动机失效过程,分为训练集和测试集各100个单元。每个单元数据来自同类型的不同发动机,每台发动机以不同的初始磨损和制造差异开始运行,这种磨损和差异被认为是制造过程中的正常情况。运行期间,高压压气机不断产生小故障,在训练集中,故障持续累积直至发动机失效;在测试集中,发动机在失效前停止运行。运行期间,通过21个传感器对相关表征参数持续监测,表征参数包括:风扇进口温度、低压压气机出口温度、高压压气机出口温度、风扇出口压力等,传感器数据均含噪音[13]。通过对数据集样本长度进行统计,发现其训练集长度分布区间为
通过观察21组传感器数据可以发现,其变化规律分为2类:一类随时间变化测量值成上升或下降趋势,能有效反应设备退化趋势,如图2(a)所示;另一类始终常值或随时间发散,无法反应设备退化趋势,如图2(b)所示。根据文献[7],通过观察法选择传感器组合2、3、4、7、11、12、15作为RUL估计的原始传感器数据。
Download:
|
|
由训练单元长度分布区间定义
Download:
|
|
为保证参考曲线
从表中可以发现:随着聚类数量
图4(a)给出了不同长度测试单元的误差散点图,可以看出
Download:
|
|
为验证所提出的K-means++聚类方法有效性,在其他参数保持不变的情况下,使用常规K均值算法运行上述估计,重复10次估计测试单剩余寿命并计算评价得分
本文针对设备剩余寿命预测问题,提出一种基于退化曲线相似性匹配的方法。
1)使用线性回归和多项式拟合方法将多维传感器参数融合为一维HI曲线,保留传感器退化信息的同时,简化了数据结构;
2)通过判别曲线与测试单元HI轨迹相关性,完成设备剩余寿命估计;
3)将K-means++聚类应用到上述方法中,极大提高了剩余寿命预测的稳定性。
实验结果表明,在大量历史数据可获取情况下,该方法预测精度较高、通用性强,可应用于机电系统关键部件(液压泵、作动筒、电作动器等)的剩余寿命估计。需要注意的是,退化曲线的提取直接影响最终RUL预测性能,如何改进多传感器数据融合方法、进一步提高曲线聚类稳定性,是今后研究的重点。
[1] | 雷从英, 夏良华, 林智崧. 基于相似性的装备部件剩余寿命预测研究[J]. 火力与指挥控制, 2014, 39(4): 91-94. (0) |
[2] | 李琪, 高占宝, 李善营, 等. 变工况条件下基于相似性的剩余使用寿命预测方法[J]. 北京航空航天大学学报, 2016, 42(6): 1236-1243. (0) |
[3] | 奚立峰, 黄润青, 李兴林, 等. 基于神经网络的球轴承剩余寿命预测[J]. 机械工程学报, 2007, 43(10): 137-143. DOI:10.3321/j.issn:0577-6686.2007.10.026 (0) |
[4] | 胡友涛, 胡昌华. 一种基于遗传算法优化小波支持向量回归机的实时寿命预测方法[J]. 上海交通大学学报, 2011, 45(8): 1216-1220. DOI:10.3969/j.issn.1674-8115.2011.08.038 (0) |
[5] | 蔡忠义, 陈云翔, 张亮, 等. 基于随机Wiener过程的剩余寿命预测贝叶斯方法[J]. 电光与控制, 2016, 23(7): 93-96. (0) |
[6] | 彭颖. 基于退化隐式半马尔科夫模型的设备健康预测及系统性维护策略研究[D]. 上海: 上海交通大学, 2011. (0) |
[7] | WANG Tianyi, YU Jianbo, SIEGEL D, et al. A similarity-based prognostics approach for remaining useful life estimation of engineered systems[C]//Proceedings of 2008 International Conference on Prognostics and Health Management. Denver, USA, 2008: 1-6. (0) |
[8] | RAMASSO E, ROMBAUT M, ZERHOUNI N. Joint prediction of continuous and discrete states in time-series based on belief functions[J]. IEEE transactions on cybernetics, 2013, 43(1): 37-50. DOI:10.1109/TSMCB.2012.2198882 (0) |
[9] | 高占宝, 李行善, 梁旭, 等. 工程系统健康描述及基于GFRF方法的健康监测[J]. 北京航空航天大学学报, 2006, 32(9): 1026-1030. DOI:10.3969/j.issn.1001-5965.2006.09.007 (0) |
[10] | MALINOWSKI S, CHEBEL-MORELLO B, ZERHOUNI N. Remaining useful life estimation based on discriminating shapelet extraction[J]. Reliability engineering & system safety, 2015, 142: 279-288. (0) |
[11] | 雷小锋, 谢昆青, 林帆, 等. 一种基于K-Means局部最优性的高效聚类算法 [J]. 软件学报, 2008, 19(7): 1683-1692. (0) |
[12] | ARTHUR D, VASSILVITSKII S. K-means++: the advantages of careful seeding[C]//Proceedings of the 18th Annual ACM-SIAM Symposium on Discrete Algorithms. New Orleans, USA, 2007: 1027-1035. (0) |
[13] | 刘帅君. 基于性能退化数据的航空发动机剩余寿命预测[D]. 成都: 电子科技大学, 2015. (0) |