自动化学报  2018, Vol. 44 Issue (6): 1045-1052   PDF    
带失效的拉式生产系统预防性维护建模
周炳海1, 刘子龙1     
1. 同济大学机械与能源工程学院 上海 201804
摘要: 为了有效解决同时具有随机失效与退化失效的拉式生产系统的维护问题,提出了基于状态的双阶段预防性维护(Preventive maintenance,PM)策略.首先,根据设备的退化状态、生产端状态以及库存容量构建了系统的状态空间,并利用马尔科夫链描述系统的状态转移.之后,分别以最小化失效率和最大化产出速率为目标,建立了考虑检测周期、看板数量以及预防性维护阈值的综合预防性维护模型.针对设备随役龄增加而故障频发的特点,引入失效率递增因子.最后,给出了最小化失效率和最大化产出速率两种目标下的求解算法,并对决策变量做了敏感性分析.数值实例与现有方案的对比表明了所建模型和算法的有效性.
关键词: 拉式系统     预防性维护     看板     马尔科夫链     遗传算法    
Preventive Maintenance Modeling of Pull System With Failures
ZHOU Bing-Hai1, LIU Zi-Long1     
1. School of Mechanical Engineering, Tongji University, Shanghai 201804
Manuscript received : November 14, 2016, accepted: February 6, 2017.
Foundation Item: Supported by National Natural Science Foundation of China (71471135)
Author brief: LIU Zi-Long Master  student at the Institute of Industrial Engineering, School of Mechanical Engineering, Tongji University. His research interest covers scheduling and control of integrated manufacturing systems, discrete system modeling, scheduling, simulation and control
Corresponding author. ZHOU Bing-Hai  Professor at the School of Mechanical Engineering, Tongji University. His research interest covers modeling, scheduling, simulation, and control in integration of manufacturing systems, reliability and preventive maintenance model for systems. Corresponding author of this paper
Recommended by Associate Editor HU Chang-Hua
Abstract: To solve the preventive maintenance (PM) problem for a pull production system with both degradation failure and random failure, a two-stage conditional preventive maintenance strategy is proposed. First, the system's state space is built according to the machine's degradation state, the production system's state and the amounts of products in buffers; the state transition matrix is constructed using Markov chain. Then, a joint preventive maintenance and production control optimization model with the goal of minimizing the failure probability and maximizing the throughput rate is built, which takes the inspection period, amounts of Kanban and PM threshold into account simultaneously. Meanwhile, the failure rate increasing factor is introduced into the modeling of the degradation process of machine. Finally, an algorithm for solving the model is proposed, and its sensitivity analysis for key parameters is conducted. Numerical experiments and contrast experiment with the current strategy have verified the effectiveness and efficiency of the proposed model.
Key words: Pull system     preventive maintenance (PM)     Kanban     Markov chain     genetic algorithm    

为了保证生产的持续进行, 需要预防性维护(Preventive maintenance, PM)来提高系统的可靠性.考虑生产与维护的相互作用, 对二者进行联合优化具有广泛的应用价值.结合不同系统的生产特点, 学者们做了大量的研究.针对单设备系统, Ji等[1]提出了基于周期性的预防性维护策略来获得最小化完工时间. Lu等[2]以最大化系统利润为目标提出了基于预测状态的预防性维护策略.以这两类策略为基础, Pan等[3]和Fitouhi等[4]分别以成本最小化和产出最大化为目标建立了生产与维护的联合模型.在多设备系统方面, Nourelfath等[5]对多设备系统的批量生产问题, 提出了不规则周期性预防性维护策略, 来实现整个加工周期成本的最小化.考虑到串行系统的设备关联性, Brundage等[6]通过对系统的动态分析提出了机会维护策略, 目标是实现生产的能耗最低.为了更好地判断系统状态, Golmakani[7]将检测周期的长度和基于状态的预防性维护联合优化问题做了深入探究.而考虑到系统的不稳定性, Golmakani等[8]和Karamatsoukis等[9]利用马尔科夫链决策模型对带缓冲区的串联设备系统预防性维护问题做了研究.陆志强等[10]针对离散流水车间, 建立了不确定性环境下预防性维护和生产调度的集成优化模型.高文科等[11]考虑主辅部件存在故障相关性, 建立了相应的可靠性及预防性维护优化模型.上述文献的研究主要集中在传统的推式生产系统, 随着丰田模式的普及, 以JIT (Just-in-time)为典型的拉式系统, 在生产领域得到了普遍的应用. Kanban[12], CONWIP[13], Base stock[14]等拉式系统生产策略也受到学者的广泛关注, 但对拉式系统的维护问题研究较少. Xanthopoulos等[15]对看板系统的预防性维护问题提出了基于状态的预防性维护策略, 但模型中忽略了设备随机失效对系统的影响. Ezema等[16]在考虑维护的条件下, 利用仿真模拟的方式设计了JIT生产系统的评价方法. Batra等[17]利用价值流(Value stream mapping, VSM)来研究工具间的配置问题以实现及时维护.

综上所述, 现有文献中, 多数预防性维护策略的研究集中在传统的推式生产系统中, 对拉式生产系统的关注不足, 尚需要对拉式系统的生产与维护作进一步研究, 综合考虑维护策略对生产的影响, 来合理设置看板和库存产品数量, 从而实现精益生产.本文在考虑设备的随机失效和退化失效的前提下, 引入失效率递增因子, 提出了基于设备状态的双阶段预防性维护策略.在不确定生产速率和订单到达速率的前提下, 分别以最小化失效率和最大化产出速率为研究目标, 旨在寻找最佳的检测周期、看板数量以及维护阈值的组合策略.

1 问题描述

拉式生产系统如图 1所示.系统包括原材料供应端、加工制造端和一个最大容量为${UB}_k$的库存区.系统采用看板生产控制策略.在生产初期, 库存区存量为$K$ (等于看板数量).当有订单到达时, 将看板下达生产制造端进行生产.生产制造端每次只能加工一个产品, 但可保持$K-1$份订单等待加工.生产制造端按先到先出原则(First in first out)进行加工.在整个加工过程中, 不考虑原材料供应端的缺货.

图 1 拉式生产系统 Figure 1 Pull production system

加工制造端的设备状态会随着加工使用而发生退化, 假设经历$d$个退化阶段后完全失效, 即第$d+1$个阶段为退化失效(Degradation failure)阶段, 此时, 必须进行更换操作.设备在前$d$个阶段具有随机失效的可能性.针对随机失效, 采取"小修"使设备恢复生产.为了判断系统状态, 定期对系统状态进行检测, 根据检测结果, 执行预防性维护策略.

对于预防性维护, 存在两种形式, 一种是"修复如新"的完全预防性维护(Perfect-preventive maintenance, PPM), 另一种是"修复非新"的非完全预防性维护(Unperfect-preventive maintenance, UPM).本文根据系统退化状态的不同, 而采取不同的维护形式, 提出了"基于状态的双阶段预防性维护"策略, 来保障系统的持续生产.

假设目前系统的退化阶段为$i$, UPM和PPM的预防性维护的阈值分别为$b_1$$b_2$.在固定周期的检测时, 当$0\le i < {b_1}$时, 不做任何维护动作; 当$b_1$ $\leq$ $i < b_2$时, 则采用UPM策略, 可使系统退化状态由$i$转化为$i-1$状态; 当$b_2\leq i\leq d$时, 采用PPM策略, 可使系统修复如新.当退化阶段$i=d +1$时, 意味严重失效发生, 需采取更换动作.

2 构建模型

本文所用符号及含义如表 1所示.

表 1 符号及含义 Table 1 Symbols and definitions
2.1 状态空间

系统的状态空间由设备的退化状态$i$、生产端状态$j$以及库存区产品数量状态$k$三者构成.设备的退化可划分为$d+1$个状态, 在$d$状态前, 系统动作存在检测、维护和随机失效, 若在$d$状态时不做维护则直接进入退化失效状态; 库存区根据产品数量可划分为$K+1$个状态.该系统转化状态可用马尔科夫(Markov)模型来描述.模型中的状态空间$S$可表示如下:

$ \begin{align} S=&\ \{(i, j, k)|i\in [0, d], ~j\in [0, 1], ~k\in [0, K]\}\, \cup \notag\\ &\ \{(i, j, k)|i\in [0, d], ~j=-1, ~k \in [0, K-1]\}\, \cup\notag \\ &\ \{(i, j, k)|i\in [{{b}_{1}}, {{b}_{2}}-1], ~j=2, ~k \in [0, K]\}\, \cup\notag \\ &\ \{(i, j, k)|i\in [{{b}_{2}}, d], ~j=3, ~k \in [0, K]\}\, \cup\notag\\ &\ \{(i, j, k)|i=d+1, j=-2, ~k \in [0, K-1]\} \end{align} $ (1)

其中, $i$ ($i\geq 0 $, $i \in {\bf N}$)随数值增大表示退化程度增加. $k$ ($k\geq 0$, $k \in {\bf N}$), 若$k$增加到$k+1$, 表示订单加工完成; 若$k$减少到$k-1$, 表示订单到达. $j$值包括$(-2, -1, 0, 1, 2, 3)$, 分别表示生产端"退化失效"、"随机失效"、"加工或闲置"、"周期检测"、"UPM"、"PPM".

在式(1)中, 第1部分表示生产端在任一退化阶段都可能处于加工、闲置状态; 第2部分表示随机失效; 第3部分表示退化状态在[$b_1$, $b_2-1]$之间时, 系统可能处于UPM状态; 第4部分表示设系统处于PPM状态; 第5部分表示系统处于退化失效状态.

2.2 状态转移

本节从事件驱动的角度来分析各状态间的转移, 并给出状态空间的转移速率矩阵.状态空间$S$通过事件集$E$实现状态间的转移.能够改变系统当前状态的事件可以用集合$E$表示为

$ \begin{align} E = \{ Ja, Jp, fd, fs, ins, ine, r, upm, ppm, up\} \end{align} $ (2)

其中, $Ja$表示订单到达, $Jp$表示产品加工完毕, $fd$表示设备发生退化, $fs$表示设备随机失效, $ins$表示周期性检测开始, $ine$表示周期性检测结束, $r$表示小修结束, $upm$表示UPM结束, $ppm$表示PPM结束, $up$表示更换结束.若以上事件都未发生, 则状态保持不变.假设当前状态为$s(i, j, k)$, 状态间转移函数用$s'=F(s, e)$表示, $e$为特定事件, 函数结果为新的状态$s'$.

下面逐一分析不同事件的发生条件及其带来的状态改变, 并给出状态间的转移速率.

1) 订单到达($Ja$).订单可以在任何时刻到达, 其状态转移速率为订单到达速率$\lambda_a$. $Ja$事件发生只会对$k$值发生影响, 当库存非0时, 库存量$k$减少1;当库存量为0时, 订单被拒绝, $k$值保持不变.其状态转移可表示为

$ \begin{align} &F(s, Ja) =\nonumber\\&\quad\ \ \begin{cases} (i, j, k - 1), \ \ i \in [0, d], ~j \in [0, 1], ~k \in [1, K] \\ \qquad\mbox{或} \, \, i \in [0, d], ~j = - 1, ~k \in [1, K - 1] \\ \qquad\mbox{或} \, \, i \in [{b_1}, {b_2} - 1], ~j = 2, ~k \in [1, K] \\ \qquad\mbox{或} \, \, i \in [{b_2}, d], ~j = 3, ~k \in [1, K] \\ \qquad\mbox{或} \, \, i = d + 1, ~j = - 2, ~k \in [1, K - 1] \\ (i, j, k), \ \ i \in [0, d], ~j \in [ - 1, 0, 1], ~k = 0 \\ \qquad\mbox{或} \, \, i \in [{b_1}, {b_2} - 1], ~j = 2, ~k = 0 \\ \qquad\mbox{或} \, \, i \in [{b_2}, d], ~j = 3, ~k = 0 \\ \qquad\mbox{或} \, \, i = d + 1, ~j = - 2, ~k = 0 \end{cases} \end{align} $ (3)

2) 产品加工完成($Jp$).生产只能在有看板授权的时候发生, 所以库存量最大为$K-1$; 此外状态$d$ $+$ $1$为退化失效状态, 设备无法生产, 故$i$最大值为$d$.事件$Jp$发生只会使$k$值增加1.其状态转移如式(4), 转移速率为平均加工周期的倒数$\lambda_p$.

$ \begin{align} F(s, Jp) =&\ (i, j, k + 1), \notag\\ &\ i \in [0, d], ~j = 0, ~k \in [0, K - 1] \end{align} $ (4)

3) 随机失效($fs$)和退化($fd$). $fs$$fd$都只能在生产端处于加工状态时发生, 条件与产品完成事件相一致. $fd$事件会使设备的进一步退化, 其速率为$\lambda_d$.当前状态为$i=d$时, $j$由0转换为$-2.$状态转移为

$ \begin{align} &F(s, fd) =\notag\\ &\quad\ \begin{cases} (i + 1, j, k), & i \in [0, d - 1], ~j = 0, \\&k \in [0, K - 1] \\[1.5mm] (i + 1, j - 2, k), & i = d, ~j = 0, \\& k \in [0, K - 1] \end{cases} \end{align} $ (5)

$fs$事件使$j$由0转换为$-1, $表示为

$ \begin{align} F(s, fs) =&\ (i, j - 1, k), \notag\\ &\ i \in [0, d], ~j = 0, ~ k \in [0, K - 1] \end{align} $ (6)

假设状态$i$的随机失效率为$\lambda_i$, 由于设备的衰退是累计效应, 所以每一阶段的失效率都受上一阶段失效率的影响, 用$\lambda_{i+1}=\alpha_i$$\lambda_i$表示, 其中$\alpha_i$为失效率递增因子, 表示随退化程度的增大, 随机失效的概率提高, 其值由当前退化阶段$i$决定, ${\alpha _i}= ({\beta _1}i$ $+$ $1)/{({{\beta_2}i+1})}, $其中$\beta_1 > \beta_2$为常数项, 详见文献[18-20].

4) 周期性检测开始($ins$)和周期性检测结束($ine$). $ins$在生产端加工或闲置的时候进行, 对应的$ine$只能在前一状态是检测过程时发生. $ins$事件不会影响退化阶段, 但$j$由0转为1, 两次检查之间的平均时长为$1/\lambda_{ins}$, 检查平均所需时长为$1/\mu_{ins}$, 表示为

$ \begin{align} F(s, ins) =&\ (i, j + 1, k), \notag\\ & \ i \in [0, d], ~j = 0, ~k \in [0, K] \end{align} $ (7)

$ine$事件对系统状态影响分为三种情况:当$i\in$ $[0, b_1-1]$时, $j$由1回到0;当$i\in[b_1, b_2-1]$时, 则$j$由1变为2;当$i\in[b_2, d]$时, $j$由1转为3.即

$ \begin{align} &F(s, ine) = \notag\\ &\qquad\ \begin{cases} (i, j - 1, k), &i \in [0, {b_1} - 1], ~j = 1, \\& k \in [0, K] \\[1mm] (i, j + 1, k), & i\in[b_1, b_2-1], ~j = 1, \\& k \in [0, K] \\[1mm] (i, j + 2, k), & i\in [{b_2}, d], ~j = 1, \\& k \in [0, K] \\ \end{cases} \end{align} $ (8)

5) 小修($r$).小修仅在当前系统处于随机失效状态时发生, 且必须发生. $j$由状态$-1$转到0, 平均时长为$1/\mu_r$, 状态转移为

$ \begin{align} F(s, r) =&\ (i, j + 1, k) , \notag\\ & \ i \in [0, d], ~ j = - 1, ~k \in [0, K - 1] \end{align} $ (9)

6) 维护($upm$$ppm$). $upm$事件发生在设备退化阶段$[b_1, b_2-1]$区间, $ppm$完成事件发生在$[b_2, d]$区间. $upm$事件对系统退化状态"修复非新", 即$i=i-1$, 平均时长为$1/\mu_{upm}$, 即

$ \begin{align} F(s, upm) =&\ (i - 1, j - 2, k), \nonumber\\ &\ i \in [{b_1}, {b_2} - 1], ~j = 2, ~k \in [0, K] \end{align} $ (10)

$ppm$事件使系统"修复如新", $i$回归到状态0, 平均时长为$1/\mu_{ppm}$, 即

$ \begin{align} F(s, ppm) =&\ (0, j - 3, k), \notag\\ &\ i \in [{b_2}, d], ~ j = 3, ~k \in [0, K] \end{align} $ (11)

7) 更新($up$).退化阶段处于$d+1$时, 则要进行更新操作.由于设备只有在加工时才会退化, 所以$k$值最大为$K-1$. $up$事件同样可使系统"修复如新", 所用时长为$1/\mu_{up}$, 即

$ \begin{align} F(s, up) =&\ (0, j + 2, k), \notag\\ &\ i = d + 1, ~j = - 2, ~ k \in [0, K - 1] \end{align} $ (12)

基于上述分析, 可以得到整个马尔科夫模型的状态转移速率, 如图 2所示.

图 2 系统状态转移图 Figure 2 System state transition diagram
2.3 状态空间

图 2可以看出, 本模型的状态彼此互通, 可以通过转移速率矩阵求得其稳态概率.用矩阵$Q$表示该模型的转移速率矩阵, 则

$ \begin{align} Q=\left[ \begin{matrix} {{q}_{11}}&{{q}_{12}}&\ldots &{{q}_{1m}} \\ {{q}_{21}}&{{q}_{22}}&\ldots &{{q}_{2m}} \\ \vdots &\vdots &\ddots &\vdots \\ {{q}_{m1}}&{{q}_{m2}}&\ldots &{{q}_{mm}} \\ \end{matrix} \right] \end{align} $ (13)

其中, $m$为空间状态量总数, $q_{nn'}$表示状态$S_n$到状态$S_{n'}$的转移速率, $n$$n'$均为序列号, 取值范围为$[1, m]$.此外, 对角元素值等于所在行其他元素和的相反数, 即$ {{q}_{nn}}=-\sum_{n'=1, n'\ne n}^{m}{{{q}_{nn'}}}, $ $n=$ $1$, $2$, $\cdots $, $m$.

$\pi(t)$$t$时刻的概率分布, 则存在稳态概率分布$\pi$, $\pi$可通过如下线性公式求解:

$ \begin{align} \pi \times Q=0, \quad \text{s}\text{.t}\text{.}~\sum\limits_{n=1}^{m}{{{\pi }_{{{s}_{n}}}}}=1 \end{align} $ (14)

其中, $\pi_{S_n}$表示状态$S_n$在稳态时的概率.在求得稳态概率分布后, 系统的性能表现采用多个指标表述.

指标 1. 系统可用度.系统的可用度(Availability, AVA)是系统处于可加工状态的时间的比例.即$j$ $=0$的状态概率, 表示为

$ \begin{align} AVA= \sum\limits_{k = 0}^K {\sum\limits_{i = 0}^d {{\pi _{i, 0, k}}} } \end{align} $ (15)

指标 2. 系统的产出速率.从可用度中排除空闲状态, 可以求得利用率.即$j=0, $ $k=K$时的概率为$\sum\nolimits_{i= 0}^d {{\pi_{i, 0, K}}}$, 由此, 系统的利用率(Utilization, UTI)可表示为

$ \begin{align} UTI = \sum\limits_{k = 0}^K {\sum\limits_{i = 0}^d {{\pi _{i, 0, k}}} } - \sum\limits_{i = 0}^d {{\pi _{i, 0, K}}} \end{align} $ (16)

若生产速率为$\lambda_p$, 可得到系统的产出速率(Throughput, THR)为

$ \begin{align} THR = {\lambda _p} \times \left(\sum\limits_{k = 0}^K {\sum\limits_{i =0}^d {{\pi _{i, 0, k}}} } - \sum\limits_{i = 0}^d {{\pi _{i, 0, K}}} \right) \end{align} $ (17)

指标 3. 故障失效率.系统的失效包括退化失效和随机失效, 失效率(Rate of failure, ROF)可表示为

$ \begin{align} ROF = {\lambda _d} \times \sum\limits_{k = 0}^{K - 1} {{\pi_{d, 0, k}}} + \sum\limits_{k = 0}^{K - 1} {\sum\limits_{i = 0}^d {{\lambda _i} \times{\pi _{i, 0, k}}} } \end{align} $ (18)

其中, 第1部分表示退化失效的概率, 第2部分表示随机失效.

指标 4. 平均库存水平.系统的平均在制品库存(Buffer-level, BUF)可分三个时段考虑: 1) $j=0, 1$时, 生产端处于加工或检查状态, 此时库存水平上限可达到$K$; 2) $j=2, 3$时, 生产端处于维护状态, 此时需划分退化阶段讨论; 3) $j=-1, -2$时, 系统处于失效阶段, 此时库存水平上限为$K-1$.具体为

$ \begin{align} BUF =&\ \sum\limits_{k = 0}^K (k \times(\sum\limits_{i = 0}^d {({\pi _{i, 0, k}} + {\pi _{i, 1, k}})}\, +\nonumber\\&\ {\sum\limits_{i = {b_1} + 1}^{{b_2}} {{\pi _{i, 2, k}} + } } \sum\limits_{i = {b_2} + 1}^d {{\pi _{i, 3, k}}))}\, + \nonumber\\&\ \sum\limits_{k = 0}^{K - 1} {(k} {\pi _{d + 1, - 2, k}} + \sum\limits_{i = 0}^d {k{\pi _{i, - 1, k}}} ) \end{align} $ (19)

在利用上述指标评估系统表现的同时, 在预先给出对应约束条件的上下限的情况下, 分别建立以最大化系统产出速率和最小化系统失效率为优化函数的线性模型.

$ \begin{align} & {\rm object}:\quad \min~ROF~~(\mbox{或}~\max~ THR) \notag \\ &{\rm s.t.}\qquad\quad~ THR \geq L{B_{{{\rm THR}}}}~~(\mbox{或}~ ROF \leq U{B_{\rm ROF}})\notag \\ & \qquad\qquad~~ 1 \leq K \leq U{B_K} \notag \\ & \qquad\qquad~~ 1 \leq {b_1} < {b_2}, ~\, 2 \leq {b_2} < d\notag \\ & \qquad\qquad~~ L{B_{{\lambda _{ins}}}} \leq {\lambda _{ins}} \leq U{B_{{\lambda _{ins}}}} \end{align} $ (20)
3 数值实验 3.1 求解方法

在文献[15]的基础上, 本节实验所用参数见表 2, 其中实际值表述了参数的构建方式.

表 2 实验参数 Table 2 Experiment parameters

模型的决策变量为检测周期$ins$, UPM的阈值$b_1$, PPM的阈值$b_2$, 以及看板数量$K$.由于搜索空间包括连续变量$ins$和离散整数变量$b_1$, $b_2$, $K$, 因此可采用智能求解算法.本文应用MATLAB中的GA工具箱作为外层搜索工具, 用于对变量空间进行快速搜索与收敛; 算法内部采用马尔科夫链求解稳态概率, 利用外层所搜索的解集下快速获取目标函数值, 并作为返回值用于外层算法的迭代搜索.

在求解目标函数之前, 实验先对决策变量的敏感性进行分析.

3.2 敏感性分析

图 3(a)所示为$K=8$, $b_1=3$, $b_2=5$时, 检测频率对系统的四个评价指标的影响.由图可知, 随着检测频率的提高, 系统的可用度先提高后逐渐降低, 原因是由于过多检测状态占用了系统的生产时间.系统的产出速率先增后减, 失效率先逐渐降低后稳定在平衡状态.在制品库存逐渐降低, 但波动幅度较小.所以, 检测频率的选择主要是权衡产出速率和失效率.

图 3 决策变量对系统的影响 Figure 3 Effects of decision variables on system

图 3(b)反映了$b_1=3$, $b_2=5$, $ins=0.05$时, 看板数量$K$对系统的影响.由图可知, 随着$K$的增大, 系统可用度逐渐降低到一定水平, 保持平衡; 产出速率和失效率逐渐增加到一定水平后平稳.因为当看板数量增多, 生产时间也相应增长, 在维护方式不变的条件下, 系统的失效率也相应提高.此外, 看板数量直接影响在制品水平, 二者呈线性增加关系, 因此, 当在制品水平作为主要考量因素时, 要慎重权衡看板数量.

图 3(c)在控制$b_1=3$, $K=8$, $ins=0.05$时, 探究$b_2$对系统表现的影响, 从图 3(c)中可知, 当UPM阈值固定后, 系统的可用度和产出速率随PPM阈值的增大而先增后减, 失效率则先降后升.同时, 在制品库存水平随维护阈值的增大而缓慢增加.需要强调的是, 在$b_2=3$时, 可视为只有完美维护策略PPM执行, 即文献[15]中的策略, 通过比对可知, 本文所提策略在上述指标中都表现较优.

图 3(d)探究$b_2=7$, $K=8$, $ins=0.05$时, $b_1$对系统的影响.由图 3(d)可知, 随着$b_1$的增加, 系统和可用度和产出速率先增后减, 失效率表现与之相反.即UPM的实施可以很好地保障系统的运行, 存在一个可寻优的最佳点.同样, 当$b_1=7$时, 则认为仅仅执行"非完美维护策略", 对比可知, 本文所提策略在四个指标上都优于该策略.综合图 3(c)图 3(d)可以发现, 存在最佳组合点$b_1$, $b_2$, 使系统同时表现出高产出速率和低失效率.因此, 有必要进行综合决策.

本文在建模过程中引入了失效率递增因子, 图 4以系统可用度为例, 展示了该因子对系统建模的影响.可以发现, 在相同维护策略下, 该因子的引入使得系统的可用度较低, 系统失效的特点在本模型中得到了更好的体现.在单一变量分析中, 注意到变量间的相互作用, 例如, 图 5图 6分别反映了看板$K$和检测频率对失效率和可用度的综合作用.综上分析, 由于决策变量间的复杂作用, 需综合权衡判断最优组合.

图 4 失效率递增因子对可用度的影响 Figure 4 Effect of increase factor on availability
图 5 看板数量与检测频率对失效率的作用 Figure 5 Effect of Kanban$'$s quantity and inspection frequency on ROF
图 6 看板数量与检测频率对可用度的作用 Figure 6 Effect of Kanban$'$s quantity and inspection frequency on availability
3.3 最佳维护策略

本节在通过改变订单到达速率和订单完成速率, 以最小化故障失效率和最大化产出速率为目标求解最优的组合$[K, \lambda_{ins}, b_1, b_2]$.在求解最大化产出速率时, 取${UB}_{\rm ROF}=0.035;$在求解最小化故障失效率时, 取${LB}_{\rm THR}=0.98$[15].为了更好地反映本文所提模型的效果, 选取当前采用较多的基于状态的"非完美维护策略"作为对比, 该策略决策变量组合为$[K$, $ins$, $b]$.

表 3给出了两种维护策略的优化结果.其中$[K$, $ins, b_1, b_2]$表示本文提出的基于状态的双阶段预防性维护策略决策组合.优化目标分别为最小化失效率($ROF$)和最大化产出速率($THR$).从表 3可以看出, 优化目标不同时, 决策变量组合不同.当订单到达速率和完成速率不同时, 决策组合也不同, 这可以指导生产实际根据淡、旺季以及仓库容量进行相应的安排设置.此外, 两种策略的比较发现, 本文所提策略在$ROF$$THR$的两个目标优化下都具有优势.

表 3 $\lambda_a=1.0 $时结果对比 Table 3 Comparison of results when $\lambda_a=1.0$
4 结论

本文综合考虑检测周期和看板数量等因素, 对拉式生产系统预防性维护问题提出了基于状态的双阶段预防性维护策略, 并利用Markov构建了状态转移模型.可以得到如下结论: 1)失效率递增因子的引入和随机失效的考虑, 使模型更加符合实际情况. 2)系统产出速率和系统失效率间存在耦合关系, 在制定维护方案时, 要权衡取舍; 优化目标不同时, 所求的最佳维护策略组合也不相同. 3)双阶段维护模型较单阈值维护策略在系统表现上更加优秀, 可以求得产出速率更高, 失效率更低的决策变量组合. 4)针对不同的订单速率和生产速率, 可以在确定目标下寻求不同的最佳组合策略.这对淡旺季生产以及生产能力不同时如何采取相应策略具有一定的参考意义.同时, 本文所求最优组合中包括看板数量, 这对实际中看板的设置具有重要的参考意义.

参考文献
1
Ji M, He Y, Cheng T C E. Single-machine scheduling with periodic maintenance to minimize makespan. Computers and Operations Research, 2007, 34(6): 1764-1770. DOI:10.1016/j.cor.2005.05.034
2
Lu S S, Tu Y C, Lu H T. Predictive condition-based maintenance for continuously deteriorating systems. Quality and Reliability Engineering International, 2007, 23(1): 71-81. DOI:10.1002/(ISSN)1099-1638
3
Pan E S, Liao W Z, Xi L F. Single-machine-based production scheduling model integrated preventive maintenance planning. The International Journal of Advanced Manufacturing Technology, 2010, 50(1-4): 365-375. DOI:10.1007/s00170-009-2514-9
4
Fitouhi M C, Nourelfath M. Integrating noncyclical preventive maintenance scheduling and production planning for a single machine. International Journal of Production Economics, 2012, 136(2): 344-351. DOI:10.1016/j.ijpe.2011.12.021
5
Nourelfath M, Fitouhi M C, Machani M. An integrated model for production and preventive maintenance planning in multi-state systems. IEEE Transactions on Reliability, 2010, 59(3): 496-506. DOI:10.1109/TR.2010.2056412
6
Brundage M P, Chang Q, Li Y, Arinez J, Xiao G X. Utilizing energy opportunity windows and energy profit bottlenecks to reduce energy consumption per part for a serial production line. In: Proceedings of the 2014 IEEE International Conference on Automation Science and Engineering. Taipei, China: IEEE, 2014. 461-466
7
Golmakani H R. Optimal age-based inspection scheme for condition-based maintenance using A* search algorithm. International Journal of Production Research, 2012, 50(23): 7068-7080. DOI:10.1080/00207543.2012.664793
8
Golmakani H R, Pouresmaeeli M. Optimal replacement policy for condition-based maintenance with non-decreasing failure cost and costly inspection. Journal of Quality in Maintenance Engineering, 2014, 20(1): 51-64. DOI:10.1108/JQME-12-2012-0044
9
Karamatsoukis C C, Kyriakidis E G. Optimal maintenance of two stochastically deteriorating machines with an intermediate buffer. European Journal of Operational Research, 2010, 207(1): 297-308. DOI:10.1016/j.ejor.2010.04.022
10
Lu Zhi-Qiang, Zhang Si-Yuan, Cui Wei-Wei. Integrating production scheduling and maintenance policy for robustness in flow shop problems. Acta Automatica Sinica, 2015, 41(5): 906-913.
( 陆志强, 张思源, 崔维伟. 集成预防性维护和流水线调度的鲁棒性优化研究. 自动化学报, 2015, 41(5): 906-913.)
11
Gao Wen-Ke, Zhang Zhi-Sheng, Zhou Yi-Fan, Liu Yang, Liu Qi. Reliability modeling and maintenance policy for main and supplementary parallel system with failure interaction and imperfect detection. Acta Automatica Sinica, 2015, 41(12): 2100-2114.
( 高文科, 张志胜, 周一帆, 刘飏, 刘祺. 存在故障相关及不完备检测的主辅并联系统可靠性建模与维修策略. 自动化学报, 2015, 41(12): 2100-2114.)
12
Lavoie P, Gharbi A, Kenné J P. A comparative study of pull control mechanisms for unreliable homogenous transfer lines. International Journal of Production Economics, 2010, 124(1): 241-251. DOI:10.1016/j.ijpe.2009.11.022
13
Khojasteh Y, Sato R. Selection of a pull production control system in multi-stage production processes. International Journal of Production Research, 2015, 53(14): 4363-4379. DOI:10.1080/00207543.2014.1001530
14
Thürer M, Stevenson M, Protzman C W. Card-based production control:a review of the control mechanisms underpinning Kanban, ConWIP, POLCA and COBACABANA systems. Production Planning and Control, 2016, 27(14): 1143-1157.
15
Xanthopoulos A S, Koulouriotis D E, Botsaris P N. Single-stage Kanban system with deterioration failures and condition-based preventive maintenance. Reliability Engineering and System Safety, 2015, 142: 111-122. DOI:10.1016/j.ress.2015.05.008
16
Ezema C N, Nonum E O, Umezinwa C N, Igwe J I. Optimal performance enhancement using JIT manufacturing system simulation model. International Journal of Technology and Systems, 2016, 1(1): 48-71.
17
Batra R, Nanda S, Singhal S, Singari R. Study of Lean Production System Using Value Stream Mapping in Manufacturing Sector and Subsequent Implementation in Tool Room. SAE Technical Papers, Delhi Technological University, India, 2016.
18
Qi Fa-Qun, Zhou Bing-Hai. Preventive maintenance policy of cluster tools based on Markov process. Journal of Shanghai Jiaotong University, 2014, 48(10): 1461-1467.
( 綦法群, 周炳海. 基于Markov过程的集束型设备预防维护策略. 上海交通大学学报, 2014, 48(10): 1461-1467.)
19
Xia Tang-Bin, Zhou Xiao-Jun, Xi Li-Feng. Multi-attribute model for dynamic preventive maintenance decision with hybrid evolution factors. Journal of Shanghai Jiaotong University, 2009, 43(5): 821-824.
( 夏唐斌, 周晓军, 奚立峰. 基于失效率调整因子的多目标动态预防性维护决策建模. 上海交通大学学报, 2009, 43(5): 821-824.)
20
Zhou B H, Liu Z L. Optimizing preventive maintenance:a deteriorating system with buffers. Industrial Management and Data Systems, 2016, 116(8): 1719-1740. DOI:10.1108/IMDS-01-2016-0026