自动化学报  2018, Vol. 44 Issue (2): 262-269   PDF    
双层模型预测控制系统的多包镇定域分析与系统设计
朱宇轩1, 李少远1,2     
1. 上海交通大学自动化系 上海 200240;
2. 系统控制与信息处理教育部重点实验室 上海 200240
摘要: 针对双层模型预测控制(Model predictive control,MPC)中出现的由于系统状态在动态控制(Dynamic control,DC)过程中超出约束集,导致下层优化不可行的问题,本文在综合控制方法的基础上提出一种新的动态控制策略,引入多包镇定域(Multi-convex hull stabilization domain,MHSD)的概念.通过离线计算多包镇定域,并根据系统每一时刻的实测状态值,在线决定(Dynamic control)层的镇定域以及相应的控制时域,结合变约束思想,保证动态控制过程递归可行,从而有效控制在大范围内变化的系统状态.另外,本文通过设计非线性反馈控制器,扩大了终端不变集和多包镇定域的范围,提高了DC层对稳态目标值的跟踪效果.本文的控制算法可以使得DC层在目标跟踪过程中保证递归可行性,并最大程度地实现无静差跟踪.仿真算例验证了本文算法对稳定系统和不稳定系统都有效.
关键词: 双层模型预测控制     约束     可镇定域     动态控制     闭环稳定性    
Analysis and System Design of Multi-convex Hull Stabilization Domain for Double-layered Model Predictive Control System
ZHU Yu-Xuan1, LI Shao-Yuan1,2     
1. Department of Automation, Shanghai Jiao Tong University, Shanghai 200240;
2. Key Laboratory of System Control and Information Processing, Ministry of Education of China, Shanghai 200240
Manuscript received : May 13, 2016, accepted: December 20, 2016.
Foundation Item: Supported by National Natural Science Foundation of China (61590924, 61521063)
Author brief: ZHU Yu-Xuan  Master student at Shanghai Jiao Tong University. Her main research interest is model predictive control
Corresponding author. LI Shao-Yuan  Professor at the Institute of Automation, Shanghai Jiao Tong University. His research interest covers predictive control, fuzzy system, adaptive control theory and applications. Corresponding author of this paper
Recommended by Associate Editor XIE Yong-Fang
Abstract: In order to solve the feasibility problem in double-layered model predictive control (MPC) caused by some states in dynamic control (DC) that violate the constraints, this paper proposes a new control strategy based on the overall control solution and introduces a new definition multi-convex hull stabilization domain (MHSD). This strategy designs the MHSD off line and then chooses a proper stabilization range online according to the real-time system state. The control horizon of the DC layer can be calculated at the same time. What is more, this paper enlarges the invariant sets and the stabilization domain through designing a nonlinear feedback controller so that the system states varying in a wide range can be controlled and the tracking effect is significantly improved. By using the above algorithm, the control process is recursively feasible and the optimal targets can be tracked precisely. The effectiveness of this method is verified in both stable and unstable systems through two examples.
Key words: Double-layered model predictive control (MPC)     constraint     stabilization region     dynamic control (DC)     closed-loop stability    

模型预测控制技术[1-3] (Model predictive control, MPC)是一种先进控制技术, 能够对复杂的多变量对象提供整体的设计方案, 并在线直接处理系统的输入、输出(或状态)约束.近年来为满足大型企业提出的控制要求, 推出了由实时优化(Real-time optimization, RTO)和双层模型预测控制构成的分层递阶控制结构[4-6], 其中双层模型预测控制技术在原有的滚动时域控制的上层添加了稳态目标计算(Steady-state target calculation, SSTC)作为上层, 使系统可以更加灵活地处理约束条件.在实际的工业过程中, 外界目标会因突然出现的扰动或操作人员的输入而发生变化, 这时双层的控制结构依然可以借助上层的稳态优化, 对系统输入和输出的稳态设定值进行更新, 从而保证动态控制的实时性和有效性.

目前, 针对双层预测控制系统的结构问题和实际应用, 国内外已经形成了一些研究成果:文献[7]系统地提出了双层模型预测控制的整体解决方案, 分开环预测、稳态目标计算和动态控制三个模块进行分析, 并保证了三个模块在模型、约束、目标上的一致性.文献[8]详细阐述了双层结构中的约束调整策略, 保证了约束集的相容性并简化了动态控制目标.但双层模型预测控制的研究难点:稳定性分析, 在国内外均没有系统性成果.作为预测控制稳定性分析的经典著作, 文献[9]在前人的研究成果基础上, 归纳出了控制"三要素":局部控制器、终端不变集[10-11]和终端代价函数, 保证了被控系统的闭环稳定性, 为后续的研究奠定了基础.本文在前人对单层预测控制稳定性的分析和无静差跟踪的研究基础上, 构建了双层预测结构的算法框架, 如图 1.

图 1 双层模型预测控制结构 Figure 1 The structure of the double-layered MPC

为了解决如下两个问题: 1)稳态目标值随外部目标变化, 每一时刻的最优稳态值都没有固定的位置, 很难实现实时的准确跟踪; 2)双层结构的信息流是单向的, 不存在反馈调节, 当下层不可控时, 上层无法做出及时调整, 所以动态控制(Dynamic control, DC)层的可控状态范围较小, 本文提出了基于多包镇定域的动态控制策略, 保证了系统的闭环稳定性以及算法的递归可行性, 为大范围内变化的系统状态提供有效的控制作用, 并最大程度上跟踪稳态目标.具体而言, 首先离线计算"三要素", 并采用模型逆算法计算在某一控制时域内, 模型的可镇定范围.通过逐步扩大控制时域, 得到一系列可镇定域, 这些镇定域中包含了系统每一时刻的状态值, 选择包含它且最小的可镇定域, 同时确定该镇定域对应的控制时域, 然后运用变约束策略设计优化问题, 有效地将系统状态驱动回不变集, 完成对设定值的跟踪.上述算法可保证DC层优化问题在跟踪稳态目标值过程中的可行性.

本文第1节介绍采用的系统及相应的约束等; 第2节分析动态控制层遇到问题, 提出多包镇定域计算算法, 给出解决问题的基本方案; 第3节进行算法的稳定性分析; 第4节的仿真验证了前述算法的有效性; 第5节小结全文.本文主要符号见表 1.

表 1 本文符号及其含义 Table 1 The meanings of the notations in this paper
1 系统描述

考虑如下$m$维输入和$n$维状态的线性时不变确定系统:

$ \begin{equation} \begin{cases} x(k+1) = Ax(k) + Bu(k)\\ y(k) = Cx(k) + Du(k) \end{cases} \end{equation} $ (1)

系统状态和输入的约束为

$ \begin{gather} x(k)\in\chi_d = \{x_d\in {\bf R}^{n} : \| {\Theta x_d}\| \leq \bar{x}\}, k \ge 0\end{gather} $ (2)
$ \begin{gather} u(k)\in\mu_d = \{u_d\in {\bf R}^{m} : \| {\Omega u_d}\| \leq \bar{u}\}, k \ge 0 \end{gather} $ (3)

其中, $\Theta$$\Omega$分别表示操作人员对状态约束和控制约束上下界的预调整, $\chi_d$$\mu_d$是非空紧凸集, 且内部包含原点.

假设 1. 系统状态可测.

假设 2. $(A, B)$是可控的.

相应地, 稳态系统模型如下:

$ \begin{equation} x_s(k+1)=Ax_s(k)+Bu_s(k) \end{equation} $ (4)

稳态状态和输入分别属于如下的可行集:

$ \begin{equation} x_s(k)\in\chi_s, u_s(k)\in\mu_s \end{equation} $ (5)

其中, $\chi_s=\chi_d, \mu_s=\mu_d.$

预测控制需要处理的输入与状态约束分别属于硬约束和软约束.本文研究的是状态空间模型, 被控变量是系统状态, 其约束条件可视为软约束, 适当情况下, 可以在一定程度上违背状态约束.双层预测控制算法按时间顺序依次执行稳态目标计算和动态控制, 下面将详细阐述双层MPC在动态跟踪层需要解决的问题, 并提出具体的解决方案.

2 动态控制 2.1 问题描述

本文采用文献[12]中基于多优先级约束调整策略的稳态目标计算方法, 考虑目标跟踪和放松软约束两种情况, 由于约束调整具有一定的顺序型, 所以外界目标发生变化时, 由两种情况计算所得的稳态目标值都会变化, 最后MV (操纵变量)和CV (被控变量)的稳态目标值可能位于调整后的状态与输入约束集的任意位置, 这给下层的动态跟踪留下了一个难题, 即如何在更新后的约束条件限制下, 很好地跟踪变化的设定值.

另外, 上层调整后的约束条件会缩小动态控制层的可控状态范围, 如果当前时刻的系统状态不在SSTC层所提供的约束集内, 那么DC层的优化问题不可行, 该时刻的状态无法得到有效的控制, 稳态目标也无法实现.即使是对初始可控的情况, 由于系统状态的变化, 随时可能出现不满足约束条件的现象, 导致优化控制不可行.这时, 需要采取措施扩大DC层的可控状态范围, 保证DC层的可行性和稳定性.

2.2 动态控制策略

本文引入综合控制方法, 将有限时域预测控制向无限时域靠拢, 保证系统的闭环稳定性以及动态优化过程的递归可行性.在此基础上, 为解决初始时刻优化不可行的问题, 本文提出了变约束策略.首先, 在综合方法的基础上详细分析算法的镇定域, 并离线设计相对于多个控制时域的镇定域.在状态进入终端不变集之前, 用镇定域对状态进行约束; 随后, 在确定的控制时域作用下, 状态会被驱动到终端不变集中, 根据不变集的性质, 只要当前时刻状态进入这一集合中, 随后每一时刻的状态都不会离开这一集合, 且都满足上层的约束条件, 此时状态受限于终端不变集.

综上, 变约束策略可简述为:控制时域以内, 采用镇定域约束系统状态, 在控制时域以外, 采用不变集约束状态.这样的算法可以确保系统的闭环稳定性, 并在此基础上扩大可控状态范围, 最大程度上实现稳态目标跟踪.

2.2.1 "三要素"控制算法

对系统(1)引入综合方法的"三要素":局部控制器($\kappa_f (x)$)、终端不变集($X_f$)和终端代价函数($\Psi (x)$)设计动态控制器, 保证动态控制是递归可行的.已知SSTC层将调整后的约束条件$\chi_s^*$$\mu_s^*$传递给DC层, 综合方法的"三要素"需满足如下条件:

条件 1. $X_f\in\chi_s^*, X_f {\rm closed}, 0\in X_f$ (在不变集中的状态满足上层调整后的约束条件).

条件 2. $\kappa_f(x)\in\mu_s^*, \forall x\in X_f$ (局部控制器得到的操作变量满足输入约束).

条件 3. $Ax+B\kappa_f(x)\in X_f, \forall x\in X_f$ ($X_f$是对应于控制器$\kappa_f$的不变集).

条件 4. $\Psi(0)=0, \Psi(x)\ge 0, \forall x\neq 0$ (终端代价函数矩阵是正定矩阵).

条件 5. $\Psi(Ax+B\kappa_f(x))-\Psi(x)+x^{\rm T}Qx+\kappa(x)^{\rm T}R\kappa(x)\leq 0, \forall x\in X_f$ (终端代价函数$\Psi(x)$是一个局部的Lyapunov函数).

其中$Q$$R$是适维的正定权重矩阵.针对具有$m$维输入以及$n$维状态的系统(1)设计反馈控制, 考虑执行器的饱和特性[13-16], 本文采用带有饱和特性的反馈控制器.定义带有饱和特性的反馈控制器$Sat(Fx)=[sat(F_1x), sat(F_2x), \cdots, sat(F_nx)]$, 其中, 矩阵$F\in {\bf R}^{m\times n}$是线性反馈矩阵, $|sat(F_ix)|\leq \bar{u}$, $F_i$, $i\in[1, n]$表示矩阵$F$的第$i$行向量.

另取线性反馈矩阵$H \in {\bf R}^{m\times n}$, 其中$\|h_jx\|\leq 1$对所有$j\in [1, m]$都成立. $Sat(\cdot)$是关于向量的饱和函数, 而$sat(\cdot)$是关于变量的饱和函数, 采用文献[18]中的饱和函数参数。令$D$为一系列$m$维对角矩阵构成的集合, 对角线上的元素是1或0, 集合$D$中包含了$2^m$个元素, 令$D_i$表示其中的第$i$个矩阵, ${D_i}^{-}=I-D_i$, 那么根据文献[17]中的结论可知, $Sat(Fx)\in co\{D_iFx+D_i^-Hx: i\in [1, 2^m]\}$, 所以$Sat(F{\pmb x})$可以表示为一系列反馈控制律的线性组合. $co(\cdot)$是指其中元素形成的凸包.定义椭圆集$E(P, 1)=\{x\in R^n: x^{\rm T}Px\leq 1\}$, $\chi(H)=\{x:\|Hx\|_\infty\leq 1\}$, 由凸包的性质可得:

$ \begin{align*} &(Ax+BSat(Fx))^{\rm T}P(Ax+BSat(Fx))\leq \\&\qquad \max\limits_{i\in[1, 2^m]}{x^{\rm T}(A+B(D_iF+D_i^-H))^{\rm T}\times} \\&{\qquad P(A+B(D_iF+D_i^-H))x} \end{align*} $ (6)

对齐符号只能在align环境下使用如果椭圆集对于线性反馈控制器具有收缩不变性, 那么

$ \begin{align*} &\max\limits_{i\in[1, 2^m]}{x^{\rm T}(A+B(D_iF+D_i^-H))^{\rm T}}\times\\&\qquad P{(A+B(D_iF+D_i^-H))x} < \\&\qquad x^{\rm T}Px \end{align*} $ (7)

对于所有的非零向量$x$都成立, 那么当$x\in E(P, 1)\setminus \{0\}$

$ \begin{equation} (Ax+BSat(Fx))^{\rm T}P(Ax+BSat(Fx)) < x^{\rm T}Px \end{equation} $ (8)

即椭圆集受饱和反馈控制器控制时, 同样具有收缩不变性.令$W=P^{-1}, Z=HW$, 对式(8)进行Schur补变换, 得到如下矩阵不等式:

$ \left( {\begin{array}{*{20}{c}} W&*\\ {AW + B{D_i}FW + BD_i^ - Z}&W \end{array}} \right){\rm{ }} \ge 0 $ (9)

其中, *号代表对角转置矩阵.用LMI表示$\chi(H)$得到:

$ \left( {\begin{array}{*{20}{c}} {\rm{1}}&{{Z_i}}\\ {Z_i^T}&W \end{array}} \right) \ge 0 $ (10)

其中, $Z_i$表示矩阵$Z$的第$i$行.由于不变集必须满足控制变量约束和状态约束, 反馈控制器的饱和性可以保证满足控制变量约束条件, 我们将状态约束(2)表达成矩阵的形式并作为下述优化问题的约束条件.下面将针对上述的反馈控制器, 计算相应的不变集和代价函数, 线性矩阵$H$会在求解不变集的时候与不变集矩阵一起求出, 从而保证了不变集与反馈控制器具有确定的对应关系.通过解决下面的MAXDET[18]问题:

$ \begin{align*} &\max\limits_{W}(-\lg{\det W})\\ &\textrm{s. t.} (9), (10), \Theta_iW\Theta_i\leq\bar{x}_i^2, i = 1, 2, \cdots, n \end{align*} $ (11)

其中, $\Theta_i$$\bar{x}_i$分别是矩阵$\Theta$$\bar{x}$的第$i$行, 得到不变集

$ \begin{equation*} X_f=\{x:x^{\rm T}Px\leq 1, P=W^{-1}\} \end{equation*} $ (12)

将同样的方法应用到终端代价函数矩阵的求解中:根据条件5可知, 代价函数矩阵$\eta$是满足如下约束:

$ \begin{align*} &\kappa_f^{\rm T}(x)\eta\kappa_f(x)-x^{\rm T}\eta x +\\&\qquad x^{\rm T}Qx+ \kappa_f(x)^{\rm T}R\kappa_f(x)\leq0 \end{align*} $ (13)

的正定矩阵.将这样的约束条件用LMI的形式表达, 进而解决MAXDET问题, 得到代价函数矩阵$\eta$.

2.2.2 多包镇定域设计

镇定域有具体的控制步数限制, 定义$F(E_p, N)$为椭圆不变集$X_f$$N$步可镇定范围, 即通过$N$步控制可以将范围$F(E_p, N)$内的初始状态控制到终端不变集上:

$ \begin{align*} &F(E_p, N)=\{x(0)\in {\bf R}^n, \exists |u(k)|_\infty\leq\bar{u}, \\ &\qquad k=1, \cdots, N-1, \textrm{such that} x(N)\in X_f\} \end{align*} $ (14)

对于$N$步可镇定范围, 本文采用系统逆运算思想进行如下的算法估计:

步骤 1.$k =0$, 因为集合$X_f$是凸集, 在集合边界即椭圆上找一些点, 构成集合$X_0=\{x_i^{\rm T}E_px_i\leq1, i=1, \cdots, \sigma\}$, 其中, $\sigma $记录了在椭圆上选点的个数.

步骤 2.计算点集

$ \begin{align*} Y=\{ y_{ij}: y_{ij}=&A^{-1}x_i-A^{-1}Bu_j, \\ &\forall x\in X_0, \forall u\in Vert(\mu_s)\} \end{align*} $ (15)

步骤 3.利用凸包运算计算$Vert(Co(Y))$, 令$X_0=Vert(Co(Y))$;

步骤 4.$k = k+1$, 若$k > N$, 则程序结束; 否则, 返回步骤2.

其中, $Vert()$描述一个凸包的定点, $Co()$描述凸包, 即包含点集中所有点的最小多面体集合.根据以上算法, 由$X_0$所有顶点确定的多面体是对$F(E_p, N)$多面体的一种估计, 可以用一个不等式组来描述二维镇定域: $c_ix\leq d_i, i=1, 2, \cdots, j$, 其中$j$为多边形的边数.通过求解下面的MAXDET问题, 得到可镇定范围的椭圆估计:

$ \begin{align*} &\min\limits_Z(-\lg{\det Z}) \\ &\textrm{s. t.} c_iZc_i^T\leq d_i, i=1, 2, \cdots, j \end{align*} $ (16)

那么得到的椭圆镇定域为

$ \begin{align*} F(E_p, N)=\{x:x^{\rm T}Vx\leq1, V=Z^{-1}\} \end{align*} $ (17)

控制时域$N$变化的时候, 可镇定范围也会随之变化, 且容易看出可镇定范围与镇定步数之间是正相关的关系, 由此推出下面的多包镇定域算法:将控制时域扩大$L$次, 且每次扩大的幅度为$\Delta n$, 得到$N_i, 0\leq i\leq L$, 与其相对应的是一系列的可镇定域$F(E_p, N_0), F(E_p, N_1), \cdots, F(E_p, N_L)$只要初始状态在这些可镇定域的其中一个之内, 就可以在相应的控制步数内将初始状态控制到终端不变集.

动态控制层接收到上层稳态计算结果$(x_s, u_s)$后, 性能指标如下:

$ \begin{align*} J_d(k)=\sum\limits_{n=0}^{N-1}[&\|x(k+i|k)-x_s\|_Q^2+\\ &\|u(k+i|k)-u_s\|_R^2]+\\ &\|x(k+N|k)-x_s\|_\eta^2 \end{align*} $ (18)

其中, $\eta$是终端代价函数的权重矩阵, $Q$$R$是适维的正定权重矩阵, 终端代价函数为

$ \begin{equation*} \Psi(x)=\|x(k+N)-x_s\|_\eta^2 \end{equation*} $ (19)

优化问题为

$ \begin{align*} &\min\limits_{u(k)}J_d(k)&\end{align*} $ (20a)
$ \begin{align*} &x(k|k)=x(k)&\end{align*} $ (20b)
$ \begin{align*} &x(k+i+1|k)=Ax(k+i|k)+Bu(k+i|k)&\end{align*} $ (20c)
$ \begin{align*} &x(k+i+1)\in\chi_{st}, x(k+N|k)\in\chi_f&\end{align*} $ (20d)
$ \begin{align*} &u(k+i|k)\in\mu_s, i\in\{0, 1, \cdots, N-1\}& \end{align*} $ (20e)

其中, $u(k)={u(k|k), u(k+1|k), \cdots, u(k+N-1)}$, $\chi_{st}$是算法的$N$步可镇定范围.

该算法优化问题的状态约束条件(20d)是对变约束策略的数学表达, 其中的$\chi_{st} = F(E_p, N_i), 0\leq i \leq L. $根据系统实测的状态, 选择包含它且最小的镇定域, 找到对应的$i$值, 从而确定控制时域$N_i$内的系统状态的约束条件.

上述算法设计了带有饱和特性的反馈控制器, 并通过解决MAXDET问题, 将终端不变集最大化, 即最大程度上覆盖约束集, 缩小约束集内任意位置上的稳态目标与不变集的距离, 增大稳态目标落在不变集中的概率, 从而提高了目标跟踪效果.由于本算法处理的初始状态来自一个很大的状态范围, 因此在达到终端不变集之前, 有确定的控制作用驱动状态向着稳态目标变化, 进而也提高了状态在达到不变集之前对稳态目标的跟踪效果.

整个多包镇定域的计算离线完成, 没有增加在线计算量.虽然经过SSTC的调整, 软约束集会在一定程度上放松, 但离线计算不变集时, 坚持了放松前的约束集, 所以得到的不变集是SSTC层调整后的约束集的子集, 满足上层对状态变量的要求, 在此基础上离线计算得到的多包镇定域可以在特定的控制时域内, 收敛回SSTC层对状态变量的约束集内.

3 稳定性分析

通过比较有限时域MPC与线性二次调节器(Linear quadratic regulator, LQR)的稳定性, 可以得出这样的启发:无穷时域的性能指标能产生稳定的MPC算法.因此本文引入了控制"三要素", 其中的终端代价函数是控制时域以外的性能指标函数的上界, 这就给有限时域性能指标函数赋予了无限时域[19]的意义, 从而实现了稳定的模型预测控制.具体证明如下:

假设在$k$时刻通过求解优化问题(7)得到的最优控制序列为$u^*(k|k), \cdots, u^*(k+N-1|k)$, 其对应的状态序列是$x^*(k+1|k), \cdots, x^*(k+N|k)$, 那么最优目标函数$J^*(k)$可表示为

$ \begin{align*} J^*(k)=&\sum\limits_{i=1}^{N-1}\|x^*(k+i|k)-x_s\|_Q^2+\\ &\|u^*(k+i|k)\!-\!u_s\|_R^2\!+\!\|x(k+N|k)\!-\!x_s\|_\eta^2 \end{align*} $ (21)

由于$x^*(k+N|k)\in E_p$, 根据$E_p$是系统关于饱和控制律$\kappa_f(x)$的可行不变集, 可得$Ax^*(k+N|k)+B\kappa_f(x^*(k+N|k))\in E_p$, 且$ \kappa_f(x^*(k+N|k)\in \mu_s$, 那么优化问题(7)在$k+1$时刻的一组可行解为$u^*(k+1|k), \cdots, u^*(k+N-1|k), \kappa_f(x^*(k+N|k))$, 其对应的状态序列是$x^*(k+1|k), \cdots, x^*(k+N|k), Ax^*(k+N|k)+B\kappa_f(x^*(k+N|k))$, 这同时也表明如果在$k = 0$时刻优化是可行的, 那么对任意的$k > 0$时刻, 优化也是可行的.同时, 我们也不难得到这组可行解对应的性能指标满足条件

$ \begin{align*} J_f(k+1)\leq J^*(k)-&\|x^*(k|k)-x_s\|_Q^2-\\ &\|u^*(k|k)-u_s\|_R^2 \end{align*} $ (22)

假设$J^*(k+1)$是经过优化得到的最优解的性能目标值, 既然$J_f (k+1)$是在$k+1$时刻的一个可行解的性能指标函数值, 那么很显然$J^*(k+1) \leq J_f (k+1)$, 进而

$ \begin{align*} J^*(k+1)\leq J^*(k)-&\|x^*(k|k)-x_s\|_Q^2-\\ &\|u^*(k|k)-u_s\|_R^2 \end{align*} $ (23)

那么$J^*(k+1) < J^* (k)$, 这表明对每一时刻$k$最优性能指标$J^* (k)$是收敛的, 这就意味着当$k\rightarrow \infty$时, $u(k)\rightarrow 0, x(k)\rightarrow 0$.又由于性能指标

$ \begin{align*} J*(k)&\geq\|x^*(k|k)-x_s\|_Q^2\geq\\ &\lambda_{\rm min}(Q)\|x(k)\|^2 \end{align*} $ (24)

那么$J^* (k)$是闭环系统的Lyapunov函数, 本文算法所构建的闭环系统是渐近稳定的.

4 仿真算例

本文的算法适用于稳定和不稳定的系统, 首先考虑某纸厂生产书写纸的纸机[20], 要求严格控制纸张的定量和水分.通过机理分析和实验, 获得如下形式的纸机数学模型:

$ \begin{equation*} G(s)= \left[ \begin{array}{cc} \dfrac{10{\rm e}^{-2s}}{1.5s+1} &\dfrac{0.8{\rm e}^{-s}}{1.6s+1} \\ \dfrac{0.8{\rm e}^{-2s}}{1.5s+1} &\dfrac{4{\rm e}^{-s}}{1.6s+1} \\ \end{array} \right] \end{equation*} $

其中, 被控变量为成纸定量($y_1$)和水分($y_2$), 控制变量为浆门开度($u_1$)和蒸汽阀门开度($u_2$).通过模型辨识, 得到状态空间模型的系数矩阵:

$ \begin{array}{l} A = \left[ {\begin{array}{*{20}{c}} { - 0.6667}&0\\ 0&{ - 0.625} \end{array}} \right],B = \left[ {\begin{array}{*{20}{c}} 2&0\\ 0&2 \end{array}} \right]\\ C = \left[ {\begin{array}{*{20}{c}} {3.333}&{0.25}\\ {0.2667}&{1.25} \end{array}} \right],D = \left[ {\begin{array}{*{20}{c}} 0&0\\ 0&0 \end{array}} \right] \end{array} $

$\bar{x}=[2.8, 2.8]^{\rm T}, \bar{u}=[0.5, 0.5]^{\rm T}$, $ \Theta=\Omega= \left[ \begin{array}{cc} 1 &0 \\ 0 &1 \\ \end{array} \right] $在SSTC层, 参数选择如下: $Q_s = I_2, $ $R_s = I_2$; 在下层, 参数选择如下: $Q = I_2, R = I_2$.通过线性二次型调节器和Riccati方程求解线性的局部控制器增益为

$ \begin{equation*} F= \left[ \begin{array}{cc} 0.0781&0 \\ 0 &0.0573 \\ \end{array} \right] \end{equation*} $

采用带有饱和非线性的反馈控制器$u(k) = \kappa_f(x)$, 通过解决线性矩阵不等式优化(LMI)问题得到终端约束集、可镇定域和终端代价函数:

$ \begin{array}{l} {x_f} = \left\{ {x:{x^{\rm{T}}}{E_p}x \le 1,{E_p} = \left[ {\begin{array}{*{20}{c}} {0.1469}&0\\ 0&{0.1499} \end{array}} \right]} \right\}\\ \Psi (x) = {x^{\rm{T}}}\eta x,\eta = \left[ {\begin{array}{*{20}{c}} {0.1650}&0\\ 0&{0.1650} \end{array}} \right] \end{array} $

$L=4, \Delta n=1, N_0=3$, 选点数$\sigma$为40, 计算对应的$N_i$ (其中$i \in(0, 3)$)步可镇定域.

图 2中矩形实线表示的区域是采用线性反馈控制器得到的$O_{\infty}=\{(x_1, x_2):0.3\leq| x_1|\leq1.74, | x_2|\leq1.68\}$, 从图 2可见, Pluymers B[21]计算得到的$O_{\infty}$$E_p$的一个子集, 这说明本文采用的带饱和特性的反馈控制器扩大了终端约束集的区域, 突破了线性反馈控制器的最大不可行集$O_{\infty}$, 这将能够进一步扩大MPC的可镇定范围.稳态目标计算是根据用户给定的优先级划分进行的, 本文按照一定的优先级[12]对不同变量依次进行稳态目标计算, 得出计算结果:

图 2 纸机系统的多包镇定域 Figure 2 The stabilization region set of the AS DPS
表 2 纸机系统的稳态目标计算结果 Table 2 The results of the SSTC in the AS DPS system

图 2所示, 本文的仿真对象在$k=31$$k=61$时刻被控初始状态发生变化, 下面是$k$从31到90的仿真结果:

1) $k$从31到60的仿真结果:

稳态目标值不变, 这时系统的状态发生变化, $x_0 = [4.2, -3]^{\rm T}$, 可镇定范围为$F(Ep, 5)$, 控制时域为$N_c=5$.

3) $k$从61到90的仿真结果:

此时系统状态为$x_0 = [3, -5]^{\rm T}$, 可镇定范围为$F(E_p, 6)$, 控制时域为$N_c = 6$.

以上仿真结果中, 约束上下限用黑色的点标记.在这两组仿真实验中, 动态控制层的控制初始状态都明显超出上层的状态约束集, 这种情况如果采用传统的DC策略, 系统状态是不可控的.采用文中算法获得的一系列镇定域后, 这些违背状态约束的状态值可以被逐步驱动到终端不变集里, 并实现稳态目标值的准确跟踪.

下面考虑不稳定的双重积分系统:

$ \begin{array}{l} A = \left[ {\begin{array}{*{20}{c}} {0.8}&{0.8}\\ 0&{0.9} \end{array}} \right],B = \left[ {\begin{array}{*{20}{c}} {0.0}&{0.5}\\ {1.0}&{0.5} \end{array}} \right]\\ C = \left[ {\begin{array}{*{20}{c}} 1&0\\ 0&1 \end{array}} \right],D = \left[ {\begin{array}{*{20}{c}} 0&0\\ 0&0 \end{array}} \right] \end{array} $

选取同样的约束条件及参数, 得到线性反馈控制矩阵:

$ \begin{equation*} F= \left[ \begin{array}{cc} -0.5548&-2.0844 \\ -2.4247 &1.0851 \\ \end{array} \right] \end{equation*} $

以及终端约束集、可镇定域和终端代价函数:

$ \begin{array}{l} {x_f} = \left\{ {x:{x^{\rm{T}}}{E_p}x \le 1,{E_p} = \left[ {\begin{array}{*{20}{c}} {0.3167}&{0.2787}\\ {0.2787}&{0.4443} \end{array}} \right]} \right\}\\ \Psi (x) = {x^{\rm{T}}}\eta x,\eta = \left[ {\begin{array}{*{20}{c}} {0.3619}&{0.0289}\\ {0.0289}&{0.2916} \end{array}} \right] \end{array} $

同样令$L=4, \Delta n=1, N_0=3$, 逐步增加控制时域, 并计算对应的$N_i$ (其中$i \in(1, 4)$)步可镇定域, 通过3组仿真验证本文方法的有效性.在本次仿真中, 期望目标和初始状态都发生变化, 其他设定参数保持不变.下面是稳态目标计算结果:

由稳态目标计算结果可知, 当外部目标发生变化时, 稳态目标值会随之变化, 这时动态控制层要跟踪变化的设定值.如图 4所示, 本文的仿真对象在$k=31$$k=61$时刻被控初始状态发生变化, 下面给出具代表性的$k$从31到60的仿真结果, 其中$x_0 = [5, -5]^{\rm T}, x_s = [-0.38, -0.2998]^{\rm T}, u_s = [-0.1, 0.2]^{\rm T} $, 可镇定范围为$F(E_p, 7)$, 控制时域为$N_c = 7$.

图 3 控制时刻$k$从31到60对应的纸机系统控制过程 Figure 3 Control process of the paper system with the control moment $k$ from 31 to 60
图 4 控制时刻$k$从61到90对应的纸机系统控制过程 Figure 4 Control process of the paper system with the control moment $k$ from 61 to 90
图 5 控制时刻$k$从31到60对应的双积分系统控制过程 Figure 5 Control process of the double-integrator system with the control moment $k$ from 31 to 60
图 6 三组仿真中的系统状态轨迹 Figure 6 The state trajectories of the three scenarios

上述仿真算例证明了本文提出的控制策略可以适应外部目标的变化, 动态跟踪最优设定值.

下图为3组仿真所得的状态轨迹:

表 3 双积分器系统的稳态目标计算结果 Table 3 The results of SSTC in the double-integrator system

图 3可以看出, 系统不满足约束的状态可以在本文算法所得控制律的作用下, 从初始位置逐渐进入约束集, 并最终准确地到达最优设定值.

综上, 应用本文提出的控制算法, 可以提高DC层对系统状态的控制能力, 并在整个目标跟踪过程中, 保证DC层的优化控制始终可行.各个状态和输入的控制结果表明, 在稳定系统中应用该算法, 可以在短时间内实现稳态目标的准确跟踪, 而不稳定系统的跟踪过程需要一段时间, 系统的状态变化比较缓慢, 但都可以在控制时域以内进入不变集, 而且即使稳态目标发生了变化, 也可以实现准确的目标跟踪.

5 结论

本文针对双层模型预测控制结构中存在的系统状态"违约"问题, 设计了带有饱和特性的反馈控制器、受控不变集和终端代价函数, 保证了闭环系统的稳定性, 并在此基础上提出一种多包镇定域算法, 结合变约束的思想, 对动态控制层进行了改进, 提高了双层模型预测控制算法对系统状态的动态控制能力.

参考文献
1
Xi Yu-Geng, Li De-Wei. Fundamental philosophy and status of qualitative synthesis of model predictive control. Acta Automatica Sinica, 2008, 34(10): 1225-1234.
( 席裕庚, 李德伟. 预测控制定性综合理论的基本思想和研究现状. 自动化学报, 2008, 34(10): 1225-1234.)
2
Xi Yu-Geng, Li De-Wei, Lin Shu. Model predictive control-status and challenges. Acta Automatica Sinica, 2013, 39(3): 222-236.
( 席裕庚, 李德伟, 林姝. 模型预测控制-现状与挑战. 自动化学报, 2013, 39(3): 222-236.)
3
Xi Yu-Geng. Predictive Control. Second Edition. Beijing: National Defense Industry Press, 2013, 15-67.
( 席裕庚. 预测控制. 第2版. 北京: 国防工业出版社, 2013, 15-67.)
4
Sildir H, Arkun Y, Cakal B, Gokce D, Kuzu E. Plant-wide hierarchical optimization and control of an industrial hydrocracking process. Journal of Process Control, 2013, 23(9): 1229-1240. DOI:10.1016/j.jprocont.2013.07.007
5
Darby M L, Nikolaou M, Jones J, Nicholson D. RTO:an overview and assessment of current practice. Journal of Process Control, 2011, 21(6): 874-884. DOI:10.1016/j.jprocont.2011.03.009
6
Scattolini R. Architectures for distributed and hierarchical model predictive control-a review. Journal of Process Control, 2009, 19(5): 723-731. DOI:10.1016/j.jprocont.2009.02.003
7
Li Shi-Qing, Ding Bao-Cang. An overall solution to double-layered model predictive control based on dynamic matrix control. Acta Automatica Sinica, 2015, 41(11): 1857-1866.
( 李世卿, 丁宝苍. 基于动态矩阵控制的双层结构预测控制的整体解决方案. 自动化学报, 2015, 41(11): 1857-1866.)
8
Li Shi-Qing, Ding Bao-Cang, Sun Yao. Multi-priority rank steady-state target calculation in double-layered model predictive control by optimizing increments of manipulated variables. Control Theory & Applications, 2015, 32(2): 239-245.
( 李世卿, 丁宝苍, 孙耀. 双层预测控制中基于操作变量增量的多优先级稳态目标计算. 控制理论与应用, 2015, 32(2): 239-245.)
9
Mayne D Q, Rawlings J B, Rao C V, Scokaert P O M. Constrained model predictive control:stability and optimality. Automatica, 2000, 36(6): 789-814. DOI:10.1016/S0005-1098(99)00214-9
10
Gutman P O, Cwikel M. An algorithm to find maximal state constraint sets for discrete-time linear dynamical systems with bounded controls and states. IEEE Transactions on Automatic Control, 1987, 32(3): 251-254. DOI:10.1109/TAC.1987.1104567
11
Gilbert E G, Tan K T. Linear systems with state and control constraints:the theory and application of maximal output admissible sets. IEEE Transactions on Automatic Control, 1991, 36(9): 1008-1020. DOI:10.1109/9.83532
12
Pan Hong-Guang, Gao Hai-Nan, Sun Yao, Zhang Ying, Ding Bao-Cang. The algorithm and software implementation for double-layered model predictive control based on multi-priority rank steady-state optimization. Acta Automatica Sinica, 2014, 40(3): 405-414.
( 潘红光, 高海南, 孙耀, 张英, 丁宝苍. 基于多优先级稳态优化的双层结构预测控制算法及软件实现. 自动化学报, 2014, 40(3): 405-414.)
13
Blanchini F. Set invariance in control. Automatica, 1999, 35(11): 1747-1767. DOI:10.1016/S0005-1098(99)00113-2
14
Li Z J, Tan W, Nian S C, Liu J Z. A stabilizing model predictive control for linear systems with input saturation. In: Proceedings of the 2006 International Conference on Machine Learning and Cybernetics. Dalian, China: IEEE, 2006. 671-675
15
Li Z J, Liu J Z, Tan W. Multi-model H_∞ loop shaping controller for nonlinear system based on gap metric. In: Proceedings of the ICARCV 8th Control, Automation, Robotics and Vision Conference. Kunming, China: IEEE, 2004, 3: 1940-1944
16
Kosut R. Design of linear systems with saturating linear control and bounded states. IEEE Transactions on Automatic Control, 1983, 28(1): 121-124. DOI:10.1109/TAC.1983.1103127
17
Li Zhi-Jun. Research on Stability and Robustness of Constrained Model Predictive Control[Ph. D. dissertation], North China Electric Power University (Beijing), China, 2005.
(李志军. 约束模型预测控制的稳定性与鲁棒性研究[博士学位论文], 华北电力大学(北京), 中国, 2005.)
18
Limon D, Alvarado I, Alamo T, Camacho E F. MPC for tracking piecewise constant references for constrained linear systems. Automatica, 2008, 44(9): 2382-2387. DOI:10.1016/j.automatica.2008.01.023
19
Chen H, Allgöwer F. A quasi-infinite horizon nonlinear model predictive control scheme with guaranteed stability. Automatica, 1998, 34(10): 1205-1217. DOI:10.1016/S0005-1098(98)00073-9
20
Cao Yong-Yan, Mao Wei-Jie, Sun You-Xian, Feng Xu. Engineering Application of Modern Control Theory. Hangzhou: Zhejiang University Press, 2000.
( 曹永岩, 毛维杰, 孙优贤, 冯旭. 现代控制理论的工程应用. 杭州: 浙江大学出版社, 2000.)
21
Pluymers B, Rossiter J A, Suykens J A K, Moor B D. The efficient computation of polyhedral invariant sets for linear systems with polytopic uncertainty. In: Proceedings of the 2005 American Control Conference. Portland, OR, USA: IEEE, 2005, 2: 804-809