郑州大学学报(理学版)  2024, Vol. 56 Issue (6): 1-8  DOI: 10.13705/j.issn.1671-6841.2023072

引用本文  

王海静, 彭金柱, 张方方. 基于控制障碍函数的受限非线性系统安全控制研究进展[J]. 郑州大学学报(理学版), 2024, 56(6): 1-8.
WANG Haijing, PENG Jinzhu, ZHANG Fangfang. Progress of Research on Safety Control of Constrained Nonlinear System Based on Control Barrier Function[J]. Journal of Zhengzhou University(Natural Science Edition), 2024, 56(6): 1-8.

基金项目

国家自然科学基金项目(62273311, 61773351);河南省重点研发与推广专项(222102220117)

通信作者

彭金柱(1980—),男,教授,主要从事机器人运动规划与控制、智能信息处理研究,E-mail: jzpeng@zzu.edu.cn

作者简介

王海静(1988—),女,博士研究生,主要从事机器人控制、非线性系统理论与应用研究,E-mail: hjwang.zzu@hotmail.com

文章历史

收稿日期:2023-04-01
基于控制障碍函数的受限非线性系统安全控制研究进展
王海静1, 彭金柱1,2, 张方方1,2    
1. 郑州大学 电气与信息工程学院 河南 郑州 450001;
2. 智能农业动力装备全国重点实验室 河南 洛阳 471039
摘要:控制障碍函数能有效兼顾控制目标和安全性,成为当前研究热点之一。首先,基于非线性控制系统的复杂性介绍了一相对阶和高相对阶控制障碍函数的构造方法及其理论成果,通过各类控制障碍函数可将安全约束转化为集合前向不变性以实现系统安全控制。其次,从不同控制目标下优化问题的求解角度对基于控制障碍函数的非线性系统安全控制进行了总结。最后,基于控制障碍函数方法的可扩展性、强实时性和强鲁棒性等优点,展望了控制障碍函数方法在非线性系统安全控制领域的应用前景。
关键词控制障碍函数    非线性系统    安全控制    二次规划    
Progress of Research on Safety Control of Constrained Nonlinear System Based on Control Barrier Function
WANG Haijing1, PENG Jinzhu1,2, ZHANG Fangfang1,2    
1. School of Electrical and Information Engineering, Zhengzhou University, Zhengzhou 450001, China;
2. State Key Laboratory of Intelligent Agricultural Power Equipment, Luoyang 471039, China
Abstract: Since control barrier function could balance control objectives and safety effectively, it has become one of the hotspots of study. Firstly, the construction methods and theoretical achievements of one relative order and high relative order control barrier functions were introduced based on the complexity of nonlinear control systems. By using various control barrier functions, safety constraints could be transformed into set forward invariance to ensure the safety control of the system. Secondly, the safety control of nonlinear systems based on control barrier functions was summarized from the perspective of solving optimization problems with different control objectives. Finally, based on the advantages of the control barrier function method, such as scalability, strong real-time performance and strong robustness, the application prospect of the control barrier function method in the field of nonlinear system safe control was explored.
Key words: control barrier function    nonlinear system    safety control    quadratic programming    
0 引言

随着科技的进步,工程控制系统被广泛应用到工业生产、生活服务、医疗、航空航天等重要领域,系统安全性问题日益凸显。为了提高系统在工作运行中或与人类协同工作时的自适应性和安全性,面向系统状态安全的分析与控制越来越多地受到国内外学者的关注。21世纪以来,障碍函数(barrier function,BF)开始应用在非线性系统以解决安全性问题,该方法继承了20世纪40年代Nagumo定理实现集合不变性的基本思想[1]。不同的是,Nagumo定理只是给出了状态在集合边界应该满足的条件,BF方法则是考虑系统的整个安全集合[2]

针对现实系统在没有干预时并不是总能保证系统安全的情况,需要通过控制输入改变系统状态的轨迹,从而使系统轨迹满足安全约束条件。因此,将BF扩展到带有输入的控制系统中,产生了控制障碍函数(control barrier function,CBF)的概念[3]。近年来,CBF成为当前研究热点之一[4-5]。该方法是控制Lyapunov函数(control Lyapunov function,CLF)对安全状态集的推广,将满足状态约束条件转化为安全状态集的前向不变性问题。该方法不需要穷举系统的动态行为,并且避免了显式计算系统的状态轨迹或可达集,进而降低了非线性系统安全控制的计算复杂性和保守性。

目前,CBF已经可以处理任意相对阶的约束条件,其约束条件可以是常值、时变的,甚至是动态生成的。同时,基于CBF的控制器的设计可以独立于原有的面向任务的控制器,并不会增加控制器设计的难度。CBF在机器人、自动驾驶等实际问题中得到了广泛应用[6-8]。本文对基于CBF的非线性系统安全控制的研究成果进行了综述。首先回顾了基于CBF的非线性系统安全控制相关理论,然后介绍了基于CBF的安全控制设计及其应用,并简要概括了现有CBF的不足之处,浅析其在非线性系统安全控制领域的未来研究方向。

1 CBF的相关理论

相关符号定义如下:$\mathbf{R} 、\mathbf{R}^{+}$$\mathbf{R}_{0}^{+}$分别表示实数、正实数和非负实数,集合$D \subset \mathbf{R}^{n}$表示动态系统容许状态集,集合$U \subset \mathbf{R}$表示容许控制输入集,$\partial C$表示集合$C$的边界,${Int}(C)$表示集合$C$的内部,。表示函数复合运算符。如果函数$\beta:[0, \varepsilon) \rightarrow[0$, $\infty), \beta>0$连续、严格递增并满足$\beta(0)=0$, 称其为一个类$\kappa$函数。特别地,如果函数$\beta:(-b, a) \rightarrow$ $(-\infty, \infty)$, 而且$a, b \in \mathbf{R}^{+}$, 则该函数是一个扩展类$\kappa$函数。

考虑非线性控制系统

$ \dot{x}=f(x)+g(x) u, $ (1)

其中: $x \in D$为系统状态; $u \in U$为输入; $f: D \rightarrow \mathbf{R}^{n}$$g: D \rightarrow \mathbf{R}^{n}$为局部Lipschitz连续函数。对于任意初始状态$x_{0}=x\left(t_{0}\right) \in D$和控制输入$u$, 记$x\left(t, x_{0}\right.$, $u$)为系统(1)的解。假设系统具有前向完备特性,即对于任意初始状态$x_{0}$, 存在一个最大时间间隔$I(x)=[0, \infty)$, 使得$x\left(t, x_{0}, u\right)$是系统在$I(x)$上的唯一状态解。

定义1[9]   对于系统(1),给定系统状态集合$C$, 如果状态$x\left(t, x_{0}, u\right)$从状态集$C$出发, 且满足对于任意$t \in I\left(x_{0}\right)$, 都有$x(t) \in C$。则称集合$C$是前向不变的。

1.1 一阶CBF

本文的目的是将系统(1)所受状态约束条件通过集合C进行刻画,集合C遵循:

$ C=\{x \in D: h(x) \geqslant 0\}, $ (2)
$ \partial C=\{x \in D: h(x)=0\}, $ (3)
$ {Int}(C)=\{x \in D: h(x)>0\}, $ (4)

其中:函数$h: D \rightarrow \mathbf{R}$连续可微,该函数可以用来观测系统(1)的当前状态是否处于安全区域。其基本思想是根据标量函数h(x)探索保证集合C前向不变性的条件,称集合C为系统(1)的安全集合。

定义2[3]  对于系统(1),给定由式(2)~(4)定义的安全集合$C$和其伴随连续可微函数$h: D \rightarrow$ $\mathbf{R}$。如果存在一个局部Lipschitz连续的类$\kappa$函数$\alpha(\cdot)$, 使得对于任意$t \geqslant 0$$x(t) \in C$, 都有

$ L_{f} h(x)+L_{g} h(x) \geqslant-\alpha(h(x)), $ (5)

则称函数$h(x)$为集合$C$的一个零点控制障碍函数(zeroing control barrier function, ZCBF)。给定一个ZCBF $h(x)$,假设系统输入没有约束,也就是$U=\mathbf{R}$,定义集合

$ K_{\text {ZCBF }}(x)=\left\{u \in U: L_{j} h(x)+L_{g} h(x)+\alpha(h(x)) \geqslant 0\right\}_{。} $ (6)

定理1[3]  给定系统(1)和由式(2)~(4)定义的安全集合$C$,如果存在满足条件(5) 的ZCBF,则任意一个Lipschitz连续的控制输入$u: D \rightarrow U$且满足$u(x) \in K_{\text {ZCBF }}(x)$可以使集合$C$前向不变。

另一类障碍函数仅在安全集合内部具有定义,随着系统状态靠近集合边界而趋向无穷大,包括倒数障碍函数[10]、障碍Lyapunov函数[11]等。此类障碍函数系统状态均在安全集合内,即在安全区域外未定义控制器,而且随着系统状态靠近安全集合边界,函数值趋向无穷大,不可避免地会因控制幅值过大造成测量误差非常敏感而无法使用。这些特点大大降低了此类障碍函数的适用性。

ZCBF最早由文献[3]提出,其障碍函数在状态空间中具有全局定义,并且随着状态轨迹靠近安全集合边界而趋于零。该类型的障碍函数条件可以实现:

1) 如果系统初始状态在安全域内,则状态轨迹仍在安全域内。

2) 如果系统初始状态在安全域外,则状态轨迹渐进收敛到安全域内。

上述优势使得ZCBF成为非线性系统安全控制中广泛应用的障碍函数。

值得一提的是,ZCBF的第2个优势正是基于ZCBF的鲁棒特性,也就是说,ZCBF不仅能够保证安全集合C的前向不变性,还保证了安全集合C是渐进稳定的。当系统状态受到扰动或者初始状态在安全集合C之外,由于ZCBF具有鲁棒特性,会使状态变量收敛至安全集合C,文献[3]从集合渐进稳定性的角度指出了该特性,其具体分析过程如下。

如果系统状态集合$D$为开集,给定一个ZCBF $h(x)$, 构造标量函数$V_{C}: D \rightarrow \mathbf{R}_{0}^{+} , $

$ V_{C}(x)= \begin{cases}0, & \text { if } x \in C \\ -h(x), & \text { if } x \in D \backslash C\end{cases} $ (7)

并得到一系列的鲁棒性质。

性质1[3]   给定系统(1)和由式(2)~(4)定义的安全集合C,如果存在满足条件(5)的ZCBF,则安全集合C是渐进稳定的,而且由式(7)定义的函数VC(x)是一个Lyapunov函数。

根据性质1,由不同的鲁棒特性可以给出性质2和性质3。

性质2[3]   给定系统$\dot{x}=f(x)+g(x) u+g_{1}(x)$, 对于任意的连续函数$g_{1}: \mathbf{R}^{n} \rightarrow \mathbf{R}^{n}$满足$\left\|g_{1}(x)\right\| \leqslant$ $\sigma_{1}\left(\|x\|_{c}\right), \forall x \in D \backslash {Int}(C)$, 其中函数$\sigma:[0, \varepsilon]$ $\rightarrow \mathbf{R}_{0}^{+}$是类$\kappa$函数, $\varepsilon \in \mathbf{R}_{0}^{+}$。则安全集合$C$相对于该扰动系统依然是渐进稳定的。

性质3[3]  给定系统$\dot{x}=f(x)+g(x) u+g_{2}(x)$, 对于任意的连续函数$g_{2}: \mathbf{R}^{n} \rightarrow \mathbf{R}^{n}$满足$\left\|g_{2}\right\|_{\infty} \leqslant k$, $k \in \mathbf{R}^{+}$。则集合$\left.C_{\sigma_{2}(}\left\|g_{2}\right\|_{\infty}\right) \subseteq D$相对于该扰动系统是渐进稳定的, 其中函数$\sigma_{2}:[0, \varepsilon] \rightarrow \mathbf{R}_{0}^{+}$是类$\kappa$函数, $\varepsilon \in \mathbf{R}_{0}^{+}$

1.2 高阶CBF

基于以上对ZCBF的理论分析,ZCBF仅能处理相对阶为一的约束条件。为了处理任意相对阶的约束条件,在ZCBF的基础上提出了高阶控制障碍函数(high-order control barrier function,HoCBF)的概念。

定义3[9]  对于系统(1),给定由式(2)~(4)定义的安全集合C和其伴随连续可微函数$h: D \rightarrow$ $\mathbf{R}_{\text {。}}$对函数$h(x)$进行$\gamma$次求导后, 建立与控制输入$u$的联系, 称$\gamma$为函数$h(x)$的相对阶, 即

$ \begin{gathered} L_{g} L_{f}^{k} h(x)=0, 0 \leqslant k \leqslant \gamma-2, \\ L_{g} L_{f}^{\gamma-1} h(x) \neq 0 \end{gathered} $

对于非线性系统(1), 假设给定的连续可微函数$h: D \rightarrow \mathbf{R}$具有任意高的相对阶, 即$\gamma \geqslant 1$。Xiao等 [9]利用类$\kappa$函数构造了HoCBF, 具体如下。

给定函数$h(x)$, 定义一系列函数$\varphi_{i}: D \rightarrow \mathbf{R}, i=$ $1, \cdots, \gamma$,

$ \varphi_{i}(x)=\dot{\varphi}_{i-1}(x)+\beta_{i}\left(\varphi_{i-1}(x)\right) $ (8)

其中:$\varphi_{0}(x)=h(x), \beta_{i}(\cdot)$$(\gamma-i)$次可微的类$\kappa$函数。

定义函数φi(x)对应的零超水平集合为

$ C_{i}=\left\{x \in D: \varphi_{i-1}(x) \geqslant 0\right\} $ (9)

定义4[9]  对于系统(1),给定由式(9)定义的安全集合Ci和一系列由式(8)定义的函数$\varphi_{i}(x)$, $i=1, \cdots, \gamma$。如果存在$(\gamma-i)$次可微的类$\kappa$函数$\beta_{i}(\cdot), i=1, \cdots, \gamma-1$, 以及一个类$\kappa$函数$\beta_{\gamma}(\cdot)$, 满足

$ \begin{align*} & \sup _{u \in U}\left[L_{f}^{\gamma} h(x)+L_{g} L_{f}^{\gamma-1} h(x) u+S(h(x))+\right. \\ & \left.\beta_{\gamma}\left(\varphi_{\gamma-1}(x)\right)\right] \geqslant 0 \end{align*} $ (10)

其中: $S(h(x))=\sum\limits_{i=1}^{\gamma-1} L_{f}^{i}\left(\beta_{\gamma-i}{ }^{\circ} \varphi_{\gamma-i-1}(x)\right)$。则称函数$h(x)$为HoCBF。

定理2[9]  对于系统(1),给定一个HoCBF $h(x)$以及由式(9)定义的安全集合$C_{i}, i=1, \cdots, \gamma$, 如果系统初始条件满足$x_{0} \in \bigcap\limits_{i=1}^{\gamma} C_{i}$, 则任意一个Lipschitz连续且满足式(10)的控制输入$u: D \rightarrow U$, 可以使集合$\bigcap\limits_{i=1}^{\gamma} C_{i}$前向不变。

不难看出, 当类$\kappa$函数为线性函数时, 即$\beta_{i}\left(\varphi_{i-1}(x)\right)=\beta_{i} \varphi_{i-1}(x)$, 该HoCBF退化为Nguyen等 [12]提出的指数型CBF, 该函数利用了线性反馈理论中的极点配置方法。

此外,以上介绍的ZCBF和HoCBF方法均是在系统具有前向完备性的限制下得以应用,文献[13]则通过利用Brezis定理,去除传统CBF的系统前向完备性限制,并且利用扩展类κ函数构造了HoCBF。该HoCBF在安全集合外也被给予了定义,进一步得出HoCBF的鲁棒特性,也就是说,ZCBF的鲁棒特性进一步扩展到了HoCBF。

性质4[13]  如果函数$h(x)$是系统(1)的一个HoCBF, 则集合$\bigcap\limits_{i=1}^{\gamma} C_{i}$是渐进稳定的。

2 面向非线性系统的CBF

实际的非线性系统往往存在不确定性、时变性等情况,使得上述的CBF不再适用。随着CBF方法研究的深入,已经涌现出许多关于不同种类非线性系统安全控制的研究成果。因此,对面向多种非线性系统的CBF分别进行了研究。

2.1 面向时不变非线性控制系统的CBF

对于时不变非线性控制系统,CBF方法已经取得了许多成果。基于前面的介绍,最早的ZCBF方法只能处理一相对阶的约束条件。鉴于高阶非线性系统控制设计问题已经成为非线性控制领域中较为重要的一个分支,近年来,为拓展基于CBF的安全控制在机器人等高阶非线性系统中的应用,在ZCBF的基础上,Xiao等[9]、Nguyen等[12]、Tan等[13]针对具有高相对阶的安全约束问题,提出了不同种类的HoCBF。

此外,利用非光滑分析技术去除连续可微限制的CBF[14]以及离散时间ZCBF[15]等的提出,极大丰富了CBF的种类、数量和应用领域。

2.2 面向时变非线性控制系统的CBF

目前,大多数文献主要研究的是面向时不变非线性系统的CBF。但是在实际工程中,研究对象日益复杂,往往会因为组件磨损或者损坏以及工作环境变化等因素具有时变性。在这种情况下,采用时变微分方程可以更准确地进行研究。为此,进一步讨论面向时变非线性系统的CBF方法。

考虑时变非线性控制系统

$ \dot{x}=f(t, x)+g(t, x) u, $ (11)

其中: $x \in D$为系统状态;$f: \mathbf{R}_{0}^{+} \times D \rightarrow \mathbf{R}^{n}$$g: \mathbf{R}_{0}^{+} \times$ $D \rightarrow \mathbf{R}^{n}$为局部Lipschitz连续函数;$u \in U$为输入。

给定$\gamma$阶连续可微时变函数$h(t, x): \mathbf{R}_{0}^{+} \times D \rightarrow$ $\mathbf{R}$, 定义函数$h(t, x)$$f$的修正李导数为$\bar{L}_{f}^{i} h(t, x)=$ $\frac{\partial^{i} h(t, x)}{\partial t^{i}}+L_{f}^{i} h(t, x)$, 其中$i$是非负整数。Xu[16]将ZCBF推广为时变HoCBF,构造方法与指数型CBF[12]相似,同样是利用构造满足负实根的多项式保证函数的非负性,该函数可处理非线性时变系统中的高阶约束条件。

性质5[16]  对于系统(11),如果给定一个时变HoCBF $\operatorname{HoCBF} h(t, x)$满足

$ \sup\limits_{u \in {U}}\left[\bar{L}_{f}^{\gamma} h(t, x)+L_{g} \bar{L}_{f}^{\nu-1} h(t, x) u\right] \geqslant-\boldsymbol{K}_{\alpha} \boldsymbol{\xi}(t, x), $ (12)

其中: $\boldsymbol{\xi}(t, x)=\left[h(t, x), \cdots, \bar{L}_{f}^{\gamma-1} h(t, x)\right]^{\mathrm{T}}$; 常数向量$\boldsymbol{K}_{\alpha} \in \mathbf{R}^{\gamma}=\left[\alpha_{\gamma}, \cdots, \alpha_{1}\right]$, 其参数为多项式$P(s)=$ $s^{\gamma}+\alpha_{1} s^{\gamma-1}+\cdots+\alpha_{\gamma}$的系数, 满足其多项式所有的根为$-\lambda_{i}, i=1, \cdots, \gamma$

构造一系列函数$B_{0}(t, x)=h(t, x), B_{k}(t, x)=$ $\frac{\mathrm{d} B_{k-1}(t, x)}{\mathrm{d} t}+\lambda_{k} B_{k-1}(t, x), 1 \leqslant k \leqslant \gamma$, 满足初始条件$B_{i}(0) \geqslant 0, i=0, \cdots, \gamma-1$, 则任意一个Lipschitz连续且满足式(12) 的控制输入$u$可以对任意$t \geqslant 0$, 都有$h(t, x) \geqslant 0$

注意到性质5是在系统具有前向完备性限制下得到的,文献[17]在没有系统前向完备性限制条件下利用Hartman得到有关不变性集合的相关结论,并给出了时变HoCBF的证明。另外,以上CBF的定义均是在函数相对阶明确的情况下,文献[13]、[18]进一步考虑了没有明确相对阶限制下的CBF。

2.3 面向不确定非线性系统的CBF

以上CBF的提出均是基于精确的系统模型,然而在实际情况下,在系统设计时得到与实际系统一致的精确数学模型几乎是不可能的。大部分模型具有非线性、不确定性、时变性、状态不可测等情况,而忽略系统的不确定性往往会导致安全约束条件并不能真正被满足。因而,不确定非线性系统受到国内外学者的广泛关注,并针对基于CBF的系统安全问题进行了大量的研究,提出了多种基于CBF的安全理论框架,为多种类型的不确定系统提供一种有效的安全控制策略。比如,为使控制系统的安全控制策略具有鲁棒性,进行了鲁棒CBF的研究;对不确定系统采用自适应控制的方法,进行了自适应安全控制策略的研究等。

针对具有干扰的非线性系统,为保证系统安全,可分为以下两种处理方法:一种方法是利用扰动最坏值增大安全域,比如文献[18]提出的鲁棒CBF,文献[19]构造的输入-状态安全CBF等;另一种方法是在线估计干扰,比如文献[20]针对具有时变并与系统状态有关的不确定扰动的非线性系统,运用自适应估计控制律估计不确定扰动的点态值,提出了一种自适应鲁棒CBF方案。

针对一类具有未知输入干扰的非线性系统,利用干扰观测器[21]、高增益输入观测器[22]等提出了一种观测器与CBF相结合的安全控制框架。与仅考虑未知干扰最坏值方法相比,该方法可以通过估计扰动值进而消除干扰的影响。

针对带有不确定参数的非线性系统,文献[23]参照自适应CLF的方法,提出了自适应CBF,其通过在线更新参数估计以保证系统安全性。在此基础上,文献[24]结合数据驱动的方法提出了鲁棒自适应CBF。

针对现实操作时系统的复杂性和不确定性,鉴于难以获得精确的系统模型,基于CBF的学习控制技术也引发了众多关注。比如文献[25]利用CBF进行安全学习,为模型不准确的系统提供了高概率的安全保障。文献[26]将贝叶斯学习方法与CBF结合,高概率地保证系统安全。

针对系统状态不可测量或者部分不可测量的情况,文献[27]利用系统的输出信息提出了一种估计误差量化观测器与CBF相结合的安全控制框架,且采用函数近似方法处理状态估计误差引入的不确定性。同时,考虑到测量以及系统动态误差,文献[28]分别针对已知完整系统信息和仅具有不完整系统状态信息两种情况,提出了基于随机系统的ZCBF和倒数CBF(reciprocal-type control barrier function,RCBF)。

3 基于CBF的非线性系统安全控制

为保证闭环非线性控制系统的安全,该部分主要介绍基于CBF的安全控制器设计方法。

3.1 基于单个CBF的二次规划框架

基于以上的理论分析,CBF本质上是一种不具有正定特性的类Lyapunov函数,在其研究和性质分析上可以借鉴控制Lyapunov函数(control Lyapunov function,CLF)的技巧和手段。此外,满足这些障碍条件的障碍函数集合是一个凸集,该特性意味着可以利用凸优化方法获取安全控制器。

鉴于CBF条件关于控制输入u是仿射的,因此利用二次规划(quadratic programming,QP)可以获取安全控制器,其形式为

$ \begin{aligned} & u^{*}=\lim _{u \in U}\left\|u-u_{\text {no }}\right\| \quad(\text { CBF-QP }), \\ & \text { s. t. } L_{f} h(x)+L_{g} h(x) u \geqslant-\alpha(h(x)), \end{aligned} $

其中: uno称为名义控制器。该控制器是指除了安全约束以外的面向任务的显式控制律,比如轨迹追踪、系统镇定等。CBF-QP的思想是实时在线地通过CBF约束条件最小化修正uno,使得被CBF条件筛选后的控制器u*能进一步保证系统安全[2]

3.2 基于多个CBF的安全控制器

上文讨论了基于单个CBF约束条件的CBF-QP框架。但是由于控制系统本身的复杂性,往往需要引入多个CBF才能完整地刻画所有的安全约束。在这种情况下,文献[17]根据多个CBF提出了激活CBF的概念,即利用即将被违反的CBF集合进一步获取CBF-QP问题的解析解。同时,当多个CBF耦合在同一个CBF-QP时,可能会导致QP不可解问题。利用多个CBF的控制共享特性是一个有效的思路。例如,文献[16]提出了控制共享CBF的定义及其充分必要条件,其本质是检测多个CBF所划定的控制输入可选范围是否存在交集。然而该方法是通过缩小安全集合的范围以换取CBF-QP的可行性,在某种程度上具有保守性。值得注意的是,以上介绍的CBF-QP框架是基于给定的uno在保证系统稳定性的前提下,进一步实现安全控制目标。

3.3 基于CLF和CBF的多目标控制

基于以上分析,CBF方法只能保证系统安全,而不能保证系统的渐进稳定性。众所周知,讨论平衡点的稳定性是控制科学最重要的问题之一。鉴于CLF方法是寻找一个控制输入使得系统轨迹能够达到平衡点,因此结合系统的CLF条件和CBF条件,构造CLF-CBF-QP问题,既保证系统稳定又保证系统安全,该方法已经在很多领域得到验证及应用。

对一般非线性系统,CLF和CBF条件会存在互相冲突的情况,进而导致QP问题无解。为了保证QP问题的可解性,本着安全第一的原则,将CLF条件设为软约束[29],始终确保系统安全。但是该方法不能保证系统的稳定性,尤其是在CBF条件没有被激活的情况下,由于松弛变量的存在,得到的控制律依然无法保证系统渐进稳定到平衡点。为了避免出现这种情况,文献[18]对QP问题中的CLF条件进行了修改;文献[30]分析了CLF-CBF-QP问题给定的控制器下的闭环系统平衡点,消除了安全域内除原点以外的平衡点,保证在原点附近渐进稳定。

3.4 在机器人系统中的应用

随着技术的不断发展,机器人的技能不断提升,应用范围越来越广泛。机器人的工作方式也由最初的分离囚笼式逐渐向人机共融协同转化。在共享空间下,物理接触不可避免,因此机器人的安全问题受到越来越多学者的关注。

基于CBF的安全控制方法在机器人系统中得到了广泛应用[31-34]。比如,CBF-QP框架的应用在保证人机交互安全的同时,处理了笛卡尔空间下的位置约束[7]。文献[35]围绕工业机器人的技术规范ISO/TS 15066,设计了人机交互的安全操作区域以及相应的CBF约束以提高性能;文献[36]针对机器人系统提出了运动学CBF。

随着机器人系统群体规模的不断增加,系统的通信负载以及避碰决策空间也会呈指数增长,加之机器人本身移动能力的限制,给多机器人系统的实时安全控制带来了挑战[37]。文献[38]针对连续线性的多智能体系统提出了多智能体CBF的概念;文献[39]考虑了系统动态不确定性或者非线性,利用多智能体CBF保证了在多机器人环境下的安全性,并结合Matrix-Variate高斯过程模型学习系统动态不确定性。文献[40-41]将分布式CBF应用于信号时间逻辑(signal temporal logic, STL)任务的多机器人系统中,并针对特定STL任务提出了不同的CBF构建方法。文献[42]为了保证多机器人系统中行为的正确组合,提出了有限时间收敛CBF的概念。现有的研究成果大多数是考虑标准的2维或3维的欧氏距离,文献[43]针对球体上一组刚体的分布式避碰问题提出了角型CBF,能够处理球面上测地距离约束。

4 小结与展望

本文对基于CBF的非线性系统安全控制进行了全面的回顾和总结。首先,重点阐述了基于ZCBF以及在其基础上扩展的各种HoCBF的构造与相关性质;基于各种CBF的构造,CBF方法可以处理任意高相对阶非线性系统的安全控制研究。其次,对基于CBF的安全控制设计方法进行了总结,分别介绍了基于单个CBF条件、多个CBF条件以及CLF-CBF条件下的二次规划框架。最后,介绍了CBF方法在机器人系统中的应用及扩展。此外,该方法在其他领域也得到了验证并被广泛应用,例如自动驾驶汽车、无人机、工业过程系统等。

如上所述,CBF方法将安全约束转化为集合前向不变性以实现系统安全控制。与现有的其他安全算法相比,CBF方法具有可扩展性、强实时性、强鲁棒性等优点,能有效兼顾控制目标和安全性,故其理论与应用已经取得了一系列研究成果,尤其是在安全控制方面的理论研究以及在机器人系统中的应用。因此,基于CBF的非线性系统安全控制方案已逐渐成为非线性控制领域的研究热点之一。

虽然CBF方法已经被广泛研究,但是该方法应用于非线性系统安全控制的研究起步较晚,目前仍存在CBF构造难、优化问题可解性差、CBF适用范围窄等尚待解决的问题。针对这些问题,提出以下解决思路和研究展望。

1) 传统的CBF方法往往需要系统非线性信息精确已知,而且目前已有的各种CBF都有其适用范围的局限性。随着现代信息科学技术的进步,控制系统的模型变得愈加复杂,给CBF的设计带来了困难和挑战。由于外部扰动、不确定参数、未建模动态等不确定因素的存在,很难制订一套适用于大多数非线性系统的CBF控制方案。因此,为了更好地满足实际应用需求,有必要深入研究CBF方法构造问题。

2) 基于QP的控制框架的可解性问题是实现安全控制的关键。针对提高QP的可行性问题虽然已经进行了一些研究工作,然而在实际控制系统中往往存在一些附加约束条件,例如由于物理限制通常需要考虑容许控制输入等。这些附加约束可能与CLF或CBF约束发生冲突,从而导致QP不存在可行解,在这种情况下,如何保证QP可解依旧是一个难题。因此,为了避免QP求解不可行问题,有必要进一步开发基于多目标的QP新形式,以提高QP的可解性。同时,可以寻找CBF安全控制新形式,例如设计显示控制器等,以实现在满足安全、稳定等多目标的同时,又能避免优化问题的不可行情况。

3) 目前CBF的理论研究主要面向时不变非线性系统,对时变非线性系统的研究与应用还很少。实际上,随着科技在各个领域的全面进步,对复杂系统建模的要求越来越高,考虑系统时变性是十分有必要的。因此,进一步开展面向时变非线性系统的CBF方法研究具有重要的理论意义和广泛的工程应用价值。

参考文献
[1]
AMES A D, COOGAN S, EGERSTEDT M, et al. Control barrier functions: theory and applications[C]//Proceedings of the 18th European Control Conference. Piscataway: IEEE Press, 2019: 3420-3431. (0)
[2]
陈杰, 吕梓亮, 黄鑫源, 等. 非线性系统的安全分析与控制: 障碍函数方法[J]. 自动化学报, 2023, 49(3): 567-579.
CHEN J, LYU Z L, HUANG X Y, et al. Safety analysis and safety-critical control of nonlinear systems: barrier function approach[J]. Acta automatica sinica, 2023, 49(3): 567-579. (0)
[3]
XU X R, TABUADA P, GRIZZLE J W, et al. Robustness of control barrier functions for safety critical control[J]. IFAC-PapersOnLine, 2015, 48(27): 54-61. DOI:10.1016/j.ifacol.2015.11.152 (0)
[4]
VERGINIS C K. Funnel control for uncertain nonlinear systems via zeroing control barrier functions[J]. IEEE control systems letters, 2023, 7: 853-858. DOI:10.1109/LCSYS.2022.3227514 (0)
[5]
LI C, ZHANG Z J, NESRIN A, et al. Instantaneous local control barrier function: an online learning approach for collision avoidance[EB/OL]. (2022-01-26)[2022-12-26]. https://doi.org/10.48550/arXiv.2106.05341. (0)
[6]
SCHILLIGER J, LEW T, RICHARDS S M, et al. Control barrier functions for cyber-physical systems and applications to NMPC[J]. IEEE robotics and automation letters, 2021, 6(4): 8623-8630. DOI:10.1109/LRA.2021.3111010 (0)
[7]
WANG H J, PENG J Z, ZHANG F F, et al. High-order control barrier functions-based impedance control of a robotic manipulator with time-varying output constraints[J]. ISA transactions, 2022, 129: 361-369. DOI:10.1016/j.isatra.2022.02.013 (0)
[8]
SHAW C W, OETOMO D, MANZIE C, et al. Control barrier functions for mechanical systems: theory and application to robotic grasping[J]. IEEE transactions on control systems technology, 2021, 29(2): 530-545. DOI:10.1109/TCST.2019.2952317 (0)
[9]
XIAO W, BELTA C, CASSANDRAS C G. Adaptive control barrier functions[J]. IEEE transactions on automatic control, 2022, 67(5): 2267-2281. DOI:10.1109/TAC.2021.3074895 (0)
[10]
朱哲人, 张新民, 柴毅, 等. 非正障碍函数: 面向非线性系统状态安全控制的一类新颖障碍函数[J]. 中国科学: 信息科学, 2022, 52(10): 1853-1869.
ZHU Z R, ZHANG X M, CHAI Y, et al. Non-positive barrier function: a new notion of barrier function for state-safety control of nonlinear dynamical systems[J]. Scientia sinica: informationis, 2022, 52(10): 1853-1869. (0)
[11]
WANG N, FU Z M, SONG S Z, et al. Barrier-Lyapunov-based adaptive fuzzy finite-time tracking of pure-feedback nonlinear systems with constraints[J]. IEEE transactions on fuzzy systems, 2022, 30(4): 1139-1148. DOI:10.1109/TFUZZ.2021.3053322 (0)
[12]
NGUYEN Q, SREENATH K. Exponential Control Barrier Functions for enforcing high relative-degree safety-critical constraints[C]//Proceedings of the American Control Conference. Piscataway: IEEE Press, 2016: 322-328. (0)
[13]
TAN X, CORTEZ W S, DIMAROGONAS D V. High-order barrier functions: robustness, safety, and performance-critical control[J]. IEEE transactions on automatic control, 2022, 67(6): 3021-3028. DOI:10.1109/TAC.2021.3089639 (0)
[14]
GHANBARPOUR M, ISALY A, SANFELICE R G, et al. Optimal safety for constrained differential inclusions using nonsmooth control barrier functions[J]. IEEE control systems letters, 2023, 7: 1303-1308. DOI:10.1109/LCSYS.2022.3232219 (0)
[15]
AHMADI M, SINGLETARY A, BURDICK J W, et al. Safe policy synthesis in multi-agent POMDPs via discrete-time barrier functions[C]//Proceedings of the 58th IEEE Conference on Decision and Control. Piscataway: IEEE Press, 2020: 4797-4803. (0)
[16]
XU X R. Constrained control of input-output linearizable systems using control sharing barrier functions[J]. Automatica, 2018, 87: 195-201. DOI:10.1016/j.automatica.2017.10.005 (0)
[17]
WANG H J, PENG J Z, XU J J, et al. High-order control barrier functions-based optimization control for time-varying nonlinear systems with full-state constraints: a dynamic sub-safe set approach[J]. International journal of robust and nonlinear control, 2023, 33(8): 4490-4503. DOI:10.1002/rnc.6624 (0)
[18]
JANKOVIC M. Robust control barrier functions for constrained stabilization of nonlinear systems[J]. Automatica, 2018, 96: 359-367. DOI:10.1016/j.automatica.2018.07.004 (0)
[19]
KOLATHAYA S, AMES A D. Input-to-state safety with control barrier functions[J]. IEEE control systems letters, 2019, 3(1): 108-113. DOI:10.1109/LCSYS.2018.2853698 (0)
[20]
ZHAO P, MAO Y B, TAO C Y, et al. Adaptive robust quadratic programs using control Lyapunov and barrier functions[C]//Proceedings of the 59th IEEE Conference on Decision and Control. Piscataway: IEEE Press, 2021: 3353-3358. (0)
[21]
ALAN A, MOLNAR T G, DAȘ E, et al. Disturbance observers for robust safety-critical control with control barrier functions[J]. IEEE control systems letters, 2023, 7: 1123-1128. DOI:10.1109/LCSYS.2022.3232059 (0)
[22]
DAȘ E, MURRAY R M. Robust safe control synthesis with disturbance observer-based control barrier functions[C]//Proceedings of the 61st IEEE Conference on Decision and Control. Piscataway: IEEE Press, 2023: 5566-5573. (0)
[23]
TAYLOR A J, AMES A D. Adaptive safety with control barrier functions[C]//Proceedings of the American Control Conference. Piscataway: IEEE Press, 2020: 1399-1405. (0)
[24]
LOPEZ B T, SLOTINE J J E, HOW J P. Robust adaptive control barrier functions: an adaptive and data-driven approach to safety[J]. IEEE control systems letters, 2021, 5(3): 1031-1036. DOI:10.1109/LCSYS.2020.3005923 (0)
[25]
MARVI Z, KIUMARSI B. Barrier-certified learning-enabled safe control design for systems operating in uncertain environments[J]. IEEE/CAA journal of automatica sinica, 2021, 9(3): 437-449. (0)
[26]
DHIMAN V, KHOJASTEH M J, FRANCESCHETTI M, et al. Control barriers in Bayesian learning of system dynamics[J]. IEEE transactions on automatic control, 2023, 68(1): 214-229. DOI:10.1109/TAC.2021.3137059 (0)
[27]
WANG Y J, XU X R. Observer-based control barrier functions for safety critical systems[C]//Proceedings of the American Control Conference. Piscataway: IEEE Press, 2022: 709-714. (0)
[28]
CLARK A. Control barrier functions for stochastic systems[J]. Automatica, 2021, 130: 109688. DOI:10.1016/j.automatica.2021.109688 (0)
[29]
AMES A D, XU X R, GRIZZLE J W, et al. Control barrier function based quadratic programs for safety critical systems[J]. IEEE transactions on automatic control, 2017, 62(8): 3861-3876. DOI:10.1109/TAC.2016.2638961 (0)
[30]
TAN X, DIMAROGONAS D V. On the undesired equilibria induced by control barrier function based quadratic programs[EB/OL]. (2021-04-30)[2022-11-21]. https://doi.org/10.48550/arXiv.2104.14895. (0)
[31]
SPYRAKOS-PAPASTAVRIDIS E, DAI J S. Minimally model-based trajectory tracking and variable impedance control of flexible-joint robots[J]. IEEE transactions on industrial electronics, 2021, 68(7): 6031-6041. DOI:10.1109/TIE.2020.2994886 (0)
[32]
XU X R, WATERS T, PICKEM D, et al. Realizing simultaneous lane keeping and adaptive speed regulation on accessible mobile robot testbeds[C]//IEEE Conference on Control Technology and Applications. Piscataway: IEEE Press, 2017: 1769-1775. (0)
[33]
NGUYEN Q, SREENATH K. Safety-critical control for dynamical bipedal walking with precise footstep placement[J]. IFAC-PapersOnLine, 2015, 48(27): 147-154. DOI:10.1016/j.ifacol.2015.11.167 (0)
[34]
EGERSTEDT M, PAULI J N, NOTOMISTA G, et al. Robot ecology: constraint-based control design for long duration autonomy[J]. Annual reviews in control, 2018, 46: 1-7. DOI:10.1016/j.arcontrol.2018.09.006 (0)
[35]
FERRAGUTI F, BERTULETTI M, LANDI C T, et al. A control barrier function approach for maximizing performance while fulfilling to ISO/TS 15066 regulations[J]. IEEE robotics and automation letters, 2020, 5(4): 5921-5928. DOI:10.1109/LRA.2020.3010494 (0)
[36]
SINGLETARY A, KOLATHAYA S, AMES A D. Safety-critical kinematic control of robotic systems[J]. IEEE control systems letters, 2022, 6: 139-144. DOI:10.1109/LCSYS.2021.3050609 (0)
[37]
张方方, 张文丽, 王婷婷. 基于速度补偿算法的多机器人编队控制研究[J]. 郑州大学学报(工学版), 2022, 43(2): 1-6.
ZHANG F F, ZHANG W L, WANG T T. Research on multi-robot formation control based on speed compensation algorithm[J]. Journal of Zhengzhou university (engineering science), 2022, 43(2): 1-6. (0)
[38]
WANG L, AMES A D, EGERSTEDT M. Safety barrier certificates for collisions-free multirobot systems[J]. IEEE transactions on robotics, 2017, 33(3): 661-674. DOI:10.1109/TRO.2017.2659727 (0)
[39]
CHENG R, KHOJASTEH M J, AMES A D, et al. Safe multi-agent interaction through robust control barrier functions with learned uncertainties[C]//Proceedings of the 59th IEEE Conference on Decision and Control. Piscataway: IEEE Press, 2021: 777-783. (0)
[40]
LINDEMANN L, DIMAROGONAS D V. Decentralized control barrier functions for coupled multi-agent systems under signal temporal logic tasks[C]//Proceedings of the 18th European Control Conference. Piscataway: IEEE Press, 2019: 89-94. (0)
[41]
LINDEMANN L, DIMAROGONAS D V. Control barrier functions for multi-agent systems under conflicting local signal temporal logic tasks[J]. IEEE control systems letters, 2019, 3(3): 757-762. DOI:10.1109/LCSYS.2019.2917975 (0)
[42]
LI A Q, WANG L, PIERPAOLI P, et al. Formally correct composition of coordinated behaviors using control barrier certificates[C]//IEEE/RSJ International Conference on Intelligent Robots and Systems. Piscataway: IEEE Press, 2019: 3723-3729. (0)
[43]
IBUKI T, WILSON S, YAMAUCHI J, et al. Optimization-based distributed flocking control for multiple rigid bodies[J]. IEEE robotics and automation letters, 2020, 5(2): 1891-1898. DOI:10.1109/LRA.2020.2969950 (0)