《哈尔滨工程大学学报》

Download PDF 打印本文

文章快速检索

高级检索

引用本文

张青, 李萍, 杨正全, 等. 带有未知参数和通讯时延的多智能体蜂拥控制[J]. 哈尔滨工程大学学报, 2016, 37(5): 696-700 复制到剪切板

ZHANG Qing, LI Ping, YANG Zhengquan, et al. Flocking control of a multi-agent system with unknown parameters and communication delays[J]. Journal of Harbin Engineering University, 2016, 37(5): 696-700.

DOI:10.11990/jheu.201502024 复制到剪切板

带有未知参数和通讯时延的多智能体蜂拥控制

张青¹, 李萍¹, 杨正全¹, 陈增强^1,2

1. 中国民航大学理学院, 天津300300;
2. 南开大学计算机与控制工程学院, 天津300071

收稿日期: 2015-02-27; 网络出版时间: 2016-04-11

通信作者: 张青(1965-),女,教授,E-mail:qz120168@hotmail.com .

摘要：模拟自然界蜂拥现象的蜂拥控制是多智能体协同控制中的一个重要问题。针对带有未知参数的复杂多智能体系统研究其蜂拥控制策略,并且考虑了蜂拥过程中存在通讯时变时延的情况。采用参数自适应控制方法,给出了带有未知参数和通讯时延的多智能体系统分布式自适应控制器;依据代数图知识和Lyapunov定理,对建立的多智能体分布式控制系统进行了稳定性分析。理论分析结果表明,在分布式自适应控制作用下,带有未知参数和通讯时延的多智能体系统能够很好地达到蜂拥状态;数值仿真结果也验证了该蜂拥控制算法的有效性。

关键词：多智能体系统蜂拥控制时变时延未知参数分布式自适应控制

Flocking control of a multi-agent system with unknown parameters and communication delays

ZHANG Qing¹, LI Ping¹, YANG Zhengquan¹, CHEN Zengqiang^1,2

1. College of Science, Civil Aviation University of China, Tianjin 300300, China;
2. College of Computer and Control Engineering, Nankai University, Tianjin 300071, China

Abstract: Flocking control, which simulates the flocking phenomenon in the natural world, is an important research topic in the multi-agent system coordinate control. Flocking control strategies were studied that investigated the complex multi-agent systems including unknown parameters and communication delays during the flocking process. By utilizing parameter estimation in an adaptive control method, a distributed adaptive controller was proposed for the multi-agent system with unknown parameters and communication delays. Based on algebraic graph knowledge and the Lyapunov theorem, the stability analysis was given for the multi-agent distributed control system. The theoretical analysis results show that the flocking states were obtained for the multi-agent system with unknown parameters and communication delays. Finally, the numerical simulation results also verified the effectiveness of the proposed flocking control scheme.

Key words: multi-agent system flocking control time-varying delay unknown parameter distributed adaptive control

自然界生物的群体行为引起国内外学者的广泛关注。如鸟类排成一定的队形飞翔与迁徙，鱼群的聚集，蚂蚁成群觅食等^[1-3]。受到生物群体运动的启发，许多学者研究生物群体运动的内在规律与机理，将多智能体系统看作是对生物种群样本的模拟，通过学习种群个体间的信息交流机制、组织与决策能力，并引入群体个体间的协调合作思想，为多智能体系统的蜂拥问题提出了系统的理论、模型设计方法和控制算法，并将蜂拥思想应用于智能控制领域^[4-5]。1987年，Reynolds 提出了一个在三维空间上用计算机来模拟群体行为的模型，这个模型要求一群智能体的群体行为满足3条基本规则：分离、聚合和速度匹配^[6]。Tanner等在此基础上提出了一种简单的编队控制律并分析了系统的稳定性^[7]。Saber 等将动态理论引入障碍物环境下的分布式编队系统^[8]。与此同时，许多学者对蜂拥问题也进行了进一步研究，其中包括不同拓扑结构下的蜂拥运动策略、基于一致性协议的运动方案设计与调整、虚拟领导者在蜂拥运动中的作用及稳定性影响，以及基于人工势场法的多种蜂拥运动算法等^[9-11]。由于在实际问题中移动多智能体之间的信息交流存在通讯时延,并且往往时延是时变的，因此讨论带有时变时延的智能体蜂拥控制算法更具有实际意义^[12]。在实际系统运行过程中存在内部结构和参数的变化等不确定性因素，不确定性的存在可能会严重影响控制系统性能。因此，需要开展对参数不确定多智能体系统控制方法的研究。为此，需要设计一种控制器，它能够自动地补偿在模型阶次和参数方面非预知的变化，即实现系统自适应控制^[13-16]。

本文的主要工作是：1)目前研究的多智能体系统，每个智能体个体动力学多为线性系统，本文研究中的智能体是二阶非线性动力学系统，并且包含有未确定的参数，同时考虑多智能体之间的信息交互时延是时变函数，因此整个系统更为复杂，对其进行控制设计和分析具有更大难度，但是获得的方法具有更强的适用性。2)针对上述带有未知参数和时变时延的非线性多智能体系统，设计了分布式自适应控制器，辨识未知的不确定参数，实现多智能体系统的蜂拥控制，并从理论上严格证明了控制系统的收敛性和稳定性。

1 问题描述

假设N(N≥2) 个智能体在n维欧几里得空间移动，其动态方程表示如下：

$\left\{ \begin{align} & {{{\dot{x}}}_{i}}\left( t \right)={{v}_{i}}\left( t \right) \\ & {{{\dot{v}}}_{i}}\left( t \right)=f\left( {{v}_{i}}\left( t \right) \right)+{{s}_{i}}\left( {{v}_{i}}\left( t \right){{\beta }_{i}}+{{u}_{i}}\left( t \right) \right) \\ \end{align} \right.$

(1)

式中：i=1,2,…N；${{\dot{x}}_{i}}$(t)∈Rⁿ是第i个智能体的状态向量；v_i(t)∈Rⁿ是第i个智能体的速度向量；f(v_i(t)):Rⁿ→Rⁿ是一个连续可微的非线性向量函数；s_i:Rⁿ→R^n×m是一个连续的矩阵函数，β_i∈R^m是智能体i的不确定参数向量,u_i(t)∈Rⁿ为作用在智能体i上的控制输入。多智能体系统(1)的虚拟领导者的动态方程表示如下:

$\left\{ \begin{align} & {{{\dot{x}}}_{l}}\left( t \right)={{v}_{l}}\left( t \right) \\ & {{{\dot{x}}}_{l}}\left( t \right)=f\left( {{v}_{i}}\left( t \right) \right) \\ \end{align} \right.$

(2)

式中：${{\dot{x}}_{l}}$(t)∈Rⁿ和${{\dot{v}}_{t}}$(t)∈Rⁿ分别是虚拟领导者的位置向量和速度向量。假设存在非负常数α满足

${{\left\| f\left( {{v}_{i}} \right)-f\left( {{v}_{l}} \right) \right\|}_{2}}\le \alpha {{\left\| {{v}_{i}}-{{v}_{l}} \right\|}_{2}},i=1,2,\cdots ,N$

(3)

定义误差向量

${{e}_{i}}={{v}_{i}}-{{v}_{l}},i=1,2,\cdots ,N$

(4)

由e_i的定义，可以得到下面的等式:

${e_i} - {e_j} = \left( {{v_i} - {v_l}} \right) - \left( {{v_j} - {v_l}} \right){\text{ = }}{v_i} - {v_j}$

(5)

${{v}_{j}}\left( t-\tau \left( t \right) \right)-{{v}_{l}}\left( t-\tau \left( t \right) \right)={{e}_{j}}\left( t-\tau \left( t \right) \right)$

(6)

其中i,j=1,2,…,N，0≤$\dot{\tau }$(t)≤ε < 1，ε是一个常数，可以得到如下的不等式：

$\frac{\left( 1-\dot{\tau }\left( t \right) \right)}{1-\varepsilon }\ge 1$

(7)

定义1 多智能体的蜂拥^[10]：当N个智能体速度达到一致，位置保持相同的距离，并且在运动过程中避免碰撞，称这N个智能体达到了蜂拥。

定义2 动态图^[10]：称G(t)=(V,E(t))为包含了被N智能体所标记的N个顶点的动态图，其中V={1，2，…N}为包含动态图N个顶点的集合，E(t)=(i,j)i,j∈V为随时间变化的动态图G(t)所有连边的集合。G(t)的切换过程见图 1，对于任意的0 < r < R,1)如果0 < ‖x_i(t)-x_j(t)‖≤r,则(i,j)∈E(t)，2)如果R≤‖x_i(t)-x_j(t)‖≤+∞，则$\left( i,j \right)\notin E\left( t \right)$。

图1 动态图Gt的切换过程 Figure 1 The Switch process for Dynamic Graph Gt

图选项

动态图G(t)=V,E(t)中任意的节点对(i,j)∈E(t)当且仅当(j,i)∈E(t)，则称G(t)是无向图。在无向图中，若顶点i和顶点j在t时刻有连边，则称i和j是邻接的或者是邻居，被记作i～j。设A(t)=(a_ij(t))为动态图G(t)的邻接矩阵，则当i~j，有a_ij(t)>0，${{a}_{ij}}\left( t \right)\text{}0,{{a}_{ij}}=-\sum\limits_{j=1,j\ne i}^{N}{{{a}_{ij}}}$,否则a_ij(t)=0。

定义3 连通图^[10]:若图G(t)中任意顶点i和顶点j之间都有至少一条路径存在，则称图G(t)是连通图。否则为非连通图。

定义4 基于动态图的多智能体的蜂拥^[10]:N(N≥2) 个智能体所构成的系统由定义2的动态图G(t)描述，G(t)的N个顶点就表示N个智能体。如果智能体i与智能体j之间在t时刻有信息的交流就表示图G(t)中顶点i和顶点j之间在t时刻有连边。C_N是具有N个顶点的连通图的集合，如果G(t₀)∈C_N，设计控制器u_i(t) ，使得对所有的t≥t₀都有G(t)∈C_N成立，并且能达到所有的智能体最终速度保持一致，位置保持相同的距离，并且在运动过程中避免碰撞，称这N个智能体达到了蜂拥。

2 分布式自适应控制器设计

对于任意动态图G(t)=(V,E(t))，定义控制输入：

$\left\{ \begin{align} & {{u}_{i}}=-2\sum\nolimits_{j=1}^{N}{{{a}_{ij}}{{\nabla }_{{{x}_{i}}}}{{V}_{ij}}-{{d}_{i}}{{e}_{i}}-{{s}_{i}}\left( {{v}_{i}} \right){{{\tilde{\beta }}}_{i}}-} \\ & 2\sum\nolimits_{j=1,j\ne i}^{N}{{{a}_{ij}}\left[ {{v}_{i}}\left( t-\tau \left( t \right) \right)-{{v}_{j}}\left( t-\tau \left( t \right) \right) \right]} \\ & {{{\dot{d}}}_{i}}={{k}_{i}}e_{i}^{T}{{e}_{i}}, \\ & \dot{\tilde{\beta }}=-{{l}_{i}}s_{i}^{T}\left( {{v}_{i}} \right){{e}_{i}} \\ \end{align} \right.$

(8)

式中：d_i为自适应调整参数，{k_i,l_i,i=1,2,…，N}为一组正常数，时延τ(t)是非负连续可微函数并满足式(7),${{\tilde{\beta }}_{i}}$是未知参数β_i的估计,${{\nabla }_{{{x}_{i}}}}{{V}_{ij}}$为下面式(9)所定义的势函数的负梯度方向向量。

${{V}_{ij}}\left( {{x}_{ij}} \right)=\frac{1}{{{R}^{2}}-{{\left\| {{x}_{ij}} \right\|}^{2}}}+\frac{1}{{{\left\| {{x}_{ij}} \right\|}^{2}}},{{\left\| {{x}_{ij}} \right\|}^{2}}\in \left( 0,R \right)$

(9)

其中,x_ij=x_i-_j，当‖x_ij‖→R^-时，V_ij趋于无穷，当‖x_ij‖→0时，V_ij趋于无穷。

根据V_ij的定义，可以得到下面的等式：

${{\nabla }_{{{x}_{ij}}}}{{V}_{ij}}\left( {{x}_{ij}} \right)={{\nabla }_{{{x}_{i}}}}{{V}_{ij}}\left( {{x}_{ij}} \right)=-{{\nabla }_{{{x}_{j}}}}{{V}_{ij}}\left( {{x}_{ij}} \right)$

(10)

式中: i,j=1,2,…,N。

由等式(4)、(7)和${{a}_{ii}}=-\sum\nolimits_{j=1,j\ne i}^{N}{{{a}_{ij}}}$，可得

$\begin{align} & {{u}_{i}}=-2\sum\limits_{j=1}^{N}{{{a}_{ij}}{{\nabla }_{{{x}_{i}}}}{{V}_{ij}}}-2\sum\limits_{j=1,j\ne i}^{N}{{{a}_{ij}}}\left[ {{v}_{i}}\left( t-\tau \left( t \right) \right)-{{v}_{j}}\left( t-\tau \left( t \right) \right) \right] \\ & -{{d}_{i}}{{e}_{i}}-{{s}_{i}}\left( {{v}_{i}} \right){{{\tilde{\beta }}}_{i}}=-2\sum\limits_{j=1}^{N}{{{a}_{ij}}{{\nabla }_{{{x}_{i}}}}{{V}_{ij}}}+ \\ & 2\sum\limits_{j=1}^{N}{{{a}_{ij}}}{{e}_{j}}\left( t-\tau \left( t \right) \right)-{{d}_{i}}{{e}_{i}}-{{s}_{i}}\left( {{v}_{i}} \right){{{\tilde{\beta }}}_{i}} \\ \end{align}$

(11)

由等式(1)、(2)和(11)可以得到误差的微分方程：

$\begin{align} & {{{\dot{e}}}_{i}}=f\left( {{v}_{i}} \right)-f\left( {{v}_{l}} \right)-2\sum\limits_{j=1}^{N}{{{a}_{ij}}{{\nabla }_{ij}}{{V}_{ij}}+} \\ & 2\sum\limits_{j=1}^{N}{{{a}_{ij}}{{e}_{j}}\left( t-\tau \left( t \right) \right)-{{d}_{i}}{{e}_{i}}-{{s}_{i}}\left( {{v}_{i}} \right){{{\bar{\beta }}}_{i}}} \\ \end{align}$

(12)

其中,${{\bar{\beta }}_{i}}={{\beta }_{i}}\text{-}{{\tilde{\beta }}_{i}};i=1,2,\cdots ,N$。

3 主要结果

为了证明多智能体系统的蜂拥，假设动态图G(t)在时刻t_p(p=1,2,…)切换，也就是说动态图G(t)在每个[t_p-1,t_p]时段内是固定的。定义g(t):[t₀,∞)→C_N为与动态图相关联的切换信号，可以得到如下结论。

定理1 对多智能体系统(1)、(2)，在控制输入(11)下，切换信号g(t)在任意的t_p≤t_q ，有E(t_p)⊆E(t_q)，且多智能体在运动过程中无碰撞。

证明：构造Lyapunov函数

$\begin{align} & {{V}_{G}}=\frac{1}{2}\sum\limits_{i=1}^{N}{e_{i}^{T}{{e}_{i}}}+\frac{1}{2}\sum\limits_{i=1}^{N}{\frac{{{\left( {{d}_{i}}-{{{\hat{d}}}_{i}} \right)}^{2}}}{{{k}_{i}}}+\sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}{{V}_{ij}}}}}+ \\ & \frac{1}{1-\varepsilon }\sum\limits_{i=1}^{N}{\int_{t-\tau \left( t \right)}^{t}{e_{i}^{T}\left( \eta \right){{e}_{i}}\left( \eta \right)d\eta +\frac{1}{2}\sum\limits_{i=1}^{N}{\frac{1}{{{l}_{i}}}\bar{\beta }_{i}^{T}}}}{{{\bar{\beta }}}_{i}} \\ \end{align}$

(13)

其中，${{\hat{d}}_{i}}$是一个足够大的正常数，V_G对时间t求导：

$\begin{align} & {{{\dot{V}}}_{G}}=\sum\limits_{i=1}^{N}{e_{i}^{T}{{{\dot{e}}}_{i}}}+\sum\limits_{i=1}^{N}{\frac{\left( {{d}_{i}}-{{{\hat{d}}}_{i}} \right)}{{{k}_{i}}}{{{\dot{d}}}_{i}}+\sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}{{{\dot{V}}}_{ij}}}}}+ \\ & \frac{1}{1-\varepsilon }\sum\limits_{i=1}^{N}{e_{i}^{T}{{e}_{i}}-\frac{\left( 1-\dot{\tau }\left( t \right) \right)}{1-\varepsilon }}\sum\limits_{i=1}^{N}{e_{i}^{T}\left( t-\tau \left( t \right) \right)} \\ & {{e}_{i}}\left( t-\tau \left( t \right) \right)+\sum\limits_{i=1}^{N}{{{{\bar{\beta }}}_{i}}^{T}{{s}_{i}}{{\left( {{v}_{i}} \right)}^{T}}{{e}_{i}}} \\ \end{align}$

(14)

由等式(4)和(10),可以得到

$ \begin{align} & \sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}{{{\dot{V}}}_{ij}}}}=\sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}v_{i}^{T}{{\nabla }_{{{x}_{i}}}}{{V}_{ij}}}-} \\ & \sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}v_{i}^{T}{{\nabla }_{{{x}_{i}}}}{{V}_{ij}}}=}\sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}\left( v_{i}^{T}-v_{j}^{T} \right){{\nabla }_{{{x}_{i}}}}{{V}_{ij}}}=} \\ & 2\sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}e_{i}^{T}{{\nabla }_{{{x}_{i}}}}{{V}_{ij}}}} \\ \end{align} $

由等式(8)、(12)和不等式(3)，可以化简等式(14)的前两部分：

$\begin{align} & \sum\limits_{i=1}^{N}{e_{i}^{T}{{{\dot{e}}}_{i}}}+\sum\limits_{i=1}^{N}{\frac{\left( {{d}_{i}}-{{{\hat{d}}}_{i}} \right)}{{{k}_{i}}}}{{{\dot{d}}}_{i}}= \\ & -2\sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}e_{i}^{T}{{\nabla }_{{{x}_{i}}}}{{V}_{ij}}}}+2\sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}e_{i}^{T}{{e}_{j}}\left( t-\tau \left( t \right) \right)}}+ \\ & \sum\limits_{i=1}^{N}{e_{i}^{T}\left( f\left( {{v}_{i}} \right)-f\left( {{v}_{l}} \right)-{{{\hat{d}}}_{i}}{{e}_{i}} \right)}-\sum\limits_{i=1}^{N}{e_{i}^{T}{{s}_{i}}\left( {{v}_{i}} \right){{{\bar{\beta }}}_{i}}\le } \\ & -2\sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}e_{i}^{T}{{\nabla }_{{{x}_{i}}}}{{V}_{ij}}}}+2\sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}e_{i}^{T}{{e}_{j}}\left( t-\tau \left( t \right) \right)}}+ \\ & \sum\limits_{i=1}^{N}{\left( \alpha -{{{\hat{d}}}_{i}} \right)}e_{i}^{T}{{e}_{i}}-\sum\limits_{i=1}^{N}{e_{i}^{T}{{s}_{i}}\left( {{v}_{i}} \right)}{{{\bar{\beta }}}_{i}} \\ \end{align}$

(15)

因此可以得到：

$ \begin{align} & {{{\dot{V}}}_{G}}\le -2\sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}e_{i}^{T}{{\nabla }_{{{x}_{i}}}}{{V}_{ij}}+2}}\sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}e_{i}^{T}{{e}_{j}}\left( t-\tau \left( t \right) \right)+\sum\limits_{i=1}^{N}{\left( \alpha -{{{\hat{d}}}_{i}} \right)}}}e_{i}^{T}{{e}_{i}} \\ & -\sum\limits_{i=1}^{N}{e_{i}^{T}{{s}_{i}}\left( {{v}_{i}} \right){{{\bar{\beta }}}_{i}}+}2\sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}e_{i}^{T}{{\nabla }_{{{x}_{i}}}}{{V}_{ij}}+}}\sum\limits_{i=1}^{N}{\bar{\beta }_{i}^{T}{{s}_{i}}{{\left( {{v}_{i}} \right)}^{T}}{{e}_{i}}+\frac{1}{1+\varepsilon }}\sum\limits_{i=1}^{N}{e_{i}^{T}{{e}_{i}}}- \\ & \frac{\left( 1-\dot{\tau }\left( t \right) \right)}{1-\varepsilon }\sum\limits_{i=1}^{N}{e_{i}^{T}\left( t-\tau \left( t \right) \right){{e}_{i}}\left( t-\tau \left( t \right) \right)}=2\sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{{{a}_{ij}}e_{i}^{T}{{e}_{j}}\left( t-\tau \left( t \right) \right)+}} \\ & \sum\limits_{i=1}^{N}{\left( \alpha -{{{\hat{d}}}_{i}}+\frac{1}{1-\varepsilon } \right)}e_{i}^{T}{{e}_{i}}-\frac{\left( 1-\dot{\tau }\left( t \right) \right)}{1-\varepsilon }\sum\limits_{i=1}^{N}{e_{i}^{T}\left( t-\tau \left( t \right) \right)\le 2\sum\limits_{i=1}^{N}{\sum\limits_{j=1}^{N}{\left| {{a}_{ij}} \right|}}} \\ & \left\| e_{i}^{T} \right\|\left\| {{e}_{j}}\left( t-\tau \left( t \right) \right) \right\|+\sum\limits_{i=1}^{N}{\left( \alpha -{{{\hat{d}}}_{i}}+\frac{1}{1-\varepsilon } \right)}e_{i}^{T}{{e}_{i}}- \\ & \sum\limits_{i=1}^{N}{e_{i}^{T}\left( t-\tau \left( t \right) \right){{e}_{i}}\left( t-\tau \left( t \right) \right)}=2e_{i}^{T}\Gamma e\left( t-\tau \left( t \right) \right)-e{{\left( t-\tau \left( t \right) \right)}^{T}}e\left( t-\tau \left( t \right) \right) \\ & +{{e}^{T}}\Lambda e\le {{e}^{T}}{{\Gamma }^{T}}\Gamma e+e{{\left( t-\tau \left( t \right) \right)}^{T}}e\left( t-\tau \left( t \right) \right)-e{{\left( t-\tau \left( t \right) \right)}^{T}}e\left( t-\tau \left( t \right) \right) \\ & +{{e}^{T}}\Lambda e={{e}^{T}}\left( {{\Gamma }^{T}}\Gamma +\Lambda \right)e \\ \end{align} $

其中,

$ \begin{align} & \Gamma ={{\left( \left| {{a}_{ij}} \right| \right)}_{N\times N}},e=\left( {{\left\| {{e}_{1}} \right\|}_{2}},{{\left\| {{e}_{2}} \right\|}_{2}},\cdots {{\left\| {{e}_{N}} \right\|}_{2}} \right)e\left( t-\tau \left( t \right) \right)= \\ & \left( {{\left\| {{e}_{1}}\left( t-\tau \left( t \right) \right) \right\|}_{2}},{{\left\| {{e}_{2}}\left( t-\tau \left( t \right) \right) \right\|}_{2}},\cdots {{\left\| {{e}_{N}}\left( t-\tau \left( t \right) \right) \right\|}_{2}} \right) \\ & \Lambda =\text{diag}\left( \alpha -{{{\hat{d}}}_{i}}+\frac{1}{1-\varepsilon },\cdots ,\alpha -{{{\dot{d}}}_{N}}+\frac{1}{1-\varepsilon } \right) \\ \end{align} $

因为α和a_ij都为非负常数，可以选择足够大的一组常数${{\hat{d}}_{i}}$(1≤i≤N)使得$\dot{V}$_G≤0。因此对于任意切换信号g(t)，都有$\dot{V}$_G≤0，从而V_G单调递减。又V_G≥0，则有V_G有界。由式(9)可知对于任意的(i,j)∈E(t)，V_ij都是有界的。然而对于任意的(i,j)∈E(t)，t∈[t_p-1,t_p]，若t→t_p时有‖x_ij‖→R^-，则V_ij无界。又由于V_ij连续，所以‖x_ij‖→R^-不成立。则(i,j)∈E(t)。依次类推(i,j)∈E(t)，t∈[t_p,t_p+1]，也就是说对任意的时间t,G(t)中的连边在切换时刻不会减少。即对任意的时间t，t_p≤t_q,有E(t_p)⊂E(t_q)。当‖x_ij‖→0时，V_ij无界。则‖x_ij‖不能趋于零，说明多智能体在运动过程中无碰撞。

推论1 在设计的控制输入(8) 的作用下，系统(1)、(2)时间切换的次数是有限的。

定理2 对于闭环系统(1)、(2)，如果初始时刻G(t₀)是连通的，则在控制输入(8)作用下，对任意时刻t,G(t)都是连通的，同时，系统所描述的多智能体系统速度会渐近收敛，位置保持相同的距离，且多智能体之间无碰撞。

证明： 由推论1可知闭环系统的时间切换次数是有限的。所以切换信号g(t)最终会变成一个常数，也就是说g(t)→g。又由定理1可知若G(t₀)是连通的，则对任意时间t>t₀，都有G(t)→G∈C_N。Lyapunov函数V_G是正定的，并且${{\dot{V}}_{G}}$≤0。定义一个连续有界的闭集：Ω_G={(x_ij,v_i)‖V_G≤c,c>0}。由拉萨尔不变原理可知，每一个Ω_G中的解渐近收敛于最大的不变集{(x_ij,v_i|${{\dot{V}}_{G}}$=0。${{\dot{V}}_{G}}$=0意味着e=0也就是说e_i=0。因此很明显有v_i=v_l 。因所有的智能体速度达到稳定状态。也就是说v_l=v₁=v₂=.…=v_N。因为e_i=0，进一步可得

$\frac{\text{d}}{\text{d}t}{{\left\| {{x}_{i}}-{{x}_{j}} \right\|}^{2}}=2{{\left( {{x}_{i}}-{{x}_{j}} \right)}^{T}}\left( {{v}_{i}}-{{v}_{j}} \right)=0$

(16)

则‖x_i-x_j‖=m_ij(m_ij为常数，且与时间t无关，所以多智能体之间趋于稳定的距离，且由定理1可知m_ij为非零常数，所以智能体之间无碰撞。

4 数值仿真

本节采用数值仿真来验证所设计的控制方法的有效性。利用R³空间中的20个智能体和Chen混沌系统来进行仿真。Chen 系统可以表示如下：

$ {{\dot{v}}_{i}}={{g}_{i}}\left( {{v}_{i}} \right)+{{h}_{i}}\left( {{v}_{i}} \right){{\beta }_{i}} $

其中，

$ \begin{array}{l} {g_i}\left( {{v_i}} \right) = \left( \begin{array}{l} 0\\ 28{v_{i1}} + 28{v_{i2}} - {v_{i1}}{v_{i3}}\\ {v_{i2}}{v_{i1}} \end{array} \right),\\ {h_i}\left( {{v_i}} \right) = \left( \begin{array}{l} {v_{i2}} - {v_{i1}}0\\ - {v_{i1}}0\\ 0 - {v_{i3}} \end{array} \right),{\beta _i} = \left( \begin{array}{l} \alpha \\ 3 \end{array} \right) \end{array} $

Chen系统的参数α=35时系统呈现混沌状态，控制器中假设该参数未知，通过自适应算法进行参数辨识。20个智能体的初速度选择v₀(t)=[sin t cos t 0]^T，时延τ(t)=0.5t，最初的位置均匀分布在直径为2的圆上。随机选取一个智能体作为领导者。多智能体蜂拥过程仿真结果如图 2～5。其中图 2是多智能体最初的状态。图 3是多智能体最后达到的蜂拥状态。图 4代表多智能体速度变化曲线，最后多智能体速度趋于一致。图 5为未知参数估计值α的曲线。仿真结果表明，本文的算法有效的解决了带有未知参数多智能体的蜂拥问题。

图2 20个智能体最初的状态 Figure 2 The initial states for the 20 agents

图选项

图3 20个智能体最终达到的蜂拥状态 Figure 3 The final flocking states for the 20 agents

图选项

图4 20个智能体速度变化曲线 Figure 4 The speed varying curves for the 20 agents

图选项

图5 未知参数估计值$\hat{\alpha }$的变化曲线 Figure 5 The varying curves for the estimated parameter $\hat{\alpha }$

图选项

5 结论

本文研究带有未知参数和通讯时延的非线性多智能体系统蜂拥控制问题，设计了分布式自适应控制器，包括分布式控制律和分布式参数估计算法两部分。

基于Lyapunov 稳定性定理和拉萨尔不变集原理分析了所建立的多智能体自适应蜂拥控制的性能，证明了在分布式自适应控制作用下，带有未知参数和通讯时延的多智能体系统能够很好地达到蜂拥状态，即所有的智能体的速度趋于一致，相互位置趋于固定的距离，并且在运动过程中避免发生碰撞。

数值仿真结果也验证了理论分析结果，表明该自适应控制算法通过参数辨识和分布式反馈控制，使多智能体系统能够最终达到稳定的蜂拥状态。

今后进一步研究方向包括带有非线性内部耦合函数的多智能体系统自适应蜂拥问题、以及异质多智能体自适应蜂拥控制问题等。

参考文献

[1]	PARRISH J K, EDELSTEIN-KESHET L. Complexity, pat-tern, and evolutionary trade-offs in animal aggregation[J]. Science, 1999, 284(5411): 99–101.

[2]	PARTRIDGE B L. Internal dynamics and the interrelations of fish in schools[J]. Journal of comparative physiology, 1981, 144(3): 313–325.

[3]	DO K D. Flocking for multiple elliptical agents with limited communication ranges[J]. IEEE transactions on robotics, 2011, 27(5): 931–942.

[4]	VICSEK T, CZIRÓOK A, BEN-JACOB E, et al. Novel type of phase transition in a system of self-driven particles[J]. Physical review letters, 1995, 75(6): 1226–1229.

[5]	JADBABAIE A, LIN Jie, MORSE A S. Coordination of groups of mobile autonomous agents using nearest neighbor rules[J]. IEEE transactions on automatic control, 2003, 48(6): 988–1001.

[6]	REYNOLDS C W. Flocks, herds and schools: a distributed behavioral model[J]. ACM SIGGRAPH computer graphics, 1987, 21(4): 25–34.

[7]	TANNER H G, JADBABAIE A, PAPPAS G J. Flocking in fixed and switching networks[J]. IEEE transactions on automatic control, 2007, 52(5): 863–868.

[8]	OLFATI-SABER R. Flocking for multi-agent dynamic systems: algorithms and theory[J]. IEEE transactions on automatic control, 2006, 51(3): 401–420.

[9]	TANNER H G, JADBABAIE A G, PAPPAS J. Stable flocking of mobile agents, part I: fixed topology[C]//Proceedings of the 42nd IEEE conference on Decision and Control. Maui, Hawaii, USA: IEEE, 2003, 2: 2010-2015.

[10]	ZAVLANOS M M, JADBABAIE A, PAPPAS G J. Flocking while preserving network connectivity[C]//Proceedings of the 46th IEEE Conference on Decision and Control. New Orleans, LA: IEEE, 2007: 2919-2924.

[11]	FERRARA A, VECCHIO C. Collision avoidance strategies and coordinated control of passenger vehicles[J]. Nonlinear dynamics, 2007, 49(4): 475–492.

[12]	YANG Zhenquan, ZHANG Qing, JIANG Zuolian, et al. Flocking of multi-agents with time delay[J]. International journal of systems science, 2012, 43(11): 2125–2134.

[13]	ZHANG Qing, LI Ping, YANG Zhengquan, et al. Adaptive flocking of multi-agents with nonlinear inner-coupling function[J]. ICIC express letters, part b: applications, 2014, 5(5): 1445–1452.

[14]	SU Housheng, ZHANG Ningzi, CHEN M Z Q, et al. Adaptive flocking with a virtual leader of multiple agents governed by locally Lipschitz nonlinearity[J]. Nonlinear analysis: real world applications, 2013, 14(1): 798–806.

[15]	HU Jiangping, ZHENG Weixing. Adaptive tracking control of leader-follower systems with unknown dynamics and partial measurements[J]. Automatica, 2014, 50(5): 1416–1423.

[16]	WANG Li, SUN Shiwen, XIA Chengyi. Finite-time stability of multi-agent system in disturbed environment[J]. Nonlinear dynamics, 2012, 67(3): 2009–2016.

DOI: 10.11990/jheu.201502024

文章信息

张青, 李萍, 杨正全, 陈增强

ZHANG Qing, LI Ping, YANG Zhengquan, CHEN Zengqiang

带有未知参数和通讯时延的多智能体蜂拥控制

Flocking control of a multi-agent system with unknown parameters and communication delays

哈尔滨工程大学学报, 2016, 37(5): 696-700

Journal of Harbin Engineering University, 2016, 37(5): 696-700.

DOI: 10.11990/jheu.201502024

文章历史

收稿日期: 2015-02-27

网络出版时间: 2016-04-11

网站导航

文章信息

文章历史

相关文章

工作空间