未知环境下无人机集群协同区域搜索算法<sup>*</sup>

Download PDF 打印本文

文章快速检索

高级检索

引用格式

侯岳奇, 梁晓龙, 何吕龙, 等. 未知环境下无人机集群协同区域搜索算法[J]. 北京航空航天大学学报, 2019, 45(2): 347-356.

HOU Y Q, LIANG X L, HE L L, et al. Cooperative area search algorithm for UAV swarm in unknown environment[J]. Journal of Beijing University of Aeronautics and Astronsutics, 2019, 45(2): 347-356.

未知环境下无人机集群协同区域搜索算法

侯岳奇^1,2, 梁晓龙^1,2, 何吕龙^1,2, 刘流^1,2

1. 空军工程大学国家空管防相撞技术重点实验室, 西安 710051;
2. 空军工程大学陕西省电子信息系统综合集成重点实验室, 西安 710051

收稿日期: 2018-04-25; 录用日期: 2018-10-15; 网络出版时间: 2018-10-26 16:33

基金项目: 国家自然科学基金（61472443，61703427）；陕西省自然科学基础研究计划（2017JQ6035）

作者简介: 侯岳奇  男, 硕士研究生。主要研究方向:航空集群智能决策;
梁晓龙  男, 博士, 教授, 硕士生导师。主要研究方向:航空集群指挥与控制、智能系统、空管智能化;
何吕龙  男, 博士研究生。主要研究方向:航空集群编队控制;
刘流  男, 硕士研究生。主要研究方向:航空集群编队控制

通信作者: 梁晓龙, E-mail: afeu_lxl@sina.com

摘要: 针对无人机集群在无先验信息的未知环境中协同搜索的问题，提出了一种以覆盖率为实时搜索奖励的无人机集群协同区域搜索算法。首先建立覆盖分布地图（CDM）来描述任务环境，并采用Hadamard积实现CDM的快速更新，继而基于CDM计算覆盖率来定量描述实时搜索效果。将无人机集群视为一个控制系统，基于分布式模型预测控制理论建立系统的预测模型，并将预测周期内最大覆盖率增量设为奖励函数，采用差分进化算法进行求解，得到最优解作为系统的最优输入。仿真结果表明，所提算法能够对区域进行覆盖搜索，在出现突发情况时，覆盖率远高于平行搜索方法。

关键词: 未知环境无人机集群协同搜索 Hadamard积覆盖率分布式模型预测控制

Cooperative area search algorithm for UAV swarm in unknown environment

HOU Yueqi^1,2, LIANG Xiaolong^1,2, HE Lyulong^1,2, LIU Liu^1,2

1. National Key Laboratory of Air Traffic Collision Prevention, Air Force Engineering University, Xi'an 710051, China;
2. Shaanxi Province Lab. of Meta-synthesis for Electronic & Information System, Air Force Engineering University, Xi'an 710051, China

Received: 2018-04-25; Accepted: 2018-10-15; Published online: 2018-10-26 16:33

Foundation item: National Natural Science Foundation of China (61472443, 61703427); Natrual Science Basic Research Plan in Shaanxi Province of China(2017JQ6035)

Corresponding author. LIANG Xiaolong, E-mail: afeu_lxl@sina.com

Abstract: Aimed at the problem of cooperative search for UAV swarm in an unknown environment without prior information, a cooperative area search algorithm for UAV swarm with coverage rate as real-time search rewards is proposed. First, coverage distribution map (CDM) is established to describe the mission area, and the rapid update of CDM is realized by using Hadamard product. Then, the coverage rate is calculated based on CDM to describe the search results quantitatively. Considering UAV swarm as a control system, a predictive model of the system is established based on the distributed model predictive control theory, and the maximum increment of coverage rate in the predictive period is determined as a reward function. The optimal solution, as the optimal input of system, is obtained by differential evolution algorithm. Simulation results demonstrate that the proposed algorithm can complete the coverage and search of region effectively. In the event of emergencies, its area coverage rate is much higher than that of the parallel search method.

Keywords: unknown environment UAV swarm cooperative search Hadamard product coverage rate distributed model predictive control

随着高精度影像设备与技术的快速发展，携带照相设备的无人机(Unmanned Aerial Vehicle，UAV)在民用和军事领域得到了广泛应用，例如环境监测、战场监视以及目标搜索等^[1-2]。无人机集群通过无人机之间的协同合作，从而实现整体能力上的涌现，即系统涌现出的能力远超系统内单架无人机能力的总和^[3-4]。相比于单架无人机，利用多架无人机协同执行区域搜索任务得到了越来越广泛的关注^[5-6]。

针对协同搜索问题，诸多学者进行了深入的探索并取得丰硕的成果。离线规划方法^[7-9]将任务区域进行分割，设计各个子区域的覆盖搜索航线，飞行航线固定。该方法的优势在于能够实现任务区域的全覆盖，而在无人机故障、火力威胁等突发情况下该方法受限。文献[5]使用笛卡儿栅格描述环境，赋予每个栅格一个值代表目标分布的不确定性，设计了搜索回报函数和禁飞区回避策略。在有先验信息的情况下，该方法可以实现重点侦察和覆盖搜索。文献[10]在文献[5]的基础上，考虑通信约束，分析了不同通信约束对协同搜索效率的影响。在通信距离和角度有约束的情况下，该方法能够较好地实现协同区域搜索。此类方法依赖先验信息来建立概率地图，然而在实际应用中，先验信息的获取和栅格量化是十分困难的。文献[11]设计了基于信息素的网格回访机制，引导无人机对目标存在概率较大的区域进行回访搜索，使得无人机能够尽早搜索到更多目标。上述方法^{[5, 10-11]}均假设无人机在相邻栅格之间运动，这种“粗粒度”的运动模型虽然简化了协同搜索决策的解空间，但却在一定程度上降低了决策结果的精细程度。文献[12-14]基于分布式模型预测控制框架，采用纳什最优和粒子群优化相结合的算法，有效地降低了协同搜索决策问题的求解规模和通信负担。虽然上述研究在一定程度上使多无人机具备了协同搜索的能力，但仍存在区域覆盖率较低的问题。存在这一问题的原因在于：缺少专门的引导机制，来引导无人机向未覆盖区域进行搜索。

在执行区域搜索任务时，无人机故障和环境中火力威胁等突发情况的影响是不容忽视的。考虑到传统的离线规划方法难以应对突发情况，本文提出了一种以覆盖率为实时搜索奖励的协同区域搜索算法，以改善一般在线规划搜索方法覆盖率不高的问题。

1 协同搜索问题建模 1.1 问题描述

多无人机协同搜索问题主要分为2类^[15]：第1类是在环境信息已知的条件下，根据先验信息对区域进行搜索，以尽快发现目标，或者对重点区域进行监控；第2类是在环境信息未知的条件下，对区域进行覆盖。本文针对第2类问题展开研究。UAV集群携带通信设备和照相设备对特定任务区域展开搜索，区域内目标的位置分布未知，如图 1所示。

图 1 UAV集群协同搜索示意图 Fig. 1 Schematic diagram of UAV swarm cooperative search

图选项

UAV按照实时规划的航路对任务区域展开搜索，并通过通信组网模块进行实时通信，为实时决策提供信息支撑，通信内容包括UAV状态、环境信息和决策信息等。当某架UAV出现故障时，传统的离线规划方法难以适应性地完成搜索任务。相比而言，在线规划方法鲁棒性更强，在出现突发情况时，无人机集群能够继续保持协同，自组织地完成搜索任务。因此，本文主要研究如何建立一种高效的区域覆盖在线规划方法，确保UAV集群在尽可能短的时间内对区域进行覆盖。

1.2 环境模型

设任务区域Ω为L_x×L_y的矩形区域，将区域按照固定间隔Δd栅格化为M×N个栅格，如图 2所示。

图 2 任务区域栅格化 Fig. 2 Mission area rasterization

图选项

赋予每个栅格一个值μ_ij(k)，用于描述截止到k时刻为止栅格(i, j)是否已被覆盖。为简化分析，做出如下假设：一旦栅格(i, j)处于UAV传感器探测范围内，则认为该栅格已被覆盖，且栅格内的目标存在情况完全已知。栅格的状态μ_ij(k)表示为

(1)

式中：Ω_c(k)为已覆盖的栅格集合；Ω_nc(k)为未覆盖的栅格集合。任务区域Ω为Ω_c(k)和Ω_nc(k)的总和。构建覆盖分布地图(Coverage Distribution Map, CDM)来描述任务区域的覆盖分布情况，用矩阵形式来表示覆盖分布地图，定义环境矩阵为

(2)

在搜索开始前，由于整个区域的环境信息完全未知，且需要对整个区域展开覆盖搜索，因此每个栅格的值μ_ij(0)=1；随着搜索的进行，μ_ij(k)实时变化，覆盖分布地图实时更新，并在UAV集群内共享，为UAV的实时决策提供环境信息。

1.3 UAV模型

为简化分析，假设UAV在任务区域上空等高度飞行，并将UAV视为二维空间中运动的质点，其运动方程为

(3)

式中：[x_i(k), y_i(k)]为UAV的位置；φ_i(k)=φ_i(k－1)+Δφ_i(k)，φ_i为航向角，Δφ_i∈[－φ_max, φ_max]为航向偏转角，为决策输入，φ_max为受机动性能限制下的最大转弯角；v₀为平飞速度；Δt为时间步长。

将UAV集群视为一个控制系统，并将每架UAV视为一个子系统。k时刻，记子系统UAVi的状态为p_i(k)=(x_i(k), y_i(k), φ_i(k))。状态方程为

(4)

式中：u_i(k)=Δφ_i(k)为子系统UAVi的输入；f(·)为状态转移函数，由式(3)确定。

根据式(4)，建立子系统UAVi的预测模型为

(5)

式中：n为UAV架数；H为预测周期；p_i(k+j|k)为基于k+j－1时刻UAVi状态预测的k+j时刻的UAVi状态，其值取决于状态p_i(k+j－1|k)和控制输入u_i(k+j－1|k)。

从k时刻起，给定H步预测控制输入后，可以预测出未来H步以内UAV的航路，如图 3所示。通过优化预测控制输入，来引导UAV尽可能向尚未被覆盖的区域进行搜索，以获得更高的区域覆盖率。

图 3 H步预测航路图 Fig. 3 H step route prediction

图选项

2 覆盖分布地图更新方法

覆盖分布地图描述了任务区域的覆盖搜索情况，是UAV进行自主决策的重要依据。因此，如何快速更新覆盖分布地图，对在线实时决策具有重要意义。

覆盖分布地图的更新就是将传感器探测范围内覆盖部分的相应栅格置为0。通过逐一判断邻近栅格到UAV之间的距离是否小于传感器探测距离，并对覆盖范围内的栅格进行逐一赋值，可以实现覆盖分布地图的更新，但这种遍历的方法运算量大、算法复杂度高，不利于实时更新。本文利用Hadamard积进行覆盖分布地图更新，操作简单且易于实现，避免了遍历判断和逐一赋值，其流程如图 4所示。

图 4 覆盖分布地图更新流程 Fig. 4 Update process of coverage distribution map

图选项

图 4中探测矩阵和环境子矩阵的定义，以及对其进行Hadamard积的运算过程将在2.1节和2.2节中详细介绍。

2.1 探测矩阵

本文将传感器探测范围简化为：UAV所处位置为中心，半径为R_s的圆形区域。如图 5所示，正方形区域记为Ψ，将区域Ψ栅格化为Q×Q个栅格。

(6)

图 5 区域Ψ栅格化 Fig. 5 Region Ψ rasterization

图选项

式中：R_s为传感器探测半径；⌈ ⌉为向上取整函数。

赋予每个栅格一个值η_pq，用于描述UAV传感器能否探测到该栅格。若栅格(p, q)处于UAV传感器探测范围内，则令η_pq=0，反之，η_pq=1。η_pq表示为

(7)

式中：Ψ_c为传感器可探测区域；Ψ_nc为不可探测区域。区域Ψ为Ψ_c和Ψ_nc的总和。

以η_pq为元素建立探测矩阵D=[η_pq]_Q×Q，表示UAV对邻近栅格的覆盖能力。

2.2 覆盖分布地图的更新

定义环境子矩阵C^(mn)(k)：在环境矩阵C(k)中，以μ_mn(k)为中心元素，维度为Q×Q的子块矩阵，称为环境子矩阵。

(8)

式中：(m, n)∈Ω；p, q=1, 2, …, Q。μ_pq^(mn)(k)与环境矩阵C(k)中的元素μ_ij(k)对应关系为

(9)

当UAV处于栅格(m, n)内时，可近似认为UAV处于该栅格的中心。此时，环境子矩阵C^(mn)(k)与探测矩阵D重合，且维度相等。对上述2个矩阵做Hadamard积

(10)

式中:“∘”为Hadamard积运算；p, q=1, 2, …, Q。

对C^(mn)(k)和D做Hadamard积，对应元素μ_pq^(mn)(k)与η_pq相乘，即对C^(mn)(k)中的元素μ_pq^(mn)(k)进行了更新。将更新后的C^(mn)(k+1)替换到C(k)的对应子块中，即实现了覆盖分布地图的更新。

假设传感器的探测周期为T_s，以T_s为时间间隔将UAV从k到k+1时刻的直线运动离散为运动点迹。对每个离散点做上述运算，即可实现一个步长内覆盖分布地图的更新。

2.3 覆盖分布地图的信息融合

文献[16]提出了一种地图信息融合更新方法，该方法适用于通信理想的情况，在通信中断或数据丢包的情况下，部分地图信息无法融合更新，对搜索过程造成影响。因此，本文提出基于Hadamard积的地图信息融合方法(见图 6)，能够在一定程度上减小通信中断或数据丢包对搜索过程的影响。

图 6 基于Hadamard积的地图信息融合示意图 Fig. 6 Schematic diagram of map information fusion based on Hadamard product

图选项

在协同搜索过程中，各UAV在本机进行覆盖分布地图更新，更新完毕后通过通信网络广播发送实现融合共享。k时刻，UAVi本地的覆盖分布地图对应的环境矩阵记为C_i(k)，并接收到其他UAV的广播消息记为C_j≠i(k)。基于Hadamard积可实现各UAV覆盖分布地图的信息融合：

(11)

与文献[16]方法相比，基于Hadamard积的地图信息融合方法共享的探测信息为环境矩阵C_i(k)，是地图的全局信息。假如k时刻数据丢包或通信中断，当前时刻的探测信息会丢失，地图信息无法更新。一旦k+x时刻通信恢复正常，环境矩阵C_i(k+x)中已包含了k到k+x时刻的历史探测信息，经过基于Hadamard积的地图信息融合方法更新后，丢失的历史探测信息就得以恢复。虽然k到k+x时刻通信中断会影响当前搜索决策，但是通信恢复后所有历史信息得到恢复，k+x时刻之后的搜索过程不会受到影响。

3 奖励函数与搜索算法 3.1 搜索奖励函数

协同搜索的关键在于设计一个搜索奖励函数，对每条预测航路进行评估^[5]。奖励的设定主要是一个步长内覆盖率增量的大小，并依据边界条件和转弯角度设计惩罚函数。在搜索过程中，UAV基于当前状态和覆盖分布地图，利用搜索奖励函数对预测航路进行评估，并自主地选择奖励值最大的航路作为决策输入。每架UAV使用搜索奖励函数J选择它的搜索航路：

(12)

式中：J_C为覆盖率增量；J_T和J_B分别为转弯角度和边界距离的惩罚函数；ω₁、ω₂和ω₃为相应权重；γ为重要性因子，覆盖率的重要性通过调整γ来体现，γ≥1。

k时刻的区域覆盖率O(k)是已搜索区域Ω_c(k)占任务区域Ω的面积比，即已搜索栅格数量与总栅格数量的比值：

(13)

k到k+1时刻的覆盖率增量是指O(k+1)与O(k)的差值。实际意义为：k时刻，未搜索区域Ω_nc(k)中，在k到k+1时刻内被搜索到的区域占任务区域Ω的面积比。覆盖率奖励函数为

(14)

在执行任务过程中，若转弯角度过大，导致耗油增大，影响续航时间。因此，设计一个惩罚函数，尽可能减少UAV转弯角度过大引起的耗油代价。转弯角度的惩罚函数J_T可以表示为

(15)

在搜索过程中，距离边界越近，传感器覆盖的有效区域越少，效率越低。借鉴虚拟势函数的思想，设计一个惩罚函数，靠近边界的UAV会受到边界的虚拟“斥力”，距离边界越近则“斥力”越大。因此，边界距离的惩罚函数J_B可以表示为

(16)

给定UAVi的控制输入u_i(k)，则UAVi状态从p_i(k)转移到p_i(k+1)，覆盖分布地图由C_i(k)更新为C_i(k+1)，从而可以计算出奖励函数J的值，优化求解使奖励函数J最大，即解得k时刻UAVi的最优控制输入u_i^*(k)。上述方法也可以推广到H步预测的情况，给定UAVi的H步控制输入U_i(k)=(u_i(k), u_i(k+1), …, u_i(k+H－1))^T，则UAVi状态由转移p_i(k)到p_i(k+H)，覆盖分布地图由C_i(k)更新为C_i(k+H)，将每一步的奖励函数J累加，得到H步累积奖励函数J^(H)为

(17)

式中：α为折扣因子，0 < α < 1，表示当前搜索奖励与长期搜索奖励之间的重要性程度。利用优化算法求解使累积奖励函数J^(H)最大，即可解得UAVi的H步最优控制输入U_i^*(k)。

3.2 基于DMPC和DE的协同搜索算法

模型预测控制(Model Predictive Control，MPC)是一种利用控制系统模型和优化技术设计预测周期内系统最优控制输入的方法，核心思想是滚动优化求解^[17]。集中式MPC方法依赖中央节点进行决策，限制了系统规模的扩展和决策速度，在实际应用中有一定局限性^{[14, 18]}。考虑到UAV子系统之间不存在耦合性，即不同UAV的控制是相对独立的，它们在系统的动态特性上并没有关联。为提高整个系统的抗毁性和决策速度，其控制结构可以采用分布式模型预测控制(Distributed Model Predictive Control，DMPC)方式^[19]，如图 7所示。

图 7 DMPC框架示意图 Fig. 7 Schematic diagram of DMPC framework

图选项

图 7中由MPCi求解得到，为UAVi的H步预测控制输入，为其他UAV的H步预测控制输入。在DMPC框架下，UAV集群不依赖任何中央节点进行决策，而是每架UAV采用局部的模型预测控制器分别进行决策。局部MPCi通过通信网络可以获得其他UAV的状态信息p_－i(k)和局部MPC的解信息。因此，第i个子系统的局部优化问题只与本地状态p_i(k)和本机控制输入U_i(k)相关，优化问题的规模大大降低，求解该优化问题就可以得到UAVi的最优预测控制输入U_i^*(k)^[14]。对应于图 7中UAVi的本地模型预测控制器MPCi，其决策流程如图 8所示。

图 8 MPCi决策流程 Fig. 8 Decision-making process of MPCi

图选项

MPCi决策流程分为3步。

步骤1 预测

在预测阶段，每架UAV基于本地覆盖地图和自身状态进行优化求解，而不考虑其他UAV的运动，即UAV之间不进行协同。根据式(17)，求解UAVi的H步预测控制输入的优化模型可以描述为

(18)

利用差分进化(Differential Evolution，DE)算法对上述优化模型进行求解，即解得UAVi的H步预测控制输入。

步骤2 通信

在通信网络理想的情况下，UAVi将自身状态p_i(k)和H步预测控制输入广播发送，并通过通信网络接收其他UAV的状态p_－i(k)和H步预测控制输入。

步骤3 决策

在预测阶段，每架UAV都不考虑其他UAV的运动，以“贪婪”的获得最大搜索奖励。在通信阶段，每架UAV通过通信网络获取到其他UAV的状态p_－i(k)和H步预测控制输入，进行UAV之间的搜索“意图”交互，进而“协同”获得最大搜索奖励，使整个系统获得更高的搜索奖励。

通信完毕后，利用p_－i(k)和将覆盖分布地图C_i(k)更新为中包含了其他UAV的搜索“意图”，是UAVi与集群内其他UAV进行协同的依据。在决策阶段，只需基于对U_i(k)进行优化即可，根据式(17)，求解UAVi的H步最优控制输入的优化模型可以描述为

(19)

利用DE算法对上述优化模型进行优化求解，解得UAVi的H步最优控制输入U_i^*(k)。将U_i^*(k)的第1项u_i^*(k|k)作为k时刻UAVi的控制输入，即u_i^*(k)=u_i^*(k|k)。根据UAVi的控制输入u_i^*(k)，将其本地覆盖分布地图C_i(k)更新为C_i(k+1)，并计算覆盖率。若覆盖率达到设定阈值，算法停止，否则UAV集群基于当前的覆盖分布地图和系统状态，重复上述优化过程，返回步骤1。

搜索决策过程的算法伪代码如下：

1初始化任务参数

2 for k = 1 to k_max

3 预测：

4 发送

5 接收

6 将C_i(k)更新为

7 (基于)

8 最优控制输入：u_i^*(k)=u_i^*(k|k)

9 将C_i(k)更新为C_i(k+1)

10 if O(k+1) ≥设定阈值

11 break

12 end if

13 end for

控制输入U_i(k)中包含H个未知变量，此优化问题是一个非线性优化问题。考虑到DE算法在求解优化问题，尤其是非线性优化问题中的优势^[20]，采用DE算法进行子系统本地优化求解，算法细节不再赘述。

4 仿真分析

为验证本文方法的有效性，本节对其进行仿真验证。仿真环境为I7-4960，主频2.60GHz，16GB内存，基于MATLAB 2014a为平台进行仿真实验。

4.1 实验1

设任务区域为8km×8km的矩形区域，每个栅格大小为20m×20m。执行搜索任务的4架UAV从不同位置进入搜索区域，其进入点坐标分别为(200, 0)m，(2200, 0)m，(4200, 0)m，(6200, 0)m。UAV之间的通信均为理想条件。UAV平飞速度v₀=30m/s，传感器探测半径R_s=200m，最大转弯角φ_max=60°，仿真步长Δt=10s，预测步长H=3，ω₁=0.9，ω₂=0.05，ω₃=0.05，γ=200。设定仿真环境条件：任务环境为无遮挡的平地区域，任务区域中存在分布未知的火力威胁，有一定几率造成UAV设备故障。在仿真中加入突发情况来模拟这一环境条件：运行至20步长时，假定UAV1设备故障，停止执行任务；运行至100步长时，假定UAV3设备故障，停止执行任务。为体现本文算法的优势，分别运用平行搜索、随机搜索和本文算法进行对比仿真。仿真结果如图 9所示(图中黑色区域为UAV传感器未覆盖的区域)。

图 9 3种搜索方法的仿真结果 Fig. 9 Simulation results of three search methods

图选项

如图 9(a)所示，在2架友机相继发生故障的情况下，UAV2和UAV4只完成了各自预先分配的搜索任务，故障UAV未完成的搜索任务得不到继续执行。如图 9(b)所示，随机搜索方法作为一种无引导机制的在线规划方法，在任务过程中多处存在UAV航迹交叉重叠的情况，搜索效率较低。如图 9(c)所示，在搜索初始阶段，各UAV之间保持传感器探测范围尽可能不重叠，实现较高的覆盖率增长。在2架友机相继故障的情况下，UAV2和UAV4通过实时协同，保持原有的搜索策略，充分发挥各自的搜索能力，继续完成搜索任务。总的来看，本文算法各UAV探测区域之间重叠部分较少，在出现突发情况时，能够继续完成搜索任务，体现了无人机集群在线协同的优势。

为消除随机因素的影响，在相同仿真条件下，针对本文算法和随机搜索方法使用蒙特卡罗方法进行500次仿真，得到平均覆盖率随时间变化曲线如图 10所示。

图 10 3种搜索方法的覆盖率变化曲线 Fig. 10 Coverage rate changing curve of three search methods

图选项

如图 10所示，平行搜索方法和本文算法覆盖率高于随机搜索方法。平行搜索方法的覆盖率变化曲线呈折线状：当某架UAV发生故障时，覆盖率曲线的斜率随之降低；当UAV到达边界时，执行转弯程序，覆盖率斜率为零。在搜索初期，本文算法与平行搜索方法覆盖率曲线斜率基本一致，体现了较高的搜索效率。当UAV2和UAV4完成各自的搜索任务后，平行搜索方法的覆盖率保持不变。相比之下，本文算法在UAV1和UAV3发生故障后，仍能保持覆盖率的稳定增长，最终任务结束时的覆盖率远高于平行搜索方法。

4.2 实验2

针对本文算法在集群规模较大时的有效性进行验证，采用10架无人机组成的无人机集群进行仿真。设任务区域为15km×15km的矩形区域，执行搜索任务的10架UAV的初始位置和航向由程序随机产生，UAV故障随机指定：设定UAV2、UAV3、UAV8、UAV9和UAV10分别于仿真步数为185、120、175、170和165时发生故障，其他仿真条件同实验1。用本文算法进行仿真，仿真步数step为100和230时的仿真结果如图 11所示。

图 11 本文算法仿真结果 Fig. 11 Simulation result of proposed algorithm

图选项

由图 11(a)可以看出，在搜索初期，10架UAV保持传感器探测范围尽可能不重叠，以获得较高的覆盖率增长。由图 11(b)可以看出，在搜索后期，由于未搜索区域被分割成多个不规则的形状，UAV航路出现了部分交叉，但本文算法还是能够引导UAV尽可能向未搜索区域移动。搜索过程中覆盖率变化曲线如图 12所示。

图 12 本文算法覆盖率变化曲线 Fig. 12 Coverage rate changing curve of proposed algorithm

图选项

如图 12所示，在搜索前期，覆盖率增长速度较快，覆盖率随时间变化曲线的斜率保持稳定。到搜索后期，由于出现重复搜索的情况，覆盖率增长放缓，斜率逐渐降低。当搜索时间到达38.33 min时，覆盖率达到了90.13%，有效地对区域进行了覆盖。仿真结果表明，在集群规模达到10架的情况下，本文算法能够较好地完成搜索任务。

5 结论

1) 本文算法在实验仿真条件下能实现较高的区域覆盖率，尤其是在出现突发情况时，覆盖率远高于平行搜索方法，体现了无人机集群在线协同的优势。

2) 以覆盖率作为实时搜索奖励的引导机制，有利于引导UAV向未搜索区域运动，并协同各UAV之间探测区域重叠部分尽可能少，以实现更高的覆盖率。

3) 利用Hadamard积可实现覆盖分布地图的快速更新，避免了遍历判断和逐一赋值，且操作简单、运算速度快，为地图信息实时更新提供了便捷。

4) 采用DMPC框架进行滚动优化求解，将长期的搜索奖励考虑在内，并且可以提高系统的抗毁性和决策速度。

本文算法在通信理想的条件下实现了对任务区域的有效覆盖搜索，但针对通信距离和角度约束的情况，尚需进行更加深入的后续研究。

参考文献

[1]	HU J W, XU J, XIE L H. Cooperative search and exploration in robotic networks[J]. Unmanned Systems, 2013, 1(1): 121-142. DOI:10.1142/S2301385013500064

[2]	HU J W, XU J, XIE L H.Vision-based multi-agent cooperative target search[C]//International Conference on Control, Automation, Robotics & Vision.Piscataway, NJ: IEEE Press, 2012: 895-900.

[3]	梁晓龙, 孙强, 尹忠海, 等. 大规模无人系统集群智能控制方法综述[J]. 计算机应用研究, 2015, 32(1): 11-16. LIANG X L, SUN Q, YIN Z H, et al. Review on large-scale unmanned system swarm intelligence control method[J]. Application Research of Computers, 2015, 32(1): 11-16. DOI:10.3969/j.issn.1001-3695.2015.01.003 (in Chinese)

[4]	梁晓龙, 张佳强, 祝捷, 等. 基于CPS的空中交通系统架构及能力涌现方法[J]. 空军工程大学学报(自然科学版), 2016, 17(1): 1-7. LIANG X L, ZHANG J Q, ZHU J, et al. Air trafic control system architecture and ability emergence method based on cyber-pyhsical system[J]. Journal of Air Force Engineering University(Natural Science Edition), 2016, 17(1): 1-7. DOI:10.3969/j.issn.1009-3516.2016.01.001 (in Chinese)

[5]	吴文超, 黄长强, 宋磊, 等. 不确定环境下的多无人机协同搜索航路规划[J]. 兵工学报, 2011, 32(11): 1337-1342. WU W C, HUANG C Q, SONG L, et al. Cooperative search and path planning of multi-unmanned air vehicles in uncertain environment[J]. Acta Armamentarii, 2011, 32(11): 1337-1342. (in Chinese)

[6]	ZHAO Z Y, LU G S. Receding horizon control for cooperative search of multi-UAVs based on differential evolution[J]. International Journal of Intelligent Computing and Cybernetics, 2012, 5(1): 145-158. DOI:10.1108/17563781211208260

[7]	于驷男, 周锐, 夏洁, 等. 多无人机协同搜索区域分割与覆盖[J]. 北京航空航天大学学报, 2015, 41(1): 167-173. YU S N, ZHOU R, XIA J, et al. Decomposition and coverage of multi-UAV cooperative search area[J]. Journal of Beijing University of Aeronautics and Astronautics, 2015, 41(1): 167-173. (in Chinese)

[8]	JONES P, VACHTSEVANOS G.Multi-unmanned aerial vehicle coverage planner for area surveillance missions[C]//AIAA Guidance, Navigation, and Control Conference and Exhibit.Reston: AIAA, 2007: 1-12.

[9]	陈海, 王新民, 焦裕松, 等. 一种凸多边形区域的无人机覆盖航迹规划算法[J]. 航空学报, 2010, 31(9): 1802-1808. CHEN H, WANG X M, JIAO Y S, et al. An algorithm of coverage flight path planning for UAVs in convex polygon areas[J]. Acta Aeronautica et Astronautica Sinica, 2010, 31(9): 1802-1808. (in Chinese)

[10]	符小卫, 魏广伟, 高晓光. 不确定环境下多无人机协同区域搜索算法[J]. 系统工程与电子技术, 2016, 38(4): 821-827. FU X W, WEI G W, GAO X G. Cooperative area search algorithm for multi-UAVs in uncertainty environment[J]. System Engineering and Elecrtonics, 2016, 38(4): 821-827. (in Chinese)

[11]	KHAN A, YANMAZ E, RINNER B. Information exchange and decision making in micro aerial vehicle networks for cooperative search[J]. IEEE Transactions on Control of Network Systems, 2015, 2(4): 335-347. DOI:10.1109/TCNS.2015.2426771

[12]	杜继永, 张凤鸣, 毛红保, 等. 多UAV协同搜索的博弈论模型及快速求解方法[J]. 上海交通大学学报, 2013, 47(4): 667-678. DU J Y, ZHANG F M, MAO H B, et al. Game theory based mutli-UAV cooperative searching model and fast solution approach[J]. Journal of Shanghai Jiao Tong University, 2013, 47(4): 667-678. (in Chinese)

[13]	TRODDEN P, RICHARDS A.Multi-vehicle cooperative search using distributed model predictive control[C]//Guidance, Navigation, and Control Conference and Exhibit.Reston: AIAA, 2008: 1-11.

[14]	彭辉, 沈林成, 朱华勇. 基于分布式模型预测控制的多UAV协同区域搜索[J]. 航空学报, 2010, 31(3): 593-601. PENG H, SHEN L C, ZHU H Y. Multiple UAV cooperative area search based on distributed model predictive control[J]. Acta Aeronautica et Astronautica Sinica, 2010, 31(3): 593-601. (in Chinese)

[15]	郑宏捷.无人机区域侦察航路规划研究[D].长沙: 国防科学技术大学, 2011: 5-8. ZHENG H J.Investigation on the UAV path planning problem of area reconnaissance[D]. Changsha: National University of Defense Technology, 2011: 5-8(in Chinese). http://cdmd.cnki.com.cn/article/cdmd-90002-1012020739.htm

[16]	刘重, 高晓光, 符小卫. 带信息素回访机制的多无人机分布式协同目标搜索[J]. 系统工程与电子技术, 2017, 39(9): 1998-2011. LIU C, GAO X G, FU X W. Multi-UAVs distributed cooperative target search algorithm with controllable revisit mechanism based on digital pheromone[J]. System Engineering and Electronics, 2017, 39(9): 1998-2011. (in Chinese)

[17]	MAYNE D Q. Model predictive control:Recent developments and future promise[J]. Automatica, 2014, 50(12): 2967-2986. DOI:10.1016/j.automatica.2014.10.128

[18]	KAYACAN E, PESCHEL J M, KAYACAN E.Centralized, decentralized and distributed nonlinear model predictive control of a tractor-trailer system: A comparative study[C]//2016 American Control Conference.Piscataway, NJ: IEEE Press, 2016: 4403-4408.

[19]	MANSOURI S S, NIKOLAKOPOULOS G, GUSTAFSSON T.Distributed model predictive control for unmanned aerial vehicles[C]//2015 Workshop on Research, Education and Development of Unmanned Aerial Systems.Piscataway, NJ: IEEE Press, 2015: 152-161.

[20]	DAS S, MULLICK S S, SUGANTHAN P N. Recent advances in differential evolution-An updated survey[J]. Swarm and Evolutionary Computation, 2016, 27: 1-29. DOI:10.1016/j.swevo.2016.01.004

http://dx.doi.org/10.13700/j.bh.1001-5965.2018.0230
北京航空航天大学主办。

文章信息

侯岳奇, 梁晓龙, 何吕龙, 刘流

HOU Yueqi, LIANG Xiaolong, HE Lyulong, LIU Liu

未知环境下无人机集群协同区域搜索算法

Cooperative area search algorithm for UAV swarm in unknown environment

北京航空航天大学学报, 2019, 45(2): 347-356

Journal of Beijing University of Aeronautics and Astronsutics, 2019, 45(2): 347-356

http://dx.doi.org/10.13700/j.bh.1001-5965.2018.0230

文章历史

收稿日期: 2018-04-25

录用日期: 2018-10-15

网络出版时间: 2018-10-26 16:33

文章信息

文章历史

相关文章

工作空间