复杂约束下可重构海洋浮体的分布式预测控制策略

引用本文

付东飞, 陈功洵, 王继龙, 等. 复杂约束下可重构海洋浮体的分布式预测控制策略[J]. 中国海洋大学学报(自然科学版), 2026, 56(6): 114-125.

Fu Dongfei, Chen Gongxun, Wang Jilong, et al. Distributed Model Predictive Control Strategy for Reconfigurable Marine Floating Body with Complex Constraints[J]. Periodical of Ocean University of China, 2026, 56(6): 114-125.

基金项目

山东省自然科学基金项目(ZR2022MF280)资助
Supported by the Natural Science Foundation of Shandong Province(ZR2022MF280)

作者简介

付东飞(1984—)，男，副教授。E-mail: fudongfei@ouc.edu.cn

文章历史

收稿日期：2025-04-15
修订日期：2025-08-03

Contents Abstract Full text Figures/Tables PDF

复杂约束下可重构海洋浮体的分布式预测控制策略

付东飞 , 陈功洵 , 王继龙 , 高旭辉

中国海洋大学工程学院，山东青岛 266404

收稿日期：2025-04-15；修订日期：2025-08-03

基金项目：山东省自然科学基金项目(ZR2022MF280)资助

作者简介：付东飞(1984—)，男，副教授。E-mail: fudongfei@ouc.edu.cn.

摘要：针对可重构海洋浮体编队控制中存在的避碰、通信受限及障碍物规避等复杂约束问题，本文提出一种鲁棒分布式模型预测控制(Robust-distributed model predictive control, Robust-DMPC)策略。该策略通过将避碰、通信距离、避障约束及状态输入限制整合为邻近网络优化问题，构建了多浮体协同控制框架。结合交替方向乘子法(Alternating direction method of multipliers，ADMM)与局部控制器一致性原则，本研究设计了基于虚拟领航者的分布式预测控制器，并引入相容性约束与鲁棒补偿机制，理论分析证明了该算法的递归可行性和闭环系统渐近稳定性。仿真结果表明，所提方法能够在复杂约束下有效实现编队轨迹跟踪与队形保持，且相较于传统DMPC算法计算量有显著降低。本研究为动态海洋环境中多浮体协同控制提供了一种兼具鲁棒性与计算效率的解决方案。

关键词：协同编队控制分布式优化模型预测控制可重构海洋浮体交替方向乘子法

可重构海洋浮体是一种特殊的水面无人系统，可以满足多智能浮体在海上根据需求自主靠泊、拼接成不同形状大型浮动平台的要求，同时还具备在水面上构建作业支点平台与柔性运输通道、自动浮桥快速搭建以及河道垃圾清理等应用潜力^[1]。当前，海洋工程领域的任务愈发复杂，单个无人系统的功能有限，难以满足实际需求，而可重构海洋浮体凭借其灵活性高、容错性强、协同高效等优势，在海洋监测、海洋资源开发和搜救巡逻等领域展现出极高的应用价值，未来还有望拓展至更多领域^[2]。

在浮体重构和拆分过程中，不仅要维持彼此间距，还需与障碍物保持安全距离，避免碰撞，因此研究浮体重构形成编队时的避碰策略具有重要的理论价值和应用潜力^[3]。但现实海洋环境存在强非线性扰动，浮体的水动力学特性也较为复杂，呈现出较强的非线性特性，这导致编队控制的鲁棒性较差。同时，浮体在实际任务中存在碰撞风险，且动力输入和运行速度受到限制。所以，浮体编队调节是一个极具挑战的问题，还需综合考虑避碰、浮体速度和驱动器输入受限时的可重构浮体协同控制。

关于无人系统集群编队协同的问题，过去20年中研究者提出了许多有效的无人系统编队控制策略，主要分为四类：基于行为的策略、基于虚拟结构的策略、基于领航者-跟随者的策略和基于一致性的策略。基于行为的编队控制方法需要为每个无人系统分配若干基本行为，并通过这些行为的在线自适应调整来实现多无人系统编队^[4]。在基于虚拟结构的方法^[5-6]中，无人系统被约束为一个刚性结构进行运动，结构中的每个位置对应着受控制的相应个体，该方法直接且直观，但队形调整的灵活性受限。在基于领航者-跟随者的方法中，无人系统通过与相应的领航者保持一定的距离来实现编队^[7-8]。作为领航者-跟随者型策略的推广，基于一致性的编队控制方法通过每个无人系统与多个相邻的个体进行通信来维持多无人系统编队。该方法有利于在一般通信拓扑下实现编队，从而增强多无人系统的鲁棒性。基于领航者-跟随者和基于一致性方法的分布式特性^[9]，使其能够有效应用于多浮体系统的编队控制实践，并已取得了一系列相关成果。虚拟领航法则是在领航者-跟随者策略的基础上引入虚拟领航者概念，虚拟领航者并不对应实际物理实体，而是为整个编队提供期望的运动参考。

针对无人系统集群的编队控制问题，考虑到上述实际的挑战，分布式模型预测控制(Distributed model predictive control, DMPC)兼具模型预测控制方法(Model predictive control, MPC)显式约束处理和滚动优化的优点，以及分布式控制结构计算量小、鲁棒性强和算法灵活性等特点，使其成为处理编队控制问题的重要工具^[10]。在同步DMPC中，每个个体利用其邻居的假设信息，通过求解个体优化问题获得其最优控制输入。但由于假设信息与实际信息之间存在不确定偏差，导致可行性和稳定性难以保证，为此提出了在优化问题中引入相容性约束的思路，该约束要求每个子系统当前时刻的预测状态轨迹不能偏离上一时刻计算得到的最优状态轨迹太远，从而增加了假设信息的可靠性^[11]。Wang等^[12]提出了一种多智能体系统的同步分布式模型预测控制算法，通过考虑各智能体间不确定偏差，设计了偏差相关的相容性约束。Wen等^[9]针对一类受状态和输入约束且受未知外部干扰的多无人水面艇系统，研究了其鲁棒避碰编队导航问题，构建了分布式模型预测控制器，并利用时延观测器估计干扰以创建可靠预测模型。Lv等^[13]采用扩展状态观测器估计欠驱动无人艇的未知模型不确定性和外部干扰，设计了基于扩展状态观测器的分布式模型预测避碰编队控制器，并将问题转化为约束二次规划问题进行求解。而本文在综合考虑状态约束、输入约束、避碰约束^[13]和避障约束^[9]的情况下，加入浮体间通信约束，考虑更加全面的复杂约束情况，对多浮体的编队控制问题进行分析。

本文提出了一种ADMM-DMPC控制框架，使多浮体系统在有限通信范围、碰撞避免、速度和控制输入有界的复杂约束下能够跟踪期望轨迹并保持队形。交替方向乘子法(Alternating direction method of multipliers，ADMM)是一种增广拉格朗日方法，最初于20世纪70年代被提出，随着计算能力的提升和分布式计算平台的发展，ADMM近年来得以再次兴起^[14]。这种方法可以视为对偶分解的变体，其核心思想是将复杂问题分解为多个子问题，每个子问题涉及少量变量和约束，可以独立分布式求解。在交替方向乘子法的框架下^[15]，结合一致性原则，设计出一种基于虚拟领航策略的鲁棒分布式模型预测控制，并加入相容性约束，在实际条件下分析了所提方法的可行性和稳定性。仿真结果表明，所提出的方法能够使浮体系统稳定地跟踪期望轨迹并保持队形且无碰撞。

1 问题描述 1.1 模型建立

本文研究的可重构海洋浮体系统由图 1所示的多个同构个体组成，为方便个体间对接重构，其舱体被设计为倒梯形结构。图 1所示浮体模型有6个自由度，为方便描述其运动，建立惯性坐标系O_I-X_IY_IZ_I和浮体本体坐标系O_B-X_BY_BZ_B。其中，体坐标系固定于浮体重心位置，随浮体运动而改变。海洋浮体在O_B-X_BY_BZ_B中的(角)速度为(u，v，w，p，q，r)。

图 1 海洋浮体的大地坐标系与本体坐标系定义 Fig. 1 Definition of inertial coordinate frame and body coordinate frame for marine floating body

将海洋浮体看作刚体，根据刚体在流体中的牛顿-欧拉运动方程, 可得出其动力学模型。假设：(1)海洋浮体仅在水平面运动，忽略其沿O_B-Z_B轴的平动以及绕O_B-X_B、O_B-Y_B轴的转动。(2)海洋浮体关于纵轴对称且航速较慢，可忽略航速的耦合项和水动力系数。(3)浮体质量分布均匀，其载体坐标系的原点与重心重合，惯性积为零。根据以上假设，可以得到海洋浮体简化的三自由度动力学模型：

$ \boldsymbol{\tau}_i=\boldsymbol{M} \boldsymbol{\delta}_i+\boldsymbol{C}\left(\boldsymbol{\delta}_i\right) \boldsymbol{\delta}_i+\boldsymbol{D}\left(\boldsymbol{\delta}_i\right) \text { 。} $

(1)

式中：δ_i为第i个海洋浮体在O_B-X_BY_BZ_B中的纵荡、横荡和艏摇速度组成的向量，且δ_i=[u_i v_i r_i]^T；τ_i为推进器所产生的力，且τ_i=[τ_{u_i} τ_{v_i} τ_{r_i}]^T；M为海洋浮体简化模型的总惯性矩阵；D(δ_i)为流体阻尼矩阵；C(δ_i)为包含附加质量系数的科里奥利项与向心项的矩阵。它们的具体形式为M=diag(M₁₁, M₂₂, M₃₃)，C(δ)_i=[0, 0, －M₂₂v; 0, 0, M₁₁u; M₂₂v, －M₁₁u, 0]，D(δ_i)=diag(D₁₁, D₂₂, D₃₃)，式中：M₁₁和M₂₂分别为海洋浮体在纵荡轴和横荡轴上的附加质量；M₃₃为转动惯量，包括横摆轴附加惯量；D₁₁、D₂₂和D₃₃分别为海洋浮体在纵荡、横荡和艏摇轴上的阻尼系数。

第i个海洋浮体的三自由度运动学模型可建立如下：

$ \dot{\boldsymbol{\eta}}_i=\boldsymbol{R}\left(\psi_i\right) \boldsymbol{\delta}_i。$

(2)

式中：η_i为海洋浮体在O_I-X_IY_IZ_I中的位置及艏摇角，且η_i=(x_iy_iψ_i)^T, $ \dot{\boldsymbol{\eta}}_i$为η_i的导数；R(ψ_i)为速度向量ψ_i从由体坐标系到惯性坐标系的雅克比变换矩阵。

为便于后续控制器设计，采用采样间隔为h的欧拉离散化方法得到浮体系统的离散时间模型。考虑系统由n艘浮体组成，综合式(1)和(2)可得第i个海洋浮体的控制模型(i∈{1，2，3，……，n})：

$ \dot{\boldsymbol{\delta}}_i(k+1)=\boldsymbol{f}_u\left(\boldsymbol{\delta}_i(k), \boldsymbol{\tau}_i(k)\right), $

(3)

$ \dot{\boldsymbol{\eta}}_i(k+1)=\boldsymbol{f}_v\left(\boldsymbol{\eta}_i(k), \delta_i(k)\right) \text { 。} $

(4)

式中：函数f_u和f_v分别为式(1)和(2)所定义的非线性函数向量；k为离散时间指标。定义u_i为系统输入(即u_i=τ_i∈R³)，x_i为系统状态(即x_i=(η_i^T, δ_i^T)^T∈R⁶)，控制模型(式(3)和式(4))可由如下非线性离散状态方程描述：

$ \boldsymbol{x}_i(k+1)=f_i\left(\boldsymbol{x}_i(k), \boldsymbol{u}_i(k)\right) \text { 。} $

(5)

当存在有界外部干扰w_i(k)时(即w_i(k)∈W，W为干扰集合)，第i个海洋浮体的受扰控制模型则变为

$ \boldsymbol{x}_i(k+1)=f_i\left(\boldsymbol{x}_i(k), \boldsymbol{u}_i(k)\right)+\boldsymbol{w}_i(k) \text { 。} $

(6)

式中：控制系统状态和控制输入需满足状态约束集X与控制约束集U，即x_i(k)∈X⊂R⁶和u_i(k)∈U⊂R³；ω为外部扰动的上界，且$ \omega \triangleq \sup\limits_{w_i(k) \in W}\left\|w_i(k)\right\|$。在预测控制器设计时，为明确区分实际系统(见式(6))和控制器内用于预测系统未来状态的模型，将用$ \left({\overline{\boldsymbol{x}}}_i(k), \overline{\boldsymbol{u}}_i(k)\right)$表示控制器内预测系统的变量，预测模型应满足如下动态特性：

$ \dot{\overline{\boldsymbol{x}}}_i(k+1)=f_i\left(\dot{\overline{\boldsymbol{x}}}_i(k), \overline{\boldsymbol{u}}_i(k)\right) 。$

(7)

式中：$ \overline{\boldsymbol{x}}_i$和$ \overline{\boldsymbol{u}}_i$分别为名义系统的状态和输入; $ \dot{\overline{\boldsymbol{x}}}_i$为$ \overline{\boldsymbol{x}}_i$的导数。

假设1：用无向图G=(V, ε)来表示多浮体系统的通信拓扑，其中V={1，2，3，……，n}和ε∈V×V分别为浮体的顶点集合和通信链路的边集合。ε_ij表示第i个海洋浮体和第j个海洋浮体之间存在通信，即第i个海洋浮体为第j个海洋浮体的邻居(ε_ij=(i, j)∈ε)，并假定第i个浮体的邻域集合为N_i，且N_i$ \triangleq${j|(i, j)∈ε}。

1.2 控制目标

本节研究可重构海洋浮体的编队问题，其编队构型由各浮体之间的相对位置向量d_ij来定义。同时，各浮体也沿着期望的虚拟领航者的轨迹(p_v(k)∈R²)运动。可重构浮体编队系统在满足自身状态、输入约束以及多浮体间通信距离、避碰和避障约束的前提下，按照期望的相对位置跟踪虚拟领航者，并保持预定的队形运动。以上可重构海洋浮体的编队调控问题可描述为如下的控制目标：

$ \text { (I) } \lim\limits_{k \rightarrow \infty}\left(\boldsymbol{p}_v(k)-\boldsymbol{p}_i(k)\right)=\boldsymbol{d}_{i v}, i \in V, $

(8)

$ \text { (II) } \lim\limits_{k \rightarrow \infty}\left(\boldsymbol{p}_j(k)-\boldsymbol{p}_i(k)\right)=\boldsymbol{d}_{i j}, i \in N_i 。$

(9)

$ \left\|\boldsymbol{p}_j(k)-\boldsymbol{p}_i(k)\right\| \leqslant C, \forall j \in N_i, $

(10)

$ \left\|\boldsymbol{p}_j(k)-\boldsymbol{p}_i(k)\right\| \geqslant 2 R, \forall j \in V \backslash\{i\}, $

(11)

$ \left\|\boldsymbol{p}_o-\boldsymbol{p}_i(k)\right\| \geqslant R+R_o, \forall o \in N_o 。$

(12)

式中：p_i(k)为浮体的位置向量；式(8)为各浮体跟踪虚拟领航浮体的轨迹；式(9)和(10)为编队构型保持约束，用于维持浮体间的期望相对位置；式(11)为避碰约束；式(12)为避障条件。如图 2所示，d_iv、d_ij分别为实际队形中的第i个浮体与虚拟浮体v之间、第i个浮体与第j个浮体之间期望的相对位置向量, 其中d_ij=d_iv－d_jv；R和C分别为浮体的安全半径与最大通信半径；o为障碍物编号；p_o为动态或静态障碍物的位置；R_o为障碍物的作用半径；N_o为障碍物集合，且N_o∈N⁺。

( (a)海洋浮体之间需要保持的距离Distance to be maintained between marine floating bodies；(b)海洋浮体与障碍物之间需要保持的距离Distance to be maintained between marine floating bodies and obstacles；(c)海洋浮体的安全半径和通信半径Safety radius and communication radius of marine floating bodies；(d)海洋浮体之间保持的相对距离Maintain relative distance between marine floating bodies. ) 图 2 海洋浮体编队同个体间通讯及避障、避碰的示意图 Fig. 2 Scheme of marine floating body formation with inter-individual communication, obstacle avoidance, and collision evasion

2 可重构浮体编队的预测控制器设计 2.1 优化问题

根据控制目标(式(8)—(12))及预测模型(式(7))，第i个浮体在预测时域[1, H]内的代价函数为

$ \begin{gathered} J_i\left(k, \overline{\boldsymbol{x}}_i, \overline{\boldsymbol{x}}_{-i}, \boldsymbol{x}_{\mathrm{r}}, \boldsymbol{u}_i, \boldsymbol{u}_{\mathrm{r}}\right)= \\ \sum\limits_{l=1}^{H-1}\left(\left\|\overline{\boldsymbol{x}}_i(k+l \mid k)\right\|_{\boldsymbol{Q}}^2+\right. \\ \left.\left\|\boldsymbol{u}_{i, \mathrm{r}}(k+l-1 \mid k)\right\|_{\boldsymbol{S}}^2+\sum\limits_{j \in N_i}\left\|\overline{\boldsymbol{x}}_{i j}(k+l \mid k)\right\|_{\boldsymbol{G}}^2\right)+ \\ \left\|\overline{\boldsymbol{x}}_i(k+H \mid k)\right\|_{\boldsymbol{P}}^2 \end{gathered} $

(13)

式中：$ \overline{\boldsymbol{x}}_i$(k+l|k)是浮体i在时刻k预测的时刻k+l的状态；$ \overline{\boldsymbol{x}}\__i$是浮体i的邻居状态。定义：u_{i, r}(k+l-1|k)=u_i(k+l-1|k)－u_r(k+l-1|k)；$ \overline{\boldsymbol{x}}_{i, {\rm{r}}}$(k + l|k) = $ \overline{\boldsymbol{x}}_{i}$(k + l|k)-x_r (k + l|k)+d_{i, r^*}, d_{i, r^*} =(d_{i, r}^T, 0)^T∈R⁶。$ \overline{\boldsymbol{x}}_{ij}$(k + l|k)=$ \overline{\boldsymbol{x}}_{i}$(k + l|k)-x_j (k + l|k) +d′_ij, d′_ij = (d_ij^T, 0)^T∈R⁶；‖$ \overline{\boldsymbol{x}}_{i, {\rm{r}}}$(k+H|k)‖_P²为终端代价函数；各权重矩阵Q、S、G和P皆为对称正定矩阵。虚拟领航者的各个状态值与设定的相对位置构成每个浮体的参考状态x_r和参考控制输入u_r，且(x_r, 0)∈X×U是系统的一个平衡点。

假设2：对于标称系统(式(7))，设(x_r, 0)处为系统的平衡点，在(x_r, 0)处线性化，线性化后的系统描述为

$ \dot{\overline{\boldsymbol{x}}}_i(k+1)=\boldsymbol{A}_i \overline{\boldsymbol{x}}_i(k)+\boldsymbol{B}_i \boldsymbol{u}_i(k) \text { 。} $

(14)

式中：A_i=∂f_i/∂x_i|_{(x_r, 0)}，B_i=∂f_i/∂u_i|_{(x_r, 0)}。对于在平衡点雅可比线性化后的系统模型(14)，存在一个线性状态反馈，使闭环系统稳定，即存在K_i，使得A_k为Hurwitz矩阵A_k=A_i+B_iK_i。

引理1^[16]：对于标称系统(式(7))，定义终端控制器为u_i(k+H|k)=$ \boldsymbol{K}_i \overline{\boldsymbol{x}}_{i, \mathrm{r}}(k+H \mid k)$，终端域为Ω_i={‖x_{i, r}‖_P²≤α_i}，x(k)∈Ω_i(ε_i)。给定加权矩阵Q，则存在反馈增益K_i，正定矩阵P和标量α_i>0，使得如下结论成立：

(1) 对于由终端控制器u_i(k+H|k)=K_ix_{i, r}(k+H|k)控制的第i个海洋浮体i，在Ω_i内第i个海洋浮体的状态均满足状态约束，终端控制器满足控制约束，Ω_i是一个不变集。

(2) 满足不等式0 < κ_i < －λ_max(A_i+B_iK_i)的常数κ_i能保证A_i+B_iK_i+κ_iI的所有特征值都具有负实部，那么(A_i+B_iK_i+κ_iI)^TP+P(A_i+B_iK_i+κ_iI)=－(Q+K_i^TSK_i)存在一个唯一的正定解P。

(3)‖p_i(k+H|k)－p_r(k+H|k)+d_{i, r}‖≤min{[(‖d_ij‖－2R)/2], [(C－‖d_ij‖)/2], [‖p_o－p_r(k+H|k)+d_{i, r}‖－(R+R_o), ∀o∈N_o], j∈N_i}是对海洋浮体施加的避碰、避障、通信约束，用来保证在终端域内仍然满足2R≤p_j(k+H|k)－ p_i(k+H|k)≤C以及避障约束，p_i(k+H|k)和p_j(k+H|k)分别是进入终端域后第i个海洋浮体及其邻域第j个海洋浮体的位置。

为处理外部干扰，本研究中为每个海洋浮体的优化问题设计了鲁棒性约束，鲁棒性约束以预先设计的方式逐步缩小标称系统的状态^[17]，以对抗外部扰动造成的影响，本节的鲁棒性约束是基于状态约束和终端约束设计的。可将可重构海洋浮体编队控制转化为如下n个局部优化问题：

$ \begin{array}{ll} \ \ \ \ \ \ \ \min\limits_{u_i} J(k)=\sum\limits_{i \in V} J_i\left(k, \overline{\boldsymbol{x}}_i, \overline{\boldsymbol{x}}_{-i}, \boldsymbol{x}_{\mathrm{r}}, \boldsymbol{u}_i, \boldsymbol{u}_{\mathrm{r}}\right) 。\\ \text { s.t. } \ \ \overline{\boldsymbol{x}}_i(k \mid k)=\boldsymbol{x}_i(k) ; \\ \ \ \ \ \ \ \ \overline{\boldsymbol{x}}_i(k+l+1 \mid k)=f_i\left(\overline{\boldsymbol{x}}_i(k+l \mid k), \boldsymbol{u}_i(k+l \mid k)\right) ; \\ \ \ \ \ \ \ \ \left\|\overline{\boldsymbol{x}}_i(k+l \mid k)\right\| \leqslant\left(1-(l / H) \zeta_i\right) c_i ; \\ \ \ \ \ \ \ \ \boldsymbol{u}_i(k+l-1 \mid k) \in U ; \\ \ \ \ \ \ \ \ \left\|\boldsymbol{p}_j(k+l \mid k)-\boldsymbol{p}_i(k+l \mid k)\right\| \geqslant 2 R ; \\ \ \ \ \ \ \ \ \left\|\boldsymbol{p}_j(k+l \mid k)-\boldsymbol{p}_i(k+l \mid k)\right\| \leqslant C ; \\ \ \ \ \ \ \ \ \| \boldsymbol{p}_o-\boldsymbol{p}_i(k+l \mid k) R+R_o, \forall o \in N_o ; \\ \ \ \ \ \ \ \ \left\|\overline{\boldsymbol{x}}_i(k+H \mid k)\right\|_{\boldsymbol{P}} \leqslant \xi_i \varepsilon_i ; i, j \in V, i \neq j, l \in\\ [1, H]\text { 。} \end{array} $

(15)

式中：ζ_i和ξ_i分别为状态约束和终端约束的缩放参数；常数$ \boldsymbol{B}_i\left(c_i\right) \triangleq\left\{\overline{\boldsymbol{x}}_i \mid \overline{\boldsymbol{x}}_i \leqslant c_i\right\}$。

2.2 假设信息和相容性约束

在多浮体系统中，各海洋浮体独立求解自身优化问题时，决策时刻无法获取其他浮体的全部预测状态。为弥补此信息缺失，引入假设的预测控制输入序列，该序列并非随机设定，而是基于前一时刻已求解的最优解，并结合终端控制输入进行合理组合。

$ \begin{gathered} \hat{\boldsymbol{u}}_i(k+l \mid k)= \\ \left\{\begin{array}{l} \boldsymbol{u}_i^*(k+l \mid k-1), l=0, 1, \cdots \cdots, H-2 \\ \boldsymbol{u}_{\kappa_i}(k-1+l \mid k-1), l=H-1 \end{array}, \right. \end{gathered} $

(16)

$ \begin{gathered} \hat{\boldsymbol{x}}_i(k+l \mid k)= \\ \left\{\begin{array}{l} \overline{\boldsymbol{x}}_i^*(k+l \mid k-1), l=0, 1, \cdots \cdots, H-1 \\ \overline{\boldsymbol{x}}_{\kappa_i}(k+l \mid k-1), l=H \end{array}\right.。\end{gathered} $

(17)

式中：[1, H]为预测时域；$ \hat{\boldsymbol{u}}_i(k+l \mid k)$为构造的预测控制输入；$ \hat{\boldsymbol{x}}_i(k+l \mid k)$为控制输入$ \hat{\boldsymbol{u}}_i(k+l \mid k)$作用下的相应状态。$ \overline{\boldsymbol{x}}_{\kappa_i}(k+H \mid k-1)$=f_i(x_i^*(k－1+H|k－1)；u_{κ_i}(k－1+H|k－1))为x_i^*(k－1+H|k－1)在u_{κ_i}(k－1+H|k－1)作用下的下一个状态，u_{κ_i}(k－1+H|k－1)=K_ix_{i, r}^*(k-1+H|k－1)为k+H－1|k时刻的可行控制输入，可由引理1中的终端约束计算得到。

用假设控制输入和状态来进行替换之后可以同步求解，但是会对避碰、通信约束产生一定的影响，所以引入位置相容性约束和状态相容性约束。为保证编队安全，使多浮体间避碰要求、通信条件仍然能够被满足，需设计位置相容性约束对假设位置的偏差进行约束：

$ \left\|\hat{\boldsymbol{p}}_i(k+l \mid k)-\boldsymbol{p}_i(k+l \mid k)\right\| \leqslant \mu_i(k+l \mid k) \text { 。} $

(18)

式中：$ \hat{\boldsymbol{p}}_i$(k+l|k)是式(17)中$ \hat{\boldsymbol{x}}_i$(k+l|k)的分量；μ_i(k+l|k)是第i个海洋浮体的位置相容性约束的上界。要满足避碰约束条件，在预测时域H的任一时刻，此距离位置上限应不高于与邻居浮体之间的距离的最小值，即min{μ_ij(k+l|k), j∈V\{i}}。

$\mu_i(k+l \mid k)=\min\limits_{j \in V \backslash\{i\}}\left\{\mu_{i j}(k+l \mid k)\right\}, $

(19)

$ \begin{gathered} \mu_{i j}(k+l \mid k)= \\ \frac{\left\|\hat{\boldsymbol{p}}_j(k+l \mid k)-\hat{\boldsymbol{p}}_i(k+l \mid k)\right\|-2 R}{2}, j \in N_i 。\end{gathered} $

(20)

再考虑避碰约束和通信约束：

$ \begin{gathered} \left\|\hat{\boldsymbol{p}}_j(k+l \mid k)-\boldsymbol{p}_i(k+l \mid k)\right\| \geqslant \\ \left.2 R+\mu_{i j}(k+l \mid k), \forall j \in V \backslash\{i\}\right\}, \end{gathered} $

(21)

$ \begin{gathered} \left\|\hat{\boldsymbol{p}}_j(k+l \mid k)-\boldsymbol{p}_i(k+l \mid k)\right\| \leqslant \\ C-\mu_{i j}(k+l \mid k), \forall j \in N_i 。\end{gathered} $

(22)

代价函数的编队保持项中，由于假设状态与真实状态存在偏差，为保证编队系统能按照一定的速度收敛，通过施加辅助状态相容性约束对偏差进行限制。首先，选取标量γ∈(0, 1)表示第i个海洋浮体的真实状态收敛到假设状态的收敛速度，则状态相容性约束：

$ \left\|\hat{\boldsymbol{x}}_i(k+l \mid k)-\overline{\boldsymbol{x}}_i(k+l \mid k)\right\|_{\boldsymbol{G}} \leqslant \eta_i(k), $

(23)

$ \eta_i(k)=\frac{\sqrt{b_i^2-4 a_i c_i}-b_i}{2 a_i}。$

(24)

式中：$ \alpha_i=\sum\limits_{j \in N_i}(1+2 \beta) ; b_i=\sum\limits_{j \in N_i} 2 \varphi(k) \sqrt{\beta_{j i}} ; c_i=$$ -\frac{\left(\gamma\left\|\overline{\boldsymbol{x}}_{i, \mathrm{r}}(k \mid k)\right\|_{\underline{\boldsymbol{Q}}}^2\right)}{(H-1)} ; \beta_{j i}=1 ; \varphi_{i j}(k)=\max \left\{\| \hat{\boldsymbol{x}}_i(k+\right.$$ \left.l \mid k)-\hat{\boldsymbol{x}}_j(k+l \mid k)+\boldsymbol{d}_{i j}^{\prime} \|_{\boldsymbol{G}}\right\}$；为智能体(第i个浮体)与某一个邻居(第j个浮体)之间的距离和期望距离之间的最大偏差；η_i(k)为该偏差的最大允许值。

2.3 ADMM-DMPC优化问题

通过交替方向乘子法，可将优化问题(15)转换为DMPC问题来进行求解。DMPC利用基于局部信息的局部控制思想，将原本的约束优化规模比较大的问题分解到每一个子系统，变成小规模的问题，各子系统又由相应的模型预测控制器来处理优化问题。

为方便后续分布式优化问题求解，重新定义第i个海洋浮体的局部系统状态和控制输入分别为X_i={x_l，i}_{l∈{i}∪N_i}和U_i={u_l，i}_{l∈{i}∪N_i}，其中x_l，i和u_l，i分别表示邻居浮体l在控制器i中计算得到的状态和控制输入。根据浮体的动力学模型，可以得到第i个海洋浮体与邻居组成的局部子系统的动力学表达式：

$ \overline{\boldsymbol{X}}_i(k+1)=F_i\left(\overline{\boldsymbol{X}}_i(k), \boldsymbol{U}_i(k)\right) \text { 。} $

(25)

通过上述的问题分析可以得知每个局部控制器都依赖一个由其自身和相邻控制器的假定控制输入组成的控制序列。但是在分布式控制中，不同的控制器的假定控制序列与实际控制序列之间可能存在偏差，这可能会引起浮体之间的冲突。所以采用基于一致性的ADMM方法^[18-19]，用来保证不同控制器对相同的海洋浮体系统状态达成一致。首先，定义全局向量Z_i(k) ={z_j(k)^T}_{j∈N_i∪_i}^T，其中z_j(k)是海洋浮体j在其邻居中预测状态的平均值。然后，每个控制器引入等式约束X_i=Z_i，由于Z_i和Z_j共享相同的分量z_i(k)，所以第i个海洋浮体及其邻居(第j个海洋浮体)之间可以达成一致性。因此，每个浮体的代价函数(式(13))可以改写为

$ \begin{gathered} J_i\left(k, \overline{\boldsymbol{X}}_i, \boldsymbol{X}_{\mathrm{r}}, \boldsymbol{U}_i, \boldsymbol{U}_{\mathrm{r}}\right)= \\ \sum\limits_{l=1}^{H-1}\left(\left\|\overline{\boldsymbol{X}}_{i, \mathrm{r}}(k+l \mid k)\right\|_{\boldsymbol{Q}_i}^2+\left\|\boldsymbol{U}_{i, \mathrm{r}}(k+l-1 \mid k)\right\|_{S_i}^2+\right. \\ \left.\sum\limits_{j \in N_i}\left\|\hat{\boldsymbol{X}}_{i j}(k+l \mid k)\right\|_{\boldsymbol{G}_i}^2\right)+ \\ \left\|\overline{\boldsymbol{X}}_{i, \mathrm{r}}(k+H \mid k)\right\|_{\boldsymbol{P}_i}^2 \end{gathered} $

(26)

式中：X_r和U_r分别为参考状态和参考控制输入，且X_r=F_{d_i}⊗x_r，U_r=F_{d_i}⊗u_r，其中F_{d_i}是一个大小为d_i的所有元素为1的列向量，d_i=|N_i|+1，|N_i|是第i个海洋浮体的邻居个数。X_{i, r}=X_i-X_r，U_i，r=U_i-U_r，$ \hat{\boldsymbol{X}}_{ij}$为代价函数(式(13))中x_ij组成的向量。各权重矩阵为Q_i=L_i⊗Q，S_i=L_i⊗S，G_i=L_i⊗G，P_i=L_i⊗P，L_i=diag(n－1, 1, 1, ……, 1)。所以，代价函数(式(26))可以转化为

$ \begin{gathered} \bar{J}_i(k)=J_i(k)+\sum\limits_{l=1}^H\left(\boldsymbol { \lambda } _ { i } ^ { \mathrm { T } } \left(\overline{\boldsymbol{X}}_i(k+l \mid k)-\right.\right. \\ \left.\left.\boldsymbol{Z}_i(k+l)\right)+\frac{\rho_i}{2}\left\|\overline{\boldsymbol{X}}_i(k+l \mid k)-\boldsymbol{Z}_i(k+l)\right\|^2\right)。\end{gathered} $

(27)

式中：λ_i为拉格朗日乘子。(27)式中的第三项为偏差惩罚项，惩罚参数为ρ_i>0。

基于增广的成本函数，可以将分布式控制器关于第i个海洋浮体及其邻居N_i组成的局部编队控制问题描述为如下优化问题，且该优化问题可由如下ADMM-DMPC算法求解。

$ \begin{aligned} & \min _{U_i} \bar{J}_i(k)=\min _{U_i} J_i(k)+\sum\limits_{l=1}^H\left(\boldsymbol { \lambda } _ { i } ^ { \mathrm { T } } \left(\overline{\boldsymbol{X}}_i(k+l \mid k)-\right.\right. \\ & \left.\left.\boldsymbol{Z}_i(k+l)\right)+\frac{\rho_i}{2}\left\|\overline{\boldsymbol{X}}_i(k+l \mid k)-\boldsymbol{Z}_i(k+l)\right\|^2\right)。\end{aligned} $

(28)

$ \begin{aligned} & \text { s.t. } \overline{\boldsymbol{x}}_i(k \mid k)=x_i(k) ; \\ & \quad \overline{\boldsymbol{X}}_i(k+l+1 \mid k)=F_i\left(\overline{\boldsymbol{X}}_i(k+l \mid k), \boldsymbol{U}_i(k+l \mid k)\right) ; \\ & \quad\left\|\overline{\boldsymbol{x}}_i(k+l \mid k)\right\| \leqslant\left(1-(l / H) \zeta_i\right) c_i ; \| \overline{\boldsymbol{x}}_j(k+ \\ & l \mid k) \| \leqslant\left(1-(l / H) \zeta_j\right) c_j ; \\ & \quad \boldsymbol{u}_i(k+l-1 \mid k) \in U ; \boldsymbol{u}_j(k+l-1 \mid k) \in U ; \\ & \quad\left\|\hat{\boldsymbol{p}}_j(k+l \mid k)-\boldsymbol{p}_i(k+l \mid k)\right\| \geqslant 2 R+\mu_{i j}(k+ \\ & l \mid k) ; \\ & \quad\left\|\hat{\boldsymbol{p}}_j(k+l \mid k)-\boldsymbol{p}_i(k+l \mid k)\right\| \leqslant C-\mu_{i j}(k+\\ &l \mid k) ; \\ & \quad\left\|\boldsymbol{p}_o-\boldsymbol{p}_i(k+l \mid k)\right\| \geqslant R+R_o, \forall o \in N_o, k \geqslant \\ 0 ; \\ &\quad \left\|\hat{\boldsymbol{x}}_i(k+l \mid k)-\overline{\boldsymbol{x}}_i(k+l \mid k)\right\|_G \leqslant \eta_i(k) ; \\ & \quad\left\|\hat{\boldsymbol{p}}_i(k+l \mid k)-\boldsymbol{p}_i(k+l \mid k)\right\| \leqslant \mu_i(k+l \mid k) ; \\ & \quad\left\|\overline{\boldsymbol{x}}_i(k+H \mid k)\right\|_{\boldsymbol{P}} \leqslant \xi_i \varepsilon_i ;\left\|\overline{\boldsymbol{x}}_j(k+H \mid k)\right\|_{\boldsymbol{P}} \leqslant \\ &\xi_j \varepsilon_j ; j \in N_i, l \in[1, H]。\end{aligned} $

迭代式ADMM-DMPC算法依赖于以下关键参数的更新：

$ \left\{\begin{array}{l} \overline{\boldsymbol{X}}_i^{(n+1)}=P_i\left(\overline{\boldsymbol{X}}_i, U_i^{(n)}, Z_i^{(n)}{ }_i, \boldsymbol{\lambda}_i^{(n)}\right) \\ \boldsymbol{Z}_i^{(n+1)}=\frac{1}{\left|N_i\right|+1} \sum\limits_{j \in N_i \cup\{i\}} \overline{\boldsymbol{x}}_{i j}^{(n+1)} \\ \boldsymbol{\lambda}_i^{(n+1)}=\boldsymbol{\lambda}_i^{(n)}+\rho\left(\overline{\boldsymbol{X}}_i^{(n+1)}-\boldsymbol{Z}_i^{(n+1)}\right) \end{array} 。\right. $

(29)

式中：上标表示ADMM的迭代次数，每一次迭代都应该包含优化问题(式(28))的ADMM参数更新和优化求解。

考虑到ADMM-DMPC算法在实际应用中较难实现，可能需要花费无限长的时间来实现一致性，所以通过将一致性条件替换为在有限ADMM迭代次数内较容易实现的有界残差‖x_j(k)－z_j(k)‖≤ε, j∈N_i∪{i}。

ADMM-DMPC算法：

(1) 离线阶段：

给定预测时域H，给定每个智能浮体的权值矩阵Q_i、S_i和G_i以及安全半径，并求解终端域Ω_i，反馈增益K_i和终端代价函数的权值矩阵P_i，尺度参数ξ_i和ζ_i。

(2) 初始化：

x_i∈V(k)=0，定义预测状态初始值x_i(k|k)和假设状态$ \hat{\boldsymbol{x}}_i(k \mid k)$，计算获得$ \hat{\boldsymbol{x}}_i(k+l \mid k)$；

接收邻居浮体假设状态$ \hat{\boldsymbol{x}}_j(k+l \mid k)$；

计算相容性约束参数η_i(k)，μ_i(k+l|k)，μ_ij(k+l|k)；

求解优化问题(28)获得u_i^*(k)，取出首项作为当前控制输入。

(3) 在线阶段：

While k < K，K为仿真时间；

For i∈V，

初始化λ_i=0，Z_i=0；

接收第个海洋浮体邻居假设状态$ \hat{\boldsymbol{x}}_j(k+l \mid k)$；

Repeat

求解优化问题(28)，得到U_i^*和$ \overline{\boldsymbol{X}}_i^*$；

与邻居j∈N_i交换数据x_ji^*；

根据ADMM优化算法迭代式(29)以更新(λ_i, Z_i)；

Until满足条件‖x_j(k)－z_j(k)‖≤ε, j∈N_i∪{i}。

得到最优的预测控制输入序列u_i^*，并将首项应用于第i个海洋浮体中。

End

k←k+1

End

2.4 算法可行性与稳定性

本节主要给出ADMM-DMPC算法的可行性与稳定性证明，首先提出以下假设和引理，这些假设和引理将用于证明主要理论结果。

假设3：对于海洋浮体控制系统(式(6))，如下Lipschitz条件对x_i∈X，n_i∈X和u_ik∈U均成立：

$ \left\|f_i\left(\boldsymbol{x}_i, \boldsymbol{u}_i\right)-f_i\left(\boldsymbol{n}_i, \boldsymbol{u}_i\right)\right\| \leqslant L_{f_i}\left(\left\|\boldsymbol{x}_i-\boldsymbol{n}_i\right\|\right) 。$

(30)

式中：L_{f_i}为Lipschitz常数，且L_{f_i}>0。

假设4：对于标称系统(式(7))，若假设2成立，定义Q^*$ \triangleq$Q+K_i^TSK_i。定义二次型函数V_i(x_i)=$ \overline{\boldsymbol{x}}_i^T \boldsymbol{P}\overline{\boldsymbol{x}}_i$且满足

$ V_i\left(\overline{\boldsymbol{x}}_i(k+1)\right)-V_i\left(\overline{\boldsymbol{x}}_i(k)\right) \leqslant-\left\|\overline{\boldsymbol{x}}_i(k)\right\|_{Q^*}^2 。$

(31)

引理2：对于第i个海洋浮体，在相关系统中，若假设2和假设3成立，且优化问题(式(28))在k时刻有可行解，则

$ \left\|\overline{\boldsymbol{x}}_i(k+l \mid k+1)-\overline{\boldsymbol{x}}_i^*(k+l \mid k)\right\| \leqslant L_{f_i}^{(l-1)} \omega 。$

(32)

证明：在k时刻，最优输入序列记为U_i^*(k)，最优状态序列记为$ \overline{\boldsymbol{X}}_i^*(k)$。最优状态与实际状态之差的上界可以推导如下：

$ \begin{gathered} \left\|\overline{\boldsymbol{x}}_i^*(k+l \mid k+l-1)-\boldsymbol{x}_i(k+l)\right\|= \\ \| f_i\left(\overline{\boldsymbol{x}}_i^*(k+l-1 \mid k+l-1), \boldsymbol{u}_i(k+l-1)\right)- \\ f_i\left(\boldsymbol{x}_i(k+l-1), \boldsymbol{u}_i(k+l-1)\right)- \\ \boldsymbol{w}_i(k+l-1) \| \leqslant \omega 。\end{gathered} $

(33)

根据式(32)和(33)，标称状态和最优状态序列之间的误差可以推导如下：

$ \begin{gathered} \left\|\overline{\boldsymbol{x}}_i(k+l \mid k+1)-\overline{\boldsymbol{x}}_i^*(k+l \mid k)\right\|= \\ \| f_i\left(\overline{\boldsymbol{x}}_i(k+l-1 \mid k+1), \boldsymbol{u}_i(k+l-1 \mid k+1)\right)- \\ f_i\left(\overline{\boldsymbol{x}}_i^*(k+l-1 \mid k), \boldsymbol{u}_i^*(k+l-1 \mid k)\right) \| \leqslant \\ L_{f_i}\left\|\overline{\boldsymbol{x}}_i(k+l-1 \mid k+1)-\overline{\boldsymbol{x}}_i^*(k+l-1 \mid k)\right\| \leqslant \\ L_{f_i}^{(l-1)}\left\|\overline{\boldsymbol{x}}_i(k+1 \mid k+1)-\overline{\boldsymbol{x}}_i^*(k+1 \mid k)\right\|= \\ L_{f_i}^{(l-1)}\left\|\boldsymbol{x}_i(k+1)-\overline{\boldsymbol{x}}_i^*(k+1 \mid k)\right\| \leqslant L_{f_i}^{(l-1)} \omega 。\end{gathered} $

(34)

证毕。

在k时刻，若ADMM-DMPC算法中优化问题是可行的，则存在一个最优控制输入u_i^* (k + l-1|k)和相应的最优状态$ \overline{\boldsymbol{x}}_i^*$ (k + l|k)，其中l∈[1, H]。假设通过求解优化问题得到控制输入u_i^* (k|k)，则可知第i个海洋浮体在k+1时刻的状态为$ \overline{\boldsymbol{x}}_i^*$ (k + 1|k)。

基于上述讨论，在k时刻，选取优化问题(28)的可行解U_i^*(k)={u_im^*(k|k), ……, u_im^*(k+H－1|k)}_{m∈{i}∪N_i}以及预测状态$ \overline{\boldsymbol{X}}_i^*(k)=\left\{\overline{\boldsymbol{x}}_{i m}^*(k+1 \mid k)\right.$$ \left.\cdots \cdots, \overline{\boldsymbol{x}}_{i m}^*(k+H \mid k)\right\}_{m \in\{i\} \cup N_i}$，其中x_ii写作x_i。显然，两者满足求解问题所述的各项约束。

在k+1时刻，基于k时刻的可行解可以构造如下控制输入序列：

$ \begin{gathered} \boldsymbol{U}_i(k+1)= \\ \left\{\boldsymbol{u}_{i m}(k+1 \mid k+1), \cdots \cdots, \boldsymbol{u}_{i m}(k+H \mid k+1)\right\} \triangleq\\ \left\{\boldsymbol{u}_{i m}^*(k+2 \mid k), \cdots \cdots, \boldsymbol{u}_{i m}^*(k+H-1 \mid k), \right. \\ \left.\boldsymbol{u}_{i m, \kappa}(k+H \mid k)\right\}, \end{gathered} $

(35)

以及相应的状态轨迹：

$ \begin{gathered} \overline{\boldsymbol{X}}_i(k+1)= \\ \left\{\overline{\boldsymbol{x}}_{i m}(k+2 \mid k+1), \cdots \cdots, \overline{\boldsymbol{x}}_{i m}(k+H+1 \mid k+1)\right\} \\ \left\{\overline{\boldsymbol{x}}_{i m}^*(k+2 \mid k), \cdots \cdots, \overline{\boldsymbol{x}}_{i m}^*(k+H \mid k), \right. \\ \left.\overline{\boldsymbol{x}}_{i m, \kappa}(k+H+1 \mid k)\right\}。\end{gathered} $

(36)

定理1：对于第i个海洋浮体，若假设2、假设3和假设4都成立，且在k时刻各控制器整定参数满足式(36)和(37)，可重构浮体系统(式(3))的编队中所有个体按照ADMM-DMPC算法同步求解各自优化问题(式(28))。如果在k时刻，每个控制器都存在一个可行解，则在后续时刻，优化问题(式(28))都是可行的，同时，闭环多浮体编队系统是渐近稳定的。

$ \frac{\lambda_{\max }\left(\boldsymbol{P}^{\frac{1}{2}}\right)}{\lambda_{\max }\left(\boldsymbol{P}^{\frac{1}{2}}\right)+\lambda_{\min }\left(\boldsymbol{Q}^{* \frac{1}{2}}\right)} \leqslant \xi_i \leqslant 1-\frac{\omega \lambda_{\max }\left(\boldsymbol{P}^{\frac{1}{2}}\right) L_{f_i}^{H-1}}{\epsilon_i} $

(37)

$ \zeta_i \geqslant H \omega L_{f_i}^{H-1} / c_i $

(38)

对于相容性约束，有如下结论：

$ \begin{gathered} \left\|\hat{\boldsymbol{x}}_i(k+1+l \mid k+1)-\overline{\boldsymbol{x}}_i(k+1+l \mid k+1)\right\|= \\ \left\|\overline{\boldsymbol{x}}_i^*(k+1+l \mid k)-\overline{\boldsymbol{x}}_i^*(k+1+l \mid k)\right\|=0 。\end{gathered} $

(39)

在k+1时刻，应用式(32)，则有

$ \begin{array}{c} \left\|\overline{\boldsymbol{x}}_i(k+H \mid k+1)-\overline{\boldsymbol{x}}_i^*(k+H \mid k)\right\|_{\boldsymbol{P}} \leqslant\\ \lambda_{\max }\left(\boldsymbol{P}^{\frac{1}{2}}\right) L_{f_i}^{H-1} \omega 。\end{array} $

(40)

通过时刻k的紧终端约束$ \left\|\overline{\boldsymbol{x}}_i^*(k+H \mid k)\right\|_{\boldsymbol{P}} \leqslant$≤ξ_iε_i，结合三角不等式，可以推导出：

$ \begin{gathered} \left\|\overline{\boldsymbol{x}}_i(k+H \mid k+1)-\overline{\boldsymbol{x}}_i^*(k+H \mid k)\right\|_{\boldsymbol{P}}+ \\ \left\|\overline{\boldsymbol{x}}_i^*(k+H \mid k)\right\|_{\boldsymbol{P}} \leqslant \lambda_{\max }\left(\boldsymbol{P}^{\frac{1}{2}}\right) L_{f_i}^{H-1} \omega+\xi_i \varepsilon_i 。\end{gathered} $

(41)

由于ξ_i满足式(36)，则有

$ \lambda_{\max }\left(\boldsymbol{P}^{\frac{1}{2}}\right) L_{f_i}^{H-1} \omega+\xi_i \varepsilon_i \leqslant \varepsilon_i \text { 。} $

(42)

则可得k+H时刻的预测状态满足终端约束。

根据所构造的控制输入序列，根据假设4，有

$ \begin{gathered} \left\|\overline{\boldsymbol{x}}_i(k+H+1 \mid k+1)\right\|_{\boldsymbol{P}} \leqslant \\ \left\|\overline{\boldsymbol{x}}_i(k+H \mid k+1)\right\|_{\boldsymbol{P}}-\left\|\overline{\boldsymbol{x}}_i(k+H \mid k+1)\right\|_{Q^*} 。\end{gathered} $

(43)

当ξ_i满足式(36)时，下面的不等式成立：

$ \begin{gathered} \max \left\{\left\|\overline{\boldsymbol{x}}_i(k+H \mid k+1)\right\|_{\boldsymbol{P}}-\right. \\ \left.\left\|\overline{\boldsymbol{x}}_i(k+H \mid k+1)\right\|_{Q^*}\right\} \leqslant \xi_i \varepsilon_i 。\end{gathered} $

(44)

则可得k+H+1时刻的预测状态满足紧状态终端约束。

最后，在k+1时刻，通过式(32)，可以得到

$ \left\|\overline{\boldsymbol{x}}_i(k+l \mid k+1)\right\| \leqslant\left\|\overline{\boldsymbol{x}}_i^*(k+l \mid k)\right\|+L_{f_i}^{l-1} \omega 。$

(45)

由于ζ_i满足式(37)，故下面的不等式成立：

$ \begin{gathered} \left\|\overline{\boldsymbol{x}}_i(k+l \mid k+1)\right\| \leqslant \\ \left\|\overline{\boldsymbol{x}}_i^*(k+l \mid k)\right\|+L_{f_i^{l-1}} \omega \leqslant\left(1-\frac{l-1}{H} \zeta_i\right) c_i 。\end{gathered} $

(46)

从而预测状态满足紧状态约束。

将k时刻所有浮体最优代价之和作为Lyapunov函数：

$ J_{\Sigma}^*(k)=\sum\limits_{i \in V} J_i^*\left(k, \overline{\boldsymbol{x}}_i^*, \hat{\boldsymbol{x}}_{-i}, \boldsymbol{x}_{\mathrm{r}}, \boldsymbol{u}_i^*, \boldsymbol{u}_{\mathrm{r}}\right) 。$

(47)

根据上述可行性证明的结论，k+1时刻的所有浮体最优代价函数之和为

$ J_{\Sigma}^*(k+1)=\sum\limits_{i \in V} J_i\left(k+1, \overline{\boldsymbol{x}}_i, \hat{\boldsymbol{x}}_{-i}, \boldsymbol{x}_{\mathrm{r}}, \boldsymbol{u}_i, \boldsymbol{u}_{\mathrm{r}}\right) 。$

(48)

比较式(46)和(47)，可得

$ \begin{gathered} J_{\Sigma}^*(k+1)-J_{\Sigma}^*(k) \leqslant J_{\Sigma}(k+1)-J_{\Sigma}^*(k) \leqslant \\ \sum\limits_{i \in V}\left[(\gamma-1)\left\|\overline{\boldsymbol{x}}_{i, \mathrm{r}}^*(k \mid k)\right\| \stackrel{2}{{\boldsymbol{Q}}}\right]。\end{gathered} $

(49)

则

$ J_{\Sigma}(k+1) \leqslant J_{\Sigma}^*(k)+\sum\limits_{i \in V}\left[(\gamma-1)\left\|\bar{x}_{i, \mathrm{r}}^*(k \mid k)\right\|_Q^2\right] 。$

(50)

又因0 < γ < 1，显然J_Σ(k+1)有界。

综上，构造的可行解U_i(k+1)和X_i(k+1)满足k+1时刻优化问题(28)的约束，所以优化问题可行。由于J_Σ^*(k+1)－J_Σ^*(k)≤0，故J_Σ^*(k)作为Lyapunov函数是单调递减的，能够保证编队系统是渐近稳定的。证毕。

3 仿真分析

本次仿真中，考虑了可重构浮体编队系统V={1, 2, ……, 6}在DMPC作用下形成六边形队形的情况。

海洋浮体如图 3所示。每个浮体实际的速度状态约束为$ \bar{u}_i=\bar{v}_i=\bar{r}_i=$0.5，每个浮体实际的控制约束的最值$ \bar{\tau}_{u_i}=\bar{\tau}_{v_i}=\bar{\tau}_{r_i}=2$，每个浮体的安全半径R=1.5，浮体之间的最大通信范围C=12，6个浮体的邻居集分别为N₁={2, 3}、N₂={1, 4}、N₃={1, 5}、N₄={2, 6}、N₅={3}和N₆={4}。6个浮体的实际参数M₁₁=11.89，M₂₂=－10.32，M₃₃=17.7，D₁₁=18.640 3，D₂₂=41.066，D₃₃=2.806。在满足避碰约束的条件下，6个浮体初始位置是在原点(0, 0)周围随机选取的，静态障碍物位置p_o=(20, 20)。根据控制算法设计，控制参数整定如下：代价函数权重矩阵为G=diag(1, 1, 1, 0.1, 0.1, 0.1)，S=diag(1, 1, 1)，Q=diag(20, 20, 20, 2, 2, 2)。

( (a)海洋浮体实物图Actual picture of marine floating body；(b)海洋浮体的通信、控制模块配置方案Configuration program for communication and control modules for a marine floating body. ) 图 3 海洋浮体物理信息及通信、控制方案 Fig. 3 Physical information, communication protocols and control modules for a marine floating body

根据六边形编队要求，设置6个浮体与虚拟领航浮体的期望相对位置d_1v=(-5.7, 5.7)^T，d_2v=(-7, -3.8)^T，d_3v=(0, 8)^T，d_4v=(0, －8)^T，d_5v=(7, 3.8)^T，d_6v=(5.7, -5.7)^T。ADMM-DMPC算法中，迭代停止条件定义为达到10次迭代或满足‖x_i－z_i‖≤ε=0.1。

图 4为编队跟踪的各浮体运动轨迹图，其中的红点标识了障碍物的具体位置。通过分析可知，从初始状态出发后，各浮体均能有效地规避同其他浮体以及障碍物的潜在碰撞，同时准确地追踪期望的预设轨迹。图 5的编队相对距离演化描述了第1个浮体与其他各浮体之间的相对距离，其中红色虚线代表浮体之间的最小距离。图 6展示了在编队形成和保持的过程中每个浮体与静态障碍物之间的相对距离，其中红色虚线代表浮体与障碍物间的最小距离。

图 4 海洋浮体编队的运动轨迹演化 Fig. 4 Evolution of marine floating bodies' formation trajectory

图 5 各海洋浮体与海洋浮体1之间的距离演化 Fig. 5 Time evolution of the distances between marine floating body 1 and others

图 6 各海洋浮体与障碍物之间的距离演化 Fig. 6 Time evolution of the distance between each marine floating body and the obstacle

图 7和8分别展示了系统编队控制过程中，每个浮体控制输入的力与速度状态的时间演化情况。可以看出，输入与速度都在所设置的约束范围内。仿真结果表明，ADMM-DMPC算法能够满足多浮体系统编队的实际约束要求。此外，通过其他编队构型的仿真实验(例如直线形或梯形编队)发现，6个浮体能够在满足约束的同时，有效地规避了与其他浮体及障碍物的碰撞，还追踪了预定轨迹，从而形成预期的队形配置。

图 7 各海洋浮体的控制输入 Fig. 7 Control inputs for each marine floating body

图 8 各海洋浮体的速度 Fig. 8 Speed of each marine floating body

设置不同的停止准则ε∈{0.01, 0.05, 0.1, 1}，则ADMM-DMPC法偏差函数定义为

$ v(k)=\frac{1}{N_v} \sum\limits_{i \in V} \sum\limits_{j \in {\bf{N}}_i}\left|\boldsymbol{p}_{i j}-\boldsymbol{p}_{i j, v}\right| \text { 。} $

(51)

如图 9所示，多浮体系统能够在运动中保持队形，ε越小，v(k)也越小，其中p_ij是第i个浮体与其邻居之间的距离，p_{ij, v}是队形中第i个浮体应该与其邻居之间保持的距离。当ε=1时，在仿真中没有进行更多的迭代，可以近似为普通的DMPC法，由此可以看出ADMM-DMPC法优于普通DMPC法。然而，为在更严格的停止准则下获得结果，需要更多的ADMM迭代，这将消耗更多的计算和通信资源。

图 9 在不同迭代停止准则ε下的偏差函数v(k)变化 Fig. 9 Dependence of deviation function v(k) on different thresholds of ε

4 结论

(1) 针对复杂约束下的可重构海洋浮体编队控制问题，本文提出了基于虚拟领航者的鲁棒分布式模型预测控制(Robust-DMPC)框架，可以将避碰、避障和通信约束及由复杂海洋环境导致的状态和输入物理限制统一整合为邻近网络优化问题。基于此，构建了多海洋浮体协同控制的系统性架构，该构架能够有效保持编队队形并精确跟踪期望轨迹。

(2) 可重构海洋浮体编队协同控制通常涉及复杂的优化问题求解，结合交替方向乘子法(ADMM)与一致性原则，可将此类复杂问题转化为较小规模的分布式优化问题求解，同时引入的约束收紧机制增强了控制系统的鲁棒性。其中，迭代停止阈值是算法的关键参数，选取合适的数值能在计算复杂度和控制精度之间实现平衡。

(3) 理论分析保证了ADMM-DMPC算法的可行性及闭环系统稳定性，为该算法在实际工程中的应用提供了理论支撑。数值仿真结果表明，与传统DMPC算法相比，ADMM-DMPC算法的队形误差有明显的降低，计算开销显著减少。这两方面的优势验证了该算法在动态海洋环境中处理复杂约束下编队控制的适用性。

当前研究以仿真验证为主，后续计划通过硬件在环实验与真实海洋场景中的测试，进一步验证算法的工程实用性。同时，将重点探索自适应约束处理策略及通信延迟鲁棒性优化方法，以提升算法在复杂环境下的适应能力。本研究为海洋工程中多浮体协同控制技术的理论发展与工程化落地提供了方法论基础。

参考文献

[1]	Wang W, Shan T, Leoni P, et al. Roboat Ⅱ: A novel autonomous surface vessel for urban environments[C]//Institute of Electrical and Electronics Engineers. 2020 IEEE/RSJ International Conference on Intelligent Robots and Systems. Las Vegas, NV: Institute of Electrical and Electronics Engineers, 2020: 1740-1747. (0)
[2]	Wang J, Hu X. Distributed consensus in multi-vehicle cooperative control: Theory and applications[J]. IEEE Control Systems Magazine, 2010, 30(3): 85-86. DOI:10.1109/MCS.2010.936430 (0)
[3]	毛宇豪. 考虑避碰的多智能体系统包含控制及航行器应用[D]. 大连: 大连海事大学, 2022. Mao Y H. The Containment Control of Multi-Agent Systems with Collision Avoidance and the Applications of Unmanned Surface Vessels[D]. Dalian: Dalian Maritime University, 2022. (0)
[4]	Tan G, Zhuang J, Zou J, et al. Coordination control for multiple unmanned surface vehicles using hybrid behavior-based method[J]. Ocean Engineering, 2021, 232: 109147. (0)
[5]	Yan X, Jiang D, Miao R, et al. Formation control and obstacle avoidance algorithm of a multi-USV system based on virtual structure and artificial potential field[J]. Journal of Marine Science and Engineering, 2021, 9(2): 161. DOI:10.3390/jmse9020161 (0)
[6]	Pan W W, Jiang D P, Pang Y J, et al. A multi-AUV formation algorithm combining artificial potential field and virtual structure[J]. Acta Armamentaria, 2017, 38(2): 326-334. (0)
[7]	Cui R, Ge S S, How B V E, et al. Leader-follower formation control of underactuated autonomous underwater vehicles[J]. Ocean Engineering, 2010, 37(17-18): 1491-1502. DOI:10.1016/j.oceaneng.2010.07.006 (0)
[8]	Wang X, Yu Y, Li Z. Distributed sliding mode control for leader-follower formation flight of fixed-wing unmanned aerial vehicles subject to velocity constraints[J]. International Journal of Robust and Nonlinear Control, 2021, 31(6): 2110-2125. DOI:10.1002/rnc.5030 (0)
[9]	Wen G, Lam J, Fu J, et al. Distributed MPC-based robust collision avoidance formation navigation of constrained multiple USVs[J]. IEEE Transactions on Intelligent Vehicles, 2023, 9(1): 1804-1816. (0)
[10]	郑毅, 李少远. 网络信息模式下分布式系统协调预测控制[J]. 自动化学报, 2013, 39(11): 1778-1786. Zheng Y, Li S Y. Networked cooperative distributed model predictive control for dynamic coupling systems[J]. IEEE/CAA Journal of Automatica Sinica, 2013, 39(11): 1778-1786. (0)
[11]	戴邵武, 赵超轮, 李飞, 等. 一种多约束下无人机编队的模型预测控制算法[J]. 控制与决策, 2023, 38(3): 706-714. Dai S W, Zhao C L, Li F, et al. An algorithm of model predictive control for formation control of a multi-UAV system considering multiple constraints[J]. Control and Decision, 2023, 38(3): 706-714. (0)
[12]	Wang P, Ding B. A synthesis approach of distributed model predictive control for homogeneous multi-agent system with collision avoidance[J]. International Journal of Control, 2014, 87(1): 52-63. DOI:10.1080/00207179.2013.822100 (0)
[13]	Lv G, Peng Z, Wang H, et al. Extended-state-observer-based distributed model predictive formation control of under-actuated unmanned surface vehicles with collision avoidance[J]. Ocean Engineering, 2021, 238: 109587. DOI:10.1016/j.oceaneng.2021.109587 (0)
[14]	Boyd S, Parikh N, Chu E, et al. Distributed optimization and statistical learning via the alternating direction method of multipliers[J]. Foundations and Trends in Machine learning, 2011, 3(1): 1-122. (0)
[15]	Lyu Y, Hu J, Chen B M, et al. Multivehicle flocking with collision avoidance via distributed model predictive control[J]. IEEE Transactions on Cybernetics, 2019, 51(5): 2651-2662. (0)
[16]	席裕庚. 预测控制[M]. 北京: 国防工业出版社, 2013: 191-213. Xi Y G. Predictive Control[M]. Beijing: National Defense Industry Press, 2013: 191-213. (0)
[17]	Dai Y, Li M, Zhang K, et al. Robust and resilient distributed MPC for cyber-physical systems against DoS attacks[J]. IEEE Transactions on Industrial Cyber-Physical Systems, 2023, 1: 44-55. DOI:10.1109/TICPS.2023.3283229 (0)
[18]	Summers T H, Lygeros J. Distributed model predictive consensus via the alternating direction method of multipliers[C]//Institute of Electrical and Electronics Engineers. 2012 50th Annual Allerton Conference on Communication, Control, and Computing. Monticello, IL: Institute of Electrical and Electronics Engineers, 2012: 79-84. (0)
[19]	Huang K, Sidiropoulos N D. Consensus-ADMM for general quadratically constrained quadratic programming[J]. IEEE Transactions on Signal Processing, 2016, 64(20): 5297-5310. (0)

Distributed Model Predictive Control Strategy for Reconfigurable Marine Floating Body with Complex Constraints

Fu Dongfei , Chen Gongxun , Wang Jilong , Gao Xuhui

College of Engineering, Ocean University of China, Qingdao 266404, China

Supported by the Natural Science Foundation of Shandong Province(ZR2022MF280)

Abstract: To address the complex constraints in formation control of reconfigurable marine floating bodies, including collision avoidance, communication limitations, and obstacle evasion, this paper proposes a robust distributed model predictive control (DMPC) strategy. By integrating collision avoidance, communication range constraints, obstacle posed restrictions, and state/input limitations into a neighboring network optimization framework, a cooperative control scheme for multiple floating body systems is established. Combining the alternating direction method of multipliers (ADMM) with local controller consensus protocols, a distributed predictive controller based on a virtual leader is designed. Compatibility constraints and a robust compensation mechanism are introduced, and subsequent theoretical analysis demonstrates the recursive feasibility of the algorithm and the asymptotic stability of the closed-loop system. Simulation results indicate that the proposed method achieves effective trajectory tracking and formation maintenance under complex constraints, while significantly reducing computational complexity compared to traditional DMPC approaches. This study provides a robust and computationally efficient solution for multi-floating-body cooperative control in dynamic marine environments.

Key words: cooperative formation control distributed optimization model predictive control reconfigurable marine floating body alternating direction method of multipliers