基于航迹预测的着舰指挥决策算法

引用本文

张雯, 张强. 基于航迹预测的着舰指挥决策算法[J]. 哈尔滨工程大学学报, 2019, 40(1): 181-188. DOI: 10.11990/jheu.201711018.

ZHANG Wen, ZHANG Qiang. Carrier landing command decision-making algorithm based on trajectory prediction[J]. Journal of Harbin Engineering University, 2019, 40(1): 181-188. DOI: 10.11990/jheu.201711018.

基金项目

国家自然科学基金项目（61603110）；中央高校基本科研业务专项资金项目（HEUCFM170401）

通信作者

张强, E-mail:zhangqiang103@hrbeu.edu.cn

作者简介

张雯, 女, 讲师, 博士;
张强, 男, 讲师, 博士

文章历史

收稿日期：2017-11-07
网络出版日期：2018-07-10

Contents Abstract Full text Figures/Tables PDF

基于航迹预测的着舰指挥决策算法

张雯 ¹, 张强 ²

1. 哈尔滨工程大学自动化学院, 黑龙江哈尔滨 150001;
2. 哈尔滨工程大学水下机器人技术重点实验室, 黑龙江哈尔滨 150001

收稿日期：2017-11-07；网络出版日期：2018-07-10

基金项目：国家自然科学基金项目（61603110）；中央高校基本科研业务专项资金项目（HEUCFM170401）

作者简介：张雯, 女, 讲师, 博士;
张强, 男, 讲师, 博士.

通信作者：张强, E-mail:zhangqiang103@hrbeu.edu.cn.

摘要：为提高着舰指挥决策的准确度，本文以预测的着舰航迹为决指挥策依据，提出了基于航迹预测的着舰指挥决策算法。该算法分为航迹预测和指挥决策两个模型，两个模型以历史着舰数据为训练样本，分别基于径向基函数RBF网络和属性相关贝叶斯算法建立，并针对着舰航迹的阶段特性，提出了基于RBF网络集成的着舰航迹预测模型。与常规算法的对比仿真实验表明：基于RBF网络集成的着舰航迹预测模型具有更高的预测精度，基于航迹预测的着舰指挥决策算法的决策结论与着舰指挥官的决策结论基本一致，能够有效提高着舰成功率。

关键词：指挥决策着舰航迹预测预测精度决策准确度属性相关最优线性网络集成

Carrier landing command decision-making algorithm based on trajectory prediction

ZHANG Wen ¹, ZHANG Qiang ²

1. College of Automation, Harbin Engineering University, Harbin 150001 China;
2. Science and Technology on Underwater Vehicle Laboratory, Harbin Engineering University, Harbin 150001, China

Abstract: To improve the accuracy of the carrier landing command decision-making, we propose a related algorithm based on trajectory prediction algorithm (TPCLCD), which takes the predicted landing trajectory as the basis of command decision-making. TPCLCD includes the trajectory prediction model and the command decision-making model, which are derived based on radial basis function (RBF) network and attribute-related Bayesian algorithm, respectively. Aiming at the stage characteristics of carrier landing trajectory, we establish the trajectory prediction model based on RBF network ensemble to improve the accuracy of the model. Compared with the conventional algorithm, the simulation results show that the carrier landing trajectory prediction model based on the RBF network ensemble has higher prediction accuracy. The decision result of TPCLCD is basically consistent with the landing signal commander. Hence, the proposed model can effectively improve the success rate of carrier landing.

Keywords: command decision-making carrier landing trajectory prediction prediction accuracy decision-making accuracy attribute correlation optimal linear neural network ensemble

受航母甲板摇摆运动、舰艉流场等多因素影响，舰载机着舰过程风险高、事故频发。着舰指挥官(landing signal officer，LSO)是确保舰载机安全着舰的指挥决策者，然而人工指挥对技能要求高、受主观影响大、易受能见度影响、环境适应性低^[1]。着舰指挥辅助决策系统可辅助或替代LSO着舰指挥，从根本上消除人工指挥的弊端，推进舰载机着舰指挥自主化与智能化。着舰指挥决策的本质是多属性决策问题，决策算法主要采用基于定量分析的多属性决策方法，然而这些传统的决策方法难以有效解决不确定性着舰环境下的决策问题^[2-3]。近几年来利用人工智能方法解决不确定性多属性决策问题取得了较好的效果^[4-7]，此外飞行数据记录系统带来了丰富航迹数据资源，为有监督智能算法应用于飞行决策提供了优良的基础，因此许多飞行智能决策算法应运而生^[8-10]，其中Goel等^[8]利用人工蜂群算法实现了动态环境下的着陆决策；Jia等^[9]将综合运用灰色理论和智能决策技术解决了战斗机作战能力的决策。上述飞行算法虽然一定程度上能够适应环境的不确定性，但均针对当前的飞行状态给出决策指令。决策理论指出没有预测的决策是盲目的，对未来情况的预测是正确决策的保障，只考虑当前状态的决策算法必然导致决策正确率的降低^[11-12]。在人工指挥着舰过程中，LSO也是先对舰载机的未来状态进行预判，然后根据预判再进行指挥决策的。综上所述，针对预测航迹进行着舰指挥决策是提高决策准确度的有效途径着舰指挥决策算法是着舰辅助决策系统的核心，本文考虑不确定的着舰环境，采用监督学习的方法，研究基于预测航迹的着舰决策算法(carrier landing command decision-making algorithm based on trajectory prediction，TPCLCD)。

1 着舰航迹预测模型

图 1为TPCLCD的流程图，该算法模拟LSO的指挥思维过程，将着舰指挥决策算法分为着舰航迹预测模型和着舰指挥决策模型2部分预测模型：根据舰载机的当前和之前的航迹预测未来2 s的航迹位置及其变化率；着舰指挥决策算法根据预测航迹给出决策指挥指令。与基于当前状态的指挥决策算法相比，本文的算法得到面向未来的指挥指令，为舰载机预留出了指令执行时间，使决策指令具有预先修正航迹、预防事故的作用。

	Download: JPG larger image
图 1 TPCLCD算法流程 Fig. 1 The algorithm flow of the TPCLCD

1.1 舰载机着舰航迹序列

着舰航迹预测模型以着舰航迹序列为基础，将舰载机与航母在着舰甲板中线方向上的距离称为舰机相对距离(relative distance, RD)。考虑到着舰航迹规律具有随RD变化的特性，在相同RD的条件下挖掘着舰航迹规律更有意义。为支撑这种航迹挖掘模式，本文以RD为标签，建立带有RD戳的着舰航迹序列。

定义坐标系O-xyz，其中原点O位于理想着舰点，x轴与着舰甲板中线重合指向船艏，y轴平行于海平面，与x轴垂直指向右舷，z轴垂直于海平面。在O-xyz中舰载机的x轴坐标即为RD，着舰航迹可由等差、升序的RD序列{x_j|m_RD≥j＞0}标识，其中m_RD为常值表示RD序列的长度。若用i表示航迹编号，带有RD戳的航迹点可表示为{O_{x_j, i}=(x_j，D_{x_j, i})m_RD≥j＞0}，其中D_{x_j, i}= [z_{x_j, i} y_{x_j, i}]^T，z_{x_j}ⁱy_{x_j}ⁱ分别为航迹i在x_j时的z轴和y轴坐标。令带有RD戳的航迹点序列的构成T_i=〈O_{x₁, i}, O_{x₂, i}, …, O_{x_m, i}〉，则Tⁱ即为带有RD戳的着舰航迹序列。

1.2 基于RBF网络的着舰航迹预测模型

预测点的RD戳x_j已知，预测量为航迹点在z轴和y轴坐标的坐标矢量，考虑到2个方向的航迹位置相关性较强，采用一个模型进行2个方向的航迹预测。此外, 为了避免2种数据尺度差异对模型的影响，预测输入均为归一化数据。

航迹预测点的坐标可由当前航迹位置和航迹的未来变化趋势求得，由于当前航迹位置已知，因此航迹预测的关键是航迹趋势预测。受不确定着舰环境的影响着舰航迹趋势具有较强非线性。RBF神经网络具有结构简单、收敛速度快、无局部极小等优点，尤其适合非线性系统的辨识和预测，因此本文采用RBF网络实现着舰航迹趋势的预测，建立基于RBF网络的着舰航迹预测模型(RBF network model for trajectory prediction, RBFTP)。根据上述分析，将着舰航迹预测模型分为RBF航迹趋势预测网络和预测航迹点计算2部分，模型结构如图 2所示，图 2中模型的结构、变量定义以及建模方法如下。

	Download: JPG larger image
图 2 基于RBF着舰航迹预测模型结构 Fig. 2 The structure chart of carrier landing trajectory prediction model based on RBF

1) 模型输出。

若用p表示预测航迹的编号，根据着舰决策指挥的需求，模型输出U(x_j)应由预测点的位置和位置变化率组成。设预测航迹的当前RD戳为x_j，通常舰载机的着舰速度约为70 m/s，则预测点即航迹未来2 s的RD戳应为x_j+140 m，根据着舰航迹的频率特性RD的采样间隔选为20 m，则预测点应为x_j后的第7个航迹点，预测点的RD戳为x_j+7。则U(x_j)为：

$ \mathit{\boldsymbol{U}}\left( {{x_j}} \right) = {\left[ {\begin{array}{*{20}{c}} {{z_{{x_{j + 7}},{\rm{p}}}}}&{{y_{{x_{j + 7}},{\rm{p}}}}} \end{array}} \right]^{\rm{T}}} $

(1)

式中Δz_{x_{j+7, p}}、Δy_{x_{j+7, p}}为预测点在z轴、y轴位置变化率。

2) 模型输入。

模型输入I(x_j)由当前航迹的z轴和y轴位置(z_{x_j, p}，y_{x_j, p})和RBF航迹趋势预测网络的输入I_t(x_j)组成。

3) RBF航迹趋势预测网络。

海况等级S_{l, P}和前向航迹趋势是影响未来航迹趋势的主要因素，因此RBF航迹趋势预测网络的输入包含以上两类。考虑到航迹变化趋势具有时变特性，为了更加有效地反映变化趋势的动态特性，利用原始数据的梯度信息训练RBF网络。对于一阶梯度，航迹的变化趋势可由位置的差分表示。综上所述RBF航迹趋势预测网络的输入可表示为${\mathit{\boldsymbol{I}}_{\rm{t}}}({x_j}) = {\rm{ }}{[{S_{l, {\rm{P}}}}\; \; \; \Delta {z_{{x_{j-N}}}}_{, {\rm{p}}}\; \; \ldots \; \; \Delta {z_{{x_j}, {\rm{p}}}}\; \; \Delta {y_{{x_{j-N}}}}_{, {\rm{p}}}\; \; \ldots \; \; \Delta {y_{{x_j}{\rm{, p}}}}]^{\rm{T}}}$，输出可表示为${\mathit{\boldsymbol{U}}_{\rm{t}}}({x_j}) = {\rm{ }}{[\Delta {z_{{x_{j + 1}}}}_{, p}\; \; \ldots \; \; \Delta {z_{{x_{j + 7}}}}_{, p}\; \; \Delta {y_{{x_{j + 1}}}}_{, p}\; \; \ldots \; \; \Delta {y_{{x_{j + 7}}}}_{, p}]^{\rm{T}}}$，其中$\Delta {z_{{x_{j-t}}}}_{, {\rm{p}}} = {z_{{x_{j-t}}}}_{, {\rm{p}}}-{\rm{ }}{z_{{x_{j - t - 1}}}}_{, {\rm{p}}}, \Delta {y_{{x_{j - t}}}}_{, {\rm{p}}} = {\rm{ }}{y_{{x_{j - t}}}}_{, {\rm{p}}} - {y_{{x_{j - t - 1}}}}_{, {\rm{p}}}$ (t=-7，…，-1，0，1，…，N)分别表示z轴和y轴的位置差分即位置变化率。N为网络输入数据的长度，N的选择需要适中，N太小不能反映系统的动态性能，达不到辨识精度要求；而N太大会使输入数据量过大，令网络对动态变化反应迟钝。

定义D_{q, i}=(T_i, S_{l, i})为航次i的着舰航迹序列对，含义为着舰航迹序列T_i对应的着舰环境为S_{l, i}。将历史着舰数据集转化为着舰航迹序列对集合$Q = {\rm{ }}\{ {D_{{q_1}}}, {D_{{q_2}}}, \ldots, {D_{{q_{{N_q}}}}}\} $，其中N_q为Q中着舰航迹序列对的数目。以Q为训练样本，采用正交最小二乘法(orthogonal least squares, OLS)实现的网络结构和参数训练。OLS算法具有迭代次数少、网络结构精简等优点，为了避免非线性学习过程，OLS将所有训练样本作为RBF网络的隐层节点，然后根据各隐层节点的贡献度选择一个显著的回归算子集合。对于具有所有样本隐层节点的网络，全样本的输入输出：

$ \mathit{\boldsymbol{D}} = \mathit{\boldsymbol{ \boldsymbol{\varPhi} \boldsymbol{\varTheta} }} + \mathit{\boldsymbol{E}} $

(2)

式中：$\mathit{\boldsymbol{D}} = [{I_{1, {\rm{t}}}}({x_j})\; \; {I_{1, {\rm{t}}}}({x_i})\; \; \ldots \; \; {I_{l, {\rm{t}}}}({x_j})] \in {{\bf{R}}^{n \times l}}$为期望输出向量；n为训练样本的数目；l=14为网络输出维度；Φ=[ϕ₁ ϕ₂… ϕ_n]^T∈R^n×m为回归算子矩阵，其实质是所有样本的径向基函数输出；m=2 N+3为输入维度；Θ=[θ₁ θ₂…θ_m]^T ∈R^m×l为权重向量；E∈R^n×l是网络输出与实际输出的偏差向量矩阵。考虑到ϕ₁, ϕ₂, …, ϕ_n一般是相关的，因此需要对Φ进行正交三角分解，令Φ=WA，其中W= [w₁ w₂… w_m]∈R^n×m是各列正交且由w₁, w₂, …, w_n张成的空间与ϕ₁, ϕ₂, …, ϕ_n张成的空间相同，A∈R^m×m为：

$ \mathit{\boldsymbol{A}} = \left[ {\begin{array}{*{20}{c}} 1&{{a_{1,2}}}& \cdots&\cdots &{{a_{1,m}}}\\ 0&1& \cdots&\cdots &{{a_{2,m}}}\\ \vdots&\vdots&\vdots&\vdots&\vdots \\ \vdots&\vdots&\vdots &1&{{a_{m - 1,m}}}\\ 0&0& \cdots &0&1 \end{array}} \right] $

(3)

采用改进的Gram-Schmidt法，W为：

$ {w_k} = \phi _k^{k - 1},k = 1,2 \cdots ,n $

(4)

其中

$ \left\{ \begin{array}{l} \phi _j^0 = {\phi _j},\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;1 \le j \le N\\ \varphi _j^k = \varphi _j^{k - 1} - {\alpha _{kj}}{\mathit{\boldsymbol{w}}_k},\;\;\;\;\;\;\;\;\;\;\;k + 1 \le j \le n\\ {\alpha _{kj}} = {\mathit{\boldsymbol{w}}_k}^{\rm{T}}\varphi _j^{k - 1}/\left( {{\mathit{\boldsymbol{w}}_k}^{\rm{T}}{\mathit{\boldsymbol{w}}_k}} \right)\;\;\;k + 1 \le j \le n \end{array} \right. $

将Φ=WA代入式(1)，并令AΘ= G=(g_ij)_m×l，则有D=WG+ E，可求得G，此时期望输出方差为：

$ {\rm{trace}}\left( {\frac{{{\mathit{\boldsymbol{D}}^{\rm{T}}}\mathit{\boldsymbol{D}}}}{m}} \right) = \frac{{\sum\limits_{i = 1}^m {\left( {\sum\limits_{j = 1}^l {{g_{ij}}} } \right){\mathit{\boldsymbol{w}}_i}^{\rm{T}}{\mathit{\boldsymbol{w}}_i}} }}{m} + {\rm{trace}}\left( {\frac{{{\mathit{\boldsymbol{E}}^{\rm{T}}}\mathit{\boldsymbol{E}}}}{m}} \right) $

(5)

在式(5)的基础上，定义w_i的误差下降率e_i：

$ {e_i} = \frac{{\left( {\sum\limits_{j = 1}^l {g_{ij}^2} } \right){\mathit{\boldsymbol{w}}_i}^{\rm{T}}{\mathit{\boldsymbol{w}}_i}}}{{{\rm{trace}}\left( {{\mathit{\boldsymbol{D}}^{\rm{T}}}\mathit{\boldsymbol{D}}} \right)}},\;\;\;\;\;1 \le i \le m $

(6)

为使e_i的衡量标准统一，使用时可先对e_i其进行标准化得到n_i(i=1, …, m)。在此基础上给定一个训练精度阈值ρ，逐步选择最大的n_i隐层节点，并在下一步对前一步剩下的向量进行正交化，直至满足$1-\sum\limits_{k = 1}^{{M_s}} {{n_i}} < \rho $，则选出的M_s个节点即为学习得到网络节点。

设${\mathit{\boldsymbol{ \boldsymbol{\tilde \varPhi} }}}$为选出节点的径向基输出矩阵，可利用伪逆方法求得对应的网络权值矩阵${\mathit{\boldsymbol{ \boldsymbol{\tilde \varTheta} }}}$:

$ \mathit{\boldsymbol{ \boldsymbol{\tilde \varTheta} }} = {{\mathit{\boldsymbol{ \boldsymbol{\tilde \varPhi} }}}^ + }\mathit{\boldsymbol{D}} = {\left( {{{\mathit{\boldsymbol{ \boldsymbol{\tilde \varPhi} }}}^{\rm{T}}}\mathit{\boldsymbol{ \boldsymbol{\tilde \varPhi} }}} \right)^{ - 1}}{{\mathit{\boldsymbol{ \boldsymbol{\tilde \varPhi} }}}^{\rm{T}}}\mathit{\boldsymbol{D}} $

(7)

4) 预测航迹点计算。

在已知航迹趋势U^t(x_j)和当前航迹位置(z_{x_j，p}，y_{x_j}^p)的条件下，模型输出为:

$ \begin{array}{*{20}{c}} {\mathit{\boldsymbol{U}}\left( {{x_j}} \right) = }\\ {{{\left[ {{z_{{x_j},{\rm{p}}}} + \sum\limits_{h = 1}^7 {{u_{h,{\rm{t}}}}\left( {{x_j}} \right){y_{{x_j},{\rm{p}}}}} + \sum\limits_{h = 8}^{14} {{u_{h,{\rm{t}}}}\left( {{x_j}} \right)} } \right]}^{\rm{T}}}} \end{array} $

(8)

式中u_h，t(x_j)为U_t(x_j)中的第h个元素。

1.3 基于RBF网络集成的着舰航迹预测模型

着舰航迹随RD变化的规律存在明显的阶段性，如图 3，根据着舰航迹的阶段性，美国LSO规范将着舰过程分为X、IM、IC、AR、TC 5个阶段^[1]。在X阶段舰载机刚进入下滑航线开始进行初始航迹偏差调整，因此航迹变化幅度较大；IM阶段着舰航迹逐渐趋向平稳；IC阶段着舰航迹相对平稳；AR阶段位于舰艉附近，该阶段舰艉流和甲板运动的干扰作用明显；TC阶段着舰航迹位于甲板上方，受甲板地效和甲板运动影响。

	Download: JPG larger image
图 3 舰载机着舰航迹划分示意图 Fig. 3 The stages classification of carrier landing trajectory

对于具有明显阶段性的着舰航迹，显然全程采用一个RBF预测模型不会得到满意的预测精度。为提高航迹预测精度，在前文的基础上，考虑着舰航迹的阶段差异性建立基于RBF网络集成着舰航迹预测模型(RBF network ensembles model for trajectory prediction, RBFETP)。该模型分别针对X、IM、IC、AR、TC阶段分别建立5个RBF着舰航迹趋势预测网络，预测时首先判断预测点所属的阶段，然后选用对应阶段的RBF网络完成航迹趋势预测，当待预测点位于两个预测网络的交界时，利用两个阶段的网络集成实现航迹趋势预测。

RBFETP采用最优线性集成实现两阶段交界处的网络集成。用N_{S_r}、N_{S_q}分别表示某2个相邻阶段S_r、S_q的航迹趋势预测网络。设x_co为S_r、S_q2个阶段交界点处的RD，选择[x_co-7, x_co+7]为集成网络预测区域。在集成网络预测区域内，令U_{s_r}(x_j)和U_{s_q}(x_j)分别表示预测点x_j的N_{S_r}、N_{S_q}网络输出，用w_{r, x_j}、w_{q, x_j}分别表示U_{s_r}(x_j)和U_{s_q}(x_j)在集成网络中的权重，且权重矩阵w_{rq, x_j}= [w_{r, x_j} w_{q, x_j}]^T满足I_nw_{rq, x_j}=1，其中I_n∈R^1×2为元素全为1的行向量，则网络集成输出：

$ \begin{array}{*{20}{c}} {{\mathit{\boldsymbol{U}}_{\rm{t}}}\left( {{x_j}} \right) = \left[ {\begin{array}{*{20}{c}} {{U_{{{\rm{s}}_r}}}\left( {{x_j}} \right)}&{{U_{{{\rm{s}}_q}}}\left( {{x_j}} \right)} \end{array}} \right],{w_{rq,{x_j}}},}\\ {{x_j} \in \left[ {{x_{co - 7}},{x_{co + 7}}} \right]} \end{array} $

(9)

其中，w_{rq, x_j}可通过优化网络集成误差均方根J_{rq, x_j}获得：

$ \left\{ \begin{array}{l} \min {J_{rq,{x_j}}} = \min \sqrt {\frac{1}{n}\mathit{\boldsymbol{w}}_{rq,{x_j}}^{\rm{T}}\mathit{\boldsymbol{E}}_{rq,{x_j}}^{\rm{T}}{\mathit{\boldsymbol{E}}_{rq,{x_j}}}{\mathit{\boldsymbol{w}}_{rq,{x_j}}}} \\ {\rm{s}}.\;{\rm{t}}.\;{\mathit{\boldsymbol{I}}_n}{\mathit{\boldsymbol{w}}_{rq,{x_j}}} = 1 \end{array} \right. $

(10)

式中E_{rq, x_j}为w_{rq, x_j}对应的预测误差矩阵，其形式为

$ {\mathit{\boldsymbol{E}}_{rq,{x_j}}} = \left[ {\begin{array}{*{20}{c}} {{e_{r1}}}&{{e_{r2}}}& \cdots &{{e_{rn}}}\\ {{e_{q1}}}&{{e_{q2}}}& \cdots &{{e_{qn}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {{e_1}}&{{e_2}}& \cdots &{{e_n}} \end{array}} \right] $

(11)

式中：n为训练样本的数目；e_rk、e_qk(k=1，…，n)分别为预测点x_j的N_{S_r}、N_{S_q}网络预测误差。考虑到网络输出U(x_j)包含z、y两个方向的位置和位置变化率信息，因此e_rk, e_qk(k=1，…，n)的一般表达e(x_j)可采用信息的加权的方式求得：

$ e\left( {{x_j}} \right) = \sum\limits_{i = 1}^2 {{K_i}} \sum\limits_{j = 1}^2 {{K_{j + 2}}\left( {{U_{2j - 2 + i}} - {{\tilde U}_{2j - 2 + i}}} \right)} $

(12)

式中U_t(t=1，2, …，4)为预测输出U(x_j)的第t个元素，${{\tilde U}_t}$为U_t对应的测试样本输出，K₁, K₂, K₃, K₄分别为z向信息权重、y向信息权重、位置信息权重、位置变化率信息权重，且满足K₁+K₂=1，K₃+K₄=1。K₁, K₂, K₃, K₄根据经验设定，由于z方向的误差更容易导致安全问题因此K₁>K₂。

式(10)的最优解w_{rq, x_j}^*和最优目标J_{rq, x_j}^*可通过如下过程求解：由于J_{rq, x_j}的表达式包含幂运算难于求解，考虑到J_{rq, x_j}>0，因此使J_{rq, x_j}²取最小值的w_{rq, x_j}亦能使J_{rq, x_j}取最小值，本文通过最优化J_{rq, x_j}²求解w_{rq, x_j}^*和J_{rq, x_j}^*。

在I_nw_{rq, x_j}=1的约束下对J_{rq, x_j}²引入Langrange乘数λ：

$ J_{rq,{x_j}}^2 = \frac{1}{n}\mathit{\boldsymbol{w}}_{rq,{x_j}}^{\rm{T}}\mathit{\boldsymbol{E}}_{rq,{x_j}}^{\rm{T}}{\mathit{\boldsymbol{E}}_{rq,{x_j}}}{\mathit{\boldsymbol{w}}_{rq,{x_j}}} + \lambda \left( {{\mathit{\boldsymbol{I}}_n}{\mathit{\boldsymbol{w}}_{rq,{x_j}}} - 1} \right) $

(13)

在等式(13)两边同时对w_{rq, x_j}求一阶偏导，根据优化目标令$\frac{{\partial {\mathit{\boldsymbol{J}}_{rq, {x_j}}}^2}}{{\partial {\mathit{\boldsymbol{w}}_{rq, {x_j}}}}} = 0$可得：

$ \frac{{\partial \mathit{\boldsymbol{J}}_{rq,{x_j}}^2}}{{\partial {\mathit{\boldsymbol{w}}_{rq,{x_j}}}}} = \frac{2}{n}\mathit{\boldsymbol{E}}_{rq,{x_j}}^{\rm{T}}{\mathit{\boldsymbol{E}}_{rq,{x_j}}}{\mathit{\boldsymbol{w}}_{rq,{x_j}}} + \lambda \mathit{\boldsymbol{I}}_n^{\rm{T}} = 0 $

(14)

在等式(14)两边同时左乘I_n(E_{rq, x_j}^T E_{rq, x_j})^-1，可求得λ：

$ \lambda = \frac{{ - 2}}{{n{\mathit{\boldsymbol{I}}_n}{{\left( {\mathit{\boldsymbol{E}}_{rq,{x_j}}^{\rm{T}}{\mathit{\boldsymbol{E}}_{rq,{x_j}}}} \right)}^{ - 1}}\mathit{\boldsymbol{I}}_n^{\rm{T}}}} $

(15)

将式(15)代入式(14)中可得w_{rq, x_j}^*:

$ \mathit{\boldsymbol{w}}_{rq,{x_j}}^ * = \frac{{{{\left( {\mathit{\boldsymbol{E}}_{rq,{x_j}}^{\rm{T}}{\mathit{\boldsymbol{E}}_{rq,{x_j}}}} \right)}^{ - 1}}\mathit{\boldsymbol{I}}_n^{\rm{T}}}}{{{\mathit{\boldsymbol{I}}_n}{{\left( {\mathit{\boldsymbol{E}}_{rq,{x_j}}^{\rm{T}}{\mathit{\boldsymbol{E}}_{rq,{x_j}}}} \right)}^{ - 1}}\mathit{\boldsymbol{I}}_n^{\rm{T}}}} $

(16)

着舰指挥决策算法是着舰辅助决策系统的核心，本文研究不确定着舰环境下着舰决策算法。

考虑E_{rq, x_j}^T E_{rq, x_j}为对称阵，将式(16)代入式(10)可得：

$ \mathit{\boldsymbol{J}}_{rq,{x_j}}^ * = \frac{1}{{\sqrt {n{\mathit{\boldsymbol{I}}_n}{{\left( {\mathit{\boldsymbol{E}}_{rq,{x_j}}^{\rm{T}}{\mathit{\boldsymbol{E}}_{rq,{x_j}}}} \right)}^{ - 1}}\mathit{\boldsymbol{I}}_n^{\rm{T}}} }} $

(17)

2 基于属性相关贝叶斯的着舰指挥决策模型 2.1 着舰指挥决策模型概述

采用模拟LSO的决策心理过程的方法构建着舰指挥决策算法。美军的调研和分析指出：LSO决策所需的预测航迹信息为未来2 s的着舰航迹位置及其变化率，着舰决策指令集主要包括无指令、飞行偏低、飞行偏高、飞行左偏、飞行右偏、不要上升、不要下降、复飞8种决策指令^[1]。着舰航迹预测模型的输出U(x_j)包含了预测点在z轴、y轴的位置和位置变化率，因此着舰指挥决策建模问题是已知模型属性输入为A=[x_j+7 U^T(x_j)]^T，如何在决策指令集C={c₁, c₂…, c₈}内选择指令的问题，其中c₁, c₂, …, c₈依次代表上述8种决策指令。着舰指挥决策建模问题的实质为多属性、多分类问题。朴素贝叶斯算法(Naive Bayes, NB)可有效该类问题，但NB算法要求各属性输入严格独立，显然着舰指挥决策输入A的各元素不独立，因此单纯的NB无法解决着舰指挥决策问题。属性相关贝叶斯算法以NB为基础，通过建立各属性间的相关模型放宽了NB的属性独立条件，是解决相关属性多分类问题的有效途径。本文采用属性相关贝叶斯理论构建着舰指挥决策模型。

2.2 基于自适应聚类的连续决策属性离散化

由于属性输入A的各元素均为连续属性，且其概率分布不规范、难于用解析形式表示，不利于后续的概率计算，因此建立决策模型前须将A的各元素转化为离散型属性。A中的x_j+7可按照图 3所示的着舰阶段划分转化为5种离散值，而U(x_j)的属性则需要通过样本数据聚类的方法实现离散化，即将连续属性按照聚类所得的类别区间进行分类，从而实现属性的离散化。

LSO指挥决策时通常将样本数据分布密集的区域划分为一类，因此U(x_j)中属性的聚类原则为最大化各类数据的分布密度，即将数据分布区间分为一些连续的数据段，使样本在各数据段内的数据数目最多。本文针对U(x_j)中属性的连续性特点和数据密度的最大化原则，提出一种逐步搜索的数据密度聚类方法，该方法的具体步骤如下：

1) 设定某属性的数据分布区间为[D_min, D_max]，根据属性样本数据的尺度设定属性分辨率R，然后将数据区间等R间隔分为、${N_s} = {\rm{INT}}\left({\frac{{{D_{{\rm{max}}}}-{D_{{\rm{min}}}}}}{R}} \right)$段作为备选类，用D₁=[D_{1, min}, D_{1, max})，D_i=(D_{i, min}, D_{i, max}]，i=2, 3, …, N_s标识备选类，其中D_{i, max}、D_{i, min}分别为D_i中数据的最大值和最小值。根据各数据段的数值大小对备选类排序并用D₁, D₂, …, D_{N_s}表示升序的备选类序列；

2) 定义某数据类D_s(s=1, 2, …, N_s)的数据分布密度${w_{{D_{\rm{s}}}}} = \frac{{{n_{{D_{\rm{s}}}}}}}{{{D_{{\rm{s, max}}}}-{D_{{\rm{s, min}}}}}}$，其中D_{s, max}、D_{s, min}、n_{D_s}分别为D_s中数据的最大值、最小值和数据数目。计算所有备选类的数据分布密度，找出数据分布密度最大的类记为D_j(1＜j＜N_s)，D_j为聚类结果中的一个类，将其存入聚类结果集合V。然后在编号小于j的备选类中提取目标类：令分类标识f=1，分类计数变量N_num=2，暂存类序列${{\tilde D}_{{k_1}}} = {D_{_{}j-1}}, {{\tilde D}_{{k_2}}} = {D_{j-2}}, \ldots, {{\tilde D}_{{k_q}}} = {D_1}$，其中q=j-1；

3) 将${{\tilde D}_{{k_1}}}, \ldots {{\tilde D}_{{k_{{\rm{num}}}}}}$组成一类用${{\tilde D}_{{k_1}{k_{{\rm{num}}}}}}$表示，计算该类的数据密度${w_{{{\tilde D}_{{k_1}{k_{{\rm{num}}}}}}}}$；

4) 若${w_{{{\tilde D}_{{k_1}{k_{{\rm{num}}}}}}}} < {w_{{{\tilde D}_{{k_1}}}}}$且N_num=q，${{\tilde D}_{{k_1}}}$作为目标类存入V；若${w_{{{\tilde D}_{{k_1}{k_{{\rm{num}}}}}}}} < {w_{{{\tilde D}_{{k_1}}}}}$且N_num < q，令N_num=N_num+1并返回3)；若${w_{{{\tilde D}_{{k_1}{k_{{\rm{num}}}}}}}} > {w_{{{\tilde D}_{{k_1}}}}}$且N_num=q，${{\tilde D}_{{k_1}{k_{{\rm{num}}}}}}$作为目标类存入V；若${w_{{{\tilde D}_{{k_1}{k_{{\rm{num}}}}}}}} > {w_{{{\tilde D}_{{k_1}}}}}$且N_num < q，令q=q-N_num+1，${{\tilde D}_{{k_1}}} = {{\tilde D}_{{k_1}{k_{{\rm{num}}}}}}$, ${{\tilde D}_{{k_2}}} = {{\tilde D}_{{\rm{num}} + 2}}$, …, ${{\tilde D}_{{k_{q-{\rm{num}} + 1}}}} = {{\tilde D}_q}$，返回3)；

5) 若f=1，在编号大于j的备选类中提取目标类：令f=2，N_num=2，${{\tilde D}_{{k_1}}}$=D_j+1, ${{\tilde D}_{{k_2}}}$=D_j+2, …, ${{\tilde D}_{{k_q}}}$=D_N₁，其中q=N₁-j，返回3)；若f=2，聚类结束。

2.3 基于属性相关贝叶斯的着舰指挥决策分类器

为了方便建模，首先给出相关的定义和符号。用A= [a₁ a₂… a₅]^T表示属性输入取值，用a₁, a₂, …, a₅依次表示A中的属性名称。定义D_p=(A, c_A)为决策对，其中c_A∈C，D_p的含义为当属性向量取值为A时决策指令为c_A；将LSO指挥指令记录和相应的着舰航迹数据作为决策模型的训练样本，决策样本集合表示为S={D_p₁ D_p₂…D_{p_{N_s}}}，其中N_s为S中决策对的数目。

在大样本条件下可认为所有属性取值概率相同，即P(A)为常值。则根据NB理论，在A给定的条件下，最大后验概率对应的类别${\tilde c}$即为决策输出，${\tilde c}$可由式(18)求得。

$ \begin{array}{*{20}{c}} {\tilde c = c\left( \mathit{\boldsymbol{A}} \right) = \mathop {\arg \max }\limits_{{{\rm{c}}_i} \in C} P\left( {{c_i}\left| \mathit{\boldsymbol{A}} \right.} \right) = }\\ {\mathop {\arg \max }\limits_{{c_i} \in C} P\left( {\mathit{\boldsymbol{A}}\left| {{c_i}} \right.} \right)P\left( {{c_i}} \right)} \end{array} $

(18)

式中P(c_i)可由决策样本统计得到。计算${\tilde c}$的关键是P(A|c_i)的求解。基于属性相关性分析的贝叶斯分类算法在属性性相关性分析的基础上可利用样本向量相关度计算P(A|c_i)的方法，该方法可有效提高属性相关条件下的NB分类精度。考虑各属性间的相关性，P(A|c_i)为：

$ P\left( {\mathit{\boldsymbol{A}}\left| {{c_i}} \right.} \right) = {\rho _{A\left| {{c_i}} \right.}} \times \prod\limits_{j = 1}^7 {P\left( {{a_j}\left| {{c_i}} \right.} \right)} $

(19)

式中ρ_{A|c_i}为c_i类中向量A的相关度。若a₁, a₂, …, a₅相关性较大则ρ_{A|c_i}正比于两两属性的相关度ρ_{a_la_k}(l < k)，因此ρ_{A|c_i}与估计值${{\tilde \rho }_{A|{c_i}}}$分别为：

$ {\rho _{{a_l}{a_k}}} = \frac{{P\left( {{a_l}{a_k}\left| {{c_i}} \right.} \right)}}{{P\left( {{a_l}\left| {{c_i}} \right.} \right)P\left( {{a_k}\left| {{c_i}} \right.} \right)}},\;\;\;l < k $

(20)

$ {{\tilde \rho }_{A\left| {{c_i}} \right.}} = {\left( {C_5^2} \right)^\beta }\sqrt {\prod\limits_{l,k = 1}^5 {{\rho _{{a_l}{a_k}}}} } ,\;\;\;l < k $

(21)

式中:C₅²=20为属性两两组合的数目；ρ_{a_la_k}可根据式(20)由样本统计得到，β为调节参数，可根据如下算法获得：

① 在决策样本S的c_i类中选择a₁, a₂, …, a₅对应的最大条件概率P(a′_j|c_i)(j=1, 2, …, 5)，其中a′₁, a′₂, …, a′₅依次为属性a₁, a₂, …, a₅的取值；

② 在决策样本S的c_i类中统计P(A′|c_i)及P(a_j|c_i)(j=1…5)，然后利用式(18)计算ρ_{A|c_i}；

③ 令A′= [a′₁ a′₂… a′₅]^T，ρ_{A|c_i}= ${{\tilde \rho }_{A'|{c_i}}}$，代入式(20)计算求取β。

3 基于仿真数据的实验验证

利用人(飞行员和LSO)在回路的半物理着舰仿真数据对TPCLCD算法进行仿真验证。选取海况等级均匀分布、着舰初始偏差随机分布条件下的2 567次着舰仿真数据和相应的LSO指挥记录，首先将其转化为着舰航迹序列对集合Q，然后形成决策样本集合S。以Q和S为数据基础分别验证着舰航迹预测模型和TPCLCD算法。

3.1 着舰航迹预测模型的仿真验证

以Q作为训练样本集，分别按照建立RBFTP和RBFETP模型。随机选取海况和初始位置偏差进行100次仿真实验，将仿真数据作为测试数据，对2种航迹预测模型进行验证。表 1为RBFTP和RBFETP的航迹预测偏差统计结果，由表 1可知RBFETP的预测精度明显优于RBFTP，且RBFETP模型的1倍标准差均小于1 m。

表 1 着舰航迹预测偏差统计结果 Table 1 Results of the carrier landing trajectory prediction error

图 4以某测试航次为例给出了RBFTP和RBFETP的着舰全程连续预测曲线。图 4显示RBFTP的预测偏差呈阶段性，其中RBFTP在X、IM阶段的预测偏差较大，这是因为RBFTP为全程模型，在该模型中X、IM阶段的航迹大幅变化特性被全局特性所淹没。而RBFETP由于采用分阶段网络集成技术，因此能够体现着舰航迹的各阶段局部特性，呈现较高的预测精度。

	Download: JPG larger image
图 4 RBFTP和RBFETP的某测试航次全程预测曲线 Fig. 4 The whole prediction curve of a test trajectory with the RBFTP and the RBFETP

3.2 TPCLCD算法的仿真验证

为了验证预测航迹对的决策结果的影响，建立TPCLCD的对比算法，以着舰航迹的当前状态向量B=[x_j z_{x_j, p} y_{x_j, p} Δz_{x_j, p} Δy_{x_j, p}]^T作为决策属性输入，采用离散化和分类器构建基于当前航迹状态着舰决策算法(carrier landing command decision-making algorithm，CLCD)。以S为数据集，采用10折交叉验证方法(10-CV)对TPCLCD和CLCD的决策准确度进行对比验证。为提高验证的可靠性，两种算法均重复进行5次10-CV实验，并以5次决策准确率的平均值作为衡量决策准确度的指标。表 2为两种算法的决策准确率对比情况，由表 2可知TPCLCD的决策准确率比CLCD高出了15.18%，这说明以预测航迹作为决策输入可提高指挥决策的准确度，TPCLCD的决策结论与LSO的指挥决策(测试样本)更接近。

表 2 TPCLCD与CLCD的决策准确率对比情况 Table 2 The decision-making accuracy comparison of the TPCLCD and the CLCD

表 3为第5次10-CV实验(决策准确率最高)中600个TPCLCD决策结果的混淆矩阵，分析表 3可知所有指令的决策准确率均高于90%，尤其是c₈(复飞)的决策正确率为100%。此外经分析，表 3中决策结果的混淆情况基本符合LSO的实际指挥情况，例如表 3中c₇(不要下降)与c₃(飞行位置偏高)为一对易混淆指令，实际上LSO指挥时也常常混淆这两个指令：着舰过程中经常出现舰载机航迹高于理想下滑道但下沉速度很大的情况，若此时舰载机继续以此下沉速度下滑，航迹将低于理想下滑道，所以此时正确的指挥指令应为c₇，而LSO往往根据航迹高于理想下滑道表象错误的下达指令c₃。

表 3 第5次10-CV实验的TPCLCD决策结果混淆矩阵 Table 3 The TPCLCD result confusion matrix of the 5th 10-CV experimen

为了验证TPCLCD对着舰成功率的影响，以S为训练集分别建立TPCLCD和CLCD决策模型，并分别将两个决策模型引入半物理着舰仿真系统，使其替代LSO进行着舰指挥决策，分别形成TPCLCD着舰仿真系统(carrier landing simulatior based on TPCLCD, TPCLCD-CLS)和CLCD着舰仿真系统(carrier landing simulatior based on CLCD, CLCD-CLS)。在随机海况和初始位置偏差条件下，分别组织50次TPCLCD-CLS和CLCD-CLS仿真实验，图 5为实验的着舰挂索情况统计。已知舰载机钩挂2#和3#阻拦索是最理想的着舰结果，复飞是着舰失败的结果，由图 5可知CLCD-CLS实验中舰载机钩挂1#、2#、3#、4#阻拦索的次数很相近，作为着舰挂索目标的2#和3#挂索情况并不突出，而在TPCLCD-CLS实验中，舰载机钩挂2#和3#阻拦索的次数明显多于CLCD-CLS，且舰载机复飞次数少于CLCD-CLS，这表明TPCLCD的着舰指挥综合效果优于CLCD，将航迹预测结果作为指挥决策输入可有效提高着舰成功率。

	Download: JPG larger image
图 5 50次TPCLCD-CLS和CLCD-CLS实验的着舰挂索条形统计图 Fig. 5 The arresting wires result bar graph of 50 simulations with the TPCLCD-CLS and the CLCD-CLS

4 结论

1) TPCLCD以预测航迹作为决策属性输入，因此其决策结果是面向未来的，具有预先修正航迹的作用。仿真实验表明TPCLCD能够提高着舰成功率。

2) TPCLCD采用模拟LSO决策心理过程的方式建立，因此TPCLCD的决策结论更贴近LSO的指挥决策，TPCLCD决策结论的混淆情况与LSO实际指挥基本一致。

3) RBFETP针对着舰航迹的阶段特性，采用网络集成技术构建，与全程概率模型(RBFTP)相比，RBFETP能够在兼顾全程航迹特性的基础上保留各阶段的局部航迹特性，仿真实验表明RBFETP可有效高着舰航迹的预测精度。

参考文献

[1]	NATOPS landing signal officer manual[S]. Naval Air Systems Command, 2007. (0)
[2]	MAZZA C J, JOHNS F R. Preliminary study of optimal wave-off control: a parametric approach[R]. Naval Air Development Center, 1973. (0)
[3]	朱齐丹, 李晖, 夏桂华, 等. 舰载机着舰风险动态多属性决策[J]. 哈尔滨工程大学学报, 2013, 34(5): 615-622. ZHU Qidan, LI Hui, XIA Guihua, et al. Dynamic multi-attribute decision making of carrier-based aircraft landing risk[J]. Journal of Harbin Engineering University, 2013, 34(5): 615-622. (0)
[4]	MARZOUK M, ABUBAKR A. Decision support for tower crane selection with building information models and genetic algorithms[J]. Automation in construction, 2016, 61: 1-15. (0)
[5]	CARMINATI M, CARON R, MAGGI F. BankSealer:a decision support system for online banking fraud analysis and investigation[J]. Computers & security, 2015, 53: 175-186. (0)
[6]	GYO Z X, NGAI E W T, YANG C, et al. An RFID-based intelligent decision support system architecture for production monitoring and scheduling in a distributed manufacturing environment[J]. International journal of production economics, 2015, 159: 16-28. DOI:10.1016/j.ijpe.2014.09.004 (0)
[7]	HEIDI W, THUMFART S, LUGHOFER E, et al. Machine learning based analysis of gender differences in visual inspection decision making[J]. Information sciences, 2013, 224: 62-76. DOI:10.1016/j.ins.2012.09.054 (0)
[8]	GOEL S, SINGH J, OJHA N. Intelligent Aircraft landing decision support system using artificial bee Colony[C]//2016 3rd International Conference on Computing for Sustainable Global Development (INDIACom). New Delhi, India: IEEE, 2016: 2412-2416. (0)
[9]	JIA Lintong, TONG Zhongxiang, WANG Chaozhe. Aircraft combat survivability calculation based on combination weighting and multiattribute intelligent grey target decision model[J]. Mathematical problems in engineering, 2016: 8934749. (0)
[10]	LU Keke, LI Qing, CHENG Nong. An autonomous carrier landing system design and simulation for unmanned aerial vehicle[C]//Proceedings of 2014 IEEE Chinese Guidance, Navigation and Control Conference. Yantai, China: IEEE, 2015: 1352-1356. (0)
[11]	LÓPEZ-RUIZ A, BERGILLOS R J, ORTEGA-SÁNCHEZ M. The importance of wave climate forecasting on the decision-making process for nearshore wave energy exploitation[J]. Applied energy, 2016, 182: 191-203. DOI:10.1016/j.apenergy.2016.08.088 (0)
[12]	SCHEPEN A, ZHAO T, WANG Q J, et al. Optimising seasonal streamflow forecast lead time for operational decision making in Australia[J]. Hydrology and earth system sciences, 2016, 20(10): 4117-4128. DOI:10.5194/hess-20-4117-2016 (0)