基于不确定度和气动模型的气动数据融合算法

引用本文

邓晨, 陈功, 王文正, 等. 基于不确定度和气动模型的气动数据融合算法[J]. 空气动力学学报, 2022, 40(4): 117-123.

DENG C, CHEN G, WANG W, et al. Aerodynamic data fusion algorithms based on aerodynamic model and uncertainly[J]. Acta Aerodynamica Sinica, 2022, 40(4): 117-123.

基金项目

中国空气动力研究与发展中心基础和前沿技术研究基金（PJD20180143）

作者简介

邓晨（1994-），男，四川绵阳人，硕士研究生，研究方向：气动建模及数据融合研究. E-mail: 253605656@qq.com

文章历史

收稿日期：2020-10-28
修订日期：2021-01-04
优先出版时间：2021-05-12

Contents Abstract Full text Figures/Tables PDF

基于不确定度和气动模型的气动数据融合算法

邓晨¹ , 陈功^1,2 , 王文正¹ , 孔轶男¹

1. 中国空气动力研究与发展中心，绵阳　621000;
2. 国防科技大学空天科学学院，长沙　410072

收稿日期：2020-10-28；修订日期：2021-01-04；接受日期：2021-01-15；优先出版时间：2021-05-12

基金项目：中国空气动力研究与发展中心基础和前沿技术研究基金（PJD20180143）

作者简介：邓晨（1994-），男，四川绵阳人，硕士研究生，研究方向：气动建模及数据融合研究. E-mail: 253605656@qq.com.

通信作者：陈功^*（1985-），男，湖北黄冈人，博士研究生，研究方向：飞行动力学及控制. E-mail: success850012@163.com.

摘要：飞行器气动数据的来源主要有风洞试验、数值模拟、飞行试验三种方式。受试验和模拟能力的限制，任意一种单一手段都难以准确地对飞行器全飞行包线进行覆盖。为弥补各种数据的“缺陷”，提出并实现了两种数据融合算法：一种是依据不确定度作为权值参考，进行加权融合的加权融合算法，利用高斯过程回归算法获得不同来源气动数据预测值的特征，并进行加权融合；另一种是基于模型的CoKriging融合算法，利用CoKriging算法直接建立融合模型。并以某型飞行器气动数据为例进行了对比分析。结果表明：使用单一精度数据建模时，在一定的范围内，样本数据越多，覆盖的设计变量空间越广，精度越高；与单独使用一种精度数据的建模算法相比，两种融合算法预测结果的精度都有较大的提高；相比于基于不确定度的融合算法，使用CoKriging算法建模得到的结果精度更高，提高了近一个数量级。融合数据对于提高数据精度和增强模型预测能力上有重要作用，在参数变量空间内，融合数据能够对高精度数据进行內填补充，同时在参数变量空间外的融合数据能对数据的变化趋势预测提供参考。

关键词：多源气动数据数据融合不确定度相关性 CoKriging模型加权融合

Aerodynamic data fusion algorithms based on aerodynamic model and uncertainly

DENG Chen¹ , CHEN Gong^1,2 , WANG Wenzheng¹ , KONG Yinan¹

1. China Aerodynamics Research and Development Center, Mianyang　621000, China;
2. College of Aerospace Science and Engineering, National University of Defense Technology, Changsha　410072, China

Abstract: Wind-tunnel experiments, numerical simulations, and flight tests are the three major means for aircraft aerodynamic research. However, each method has its limitation, thus it is difficult to accurately predict aerodynamic characteristics of an aircraft in its full flight envelope by a single approach. Data fusion is important for improving accuracy and enhancing forecasting capabilities. In the parameter space, the fused data could be a supplement to high-fidelity data. Meanwhile, the fused data outside the parameter space can provide a reference for the variation trend of the data. Therefore, aerodynamic data obtained by different methods need to be fused. To this end, two data fusion algorithms are proposed. One is a weighted fusion algorithm based on uncertainty, which uses the Gaussian process regression to obtain the characteristics of aerodynamic data from different sources before performing a weighted fusion. The other is an agent fusion model which is established by using the CoKriging algorithm. Aerodynamic data of an aircraft are taken for comparative analyses. Results show that the prediction accuracy of the Kriging model using single-precision data can be improved by more samples. Both fusion algorithms have significant higher accuracy than the Kriging model using only single-precision data. But the accuracy of the CoKriging algorithm is roughly one order of magnitude higher than the fusion algorithm based on uncertainty.

Keywords: multi-source aerodynamic data data fusion uncertainly correlation CoKriging model weighted fusion

0 引　言

飞行器气动数据的来源主要有三种方式：风洞试验、数值计算和飞行试验^[1]。三种方式各有优缺点：风洞试验可以模拟飞行状态和飞行环境，但是存在支架干扰、雷诺数影响、洞壁干扰等限制，不能完全模拟真实飞行状态^[1]；数值计算方法灵活，成本低，提供的数据多，但是因为物理模型不够完善，使得复杂状态的计算精度较低；飞行试验可以完全模拟真实飞行状态，但是试验代价昂贵，大气数据和传感器误差影响大，气动参数辨识困难，得到的有效飞行试验数据有限^[1-2]。

为了弥补各种数据的“缺陷”，综合利用各种方式的优势，在降低试验代价的同时，提高气动数据精度，国内外很多专家学者提出了基于数据融合的方法并做了大量的研究。Alexandrov等^[3]对复杂的模型进行设计和优化时，利用低精度数据进行迭代，并用高精度数据监控设计优化的进展，最终在三维问题的结果精度提高的同时，成本节约了三倍；Eldred等^[4]采用了二阶加法、乘法和组合修正的数据融合算法，有效地克服了工程设计过程中的非光滑性和计算成本高的问题；Keane^[5]在机翼的优化设计中，利用Kriging模型建立了基于试验的预测模型和基于CFD数据的响应面模型的融合模型，气动数据的预测精度有了较大的提高。国内，中国空气动力研究与发展中心的王文正等^[6]创造性地提出了基于数学模型的气动数据融合，建立了反映气动力随着气动滚转角变化的数学模型；傅建明等^[7]采用Chebyshev-Taylor-Fourier混合级数来平衡不同精度数据之间的不确定度，并采用最小二乘原理来求解级数参数，该方法高效实用，工程应用前景良好。

根据国内外的研究可以发现，气动数据融合算法可以分为基于不确定度和基于气动模型的数据融合算法^[1]。目前两种算法的研究都有一些，但是缺少了对比分析，而有关于融合算法的适用性的研究几乎没有。鉴于此，本文首先提出并实现了两种数据融合算法：一种是基于不确定度的多保真度气动数据加权融合算法，通过建立各数据源的高斯回归模型来量化数据的不确定度，并利用专家经验等先验信息来对数据的不确定度进行修正，最后通过加权融合进行数据融合；另一种是基于建模的CoKriging模型算法，在Kriging模型的基础上考虑了不同数据之间的相关性，直接建立融合代理模型。然后以某型飞行器气动数据为例，对比分析得到了两种算法的优缺点。

1 数据融合算法 1.1 基于不确定度的加权融合算法

基于不确定度的加权融合算法，主要利用了高斯过程回归来量化每一种数据源的不确定度，并利用不确定度作为权值进行加权融合。下面简单介绍高斯过程回归算法和基于不确定度的加权融合算法。

1.1.1 高斯过程回归算法

高斯过程是一个随机过程，对处理小样本、非线性、高维数等复杂问题具有良好的适用性^[8-9]。其本质是一种基于贝叶斯优化的回归算法。给定一个数据集 ${\boldsymbol{D}} = \{ ({x_i},{y_i})\} _{i = 1}^n$ ，在集合D中，定义具有联合高斯分布的变量集合 $ f(x) $ ，由均值函数和协方差函数组成：

$ f(x)\sim GP(\mu (x),k(x,x')) $

(1)

考虑到噪声，则高斯过程回归的一般模型为：

$ y = f(x) + \varepsilon $

(2)

式中， $ \varepsilon $ 为独立的高斯白噪声。

根据贝叶斯原理，高斯过程回归在数据集D建立了 $ y $ 的先验函数，则样本点和新的数据点 $ {f_*} $ 的联合高斯分布为：

$ \left[ \begin{array}{*{20}{c}} y \\ {f_*} \end{array} \right]\sim N\Bigg(0,\left[ {\begin{array}{*{20}{c}} {{\boldsymbol{K}} + \sigma _n^2{{\boldsymbol{I}}_n}}&{{\boldsymbol{K}}_*^{\rm{T}}} \\ {{{\boldsymbol{K}}_*}}&{{{\boldsymbol{K}}_{**}}} \end{array}} \right]\Bigg) $

(3)

式中，K、 $ {{\boldsymbol{K}}_*} $ 和 $ {{\boldsymbol{K}}_{**}} $ 的定义如下：

$ {\boldsymbol{K}} = \left[ {\begin{array}{*{20}{c}} {k({x_1},{x_1})}&{k({x_1},{x_2})}& \cdots &{k({x_1},{x_n})} \\ {k({x_2},{x_1})}&{k({x_2},{x_2})}& \cdots &{k({x_2},{x_n})} \\ \vdots & \vdots & \vdots & \vdots \\ {k({x_n},{x_1})}&{k({x_n},{x_2})}& \cdots &{k({x_n},{x_n})} \end{array}} \right] $

(4)

$ {{\boldsymbol{K}}_ * } = \left[ {\begin{array}{*{20}{c}} {k({x_ * },{x_1})}&{k({x_ * },{x_2})}& \cdots &{k({x_ * },{x_n})} \end{array}} \right] $

(5)

$ {{\boldsymbol{K}}_{ * * }} = k({x_ * },{x_ * }) $

(6)

根据高斯过程的性质， $ {f_*} $ 的后验概率分布 $ \left. {{f_ * }} \right|X,y,x $ 同样符合高斯分布：

$ \left. {{f_ * }} \right|X,y,x\sim N({\mu _*}(x),{\varSigma _*}) $

(7)

式中：

$ {\mu _*}(x) = {{\boldsymbol{K}}_*}{({\boldsymbol{K}} + \sigma _n^2{{\boldsymbol{I_n}}})^{ - 1}}y $

(8)

$ {\varSigma _* } = {{\boldsymbol{K}}_{ * * }} - {{\boldsymbol{K}}_ * }{({\boldsymbol{K}} + \sigma _n^2{{\boldsymbol{I}}_n})^{ - 1}}{\boldsymbol{K}}_ * ^{\rm{T}} $

(9)

$ \;{\mu _*}(x) $ 即新的数据点 $ {x_*} $ 预测的输出值， ${\varSigma _*}$ 为预测输出的方差，这样便求得预测值的分布特征。即获得了数据集的不确定度。有关于高斯回归过程中的协方差函数的选择和超参数的优化参阅文献[10]。

1.1.2 加权融合算法

针对多来源的气动数据，采用高斯过程回归进行回归处理，得到每一种数据源的均值 $\;{\mu _{{\rm{GPR}}i}}$ 和方差 $\sigma _{{\rm{GPR}}i}^2$ ，接着采用基于不确定度的加权融合算法进行数据融合，具体流程图如图1所示。

图 1 基于不确定度的气动数据融合算法 Fig.1 Aerodynamic data fusion algorithm based on uncertainly

由图1可知，首先采用了高斯过程回归对不同来源的气动数据样本进行回归处理，得到模型的不确定度。接着因为每一种数据都来自计算或者测量，与真实值存在偏差，所以需要根据专家经验等先验信息，确定每一种数据的保真度。保真度反映了气动数据样本和真值间的不确定度，保真度越高，则数据越精确，并定义数据源 $ i $ 的保真度函数为 $\sigma _{{\rm{F}}i}^2$ 。然后将模型的不确定度和数据的不确定度结合起来得到每一种数据源的总的不确定度 $\; {\mu _{{\rm{T}}i}}$ 和 $\sigma _{{\rm{T}}i}^2$ ，如式（10）和式（11）所示。最后根据加权融合算法对每一种数据总的不确定度进行融合估计。

$ {\mu _{{\rm{T}}i}}({{\boldsymbol{x}}}) = {\mu _{{\rm{GPR}}i}}({{\boldsymbol{x}}})$

(10)

$ \sigma _{{\rm{T}}i}^2({{\boldsymbol{x}}})= \sigma _{{\rm{GPR}}i}^2({{\boldsymbol{x}}})+ \sigma _{{\rm{F}}i}^2({{\boldsymbol{x}}})$

(11)

对于高精度数据，因为样本点过少，所以它的模型不确定度高，而高精度数据本身的不确定度低；而对于低精度数据，因为样本点很多，所以它的模型不确定度低，而低精度数据本身的不确定高。通过加权融合的方式，可以得到精度更高、不确定度更低的数据。加权融合算法即对每一种数据源分配不同的权重系数 $ w $ ，再进行相加处理。假定各数据源是相互独立的，则权重系数和数据的不确定度方差成反比，即方差越高，说明数据精度越低，权重系数就小。具体表达式如下：

$ {w_i} = \frac{{{\dfrac{{1} {\mathord{ {\vphantom {1 {\sigma _{{\rm{T}}i}^2({{\boldsymbol{x}}})}}}} } } {\sigma _{{\rm{T}}i}^2({{\boldsymbol{x}}})}}}}{{\displaystyle\sum\limits_{i = 1}^N {\dfrac{1}{\sigma _{{\rm{T}}i}^2({{\boldsymbol{x}}})} }}} $

(12)

$ \mu ({{\boldsymbol{x}}}) = \sum\limits_{i = 1}^N {{w_i}} {\mu _{{\rm{T}}i}}({{\boldsymbol{x}}})$

(13)

$ {\sigma ^2}({{\boldsymbol{x}}})= {\Bigg(\sum\limits_{i = 1}^N {\frac{1}{{\sigma _{{\rm{T}}i}^2({{\boldsymbol{x}}})}}} \Bigg)^{ - 1}} $

(14)

1.2 基于模型的CoKriging融合代理模型

CoKriging模型是20世纪70年代发展起来的一种更有效的地质统计学插值模型^[11-12]。目前国际上对CoKriging模型的研究主要集中于地质统计学和数学统计学等领域，在航空航天等工程科学领域的研究也正逐渐得到重视^[13]。

CoKriging模型的原理如下^[14]：假设一个具有m个设计变量的优化问题，高、低可信度分析程序的抽样位置为：

$ {{{\boldsymbol{S}}}_{1}} = {[{{{x}}_{1}}^{(1)}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {{{{x}}}_{1}}^{(2)}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \cdots {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {{{{x}}}_{1}}^{({n_1})}]^{\rm{T}}} \in {R^{{n_1} \times m}} $

(15)

$ {{{\boldsymbol{S}}}_{2}} = {[{{{{x}}}_{2}}^{(1)}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {{{{x}}}_{2}}^{(2)}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \cdots {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {{{{x}}}_{2}}^{({n_2})}]^{\rm{T}}} \in {R^{{n_2} \times m}} $

(16)

式中：下标“1”和“2”分别代表了高、低可信度， ${n_1}$ 和 ${n_2}$ 分别代表高、低可信度样本点数。相应的目标或约束函数的值为：

$ {{{\boldsymbol{y}}}_{\mathbf{1}}} = {[{y_1}^{(1)}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {y_1}^{(2)}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \cdots {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {y_1}^{({n_1})}]^{\rm{T}}} \in {R^{{n_1}}} $

(17)

$ {{{\boldsymbol{y}}}_{\mathbf{2}}} = {[{y_2}^{(1)}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {y_2}^{(2)}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \cdots {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {y_2}^{({n_2})}]^{\rm{T}}} \in {R^{{n_2}}} $

(18)

CoKriging代理模型的预估值为：

$ {\hat y_1}({{\boldsymbol{x}}}) = {{\lambda }^{\rm{T}}}{{{\boldsymbol{y}}}_{s}} = {\lambda }_1^{\rm{T}}{{{\boldsymbol{y}}}_1} + {\lambda }_2^{\rm{T}}{{{\boldsymbol{y}}}_2} $

(19)

式中： ${\lambda _1}$ 和 ${\lambda _2}$ 为对应的加权系数。假如存在分别与 ${y_1}$ 和 ${y_2}$ 对应的两个静态随机过程：

$ {Y_1}({{\boldsymbol{x}}}) = {\beta _1} + {Z_1}({{\boldsymbol{x}}}) $

(20)

$ {Y_2}({{\boldsymbol{x}}}) = {\beta _2} + {Z_2}({{\boldsymbol{x}}}) $

(21)

式中： $\; \beta $ 为全局趋势模型，代表 $ Y({x}) $ 的数学期望值； $ Z(x) $ 为均值为零、方差为 $ {\sigma ^2} $ 的静态随机过程。在设计空间不同位置处，随机变量之间的协方差和交叉协方差定义为：

${{\rm{Cov}}}(Z({{x}}_1^{(i)}),Z({{x}}_1^{(j)})) = \sigma _1^2{R^{(11)}}({{x}}_1^{(i)},{{x}}_1^{(j)}) $

(22)

$ {\rm{Cov}}(Z({{x}}_2^{(i)}),Z({{x}}_2^{(j)})) = \sigma _2^2{R^{(22)}}({{x}}_2^{(i)},{{x}}_2^{(j)}) $

(23)

$ {\rm{Cov}}(Z({{x}}_1^{(i)}),Z({{x}}_2^{(j)})) = {\sigma _1}{\sigma _2}{R^{(12)}}({{x}}_1^{(i)},{{x}}_2^{(j)}) $

(24)

式中 $ R $ 为相关函数，只与空间距离有关，并满足距离为零时等于1，距离无穷大时等于0。

经过推导^[13]，得到CoKriging模型预估值和预估值的均方差如下：

$ {\hat y_1}({{\boldsymbol{x}}}) = {{{\boldsymbol{\varphi}} }^{\rm{T}}}{{\boldsymbol{\beta}} } + {{{\boldsymbol{r}}}^{\rm{T}}}({{\boldsymbol{x}}}){{{\boldsymbol{R}}}^{ - 1}}({{\tilde {\boldsymbol{y}}}_{s}} - {{\boldsymbol{F}}{\boldsymbol{\beta }}}) $

(25)

式中：

$ {{\boldsymbol{\varphi}} } = \left[ \begin{gathered} 1 \\ 0 \end{gathered} \right] $

(26)

$ {{\boldsymbol{\beta}} } = \left[ \begin{gathered} {{\tilde \beta }_1} \\ {{\tilde \beta }_2} \\ \end{gathered} \right] = {({{{\boldsymbol{F}}}^{\rm{T}}}{{{\boldsymbol{R}}}^{ - 1}}{{\boldsymbol{F}}})^{ - 1}}{{{\boldsymbol{F}}}^{\rm{T}}}{{{\boldsymbol{R}}}^{ - 1}}{{\tilde {\boldsymbol{y}}}_{s}} $

(27)

$ {{\boldsymbol{r}}} = \left[ \begin{gathered} {{{\boldsymbol{r}}}_1}({{\boldsymbol{x}}}) \\ {{{\boldsymbol{r}}}_2}({{\boldsymbol{x}}}) \\ \end{gathered} \right] $

(28)

$ {{\boldsymbol{R}}} = \left[ {\begin{array}{*{20}{c}} {{{{\boldsymbol{R}}}^{(11)}}}&{{{{\boldsymbol{R}}}^{(12)}}} \\ {{{{\boldsymbol{R}}}^{(21)}}}&{{{{\boldsymbol{R}}}^{(22)}}} \end{array}} \right] $

(29)

$ {{\tilde {\boldsymbol{y}}}_{s}} = \left[ \begin{gathered} \;\;\;{{{\boldsymbol{y}}}_1} \\ \frac{{{\sigma _1}}}{{{\sigma _2}}}{{{\boldsymbol{y}}}_2} \end{gathered} \right] $

(30)

$ {{\boldsymbol{F}}} = \left[ {\begin{array}{*{20}{c}} {{\boldsymbol{I_n}}}&{{\boldsymbol{0}}} \\ {{\boldsymbol{0}}}&{{\boldsymbol{I_n}}} \end{array}} \right] \in {{{\boldsymbol{R}}}^{2({n_1} + {n_2}) }} $

(31)

且有：

$ {{{\boldsymbol{R}}}^{(11)}}: = {({R^{(11)}}({{\boldsymbol{x}}}_1^{(i)},{{\boldsymbol{x}}}_1^{(j)}))_{i,j}} \in {{{\boldsymbol{R}}}^{{n_1} {n_1}}} $

(32)

$ {{{\boldsymbol{R}}}^{(12)}}: = {({R^{(12)}}({{\boldsymbol{x}}}_1^{(i)},{{\boldsymbol{x}}}_2^{(j)}))_{i,j}} = {({{{\boldsymbol{R}}}^{(21)}})^{\rm{T}}} \in {{{\boldsymbol{R}}}^{{n_1} {n_2}}} $

(33)

$ {{{\boldsymbol{R}}}^{(22)}}: = {({R^{(22)}}({{\boldsymbol{x}}}_1^{(i)},{{\boldsymbol{x}}}_1^{(j)}))_{i,j}} \in {{{\boldsymbol{R}}}^{{n_2} {n_2}}} $

(34)

$ {{r}_1}: = {({R^{(11)}}({{\boldsymbol{x}}}_1^{(i)},{{\boldsymbol{x}}}))_i} \in {{{\boldsymbol{R}}}^{{n_1}}} $

(35)

$ {{r}_2}: = {({R^{(12)}}({{\boldsymbol{x}}}_2^{(i)},{{\boldsymbol{x}}}))_i} \in {{{\boldsymbol{R}}}^{{n_2}}} $

(36)

CoKriging模型预估值的均方差为：

$ \begin{split}& {\rm{MSE}}\left\{ {{{\hat y}_1}({{\boldsymbol{x}}})} \right\} = \sigma _1^2[1.0 - {{{\boldsymbol{r}}}^{\rm{T}}}{{{\boldsymbol{R}}}^{ - 1}}{{\boldsymbol{r}}} + \\&\qquad {({{\boldsymbol{\varphi}} } - {{{\boldsymbol{F}}}^{\rm{T}}}{{{\boldsymbol{R}}}^{ - 1}}{{\boldsymbol{r}}})^{\rm{T}}}{({{{\boldsymbol{F}}}^{\rm{T}}}{{{\boldsymbol{R}}}^{ - 1}}{{\boldsymbol{F}}})^{ - 1}}({{\boldsymbol{\varphi}} } - {{{\boldsymbol{F}}}^{\rm{T}}}{{{\boldsymbol{R}}}^{ - 1}}{{\boldsymbol{r}}})] \end{split} $

(37)

采用最大似然估计，CoKriging的3个模型参数 ${\tilde {\boldsymbol{\beta}} }$ 、 $ {{{\sigma _1}} \mathord{\left/ {\vphantom {{{\sigma _1}} {{\sigma _2}}}} \right. } {{\sigma _2}}} $ 和 $ {\sigma _1}^2 $ 的最优值分别为：

$ {\tilde {\boldsymbol{\beta}} } = {({{{\boldsymbol{F}}}^{\rm{T}}}{{{\boldsymbol{R}}}^{ - 1}}{{\boldsymbol{F}}})^{ - 1}}{{{\boldsymbol{F}}}^{\rm{T}}}{{{\boldsymbol{R}}}^{ - 1}}{{\tilde {\boldsymbol{y}}}_{s}} $

(38)

$ \frac{{{\sigma _1}}}{{{\sigma _2}}} = {\Bigg({\left[ \begin{gathered} {\mathbf{0}} \\ {{{\boldsymbol{y}}}_2} \\ \end{gathered} \right]^{\rm{T}}}{{{\boldsymbol{R}}}^{ - 1}}\left[ \begin{gathered} {\mathbf{0}} \\ {{{\boldsymbol{y}}}_2} \\ \end{gathered} \right]\Bigg)^{ - 1}}{\left[ \begin{gathered} {\mathbf{0}} \\ {{{\boldsymbol{y}}}_2} \\ \end{gathered} \right]^{\rm{T}}}{{{\boldsymbol{R}}}^{ - 1}}\left[ \begin{gathered} - ({{{\boldsymbol{y}}}_1} - {\boldsymbol{I}_n}{{\tilde \beta }_1}) \\ \quad - {\boldsymbol{I}_n}{{\tilde \beta }_2} \\ \end{gathered} \right] $

(39)

$ \sigma _1^2 = \frac{{{{({{{\tilde {\boldsymbol{y}}}}_{s}} - {{\boldsymbol{F}}\tilde {\boldsymbol{\beta}} })}^{\rm{T}}}{{{\boldsymbol{R}}}^{ - 1}}({{{\tilde {\boldsymbol{y}}}}_{s}} - {{\boldsymbol{F}}\tilde {\boldsymbol{\beta}} })}}{{{n_1} + {n_2}}} $

(40)

剩余参数 ${{\theta }^{(11)}}$ 、 ${{\theta }^{(12)}}$ 、 ${{\theta }^{(22)}}$ 没有解析最优解，可以通过数值优化算法求解下式的最大值得到：

$ \ln L = - \frac{1}{2} \left [({n_1} + {n_2})\ln (\sigma _1^2) + \ln (\left| {{\boldsymbol{R}}} \right|)\right] $

(41)

在算法实现过程中，需要注意如下几个关键点：

（1）样本点归一化。将样本数据归一化后再建立CoKriging模型，可以提高模型的精度和鲁棒性。

（2）模型参数优化。合理的模型参数，可以显著提高CoKriging模型精度。

（3）相关矩阵R保持正定。采用“正则化”方法，让R保持正定。

（4）合理的矩阵分解方法。采用Cholesky分解，可以有效提高计算效率。

2 两种数据融合算法结果对比分析

本节中，利用已有的典型飞行器高精度数据和低精度的数据来建立飞行器气动模型。首先使用Kriging模型对高、低精度数据分别建立代理模型，接着使用基于不确定度和CoKriging代理模型来建立融合模型，最后进行比较分析。

2.1 数据样本说明

选择马赫数Ma和迎角 $\alpha $ 作为设计变量，轴向力系数 ${C_A}$ 作为函数响应值。采用现代试验方法进行试验方法设计^[15-16]，一共得到高精度数据样本点11个，低精度数据样本点24个。并将高精度样本点分为两部分，一部分用来进行训练，另一部分作为验证。如表1～表3所示。

表 1 用来训练的高精度数据样本点 Table 1 High-precision samples for training

表 2 用来验证的高精度数据样本点 Table 2 High-precision samples for validation

表 3 部分低精度数据样本点 Table 3 Part of low-precision samples

2.2 建立模型及分析

利用样本数据建立了四个轴向力系数模型，分别是高高精度数据Kriging模型、低高精度数据Kriging模型、不确定度融合模型和CoKriging融合模型，具体结果如下。

2.2.1 高高精度数据Kriging轴向力系数模型

图2给出了高高精度数据Kriging模型对轴向力系数的预测值。由图可见，高马赫数时模型预测精度较差，与理论分析结果相差较远，这是因为缺少了高马赫样本点，而低马赫数时预测结果较好。

图 2 高精度数据Kriging模型预测值 Fig.2 Predictions of the Kriging model using high-precision samples

2.2.2 低高精度数据Kriging轴向力系数模型

图3给出了低高精度数据Kriging模型对轴向力系数的预测值。由图可见，因为低精度数据样本点多且广，建立的模型在变量全设计空间预测情况较好，与样本点接近。但是因为低精度数据本身精度低，所以预测结果只是接近样本点，与真实情况的误差未知。

图 3 低精度数据Kriging模型预测值 Fig.3 Predictions of the Kriging model using low-precision samples

2.2.3 融合模型—基于不确定度的加权融合模型

利用高斯过程回归量化了不同精度数据的不确定度之后，采用加权融合算法得到结果如图4所示。根据不确定度进行加权融合，这种融合方式没有考虑到不同精度数据之间的相关性，所以在高马赫数时的预测值与低精度数据样本值几乎一样，和真实值也有所差异。

图 4 基于不确定度的加权融合模型预测值 Fig.4 Predictions of the weighted fusion model based on uncertainly

2.2.4 融合模型—基于建模的CoKriging融合代理模型

CoKriging融合代理模型就是在Kriging模型的基础上，考虑了不同数据之间的协相关性，所以结果更符合真实情况。本节中，由于高、低精度数据具有相似的函数变化趋势，只是存在小幅度的平移或旋转现象，为简便，假设其具有如下的相关性：

$ {{\boldsymbol{\theta}} } = {{{\boldsymbol{\theta}} }^{11}} = {{{\boldsymbol{\theta}} }^{12}} = {{{\boldsymbol{\theta}} }^{22}} $

(42)

$ {R^{11}}(h) = {R^{22}}(h) = R(h) $

(43)

$ {R^{12}}(h) = \rho R(h) $

(44)

式中：h为空间距离； $\; \rho $ 为两种不同数据的相关系数，一般作为超参数进行优化寻优获得，可以表示两种数据之间相关性，这种相关性只是代表了数据数值上的相关，没有具体的物理含义。本文将 $ \rho $ 当成超参数，通过最大似然估计方法寻优求得值为0.930。得到CoKriging融合代理模型预测结果如图5所示。

图 5 CoKriging融合代理模型预测值 Fig.5 Predictions of the CoKriging fusion model

与不考虑数据相关性的直接加权融合相比，CoKriging模型的结果更符合真实情况：在低马赫数时，预测结果更接近高精度数据结果；在高马赫数时，高、低精度数据相互修正，得到了一个更加符合理论分析和真实情况的结果。

2.3 预测结果对比分析

训练得到两个单精度数据模型和两个融合模型。为了比较不同模型的预测结果，定义误差值 $ {E_{rr}} $ ：

$ {E_{rr}} = \sum\limits_{i = 1}^n {{{({y_i} - {{\hat y}_i})}^2}} $

(45)

式中， $ {y_i} $ 为用于验证的高精度样本值， $ {\hat y_i} $ 为各模型对应的预测值。误差值 $ {E_{rr}} $ 越小，则越接近真实值。计算得到四个模型的误差值如表4、表5所示。对表4和表5进行横向和纵向对比分析，总结得到以下结论：

1）单源数据建模时，用相同数量的数据点建模，高精度数据建立的模型精度比低精度模型高；

2）数据点越多，建立的模型越精确，数据点覆盖的设计变量空间越广，得到的模型越精确；

3）与单源数据的建模结果相比，两种融合模型的预测结果的精度都有较大的提升；

4）相比于基于不确定度的直接加权算法，CoKriging融合模型的精度更高。

表 4 不同单数据模型的预测误差值 Table 4 Prediction errors of single-data models

表 5 不同融合模型的预测误差值 Table 5 Prediction errors of fusion models

本文用于训练和验证的高精度数据来自风洞试验，因为试验条件限制，没有高马赫数时的气动数据。为了获得参数空间更广的融合数据，所以对建立的预测模型进行了大范围的外插，这种方法虽然在工程上不适定，但是对于定性分析具有一定的参考价值。在高精度数据参数变量空间内，融合数据內填了高精度数据，精度也得到了提高，而在外推的变量空间内，融合数据也为数据的变化趋势提供了参考。后续研究方向可以为通过补充其他手段得到的高精度数据进行补充完善，让涵盖所需要的建模空间且相对均匀，这样能得到准确度、可信度更高的结果。

3 结　论

本文研究了两种气动数据融合算法：一种是基于不确定度的直接加权融合算法，另一种是基于模型的CoKriging融合代理模型算法。并以典型飞行器气动数据为例进行了对比分析，得到以下结论：

1）与使用单精度数据的建模结果相比，两种融合算法预测结果的精度都有较大的提高。

2）对于融合算法，数据样本点对预测精度影响很大，数据点越多，覆盖范围越广，结果越精确；

3）和基于不确定度的加权融合算法相比，考虑了数据之间相关性的CoKriging算法建模得到的结果精度更高。

4）融合数据主要有两个作用：一是对高精度数据进行內填，补充参数空间内的数据；二是通过外推，对参数空间外的数据变化趋势进行预测。后续研究方向可以为通过补充其它手段得到的高精度数据进行补充完善，让高精度数据涵盖所需要的建模空间且相对均匀，这样能得到准确度、可信度更高的结果。

参考文献

[1]	何开锋, 钱炜祺, 汪清, 等. 数据融合技术在空气动力学研究中的应用[J]. 空气动力学学报, 2014, 32(6): 777-782. HE K F, QIAN W Q, WANG Q, et al. Application of data fusion technique in aerodynamics studies[J]. Acta Aerodynamica Sinica, 2014, 32(6): 777-782. (in Chinese)
[2]	POLOCZEK M, WANG J L, FRAZIER P I. Multi-information source optimization[C]//NIPS 2017. Red Hook, NY, 2017. https://proceedings.neurips.cc/paper/2017/file/df1f1d20ee86704251795841e6a9405a-Paper.pdf
[3]	ALEXANDROV N M, LEWIS R M, GUMBERT C R, et al. Approximation and model management in aerodynamic optimization with variable-fidelity models[J]. Journal of Aircraft, 2001, 38(6): 1093-1101. DOI:10.2514/2.2877
[4]	ELDRED M, GIUNTA A, COLLIS S. Second-order corrections for surrogate-based optimization with model hierarchies[C]//10th AIAA/ISSMO Multidisciplinary Analysis and Optimization Conference, Albany, New York. Reston, Virginia: AIAA, 2004 doi: 10.2514/6.2004-4457
[5]	KEANE A J. Wing optimization using design of experiment, response surface, and data fusion methods[J]. Journal of Aircraft, 2003, 40(4): 741-750. DOI:10.2514/2.3153
[6]	王文正, 桂业伟, 何开锋, 等. 基于数学模型的气动力数据融合研究[J]. 空气动力学学报, 2009, 27(5): 524-528. WANG W Z, GUI Y W, HE K F, et al. Aerodynamic data fusion technique exploration[J]. Acta Aerodynamica Sinica, 2009, 27(5): 524-528. DOI:10.3969/j.issn.0258-1825.2009.05.004 (in Chinese)
[7]	傅建明, 李欣益, 唐海敏, 等. 基于Chebyshev-Taylor-Fourier混合级数模型函数的多源气动数据融合方法[J]. 气体物理, 2021, 6(1): 45-51. FU J M, LI X Y, TANG H M, et al. A fusion method for multi-source aerodynamic data based on Chebyshev-Taylor-Fourier combined series model function[J]. Physics of Gases, 2021, 6(1): 45-51. (in Chinese)
[8]	孙斌, 姚海涛, 刘婷. 基于高斯过程回归的短期风速预测[J]. 中国电机工程学报, 2012, 32(29): 104-109,5. SUN B, YAO H T, LIU T. Short-term wind speed forecasting based on Gaussian process regression model[J]. Proceedings of the CSEE, 2012, 32(29): 104-109,5. (in Chinese)
[9]	SEEGER M. Gaussian processes for machine learning[J]. International Journal of Neural Systems, 2004, 14(2): 69-106. DOI:10.1142/s0129065704001899
[10]	何志昆, 刘光斌, 赵曦晶, 等. 高斯过程回归方法综述[J]. 控制与决策, 2013, 28(8): 1121-1129,1137. HE Z K, LIU G B, ZHAO X J, et al. Overview of Gaussian process regression[J]. Control and Decision, 2013, 28(8): 1121-1129,1137. (in Chinese)
[11]	韩忠华. Kriging模型及代理优化算法研究进展[J]. 航空学报, 2016, 37(11): 3197-3225. HAN Z H. Kriging surrogate model and its application to design optimization: a review of recent progress[J]. Acta Aeronautica et Astronautica Sinica, 2016, 37(11): 3197-3225. (in Chinese)
[12]	MYERS D E. Matrix formulation of Co-Kriging[J]. Journal of the International Association for Mathematical Geology, 1982, 14(3): 249-257. DOI:10.1007/BF01032887
[13]	KUYA Y, TAKEDA K, ZHANG X, et al. Multifidelity surrogate modeling of experimental and computational aerodynamic data sets[J]. AIAA Journal, 2011, 49(2): 289-298. DOI:10.2514/1.J050384
[14]	HAN Z H, ZIMMERMANN, GÖRTZ S. Alternative cokriging method for variable-fidelity surrogate modeling[J]. AIAA Journal, 2012, 50(5): 1205-1210. DOI:10.2514/1.J051243
[15]	唐志共, 王文正, 陈功, 等. 气动模型在现代气动试验设计中的应用研究[J]. 空气动力学学报, 2017, 35(2): 172-176. TANG Z G, WANG W Z, CHEN G, et al. Research on the application of aerodynamic models in modern design of aerodynamic experiments[J]. Acta Aerodynamica Sinica, 2017, 35(2): 172-176. (in Chinese)
[16]	何开锋, 王文正, 钱炜祺. 根据风洞试验结果建立有尾翼导弹数学模型[J]. 流体力学实验与测量, 2004, 18(4): 62-66. HE K F, WANG W Z, QIAN W Q. Mathematic modeling for the missile aerodynamics with tail-wing according to wind-tunnel test results[J]. Experiments and Measurements in Fluid Mechanics, 2004, 18(4): 62-66. (in Chinese)