基于数据驱动的压气机特性图代理模型构建和优化

引用本文

杨启融, 王贺春, 杨传雷, 王银燕, 赵兴天, 牟红雨. 基于数据驱动的压气机特性图代理模型构建和优化. 舰船科学技术, 2025, 47(3): 89-94 复制到剪切板

YANG Qirong, WANG Hechun, YANG Chuanlei, WANG Yinyan, ZHAO Xingtian, MU Hongyu. Construction and optimization of compressor map surrogate model based on data. Ship Science and Technology, 2025, 47(3): 89-94 复制到剪切板

基于数据驱动的压气机特性图代理模型构建和优化

杨启融¹, 王贺春¹, 杨传雷¹, 王银燕¹, 赵兴天², 牟红雨²

1. 哈尔滨工程大学动力与能源工程学院，黑龙江哈尔滨 150009;
2. 哈尔滨东安汽车动力股份有限公司增程动力系统研究院，黑龙江哈尔滨 150060

收稿日期: 2024-04-30.

基金项目: 黑龙江省重点研发计划项目（2023ZX01A14）

作者简介: 杨启融（1993 – ），男，博士研究生，研究方向为发动机涡轮增压原理、数字孪生系统构建

摘要: 本文通过对某船用柴油机的匹配涡轮增压器进行研究，得到了压气机的特性曲线。分析了压气机转速、质量流量、压比和效率之间的关系。为了拟合回归和预测压气机特性曲线，使用了一些广泛使用的代理模型，包括Kriging模型、响应面法（RSM）、人工神经网络（ANN）、径向基函数（RBF）和支持向量机（SVM）。代理模型用于精确预测涡轮增压器在特定时间的运行参数。采用代理模型对不同速度组的曲线进行拟合，研究了压力比与效率的整体预测建模方法，并通过数据分析了不同训练样本量对拟合精度的影响; 通过遗传算法优化后的全转速下的代理模型的拟合精度提高，在样本数量较少时，其代理模型拟合结果的R²超过95%。

关键词: 船舶发动机涡轮增压器代理模型机器学习压气机特性图

Construction and optimization of compressor map surrogate model based on data

YANG Qirong¹, WANG Hechun¹, YANG Chuanlei¹, WANG Yinyan¹, ZHAO Xingtian², MU Hongyu²

1. School of Power and Energy Engineering, Harbin Engineering University, Harbin 150009, China;
2. Extended Range Powertrain Research Institute, Harbin Dongan Auto Engine Co., Ltd., Harbin 150060, China

Abstract: This study gets the matched turbocharger of a marine diesel engine to acquire the compressor characteristic curve. It was done to analyze the relationships between compressor speed, mass flow rate, pressure ratio, and efficiency. For fitting regression and predicting the compressor characteristic curve, a number of widely used surrogate models, including the Kriging model, Response Surface Methodology (RSM), Artificial Neural Networks (ANNs), Radial Basis Function (RBF) and Support vector machines (SVM), were used. The surrogate model is used to precisely anticipate the turbocharger's operational parameters at a specific time. The surrogate models are used to fit the curves of different speed groups, the result shows that the whole prediction modeling method of pressure ratio and efficiency is studied, and the influence of different training sample size on fitting accuracy is analyzed by data. After optimization by genetic algorithm, the fitting accuracy of the surrogate model at full speed is improved. When the samples size is small, the fitting result R² of the surrogate model is more than 95%.

Key words: marine diesel engine turbocharger surrogate model machine learning compressor characteristics

0 引　言

对于船用发动机，除了需要对动力机械的空间尺寸进行测量，以便构建准确的物理模型。还需要对发动机的运行数据进行准确且实时的获取，用于构建数字模型。基于发动机的建模仿真能够准确地模拟机械的不同工况，减少实验成本。但是尽管获得了大量的仿真数据，仍然需要对数据进行处理。但是发动机的仿真数据与状态之间存在复杂的关系，并不能通过单一参数的简单变化判断发动机的状态，需要建立设备运行状态和获取数据的映射关系。

代理模型是工程问题中常见的优化方法。当实际问题（高精度模型）需要大量的计算，不容易解决时，一个简化的模型和快速解决方案可以用来替换原始模型来加速优化过程^[1]。代理模型应用于许多领域，如医学^[2]、电力工程^[3]、结构工程^[4]等。可以简化复杂的物理模型，减少仿真和优化过程的计算负担^[5-6]。此外，代理模型可以处理工程系统^[7]的不确定性，如压气机特性曲线的拟合。在工程应用中，利用优化算法对代理模型进行优化，使其更准确。

近年来，许多学者利用代理模型取代了可靠性分析的功能功能，如响应面^[8−9]、支持向量机^[10−11]、人工神经网络^[12−13]、Kriging模型^[14−15]、径向基函数RBF^[16−17]等。这大大提高了分析效率。

目前已有不少学者利用代理模型拟合压气机特性曲线，并证明了代理模型的准确性。Ying等^[18]提出一种线性多元回归方法，即偏最小二乘回归方法。采用偏最小二乘回归建模方法对压气机映射进行了再现。利用不同幂次的多项式函数分别得到压缩映射的表达式；Bayomi等^[19]介绍了一种方法，该方法可以预测在稳定和不稳定条件下指定的离心压气机性能图；Chu等^[20]利用核偏最小二乘（KPLS）对离心（涡轮）压气机进行了性能建模。结果表明，KPLS能较好地预测压气机映射，具有较高的精度；Zhao等^[21]针对发动机部件特性二维线性插值精度低、特征数据样本少的问题，提出一种基于量子粒子群优化（QPSO）算法的压气机特性代理模型优化方法。

本文通过采集船用柴油机涡轮增压器的实际运行数据绘制压气机特性图，利用多种机器学习算法构建压气机特性图的代理模型。为了进一步简化代理模型，通过对数据分析尝试构建全转速下的代理模型，以达到少样本数据、高预测精度的目的。

1 理论基础 1.1 代理模型

由于代模型无法有效的解所有问题^[22]。本文采用Kriging模型、BP-ANN模型、SVM模型、RSM模型和RBF模型对压气机特性曲线进行拟合和回归。图1为5种代理模关相关特征，横坐标表示非相关性，纵坐标表示样本数量。5种代理模型的相关知识可以参考文献[23]。

图 1 5种代理模型的相关特征 Fig. 1 The features of five surrogate models

1.2 回归指标

在回归分析中，损失函数常用于度量模型预测值与实际值之间的差值，它是一种非负的实值函数。损失函数越小，模型的鲁棒性越好。本文采用均方误差和决定系数R²作为回归评价指标。

均方误差（Mean Squared Error, MSE）是平方误差的期望值，而误差是估计值与估计值之差。公式如下：

$ MSE = \frac{1}{n}{\sum\limits_{i = 1}^n {\left( {{y_i} - \mathop {{y_i}}\limits^ \wedge } \right)} ^2} 。$

(1)

式中：ŷ为代理模型的预测值；y为数据的真实值。

对于拟合问题，可以通过决定系数R²来反映拟合精度。根据R²的值来判断模型，R²的取值范围为[0, 1]。一般来说，R²越大，模型拟合效果越好。其表达式为：

$ {R^2} = \dfrac{{{{\left( {n\displaystyle\sum\limits_{i = 1}^n {\mathop {{y_i}}\limits^ \wedge {y_i} - \displaystyle\sum\limits_{i = 1}^n {\mathop {{y_i}}\limits^ \wedge \displaystyle\sum\limits_{i = 1}^n {{y_i}} } } } \right)}^2}}}{{\left( {n\displaystyle\sum\limits_{i = 1}^n {{{\mathop {{y_i}}\limits^ \wedge }^2} - {{\left( {\displaystyle\sum\limits_{i = 1}^n {\mathop {{y_i}}\limits^ \wedge } } \right)}^2}} } \right)\left( {n\displaystyle\sum\limits_{i = 1}^n {{y_i}^2 - {{\left( {\displaystyle\sum\limits_{i = 1}^n {{y_i}} } \right)}^2}} } \right)}} 。$

(2)

式中：ŷ为代理模型的预测值；y为数据的真实值。

数据归一化是神经网络预测前数据处理的常用方法。数据归一化过程将所有数据转换为[0, 1]之间的数字，以避免由于输入和输出数据差异较大而产生较大的网络预测误差。

$ x_k=\left(x_k-x_{\min}\right)/\left(x_{\max}-x_{\min}\right)。$

(3)

式中：x_max为样本最大值；x_min为样本最小值。

2 压气机特性曲线

本文对某船用发动机涡轮增压进行了试验，采集相关的运行数据，并且绘制相应的压气机特性曲线。其压气机特性曲线如图2所示。压气机特性曲线中采不同的转速下分为10组，分别表示了质量流量和压比、效率的关系图中不同的曲线分别为喘振线和不同转n的特性曲线。

图 2 压气机特性曲线 Fig. 2 The compressor map

2.1 不同转速下代理模型

首先采用5种机器学习算法构建代理模型，拟合不同转速组的质量流量-压比曲线和质量流量-效率曲线。对于全体数据样本，随机选取所有数据的4/5作为训练样本，1/5作为测试样本。拟合结果的平均R²和平均MSE见表1。R²越大，拟合精度越高；MSE越小，拟合精度越高。图3和图4显示了测试样本点和数据曲线之间的差异。

表 1 质量流量-压比曲线拟合结果 Tab.1 The fitting results of mass flow-pressure ratio

图 3 质量流量-压比曲线预测结果 Fig. 3 The predict values of mass flow-pressure ratio

图 4 质量流量-效率曲线预测结果 Fig. 4 The predict values of mass flow- efficiency

对于质量流量-压比曲线拟合，除SVM模型外，其余4种代理模型曲线拟合精度均较高，R²均大于98%，均方差均小于0.005。质量流量-效率曲线总体R²大于97%，MSE小于0.0005，如表2所示。

表 2 质量流量-效率曲线拟合结果 Tab.2 The fitting results of mass flow- efficiency

2.2 压力比与效率预测模型

从上面的分析可以看出，5种算法构造的代理模型，在拟合不同转速下的压气机图曲线时非常准确。

2.2.1 样本相关性分析

在对数据进行相关分析之前，首先要确定数据是否符合正态分布。压气机参数分析结果如表3所示。由于样本量大于50，应以Kolmogorov-Smirov（K-S）检验结果为准。经检验，各组样本的相关性为sig = 0< 0.05，说明样本不符合正态分布。

表 3 正态分布分析 Tab.3 The analysis of normal distribution

由于压气机转速n、升压比Π、质量流量m和效率η的数据不符合正态分布，因此应采用Spearman方法对压气机转速、升压比、质量流量和效率进行相关性分析。表4为4个参数之间的相关性分析，其中“**”表示在0.01水平上显著相关。由此可见，增压比对效率预测有很大的影响。

表 4 相关性分析 Tab.4 The data correlation analysis

2.2.2 压比预测

通过对数据样本的相关性分析，质量流量m、速度n和效率η会影响压比的预测。表5是采用5种替代模型拟合质量流量-压比曲线的结果。在表5中，分别以质量流量、速度和效率作为输入参数，以压力比作为输出参数拟合质量流量-压比曲线。

表 5 不同输入参数的拟合结果 Tab.5 The fit results for different input parameters

可以看出，在5个代理模型中，SVM模型和RSM模型的拟合精度较低。f (m)的拟合结果R²较低，MSE较高。f (n, m)和f (n, m, η)的拟合结果具有较高的R²和较低的MSE。f (n, m, η)的R²为99%，MSE小于0.001。也就是说，质量流量作为输入参数的拟合精度较低，质量流量和速度作为输入参数的拟合精度较高，质量流量、速度和效率作为输入参数的拟合精度接近原始数据。

对不同转速组的样本，随机选取相同数量的样本组成训练样本，用于构建代理模型，预测压缩比。文中的压气机特性曲线中根据转速分为10组，随机选取每组的x个样本构成训练样本，并且命名为设计组。分别分析了以质量流量、速度为输入参数Π=f (n, m)和以质量流量、速度、效率为输入参数Π=f (n, m, η)的代理模型的拟合结果。

表6给出了Π=f (n, m, η)在不同设计组拟合结果的均方误差和R²。可以看出，随着训练样本数量的增加，R²越高，MSE越小，即拟合精度越高。SVM模型的拟合精度最低。当设计组为5次时，4个代理模型的拟合精度足够准确。对于Kriging模型，当训练样本为设计组的2倍时，可以获得较高的拟合精度。

表 6 Π=$ f $(n, m, η)拟合结果的MSE和R² Tab.6 The MSE and R² of fitting results of Π=f (n, m, η)

图5为Π=f (n, m)生成的代理模型在不同设计组拟合结果的均方差MSE。由于样本的随机选择，拟合结果会有所不同。可以看出，随着训练样本数量的增加，MSE越小，即拟合精度越高；在5个代理模型中，SVM模型和RSM模型的拟合精度较低，当训练样本数量为设计组的12倍（总样本的1/2）时，其他3个代理模型的MSE均小于0.01；对于RBF模型，当训练样本较少时，其拟合精度低于其他4种代理模型，但当训练样本数量足够时（本实验中设计组数量为7次），其拟合精度可以达到最佳。

图 5 不同设计组的均方差MSE Fig. 5 The MSE of different design groups

2.2.3 效率预测模型

基于上述对各参数的相关性分析可知，压力比影响效率预测模型的预测精度。为了进一步分析不同输入变量对预测精度的影响，构建5种代理模型在不同输入变量下的拟合结果，分别为全部变量、无质量流量、无速度、无压力比。由图6可知，速度参数对整个样品的效率拟合结果影响较小，而压力比和质量流量对样品的整体拟合结果有影响，其中压力比对样品的整体拟合结果影响较大。因此，本文以转速进行分组，以压力比和质量流量作为拟合效率的主要输入参数，构建代理模型。

图 6 不同输入变量下的拟合结果 Fig. 6 The fit results for different input variables

代理模型中的参数是默认值。采用5种代理模型对压气机特性曲线进行拟合，拟合结果如表7所示。

表 7 5种代理模型的R²和MSE Tab.7 The R² and MSE of 5 ssurrogate models

由于压气机转速特性对模型整体预测精度影响较小，因此将压气机特性数据按不同转速分组，每组随机选取不同样本点构建训练样本，对整体样本进行拟合和预测。图7为不同样本量对预测精度的影响。横坐标为设计分组数量，纵坐标为预测精度R²。随着设计组的增加，预测精度整体提高，当设计组达到15时，预测精度R²较为稳定，而此时训练样本的总量达到了总样本数量的60%。当训练样本较少时，其拟合精度波动较大。因此，如何使用最小的样本量达到最佳的预测精度，需要对代理模型的参数进行优化。

图 7 不同设计组的预测结果的R² Fig. 7 The predic results of different design groups

3 代理模型的优化

为了构造整体代理模型，需要随机选取不同速度组的数据点构成作为训练样本，本文对压气机特性曲线的10组速度数据组进行处理，随机选取不同速度组的相同数量的样本点构成训练样本，并且为了减小拟合过程的随机性，每组训练样本随机选取5次，取5次结果的平均值作为拟合结果。利用3种方法构建压气机整体效率的代理模型，并且用粒子群优化算法对代理模型进行优化，以便得到拟合精度最高的代理模型。

本文采用遗传算法对代理模型的参数进行优化，对于优化算法，不同的种群数量、迭代或几代将影响最终的优化精度和优化的成本，而运行时间将随着人口数量和迭代的增加而增加。因此，确定适当的人口大小和迭代次数非常重要。迭代的次数通常是人口数量的1～10倍。通过实验，本文设定迭代次数为120，种群数量为30。确定了优化算法的约束条件，如式(6)所示适应度函数，用于判断拟合精度。

$ fitness = \frac{{\text{1}}}{N}{\left( {y - \mathop y\limits^ \wedge } \right)^{\text{2}}}。$

(4)

利用遗传算法对5种算法的代理模型进行优化后的拟合精度的R²如表8所示。与图7对比可知，通过遗传算法优化后，其代理模型的拟合精度提高。当设计组达到5时，其Kriging模型、BP预测和SVM模型结果的R²超过95%，其预测值与真实值接近。

表 8 遗传算法优化后的代理模型的R² Tab.8 The R² of the surrogate model optimized by genetic algorithm

4 结　语

本文采用Kriging模型、BP模型、RBF模型、SVM模型和RSM模型对压气机特性曲线进行拟合和回归。得出以下结论：

1）对于不同转速下的质量流量-压比和质量流量-效率曲线的拟合，5种代理模型的SVM模型拟合精度较低，而其余4种代理模型的拟合结果较高。

2）对于基于所有数据的曲线拟合，当训练样本量较大时，5种代理模型的拟合精度较高，但随着训练样本量的减小，预测结果的精度会降低。

3）通过压气机特性的相关性分析，对于以压力比为因变量的建模，以速度和质量流量为自变量的代理模型的拟合精度更高。对于以效率为因变量的模型，以质量流量和压比为自变量的代理模型的拟合精度更高。

4）通过遗传算法优化后的全转速下的代理模型的拟合精度提高，在样本数量较少时，其代理模型拟合结果的R²超过95%。

参考文献

[1]	HAN Z. Kriging surrogate model and its application to design optimization: A review of recent progress[J]. Acta Aeronauticaet Astronautica Sinica, 2016, 37(11): 3197-3225.
[2]	FAISAL T R, ADOUNI M, DHAHER Y Y. Surrogate modeling of articular cartilage degradation to understand the synergistic role of MMP-1 and MMP-9: a case study[J]. Biomech Model Mechanobiol, 2023, 22(1): 43-56. DOI:10.1007/s10237-022-01630-0
[3]	YEPES B L, BRUN I A, ALCALÁ J, et al. CO(2)-Optimization of post-tensioned concrete slab-bridge decks using surrogate modeling[J]. Materials (Basel), 2022, 7, 15(14).
[4]	BERTHELSON P R, GHASSEMI P, WOOD J W, et al. A finite element-guided mathematical surrogate modeling approach for assessing occupant injury trends across variations in simplified vehicular impact conditions[J]. Med Biol Eng Comput. 2021 May;59(5): 1065−1079.
[5]	CONN A R, SCHEINBERG K, VICENTE L N. Introduction to derivative-free optimization \| \| 12[J]. Review of Surrogate Model Management. 2009, 229–240.
[6]	GARZÓN A, LANGEVELD J, KAPELAN Z, et al. Machine learning‐based surrogate modeling for urban water networks: review and future research directions[J]. Water Resources Research, 2022, 58(5): 1–26.
[7]	WU T. Recent advances in surrogate modeling methods for uncertainty quantification and propagation[J]. Symmetry, 2022, 14: 1219.
[8]	JIANG C, ZHANG D Q, LIU J, et al. Time-dependent reliability analysis through response surface method[J]. Journal of Mechanical Design, 2017, 139(4): 1547-1559.
[9]	KUMAR A S, SINGH H P, MOHSIN M K. Response surface optimization approach to enhance the performance of diesel engine using ternary blends of biobutanol and biodiesel doped with ZnO nanoparticles[J]. Energy Conversion and Management, 2024, 300: 117899.
[10]	DAI H, ZHANG H, WANG W. A support vector density-based importance sampling for reliability assessment[J]. Reliability Engineering and System Safety, 2012, 106(106): 86-93.
[11]	SALMA J, ADEL K. Sensorless DTC-SVM applied to an induction motor controlled by a three-level inverter using SMSFO[J]. COMPEL - The international journal for computation and mathematics in electrical and electronic engineering, 2023, 42(6): 1349-1371. DOI:10.1108/COMPEL-04-2022-0162
[12]	PAPADOPOULOS V, GIOVANIS D G, LAGAROS N D, et al. Accelerated subset simulation with neural networks for reliability analysis[J]. Computer Methods in Applied Mechanics and Engineering, 2012, 223−224: 70-80. DOI:10.1016/j.cma.2012.02.013
[13]	SHENG G, YAN H Z, ZHI Q Z, et al. Multi-objective optimization of the combustion chamber geometry for a highland diesel engine fueled with diesel/n-butanol/PODEn by ANN-NSGA III[J]. Energy, 2023, 282: 128793.
[14]	LEE S, KIM J H. An adaptive importance sampling method with a Kriging metamodel to calculate failure probability[J]. Journal of Mechanical Science & Technology, 2017, 31(12): 5769-5778.
[15]	DRĘŻEK P S. , Kubacki sławomir, żółtak jerzy. kriging-based framework applied to a multi-point, multi-objective engine air-intake duct aerodynamic optimization problem[J]. Aerospace, 2023, 10(3): 266-266. DOI:10.3390/aerospace10030266
[16]	GAO S, LIU J. Adaptive fault‐tolerant robust control based on radial basis function neural network for a class of mechanical systems with input constraints[J]. International Journal of Robust and Nonlinear Control, 2022(7): 32.
[17]	QIU W M, HUI H Z, ZHI B S, et al. Multiobjective optimization of stress-release boot of solid rocket motor under vertical storage based on RBF model[J]. International Journal of Aerospace Engineering, 2022(346−351): 1-8.
[18]	YING Y, SUN B, PENG S, et al. Study on the regression method of compressor map based on partial least squares regression modeling[J]. Proceedings of the ASME Turbo EXPO: Turbine Technical Conference and Exposition, 2014.
[19]	BAYOMI N, ABDEL M R, REZK M. Centrifugal compressor map prediction and modification[J]. Journal of King Abdulaziz University Engineering Sciences, 2013, 24(24): 73-88.
[20]	CHU F, WANG F, WANG X, et al. Performance modeling of centrifugal compressor using kernel partial least squares[J]. Applied Thermal Engineering, 2012, 44: 90-99.
[21]	ZHAO Y, LI B W, ZHU F X, et al. Surrogate model optimization of compressor characteristics based on qpso algorithm[J]. Journal of Propulsion Technology, 2014, 35(11): 1537-1543.
[22]	QUEIPO N V, HAFTKA R T, SHYY W, et al. Surrogate-based analysis and optimization[J]. Progress in Aerospace Sciences, 2005, 41(1): 1-28. DOI:10.1016/j.paerosci.2005.02.001
[23]	YANG Q R, WANG H C, YANG C L, et al. Research on surrogate models and optimization algorithms of compressor characteristic based on digital twins[J/OL]. Journal of Engineering Research, 2024.


舰船科学技术 2025, Vol. 47 Issue (3): 89-94 DOI: 10.3404/j.issn.1672-7649.2025.03.015	PDF