基于CGAN和BiLSTM的内燃机故障诊断方法

引用本文

吴唐奕, 刘腾, 王俊雄. 基于CGAN和BiLSTM的内燃机故障诊断方法. 舰船科学技术, 2026, 48(7): 77-83 复制到剪切板

WU Tangyi, LIU Teng, WANG Junxiong. A fault diagnosis method for internal combustion engines based on CGAN and BiLSTM. Ship Science and Technology, 2026, 48(7): 77-83 复制到剪切板

基于CGAN和BiLSTM的内燃机故障诊断方法

吴唐奕^1,2, 刘腾², 王俊雄¹

1. 上海交通大学船舶海洋与建筑工程学院，上海 200240;
2. 中船动力研究院，上海 201208

收稿日期: 2025-07-31.

作者简介: 吴唐奕（2001 – ），男，硕士研究生，研究方向为内燃机仿真与故障诊断

摘要: 构建神经网络分类器，使其能够依据热工参数的变化规律，精准识别包括复合故障在内的各类故障；同时，针对实际应用中存在的数据不平衡问题，提出切实可行的解决办法。首先基于双向长短期记忆网络（BiLSTM）构建故障诊断分类器，经仿真数据训练验证其基础性能达标；针对实际应用中故障样本较少的问题，补充构建条件生成对抗网络（CGAN）生成与原始数据规律一致的相似样本，提升分类器对少数类故障辨别能力；最终通过中船动力M320DM-PFI双燃料机实际试验数据验证性能。仿真数据验证显示，BiLSTM 分类器诊断准确率为100%；CGAN可保留原始特征生成新样本，生成数据的JS散度均在0.3以下，与原始数据分布近似；数据增强后，分类器的召回率从80%提升至100%，诊断性能显著优化。CGAN数据增强方法与BiLSTM分类器结合可有效提高少数类的诊断准确性，为实际的热工故障诊断提供参考。

关键词: 故障诊断热工故障条件生成对抗网络（CGAN）双向长短期记忆网络（BiLSTM）

A fault diagnosis method for internal combustion engines based on CGAN and BiLSTM

WU Tangyi^1,2, LIU Teng², WANG Junxiong¹

1. School of Ocean and Civil Engineering, Shanghai Jiao Tong University, Shanghai 200240, China;
2. China Shipbuilding Power Engineering Institute, Shanghai 201208, China

Abstract: To construct a neural network classifier capable of accurately identifying various faults, including compound faults, based on the variation patterns of thermal parameters. Meanwhile, a practical solution is proposed to address the data imbalance issue encountered in real-world applications. First, a fault diagnosis classifier was built based on the Bidirectional Long Short-Term Memory (BiLSTM) network, and its basic performance was verified to meet standards through training with simulation data. To tackle the problem of insufficient fault samples in practical applications, a Conditional Generative Adversarial Network (CGAN) was additionally constructed to generate similar samples that conform to the patterns of the original data, thereby enhancing the classifier’s ability to identify minority-class faults. Finally, the performance was validated using actual test data from the CSSC Power M320DM-PFI dual-fuel engine. Simulation data verification showed that the diagnostic accuracy of the BiLSTM classifier reached 100%. The CGAN could preserve original features while generating new samples, with the Jensen-Shannon (JS) divergence of the generated data all below 0.3, indicating a distribution similar to that of the original data. After data augmentation, the recall rate of the classifier increased from 80% to 100%, achieving a significant optimization in diagnostic performance. The combination of the CGAN data augmentation method and the BiLSTM classifier can effectively improve the diagnostic accuracy of minority-class faults, providing a reference for practical thermal fault diagnosis.

Key words: fault diagnosis thermal fault Conditional Generative Adversarial Network (CGAN) Bidirectional Long Short-Term Memory (BiLSTM)

0 引　言

随着科技进步，现代船舶动力系统结构日益复杂，受恶劣工作环境、繁多零部件及子系统间复杂耦合作用的影响^[1]，其故障发生概率较高且类型多样^[2]。提升船舶发动机的智能化管理与控制水平，确保其在复杂工况及故障状态下稳定运行，已成为当前研究的重点课题。船用甲醇-柴油双燃料发动机作为一种多燃料动力系统，可显著降低碳排放，但在运行过程中涉及复杂的燃烧特性、燃料切换策略及多种控制需求，相较于传统柴油机，其故障发生率更高^[3]。故障状态下，传统检测手段难以实现及时准确的状态识别：明显故障发生后再进行维护可能缩短发动机寿命，造成安全隐患，定期维护又易出现维护不足或过剩的问题，故而借助神经网络技术通过热工参数进行故障诊断，对提升发动机的智能化与信息化管理水平具有重要意义。

近些年来，随着科技的发展，许多故障诊断方法的研究产生了。郭晓成^[4]基于甲醇-柴油双燃料发动机主轴滚动轴承的振动信号特征，构建了融合多尺度卷积神经网络（Multi-Scale Convolutional Neural Network, MSCNN）与双向长短时记忆网络（Bidirectional Long Short-Term Memory, BiLSTM）的故障诊断模型，但仅采集了单一故障类型的数据，且未通过实验验证模型有效性，导致研究缺乏实际应用价值。张振京等^[5]构建了一种融合降噪自编码器、注意力机制和双向门控循环单元的深度网络模型，该模型可兼顾实际监测参数的噪声干扰、敏感性差异及时序特性，但研究仅聚焦于喷油故障这一单一类型，且模型训练依赖仿真数据，未结合真实工况数据验证，因此普适性不足。毛荣珍等^[6]针对旋转机械的复合故障，提出了基于复合故障数据增强的多输出卷积神经网络诊断模型，其核心是通过数据增强方法处理复合故障识别问题，然而该研究中复合故障数据是通过单故障信号叠加理论生成的振动信号，与热工参数数据的特性不匹配，故难以适用于使用热工参数场景。杨松翰^[7]提出了一种基于多尺度孪生注意力小波胶囊多标签网络的非完备数据复合故障诊断方法，提高了仅使用少量单一故障数据时的分类能力和复合故障解耦能力，但其数据基于实验室模拟数据，未考虑实际环境中的噪声问题，且其诊断方法属于黑箱性质，可解释性差，决策过程不透明。李巍华等^[8]基于小波核卷积层和胶囊层构建了小波胶囊网络，提升了模型的可解释性，但仍然仅适用于振动信号。可见当下大部分故障诊断的研究基于振动信号，适用于热工参数的故障诊断方法较少，而热工参数是内燃机运行过程中需常规监测的基础参数，多数内燃机本身已集成相关传感器，相较于振动信号的采集更便捷、成本更低，且更易实现长期稳定监测。

本文针对甲醇-柴油双燃料中速机的热工故障，搭建适用于热工参数的故障诊断模型。通过使用仿真数据，验证了故障诊断模型的可靠性，证明其可以通过热工参数的数据进行故障诊断。针对实际应用中样本缺乏的问题，使用了条件生成对抗网络（Conditional Generative Adversarial Network, CGAN）拓展试验数据集，并以中船动力M320DM-PFI甲醇—柴油双燃料机工作过程中产生喷油波动的异常数据为例，验证神经网络模型的可行性。

1 研究对象与数据准备

本文研究对象为中船动力M320DM-PFI甲醇—柴油双燃料中速机，主要参数如表1所示。使用Modelica语言搭建的整机模型框架如图1所示。

表 1 目标双燃料机主要技术参数 Tab.1 Main technical parameters of the target dual fuel machine

图 1 模型框架示意图 Fig. 1 Schematic diagram of the model frame

在100%、75%、50%、25%负荷下稳态运行时，该模型的关键热工参数的仿真值与试验值相差小于5%，故而可以将仿真数据作为训练样本。

本文在100%负荷下以0.001 s为仿真步长，按表2参数设置，仿真获取了各类故障状态下涡轮机进口压力与温度、涡轮机出口温度、压缩机出口压力与温度、涡轮增压器转速、缸压及燃料消耗量共8种参数的数据。同时，为了能同时判别单个故障与复合故障，本文在标签格式上采用多热编码的格式，即以诸如[1,0,1]的格式表明该样本存在1号故障和3号故障。

表 2 故障模拟参数设置 Tab.2 Fault simulation parameter Settings

为模拟实际场景下的数据噪声，保证分类器具备一定鲁棒性，本文为上述仿真数据加上了均值为0，标准差为原数据标准差10%的高斯噪声。以200时间步为1个样本的长度，100时间步为2个样本间的间隔，从正常工况和5种故障工况中各分割出100个样本，共计600个样本，每个样本为8×200的数据集，打乱后将其中80%作为训练集，用以训练神经网络，20%作为验证集，验证训练后的神经网络效果。

2 研究方法

本文的故障诊断方法以数据驱动为核心，通过“故障仿真—故障诊断—数据增强”三步层层递进，将基于仿真数据的故障诊断逐步迁移到基于真实数据的故障诊断，实现实际应用中的故障识别，具体思路如图2所示。

图 2 研究流程 Fig. 2 Research process

分类器以BiLSTM网络为基础框架以便捕捉热工参数的时序依赖关系^[9]，通过2个LSTM补充从未来到过去的反向传播过程，更全面地验证周期的一致性；引入自注意力机制，聚焦关键周期特征，通过计算序列中任意2个时刻的关联性来强化敏感时段的特征权重，解决传统时序模型对周期性波动特征关注度不足的问题，提升特征提取的针对性与鲁棒性。

在实际应用中，内燃机的故障数据远少于正常数据^[10]，使用少量的故障数据进行训练容易让神经网络错误地将噪声信号或某些个例当成该故障的典型特征，无法学习到更普遍的特征，对之后的故障诊断造成误判^[11]。同时，故障数据远少于正常数据数量会让神经网络倾向于判断当前状态为正常状态，忽视数据量较少的故障状态。

针对上述问题，Chawla等^[12]使用过采样的方法，从少数类的样本中随机选择一部分生成新样本来扩充数据集；王琦等^[13]通过重叠采样来获取足够的训练数据，也能达到提高故障诊断准确性的目的。但上述方法忽略了数据的原始分布，仅对原始数据进行了简单的变换，重复率高，不能彻底挖掘信号的深层特征，不能满足智能故障诊断对训练数据的要求^[14]。本文引入CGAN进行数据增强：通过生成器与判别器的对抗训练，基于少量真实故障样本训练生成器生成高度逼真的扩充数据，优化数据集的类别分布比例。将平衡后的数据集用于分类器再训练，可以有效缓解模型因样本分布偏差导致的泛化性能下降问题。

本文通过可靠的仿真数据建立有效的故障诊断模型框架，再基于真实数据的特性进行优化调整，最终形成切实有效的故障诊断方法，为复杂工业场景下的智能故障诊断提供了参考。

3 建立故障诊断分类器 3.1 神经网络分类器设计

考虑到实际应用中内燃机的转速并不固定，而用于故障诊断的样本应至少包含一个循环的完整信息才能做出可靠的判断。本文以200时间步（额定转速下为1.25个循环）为一个样本，确保即使转速下降，一个样本内也能有至少一个循环的完整信息，但这样所设计的神经网络分类器应具备从片段中提取出周期规律的能力。本文设计了如图3所示的神经网。

图 3 分类器结构简介 Fig. 3 Introduction to the structure of the classifier

3.2 用仿真数据验证神经网络分类器

为验证所建立的分类器性能，用训练集多次迭代上述神经网络，使模型的均方根误差（RMSE）收敛至0.1以下，用训练完的神经网络分类器判别训练集与验证集，根据预测结果绘出混淆矩阵，如图4所示。

图 4 仿真数据混淆矩阵图 Fig. 4 Simulation data confusion matrix graph

可知，训练集和验证集的全部样本中，准确率、精确率、召回率、F1分数均为1，所有样本的真实类与预测类均一致，表明神经网络分类器对仿真数据的标签均有准确的判断，没有将复合故障与近似的单个故障混淆，表现良好。

4 试验数据验证 4.1 不平衡数据集的训练效果

中船动力研究院提供了M320DM-PFI甲醇−柴油双燃料机的试验数据，涵盖200个运行循环，其中150个循环为正常状态，50个循环中出现了6号缸喷油量波动的情况。该数据通过 KiBox燃烧分析仪采集，采样分辨率达0.1°CA（曲轴转角）。本文以一个循环的数据为一个样本，将80%的样本划分为训练集，20%划分为测试集，重新进行神经网络的训练和验证，结果如图5所示。

图 5 原始试验数据混淆矩阵 Fig. 5 Confusion matrix of the original experimental data

图5(a)混淆矩阵仅含测试集，结果较为准确，具有普适性，图5(b)混淆矩阵包含所有数据，准确率可能虚高。可知，某类故障数据较少将导致神经网络在精准识别多数类后便难以更新自身，从而忽视了少数类的准确性。虽然分类器整体的准确率较高，但召回率（正确识别正例的概率）仅为80%，需要通过数据增强来改善这一情况。

4.2 基于条件生成对抗网络（CGAN）的数据增强

合成少数类过采样技术（Synthetic Minority Oversampling Technique，SMOTE）、变分自动编码器（Variational Autoencoder, VAE）和生成对抗网络（Generative Adversarial Network, GAN）都能学习数据的分布并生成新的、与训练数据相似的样本，以达到扩充数据集的作用。不同的是，SMOTE通过计算少数类样本的k近邻合成新样本，生成的数据能保留数据分布特征，但受噪声和预测值影响大；VAE通过重构和概率正则化学习结构化潜在空间，侧重稳定性和可解释性，生成的样本偏模糊；GAN通过对抗博弈学习数据细节，侧重生成质量，虽然训练不稳定，但生成的数据更为逼真。考虑到本文需要生成尽可能逼真的数据，故在选用GAN的基础上引入类别标签作为条件（即CGAN），可定向生成特定类别的样本。具体结构和作用如图6和图7所示。

图 6 判别器结构 Fig. 6 Introduction to the Discriminator structure

图 7 生成器结构 Fig. 7 Generator structure

本文采用4.1中的试验数据训练CGAN，以达到拓展故障数据的目的。以某个循环的实验数据与生成数据为例，原数据与生成的新数据对比如图8和图9所示。

图 8 6号缸喷油量波动时1号缸缸压曲线 Fig. 8 The cylinder pressure curve of cylinder 1 when the fuel injection volume of cylinder 6 fluctuates

图 9 6号缸喷油量波动时6号缸缸压曲线 Fig. 9 The cylinder pressure curve of cylinder 6 when the fuel injection volume of cylinder 6 fluctuates

为衡量生成曲线的质量，本文计算了故障发生时各缸“缸压峰值”、“缸压峰值对应的曲轴转角”、“300°CA到370°CA的上升速率”、“315°CA到435°CA的曲线积分”4种特征值的JS散度和均值相对误差，结果如表3和表4所示。

表 3 缸压曲线各特征值的JS散度 Tab.3 The JS divergence of each characteristic value of the cylinder pressure curve

表 4 缸压曲线各特征值的均值相对误差 Tab.4 The mean relative error of each characteristic value of the cylinder pressure curve

“315-435°CA的曲线积分”的JS散度较高，但均值相对误差较低，说明主要原因在于原数据方差较大而生成数据方差较小，导致该特征值的重叠区域面积较小。但综合各特征值可知，各缸的JS散度均在0.3以下，表明生成曲线与实际曲线的分布大体一致。各特征值的均值相对误差都在5%以下，表明生成数据与原数据的均值接近。总体上看，生成曲线质量较好，可以用作数据增强。

4.3 CGAN方法与SMOTE方法对比

CGAN与SMOTE均是用于解决类别不平衡问题的常用方法。SOMTE基于少数类样本的局部邻域相似性，通过线性插值生成新样本。

本文将取50个实验样本，一半用作训练素材生成新样本，一半用于对比检验CGAN和SMOTE生成的新样本，以防止数据泄露导致结果虚高。对比指标选用KL散度、JS散度和Wasserstein距离三项，主要从关键特征、整体形状、整体平移三方面衡量生成样本的质量，结果如表5所示。

表 5 CGAN生成数据与SMOTE生成数据对比 Tab.5 Comparison of data generated by CGAN and SMOTE

JS散度能衡量整体相似性，是判断两分布是否相似的核心指标，CGAN数据和SMOTE数据的JS散度都在0.3以下，但SMOTE数据要高42%，说明SMOTE数据的整体形状与原数据有较大偏差；KL散度能衡量拟合真实分布时的信息损失，更小的KL散度意味着生成数据更能捕捉真实分布的局部高概率区域特征，如曲线的峰值、突变点等，SMOTE数据的KL散度较大，意味着核心区域可能有所缺失，如峰值被平滑、突变点被平均；Wasserstein距离衡量全局传输成本，更小的值意味着生成分布与真实分布的位置偏移更小，SMOTE数据的Wasserstein距离更小，说明两者的整体均值更接近。总体来说，虽然SMOTE数据的整体均值更接近，但在生成曲线的形状和特征上存在不足，而数据的形状及特征是故障诊断的关键，故而CGAN比SMOTE更适合用作数据增强。

4.4 用增强后的试验数据验证神经网络分类器

利用建立的CGAN将故障样本扩充至150个（含50个原始实验数据），保留150个正常样本，打乱后取80%的训练集和20%的验证集，用训练集训练3.1中建立的神经网络框架，结果如图10所示。

图 10 扩充后试验数据混淆矩阵 Fig. 10 Enhanced test data confusion matrix

可知，正类全部判断正确，召回率由80%提升至100%，说明使用CGAN扩充后的数据训练神经网络，可以让神经网络更关注少数类，提高神经网络的判断能力。

4.5 对黑箱模型可解释性的分析

本文所涉及模型复杂且非线性，虽能有效捕捉特征，但决策过程为黑箱，难以拆解每一个参数的物理意义，但可借助LIME（局部线性近似）等工具帮助理解黑箱模型做出决策的原因。

本文以某个正常工况下的实验样本为例，利用LIME辅助分析黑箱模型的决策过程，LIME分析结果如图11所示。

图 11 LIME分析结果 Fig. 11 Analysis results by LIME

可知，影响结果判断的主要因素为6号缸。6号缸系数全为负值，说明6号缸缸压越高，模型输出结果越接近0（正常），缸压越低，模型输出结果越接近1（6号缸故障），符合6号缸喷油量波动后缸压下降的情况。1号缸影响系数较大且多为正数，说明1号缸缸压越高，模型越倾向于认为出现“6号缸喷油量波动”这一故障。实际上6号缸缸压下降后，输出功率下降，导致其它缸喷油量在负反馈下增加，1号缸缸压提升，与黑箱判断逻辑符合。

但上述内容仅为针对单一样本的解释，全局可解释性仍需进一步研究。

5 结　语

本文以中船动力 M320DM-PFI 甲醇—柴油双燃料机为研究对象，围绕内燃机故障诊断展开系统性研究，主要得到以下结论：

1）基于BiLSTM的神经网络分类器可以基于热工参数对常见故障进行诊断，基于仿真数据的诊断准确率为100%，可以区分复合故障与单个故障，表现较好。

2）样本缺乏将导致分类器忽视少数类的准确率，需要进行数据增强。

3）对比SMOTE，利用CGAN生成的数据集与原数据集形状更为近似，可以实现数据增强。

4）以单缸喷油量波动的试验数据为例，将故障数据的数量扩充后，召回率从80%提升至100%，证明使用CGAN进行数据增强可以提高分类器正确识别少数类的能力。

综上所述，本文构建了适用于甲醇—柴油双燃料机的热工故障诊断方法。基于BiLSTM的分类器展现了对故障特征的强捕捉能力，而CGAN的数据扩充方法则有效解决了实际应用中数据不平衡的问题，两者结合为内燃机的热工故障诊断提供了可行的技术方案，具有较好的工程应用价值。

参考文献

[1]	刘长铖. 基于Modelica语言的柴油机建模仿真研究 [D]. 哈尔滨: 哈尔滨工程大学, 2017.
[2]	李方玉, 汪翔, 陆轶, 等. 大型动力装置的故障模拟及分析[J]. 机电工程技术, 2022, 51(2): 102-105. LI F Y, WANG X, LU Y, et al. Fault simulation and analysis of large-scale power equipment[J]. Mechanical & Electrical Engineering Technology, 2022, 51(2): 102-105. DOI:10.3969/j.issn.1009-9492.2022.02.025
[3]	张海涛. 船舶双燃料发动机故障诊断系统优化研究[J]. 舰船科学技术, 2020, 42(4): 76-78. ZHANG H T. Research on the optimization of fault diagnosis system for marine dual fuel engine[J]. Ship Science and Technology, 2020, 42(4): 76-78.
[4]	郭晓成. 甲醇/柴油双燃料发动机健康评估与故障诊断方法研究[D]. 镇江: 江苏科技大学, 2024.
[5]	张振京, 曹石, 窦全礼, 等. 深度学习与异常信息融合的内燃机燃油系统智能诊断方法[J]. 北京化工大学学报(自然科学版), 2025, 52(2): 76−87. ZHANG Z J, CAO S, DOU Q L, et al. A deep learning and anomaly information fusion intelligent diagnosis method for the fuel system in internal combustion engine[J]. Journal of Beijing University of Chemical Technology(Natural Science), 2025, 52(2): 76−87.
[6]	毛荣珍, 米洁, 甄真, 等. 基于数据增强的多输出分类旋转机械复合故障诊断[J]. 北京信息科技大学学报(自然科学版), 2025, 40(1): 94-101. MAO R Z, MI J, ZHEN Z, et al. Multi-output classification fault diagnosis of rotating machinery based on data augmentation[J]. Journal of Beijing Information Science and Technology University (Natural Science Edition), 2025, 40(1): 94-101. DOI:10.16508/j.cnki.11-5866/n.2025.01.011
[7]	杨松翰. 基于多尺度孪生网络的旋转机械小样本故障诊断方法研究[D]. 广州: 华南理工大学, 2024.
[8]	李巍华, 蓝昊, 陈祝云, 等. 非完备数据驱动的装备复合故障智能解耦方法[J]. 机械工程学报, 2024, 60(24): 45−55. LI W H, LAN H, CHEN Z Y, et al. Incomplete data-driven intelligent decoupling method for equipment composite faults[J]. Journal of Mechanical Engineering, 2024, 60(24): 45−55.
[9]	田睿, 刘维可, 伍珣. 基于CGAN与LSTM的逆变器多类型故障诊断方法研究[J]. 湖南电力, 2023, 43(6): 151-158. TIAN R, LIU W K, WU X. Research on multi-type fault diagnosis method of inverter based on CGAN and LSTM[J]. Hunan Electric Power, 2023, 43(6): 151-158. DOI:10.3969/j.issn.1008-0198.2023.06.023
[10]	张伟业, 缪维跑, 苏欢欢, 等. 基于不平衡样本数据的轴承故障诊断模型与方法研究[J]. 动力工程学报, 2025, 45(6): 904−912. ZHANG W Y, MIAO W P, SU H H, et al. Research on bearing fault diagnosis model and method based on imbalanced sample data[J]. Journal of Chinese Society of Power Engineering, 2025, 45(6): 904−912.
[11]	周建民, 夏晓枫, 李家辉. 改进生成对抗网络的不平衡数据下轴承故障诊断[J]. 控制工程, 2025, 32(6): 1039-1048. ZHOU J M, XIA X F, LI J H. Bearing fault diagnosis under imbalanced data using improved generative adversarial network[J]. Control Engineering of China, 2025, 32(6): 1039-1048.
[12]	CHAWLA N V, BOWYER K W, Hall L O, et al. SMOTE: Synthetic minority over-sampling technique[J]. Journal of Artificial Intelligence Research, 2002, 16(1): 321-357.
[13]	王琦, 邓林峰, 赵荣珍. 基于改进一维卷积神经网络的滚动轴承故障识别[J]. 振动与冲击, 2022, 41(3): 216-223. WANG Q, DENG L F, ZHAO R Z. Fault recognition of rolling bearings based on improved one-dimensional convolutional neural network[J]. Journal of Vibration and Shock, 2022, 41(3): 216-223. DOI:10.13465/j.cnki.jvs.2022.03.026
[14]	何汇汇. 基于生成对抗网络的滚动轴承故障诊断方法研究[D]. 秦皇岛: 燕山大学, 2024.


舰船科学技术 2026, Vol. 48 Issue (7): 77-83 DOI: 10.3404/j.issn.1672-7649.2026.07.013	PDF