融合D-S理论与CNN的船用柴油机故障诊断研究

引用本文

罗自来, 李东亮. 融合D-S理论与CNN的船用柴油机故障诊断研究. 舰船科学技术, 2026, 48(8): 83-89 复制到剪切板

LUO Zilai, LI Dongliang. Research on fault diagnosis of marine diesel engine by integrating D-S theory and CNN. Ship Science and Technology, 2026, 48(8): 83-89 复制到剪切板

融合D-S理论与CNN的船用柴油机故障诊断研究

罗自来¹, 李东亮²

1. 中国人民解放军92557部队，广东广州 510700;
2. 海军工程大学，湖北武汉 430033

收稿日期: 2025-08-25.

作者简介: 罗自来（1981 − ），男，博士，副研究员，研究方向为装备监测与故障诊断

摘要: 为提升柴油机故障诊断的精度与鲁棒性，本文提出一种基于卷积神经网络（Convolutional Neural Network，CNN）与D-S证据理论的融合诊断模型。该方法首先利用格拉姆角场（Gramian Angular Field，GAF）将一维振动信号转换为二维图像，再构建多种结构差异化的CNN子模型以提取故障特征并完成初步分类。在此基础上，选取性能最优的子模型作为基分类器，并引入D-S证据理论对各分类器的输出结果进行融合推理，从而提高诊断结果的可信度与稳定性。仿真实验结果表明，与传统CNN及其他智能诊断方法相比，本文所提模型在船用柴油机故障识别中表现出更高的准确率和更强的抗干扰能力，为船舶柴油机的状态监测与健康管理提供了有效技术支撑。

关键词: D-S理论卷积神经网络柴油机故障诊断

Research on fault diagnosis of marine diesel engine by integrating D-S theory and CNN

LUO Zilai¹, LI Dongliang²

1. No.92557 Unit of PLA, Guangzhou 510700, China;
2. Naval University of Engineering, Wuhan 430033, China

Abstract: To enhance the accuracy and robustness of fault diagnosis, this study proposes a fusion model that integrates convolutional neural networks (CNNs) with Dempster–Shafer (D-S) evidence theory. The approach first converts one-dimensional vibration signals into two-dimensional images using the Gramian Angular Field (GAF) method. Multiple CNN sub-models with different architectures are then constructed to extract fault features and perform preliminary classification. The best-performing sub-models are selected as base classifiers, and their outputs are subsequently fused through the D-S evidence theory to improve the credibility and stability of diagnostic decisions. Simulation results demonstrate that, compared with traditional CNNs and other intelligent algorithms, the proposed model achieves higher accuracy and stronger anti-interference capability in marine diesel engine fault recognition, thereby providing effective technical support for condition monitoring and health management of ship diesel engines.

Key words: D-S theory convolutional neural network diesel engine fault diagnosis

0 引　言

柴油机长期运行于高负荷、高振动、高温等复杂工况下，极易发生磨损、松动、不平衡等故障，若不能及时识别与修复，将有可能导致设备失效、电力中断甚至发生安全事故^[1]。因此，在船用柴油机上进行有效的状态评估与故障诊断研究，具有非常重大的价值。众所周知，柴油机在运转过程中会产生大量与其运转状态密切相关的振动信号，由于这些信号获取便捷、响应灵敏，其在状态监测与故障诊断领域得到了广泛应用^[2]。在早期研究中，学者们主要采用时域、频域及时频域分析方法对振动信号进行特征提取，常见技术包括小波变换、经验模态分解等^[3]，提取出的特征参数通常依赖人工分析与专家经验进行故障判断，存在较强的主观性与不确定性，进而限制了诊断结果的准确性与可重复性。

随着计算机技术的飞速发展，各种机器学习方法逐渐被运用到柴油机故障诊断中。蔡一杰等^[4]提出一种遗传算法和SVM结合的故障诊断方法，对向量机的核函数和惩罚因子进行优化，结果表明故障诊断率提高明显。虽然这些方法可达到故障的一个分类诊断，但都依赖于人工进行特征提取，同时无法实现特征提取和故障识别的连贯性，直接影响故障诊断的准确率。

卷积神经网络（Convolutional Neural Network，CNN）作为一种用于识别图像及其进行分类的学习方法，因其强大的特征提取与识别能力，近年来在机械设备故障诊断领域得到了广泛应用。为进一步提升CNN在柴油机故障诊断中的性能，众多学者对其结构与功能进行了改进与拓展。PAN等^[5]将CNN的空间特征提取优势与长短期记忆网络（LSTM）在时序建模方面的能力相结合，构建了融合模型以实现对时域特征的一致性保持和精准识别。张康等^[6]提出一种改进的 CNN 架构，在输入层引入Dropout技术以增强模型的抗噪能力，在卷积层引入批量归一化以降低信号分布变化，提高训练稳定性，并基于多分类策略实现对柴油机失火现象的准确诊断。张永祥等^[7]提出一种融合加窗处理与CNN的故障识别方法，利用加窗策略有效抑制非目标信号干扰，增强故障特征的可识别性。路鹏^[8]提出将集成CNN诊断模型应用于柴油机智能诊断中，结果表明，该模型克服了传统智能诊断模型的局限性，具有更好、更稳定的诊断性能。

CNN在柴油机故障诊断中的应用已形成如时序建模融合、多尺度特征增强与抗干扰能力提升等多个优化方向，为故障诊断方法的发展提供坚实理论基础，同时提高CNN在故障诊断方面的准确率，但对于工况复杂的船用柴油机来说，该模型还存在诊断精度低且稳定性不够高等方面的问题。为解决上述问题，在船舶柴油机故障诊断中采用一种融合D-S理论与CNN模型，该方法利用多通道数据采集器收集的振动信号，通过格拉姆角场转换成二维图像，实现时序信号的可视化表达；随后构建多个结构互异的CNN子模型作为基分类器，利用随机采样和超参数优化增强模型多样性；最后采用D-S理论融合策略，将各子模型的诊断结果进行加权融合，从而提升故障诊断的准确性与鲁棒性。

1 理论基础 1.1 卷积神经网络

CNN是一种在图像识别任务方面得到广泛应用的前馈型神经网络。它能够通过输入层接收原始数据，利用多层卷积与池化操作在隐藏层中提取关键特征，最终由输出层直接给出故障识别结果。相较于传统机器学习方法，CNN可自动学习特征表示，省去了复杂的特征工程步骤，具有良好适应性与推广性。

在卷积层中，主要是将输入层信号进行卷积计算，以便提取深层故障特征。卷积核会对输入数据进行卷积操作，具体计算过程如图1所示。

图 1 卷积计算过程 Fig. 1 Convolution calculation process

池化层主要是通过池化核对特征图进行下采样操作，通过降低特征图维度来减少参数数量。本文采用的池化方法为Max-Pooling法，即对局部区域中最大的值进行输出，计算式为：

${x}^{l}=\max \left(\sum \limits_{l\in m}x_{i}^{l-1}\right)+{b}^{l} 。$

(1)

式中：$ l $为层数；$ m $为池化区域的神经元个数；$ b $为偏置。

经过卷积和池化操作后，生成的特征图已经高度抽象化，再由CNN去除特征图的二维结构，使之成为一维向量，并将该向量输入到全连接层，然后连接一个Softmax分类器函数，最终生成预测结果。

1.2 格拉姆角场

格拉姆角场（Gramian Angular Field，GAF）是一种将一维时间序列信号转换为二维图像的有效办法，这种编码方式可保留原始信号的时频信息及样本点间的联系，生成的二维图像无需其他处理就可直接导入CNN中进行样本的特征提取及分类。对于包含$ n $个采样点的振动信号，GAF编码将产生$ n \times n $维的数值矩阵。当$ n $取值较大时，会导致生成图像的维度急剧增加。为降低计算复杂度，可采用分段聚合近似算法对原始信号进行降维处理。该算法通过将时序数据等分并计算分段均值，在保留数据主要趋势的前提下有效减小矩阵规模。

1.3 集成学习

集成学习^[8]是通过搭建多个学习器并将其组合来完成学习任务。考虑到训练时间，本文使用Bagging算法。在训练弱分类器时，以每次重新复位的方法进行随机提取。目的是保证经过训练的模型具有一定差异性。每个子集训练一个弱分类器，随后将多个弱分类器并行组合，最终通过融合策略得到一个强分类器，具体如图2所示。

图 2 Bagging算法原理图 Fig. 2 Bagging algorithm schematic

1.4 D-S理论

将多个CNN模型作为柴油机状态分类器，并利用Dempster-Shafer（D-S）证据理论对其输出进行融合。与传统的学习法、平均法和投票法相比，D-S理论能够在保持多源信息独立性的前提下，有效降低单一分类器不确定性带来的影响，从而提升整体诊断准确率。首先，每个CNN模型对输入样本输出一个概率分布向量，经softmax函数后得到：

${P}^{\left(j\right)}=\left\{p_{1}^{\left(j\right)},p_{2}^{\left(j\right)},\ldots ,p_{L}^{\left(j\right)}\right\},j=1{,}2,\ldots ,c。$

(2)

式中：$ p_{l}^{\left(j\right)} $为第$ j $个CNN分类器对类别$ l $的预测概率；$ L $为类别数（本研究中为5）；$ c $为基分类器数量。

为了将CNN的概率输出转化为D-S理论中的基本概率分配（Basic Probability Assignment, BPA），定义如下mass函数：

$ {m}^{\left(j\right)}\left({y}_{l}\right)=\frac{p_{l}^{\left(j\right)}}{\sum \limits_{l=1}^{L}p_{l}^{\left(j\right)}},l=1{,}2,\ldots ,L ，$

(3)

${m}^{\left(j\right)}\left(\theta \right)=1-\sum \limits_{l=1}^{L}{m}^{\left(j\right)}\left({y}_{l}\right)。$

(4)

式中：$ {m}^{\left(j\right)}\left({y}_{l}\right) $为分类器$ j $对故障类别$ {y}_{l} $的信任度；$ {m}^{\left(j\right)}\left({\theta}\right) $为分配给“未知”或“未识别”集合的信任度，用于量化模型预测的不确定性。

然后，利用Dempster组合规则对所有分类器的mass函数进行迭代融合：

$ m\left(A\right)=\frac{1}{1-K}\sum \limits_{B\cap C=A}{m}_{1}\left(B\right)\cdot {m}_{2}\left(C\right) 。$

(5)

式中：$ K={\sum }_{B\cap C=A}{m}_{1}(B)\cdot {m}_{2}(C) $为冲突系数。该过程可递归推广至多个分类器。

最终，样本的预测类别由融合后mass函数最大对应的标签确定：

$ \hat{y}=\arg {\max}_{l}\left({y}_{l}\right) 。$

(6)

通过上述步骤，CNN的概率向量被有效转化并融合为D-S证据，从而实现更加鲁棒的故障诊断。

2 CNN模型 2.1 单一CNN模型构建

单一CNN模型的分类性能将直接影响后续融合CNN框架的整体表现。因此，本文首先构建并训练单一CNN分类器，其具体流程如图3所示。输入的振动信号经过预处理与特征提取后，依次通过卷积层、池化层和全连接层，最终由Softmax函数输出各类别的概率分布，用于柴油机故障的识别。

图 3 单一CNN故障诊断算法流程图 Fig. 3 Flow chart of single CNN fault diagnosis algorithm

2.2 融合CNN模型构建

本文设计了基于D-S证据理论的融合CNN框架，具体步骤如下：

步骤1　数据采集与处理。利用多通道振动数据采集系统，获取船用柴油机在不同运行状态下的时域振动信号。由于振动信号为一维时间序列，本文采用方法将其转化为二维图像形式，以便后续CNN建模。数据集按6∶4比例划分为训练集和测试集。为确保实验的可复现性，在数据划分过程中设置了固定随机种子，并在不同随机种子下重复实验5次。结果表明，各次实验的平均准确率及标准差波动较小（小于1%），说明本文所提方法具有良好的稳定性和鲁棒性。

步骤2　基分类器训练。基于转换后的数据集，构建并训练多个单一CNN模型。每个CNN通过Softmax层输出一个概率分布向量，作为其对输入样本的分类结果。

步骤3　Bagging抽样策略。为提升基分类器的多样性，采用Bagging思想对训练数据进行随机抽样（抽样比例为80%），由此获得多组差异化的CNN基分类器。

步骤4　D-S理论融合。在推理阶段，首先利用Softmax函数获取每个CNN基分类器对样本的概率分布，并将其转化为基本概率分配（mass函数）。随后，基于Dempster组合规则对多个分类器的mass函数进行迭代融合，得到最终的合成概率分布。

步骤5　故障诊断与评估。通过融合后的概率分布，选择最大值对应的故障类别作为最终诊断结果。最后，使用测试数据集对融合模型进行验证和性能评估。

3 实验验证 3.1 振动信号采集

本文研究对象为某船用柴油机，采样频率设为4 kHz，转速为1500 r/min，每个采样周期包含1600个数据点。采集5种工况数据，每种工况采集300个样本。将每种工况数据随机划分180个数据样本作为模型训练集，其余120个数据样本用于模型测试集，具体情况如表1所示，5种工况的振动信号如图4所示。

表 1 不同工况下振动信号样本数 Tab.1 Number of vibration signal samples under different working conditions

图 4 振动信号时域图 Fig. 4 Time domain diagram of vibration signal

3.2 振动信号的预处理

由于每个周期采集的样本长度为1600，根据GAF转换原理，将会生成一个1600×1600的矩阵，作为CNN的输入量来说过大，会造成训练时间大幅增加。因此，采用PAA方法对原始数据进行分段切割，取分段的均值来聚合时间序列以减小尺寸大小。最终输入系统的数据为40×40的二维图像，每种工况的二维图如图5所示。

图 5 样本二维示意图 Fig. 5 Sample 2D schematic diagram·

3.3 基分类器模型参数选择

基分类器模型的构建将直接影响到融合CNN模型的精度，其中CNN模型的性能受到多个参数共同影响，主要包括卷积池化层的结构、激活函数搭配、全连接层的大小、输出分类器等；经过多次实验和研究，最终构建的单一CNN模型参数如表2所示。

表 2 基分类器相关参数设置 Tab.2 Parameter settings related to the base classifier

3.4 基分类器优化器选择

优化器的主要作用是加速梯度下降的过程，以提升收敛速度和精度，从而帮助模型更高效、更准确地进行融合。以上述设计的基分类器模型为基础，分别选取 SGD、Adagrad、RMSProp、Adam这4种优化器进行实验对比，其参数设置如表3所示。

表 3 不同优化算法的参数设置 Tab.3 Hyperparameter settings for different optimization algorithms

为了公平比较上述4种算法，模型网络结构和参数都保持不变，实验的数据集也相同。分别在训练集和测试集中使用4种优化器进行反复实验，得到了准确率随着训练次数增加的变化曲线，如图6所示。

图 6 不同优化器下训练集和测试集的准确率 Fig. 6 Accuracy of training and testing sets under different optimizers

可知，4种优化器在训练集中的准确率随着训练次数的增加最终均能达到100%，其中Adam优化器的收敛速度最快，大约在30次训练后便实现收敛，而其他几种优化器收敛情况与它相比有明显差距。准确率的差异在测试集曲线中就更明显，其中Adam优化器效果最佳，准确率可达到95%，而其他3种优化器的准确率只有90%左右。从测试集和训练集曲线观察，Adam优化器曲线更加平稳，因此基分类器使用Adam优化器效果相对会更好。

3.5 基分类器数量设定对比

在融合CNN模型架构图中，基分类器的数量并未确定，需通过实验来最终确定。单一CNN模型的数量i在实验过程中分别设置为（3,5,7,9），为保证每个基分类器数据的不同，对训练数据集进行随机采样。为了避免实验的随机性，每种模型数量的结果都是独立运行40次，然后取平均值，最终结果如图7所示。

图 7 准确率及时间随基分类器数量变化图 Fig. 7 Accuracy and time variation with the number of base classifiers

可知，训练集准确率随着基分类器的个数逐步增加而增加，特别是从3个增加到5个，准确率增加了1.20%。当基分类器数量增加到7个和9个时，准确率相比于5个增加不明显。再从时间方面进行对比，随着基分类器数量的增加，训练时间逐步增加，分别为475、556、674、842 s，这是因为随着基分类器数量的增加使得模型更加复杂，从而训练时间变得更长；从测试时间也可以得到验证，测试时间分别是0.88、0.95、1.2、1.75 s；设定5个基分类器时模型的测试时间与3个的时间相差不大，都小于1 s，可达到快速故障诊断的要求。综合测试准确率、训练时间、测试时间的分析，本文选择5个基分类器作为最优的融合CNN模型。

4 结果分析 4.1 集成CNN模型故障诊断

为了验证融合CNN模型诊断的优越性，将表1测试集数据输入到创建好的融合CNN模型中，其分析结果与单一CNN分析结果进行对比，如表4所示；2种模型分析结果准确率随迭代次数变化如图8所示。

表 4 不同CNN模型的分析结果 Tab.4 Analysis results of different CNN models

图 8 不同CNN模型测试集准确率对比图 Fig. 8 Comparison of accuracy of different CNN test set

可知，在测试集数据中，采用单一CNN模型的准确率约为94%，而采用融合CNN模型的准确率则提高至98.6%，其分析准确性有了明显提升。同时融合CNN模型准确率曲线大概40次就达到收敛，达到收敛以后曲线更加平滑，比单一CNN模型具有更高的稳定性。再从训练时间和测试时间方面进行对比，由表4可知，由于融合模型更加复杂，从而训练时间明显比单一CNN模型更长；但是测试时间方面相差不大。综合所有对比；融合CNN模型在故障诊断任务中的表现优于单一CNN模型，准确率及稳定性更高。

4.2 融合CNN模型评价

为了更加精准评价上述融合CNN模型，引入精确率（P）、召回率（R）和调和均值（F₁）等评价指标。F₁为P和R的调和均值，计算公式为：

$ \left\{\begin{aligned} &P=TP/\left(TP+FP\right)，\\ &R=TP/\left(TP+FN\right)，\\ &{F}_{1}=2 \times P\times R/\left(P+R\right)。\end{aligned}\right. $

(7)

将融合模型中测试数据集结果运用式(4)计算得到的精确率、召回率、调和均值如表5所示。可知，模型在各个工况下的精确率均达到了97%以上，召回率均在98%以上，平均精确率、召回率和F₁调和均值都为98.6%；表明模型在各个工况下均具有良好的故障诊断性能。

表 5 融合CNN模型的评价结果 Tab.5 Evaluation of integrated CNN model results

为对融合CNN模型的性能进行进一步评价，同时了解每种工况的预测情况；引入多分类混淆矩阵，结果如图9所示。

图 9 测试集的混淆矩阵 Fig. 9 The confusion matrix of the test set

可知主对角线表示预测标签和真实标签相同的数目和占比。模型对G1正常工况预测完全正确；对G2、G3、G4故障工况各有2个误判，G5有1个误判，但都是故障之间的误判，没有出现正常工况和故障工况的误判，这对于柴油机故障识别很有意义。同时整个故障诊断准确率为98.6%，说明融合CNN模型具有较高的故障识别率。

4.3 对比分析其他算法

为验证本文所提出的融合CNN模型相较于当前主流算法的优越性；将实验结果与SVM、RF、ELM等算法进行对比。与CNN网络不同，这些算法都需人工提取振动信号的特征，将提取的特征作为3种算法的输入，对比结果如表6所示。可知，RF、SVM、ELM算法平均准确率为92.8%、91.2%、89.2%；而融合CNN模型平均准确率为98.6%，明显高于其他3种算法。而且对于每种工况的测试准确率，融合CNN模型也是明显最优，再次验证了本文所建立的融合CNN模型性能的优越性。

表 6 四种算法的准确率对比(%) Tab.6 Comparison of accuracy of four algorithms (%)

4.4 噪声对融合CNN模型影响

在信噪比为10、20、30 dB的噪声分别添加至原始信号中。信噪比公式为：

$ {R}_{\mathrm{sn}}=10 \ln\frac{{p}_{\mathrm{signal}}}{{p}_{\mathrm{noise}}}。$

(8)

式中：$ {p}_{\mathrm{signal}} $为原始信号的功率；$ {p}_{\mathrm{noise}} $为噪声的功率；$ {R}_{\mathrm{sn}} $的值越小，表示噪声功率越大，原始信号失真程度越大。

为验证模型在噪声干扰下的鲁棒性，将不同信噪比的信号分别输入融合CNN模型与单一CNN模型进行对比实验。每组实验均重复 5 次，并取测试准确率的平均值作为最终评价指标，结果如图10所示。可知，随着信噪比的降低，单一CNN模型的测试准确率逐渐下降，当信噪比为10 dB时，其准确率仅为88.4%。相比之下，融合CNN模型虽然同样受到噪声影响，但下降幅度明显较小，在各信噪比条件下的准确率均保持在94.5%以上，体现了较强的抗干扰能力，可以证明融合CNN比单一CNN模型具有更好抗干扰能力。

图 10 噪声影响下模型准确率对比图 Fig. 10 Comparison chart of model accuracy under noise influence

5 结　语

1）提出的融合CNN模型利用格拉姆角场将一维振动信号转换为二维图像，使原始信号的时域关联特征得到了充分保留，并使船用柴油机故障诊断结论更加稳健。

2）与传统智能算法的对比实验表明，提出的融合CNN模型在故障诊断准确率方面具有显著优势，更优的稳定性，以及良好的抗干扰能力。

3）本文所构建的基分类器均为CNN模型，未来可进一步引入不同类型的基分类器，并考虑整合热力学参数、油液分析等多源监测数据，并全面评估模型的泛化能力和适用性，以提升船用柴油机故障识别精准性。

参考文献

[1]	殷文慧, 王飞, 孙强, 等. 船用柴油机人工智能故障诊断应用综述[J]. 舰船科学技术, 2023, 45(24): 122-127. YIN W H, WANG F, SUN Q, et al. A review of the application of artificial intelligence in fault diagnosis for marine diesel engines[J]. Ship Science and Technology, 2023, 45(24): 122-127. DOI:10.3404/j.issn.1672-7649.2023.24.022
[2]	宋凯, 黄盟, 尤健, 等. 基于改进残差卷积网络的柴油机故障诊断方法[J]. 内燃机工程, 2023, 44(5): 66-73. SONG K, HUANG M, YOU J, et al. A fault diagnosis method for diesel engines based on an improved residual convolutional network[J]. Internal Combustion Engine Engineering, 2023, 44(5): 66-73. DOI:10.13949/j.cnki.nrjgc.2023.05.009
[3]	李少康, 陈龙, 陈辉, 等. 基于GAF-CNN的柴油机振动信号故障诊断[J]. 武汉理工大学学报, 2023, 47(4): 648-653. LI S K, CHEN L, CHEN H, et al. Fault diagnosis of diesel engine vibration signals based on GAF-CNN[J]. Journal of Wuhan University of Technology, 2023, 47(4): 648-653. DOI:10.3963/j.issn.2095-3844.2023.04.013
[4]	蔡一杰, 陈俊杰, 王君, 等. 基于遗传算法优化支持向量机的柴油机气门漏气故障智能诊断方法[J]. 内燃机工程, 2022, 43(2): 71-76. CAI Y J, CHEN J J, WANG J, et al. Intelligent fault diagnosis of diesel engine valve leakage using a genetic algorithm-optimized support vector machine[J]. Internal Combustion Engine Engineering, 2022, 43(2): 71-76.
[5]	PAN H H, et al. An improved bearing fault diagnosis method using one-dimensional CNN and LSTM[J]. Journal of Mechanical Engineering, 2018, 7−8: 443−452.
[6]	张康, 陶建峰, 覃程锦, 等. 随机丢弃和批标准化的深度卷积神经网络柴油机失火故障诊断[J]. 西安交通大学学报, 2019, 53(8): 159-166. ZHANG K, TAO J F, QIN C J, et al. Diesel engine misfire fault diagnosis of a deep convolutional neural network with random dropout and batch normalization[J]. Journal of Xi′an Jiaotong University, 2019, 53(8): 159-166.
[7]	张永祥, 王宇, 姚晓山. 基于加窗和卷积神经网络的柴油机拉缸故障诊断[J]. 车用发动机, 2019(6): 84-89. DOI:10.3969/j.issn.1001-2222.2019.06.014
[8]	路鹏. 基于改进CNN 的船舶柴油机故障诊断方法研究[D]. 武汉: 武汉理工大学, 2021.


舰船科学技术 2026, Vol. 48 Issue (8): 83-89 DOI: 10.3404/j.issn.1672-7649.2026.08.013	PDF