2. 海军工程大学,湖北 武汉 430033
2. Naval University of Engineering, Wuhan 430033, China
柴油机长期运行于高负荷、高振动、高温等复杂工况下,极易发生磨损、松动、不平衡等故障,若不能及时识别与修复,将有可能导致设备失效、电力中断甚至发生安全事故[1]。因此,在船用柴油机上进行有效的状态评估与故障诊断研究,具有非常重大的价值。众所周知,柴油机在运转过程中会产生大量与其运转状态密切相关的振动信号,由于这些信号获取便捷、响应灵敏,其在状态监测与故障诊断领域得到了广泛应用[2]。在早期研究中,学者们主要采用时域、频域及时频域分析方法对振动信号进行特征提取,常见技术包括小波变换、经验模态分解等[3],提取出的特征参数通常依赖人工分析与专家经验进行故障判断,存在较强的主观性与不确定性,进而限制了诊断结果的准确性与可重复性。
随着计算机技术的飞速发展,各种机器学习方法逐渐被运用到柴油机故障诊断中。蔡一杰等[4]提出一种遗传算法和SVM结合的故障诊断方法,对向量机的核函数和惩罚因子进行优化,结果表明故障诊断率提高明显。虽然这些方法可达到故障的一个分类诊断,但都依赖于人工进行特征提取,同时无法实现特征提取和故障识别的连贯性,直接影响故障诊断的准确率。
卷积神经网络(Convolutional Neural Network,CNN)作为一种用于识别图像及其进行分类的学习方法,因其强大的特征提取与识别能力,近年来在机械设备故障诊断领域得到了广泛应用。为进一步提升CNN在柴油机故障诊断中的性能,众多学者对其结构与功能进行了改进与拓展。PAN等[5]将CNN的空间特征提取优势与长短期记忆网络(LSTM)在时序建模方面的能力相结合,构建了融合模型以实现对时域特征的一致性保持和精准识别。张康等[6]提出一种改进的 CNN 架构,在输入层引入Dropout技术以增强模型的抗噪能力,在卷积层引入批量归一化以降低信号分布变化,提高训练稳定性,并基于多分类策略实现对柴油机失火现象的准确诊断。张永祥等[7]提出一种融合加窗处理与CNN的故障识别方法,利用加窗策略有效抑制非目标信号干扰,增强故障特征的可识别性。路鹏[8]提出将集成CNN诊断模型应用于柴油机智能诊断中,结果表明,该模型克服了传统智能诊断模型的局限性,具有更好、更稳定的诊断性能。
CNN在柴油机故障诊断中的应用已形成如时序建模融合、多尺度特征增强与抗干扰能力提升等多个优化方向,为故障诊断方法的发展提供坚实理论基础,同时提高CNN在故障诊断方面的准确率,但对于工况复杂的船用柴油机来说,该模型还存在诊断精度低且稳定性不够高等方面的问题。为解决上述问题,在船舶柴油机故障诊断中采用一种融合D-S理论与CNN模型,该方法利用多通道数据采集器收集的振动信号,通过格拉姆角场转换成二维图像,实现时序信号的可视化表达;随后构建多个结构互异的CNN子模型作为基分类器,利用随机采样和超参数优化增强模型多样性;最后采用D-S理论融合策略,将各子模型的诊断结果进行加权融合,从而提升故障诊断的准确性与鲁棒性。
1 理论基础 1.1 卷积神经网络CNN是一种在图像识别任务方面得到广泛应用的前馈型神经网络。它能够通过输入层接收原始数据,利用多层卷积与池化操作在隐藏层中提取关键特征,最终由输出层直接给出故障识别结果。相较于传统机器学习方法,CNN可自动学习特征表示,省去了复杂的特征工程步骤,具有良好适应性与推广性。
在卷积层中,主要是将输入层信号进行卷积计算,以便提取深层故障特征。卷积核会对输入数据进行卷积操作,具体计算过程如图1所示。
|
图 1 卷积计算过程 Fig. 1 Convolution calculation process |
池化层主要是通过池化核对特征图进行下采样操作,通过降低特征图维度来减少参数数量。本文采用的池化方法为Max-Pooling法,即对局部区域中最大的值进行输出,计算式为:
| ${x}^{l}=\max \left(\sum \limits_{l\in m}x_{i}^{l-1}\right)+{b}^{l} 。$ | (1) |
式中:
经过卷积和池化操作后,生成的特征图已经高度抽象化,再由CNN去除特征图的二维结构,使之成为一维向量,并将该向量输入到全连接层,然后连接一个Softmax分类器函数,最终生成预测结果。
1.2 格拉姆角场格拉姆角场(Gramian Angular Field,GAF)是一种将一维时间序列信号转换为二维图像的有效办法,这种编码方式可保留原始信号的时频信息及样本点间的联系,生成的二维图像无需其他处理就可直接导入CNN中进行样本的特征提取及分类。对于包含
集成学习[8]是通过搭建多个学习器并将其组合来完成学习任务。考虑到训练时间,本文使用Bagging算法。在训练弱分类器时,以每次重新复位的方法进行随机提取。目的是保证经过训练的模型具有一定差异性。每个子集训练一个弱分类器,随后将多个弱分类器并行组合,最终通过融合策略得到一个强分类器,具体如图2所示。
|
图 2 Bagging算法原理图 Fig. 2 Bagging algorithm schematic |
将多个CNN模型作为柴油机状态分类器,并利用Dempster-Shafer(D-S)证据理论对其输出进行融合。与传统的学习法、平均法和投票法相比,D-S理论能够在保持多源信息独立性的前提下,有效降低单一分类器不确定性带来的影响,从而提升整体诊断准确率。首先,每个CNN模型对输入样本输出一个概率分布向量,经softmax函数后得到:
| ${P}^{\left(j\right)}=\left\{p_{1}^{\left(j\right)},p_{2}^{\left(j\right)},\ldots ,p_{L}^{\left(j\right)}\right\},j=1{,}2,\ldots ,c。$ | (2) |
式中:
为了将CNN的概率输出转化为D-S理论中的基本概率分配(Basic Probability Assignment, BPA),定义如下mass函数:
| $ {m}^{\left(j\right)}\left({y}_{l}\right)=\frac{p_{l}^{\left(j\right)}}{\sum \limits_{l=1}^{L}p_{l}^{\left(j\right)}},l=1{,}2,\ldots ,L ,$ | (3) |
| ${m}^{\left(j\right)}\left(\theta \right)=1-\sum \limits_{l=1}^{L}{m}^{\left(j\right)}\left({y}_{l}\right)。$ | (4) |
式中:
然后,利用Dempster组合规则对所有分类器的mass函数进行迭代融合:
| $ m\left(A\right)=\frac{1}{1-K}\sum \limits_{B\cap C=A}{m}_{1}\left(B\right)\cdot {m}_{2}\left(C\right) 。$ | (5) |
式中:
最终,样本的预测类别由融合后mass函数最大对应的标签确定:
| $ \hat{y}=\arg {\max}_{l}\left({y}_{l}\right) 。$ | (6) |
通过上述步骤,CNN的概率向量被有效转化并融合为D-S证据,从而实现更加鲁棒的故障诊断。
2 CNN模型 2.1 单一CNN模型构建单一CNN模型的分类性能将直接影响后续融合CNN框架的整体表现。因此,本文首先构建并训练单一CNN分类器,其具体流程如图3所示。输入的振动信号经过预处理与特征提取后,依次通过卷积层、池化层和全连接层,最终由Softmax函数输出各类别的概率分布,用于柴油机故障的识别。
|
图 3 单一CNN故障诊断算法流程图 Fig. 3 Flow chart of single CNN fault diagnosis algorithm |
本文设计了基于D-S证据理论的融合CNN框架,具体步骤如下:
步骤1 数据采集与处理。利用多通道振动数据采集系统,获取船用柴油机在不同运行状态下的时域振动信号。由于振动信号为一维时间序列,本文采用方法将其转化为二维图像形式,以便后续CNN建模。数据集按6∶4比例划分为训练集和测试集。为确保实验的可复现性,在数据划分过程中设置了固定随机种子,并在不同随机种子下重复实验5次。结果表明,各次实验的平均准确率及标准差波动较小(小于1%),说明本文所提方法具有良好的稳定性和鲁棒性。
步骤2 基分类器训练。基于转换后的数据集,构建并训练多个单一CNN模型。每个CNN通过Softmax层输出一个概率分布向量,作为其对输入样本的分类结果。
步骤3 Bagging抽样策略。为提升基分类器的多样性,采用Bagging思想对训练数据进行随机抽样(抽样比例为80%),由此获得多组差异化的CNN基分类器。
步骤4 D-S理论融合。在推理阶段,首先利用Softmax函数获取每个CNN基分类器对样本的概率分布,并将其转化为基本概率分配(mass函数)。随后,基于Dempster组合规则对多个分类器的mass函数进行迭代融合,得到最终的合成概率分布。
步骤5 故障诊断与评估。通过融合后的概率分布,选择最大值对应的故障类别作为最终诊断结果。最后,使用测试数据集对融合模型进行验证和性能评估。
3 实验验证 3.1 振动信号采集本文研究对象为某船用柴油机,采样频率设为4 kHz,转速为
|
|
表 1 不同工况下振动信号样本数 Tab.1 Number of vibration signal samples under different working conditions |
|
图 4 振动信号时域图 Fig. 4 Time domain diagram of vibration signal |
由于每个周期采集的样本长度为
|
图 5 样本二维示意图 Fig. 5 Sample 2D schematic diagram· |
基分类器模型的构建将直接影响到融合CNN模型的精度,其中CNN模型的性能受到多个参数共同影响,主要包括卷积池化层的结构、激活函数搭配、全连接层的大小、输出分类器等;经过多次实验和研究,最终构建的单一CNN模型参数如表2所示。
|
|
表 2 基分类器相关参数设置 Tab.2 Parameter settings related to the base classifier |
优化器的主要作用是加速梯度下降的过程,以提升收敛速度和精度,从而帮助模型更高效、更准确地进行融合。以上述设计的基分类器模型为基础,分别选取 SGD、Adagrad、RMSProp、Adam这4种优化器进行实验对比,其参数设置如表3所示。
|
|
表 3 不同优化算法的参数设置 Tab.3 Hyperparameter settings for different optimization algorithms |
为了公平比较上述4种算法,模型网络结构和参数都保持不变,实验的数据集也相同。分别在训练集和测试集中使用4种优化器进行反复实验,得到了准确率随着训练次数增加的变化曲线,如图6所示。
|
图 6 不同优化器下训练集和测试集的准确率 Fig. 6 Accuracy of training and testing sets under different optimizers |
可知,4种优化器在训练集中的准确率随着训练次数的增加最终均能达到100%,其中Adam优化器的收敛速度最快,大约在30次训练后便实现收敛,而其他几种优化器收敛情况与它相比有明显差距。准确率的差异在测试集曲线中就更明显,其中Adam优化器效果最佳,准确率可达到95%,而其他3种优化器的准确率只有90%左右。从测试集和训练集曲线观察,Adam优化器曲线更加平稳,因此基分类器使用Adam优化器效果相对会更好。
3.5 基分类器数量设定对比在融合CNN模型架构图中,基分类器的数量并未确定,需通过实验来最终确定。单一CNN模型的数量i在实验过程中分别设置为(3,5,7,9),为保证每个基分类器数据的不同,对训练数据集进行随机采样。为了避免实验的随机性,每种模型数量的结果都是独立运行40次,然后取平均值,最终结果如图7所示。
|
图 7 准确率及时间随基分类器数量变化图 Fig. 7 Accuracy and time variation with the number of base classifiers |
可知,训练集准确率随着基分类器的个数逐步增加而增加,特别是从3个增加到5个,准确率增加了1.20%。当基分类器数量增加到7个和9个时,准确率相比于5个增加不明显。再从时间方面进行对比,随着基分类器数量的增加,训练时间逐步增加,分别为475、556、674、842 s,这是因为随着基分类器数量的增加使得模型更加复杂,从而训练时间变得更长;从测试时间也可以得到验证,测试时间分别是0.88、0.95、1.2、1.75 s;设定5个基分类器时模型的测试时间与3个的时间相差不大,都小于1 s,可达到快速故障诊断的要求。综合测试准确率、训练时间、测试时间的分析,本文选择5个基分类器作为最优的融合CNN模型。
4 结果分析 4.1 集成CNN模型故障诊断为了验证融合CNN模型诊断的优越性,将表1测试集数据输入到创建好的融合CNN模型中,其分析结果与单一CNN分析结果进行对比,如表4所示;2种模型分析结果准确率随迭代次数变化如图8所示。
|
|
表 4 不同CNN模型的分析结果 Tab.4 Analysis results of different CNN models |
|
图 8 不同CNN模型测试集准确率对比图 Fig. 8 Comparison of accuracy of different CNN test set |
可知,在测试集数据中,采用单一CNN模型的准确率约为94%,而采用融合CNN模型的准确率则提高至98.6%,其分析准确性有了明显提升。同时融合CNN模型准确率曲线大概40次就达到收敛,达到收敛以后曲线更加平滑,比单一CNN模型具有更高的稳定性。再从训练时间和测试时间方面进行对比,由表4可知,由于融合模型更加复杂,从而训练时间明显比单一CNN模型更长;但是测试时间方面相差不大。综合所有对比;融合CNN模型在故障诊断任务中的表现优于单一CNN模型,准确率及稳定性更高。
4.2 融合CNN模型评价为了更加精准评价上述融合CNN模型,引入精确率(P)、召回率(R)和调和均值(F1)等评价指标。F1为P和R的调和均值,计算公式为:
| $ \left\{\begin{aligned} &P=TP/\left(TP+FP\right),\\ &R=TP/\left(TP+FN\right),\\ &{F}_{1}=2 \times P\times R/\left(P+R\right)。\end{aligned}\right. $ | (7) |
将融合模型中测试数据集结果运用式(4)计算得到的精确率、召回率、调和均值如表5所示。可知,模型在各个工况下的精确率均达到了97%以上,召回率均在98%以上,平均精确率、召回率和F1调和均值都为98.6%;表明模型在各个工况下均具有良好的故障诊断性能。
|
|
表 5 融合CNN模型的评价结果 Tab.5 Evaluation of integrated CNN model results |
为对融合CNN模型的性能进行进一步评价,同时了解每种工况的预测情况;引入多分类混淆矩阵,结果如图9所示。
|
图 9 测试集的混淆矩阵 Fig. 9 The confusion matrix of the test set |
可知主对角线表示预测标签和真实标签相同的数目和占比。模型对G1正常工况预测完全正确;对G2、G3、G4故障工况各有2个误判,G5有1个误判,但都是故障之间的误判,没有出现正常工况和故障工况的误判,这对于柴油机故障识别很有意义。同时整个故障诊断准确率为98.6%,说明融合CNN模型具有较高的故障识别率。
4.3 对比分析其他算法为验证本文所提出的融合CNN模型相较于当前主流算法的优越性;将实验结果与SVM、RF、ELM等算法进行对比。与CNN网络不同,这些算法都需人工提取振动信号的特征,将提取的特征作为3种算法的输入,对比结果如表6所示。可知,RF、SVM、ELM算法平均准确率为92.8%、91.2%、89.2%;而融合CNN模型平均准确率为98.6%,明显高于其他3种算法。而且对于每种工况的测试准确率,融合CNN模型也是明显最优,再次验证了本文所建立的融合CNN模型性能的优越性。
|
|
表 6 四种算法的准确率对比(%) Tab.6 Comparison of accuracy of four algorithms (%) |
在信噪比为10、20、30 dB的噪声分别添加至原始信号中。信噪比公式为:
| $ {R}_{\mathrm{sn}}=10 \ln\frac{{p}_{\mathrm{signal}}}{{p}_{\mathrm{noise}}}。$ | (8) |
式中:
为验证模型在噪声干扰下的鲁棒性,将不同信噪比的信号分别输入融合CNN模型与单一CNN模型进行对比实验。每组实验均重复 5 次,并取测试准确率的平均值作为最终评价指标,结果如图10所示。可知,随着信噪比的降低,单一CNN模型的测试准确率逐渐下降,当信噪比为10 dB时,其准确率仅为88.4%。相比之下,融合CNN模型虽然同样受到噪声影响,但下降幅度明显较小,在各信噪比条件下的准确率均保持在94.5%以上,体现了较强的抗干扰能力,可以证明融合CNN比单一CNN模型具有更好抗干扰能力。
|
图 10 噪声影响下模型准确率对比图 Fig. 10 Comparison chart of model accuracy under noise influence |
1)提出的融合CNN模型利用格拉姆角场将一维振动信号转换为二维图像,使原始信号的时域关联特征得到了充分保留,并使船用柴油机故障诊断结论更加稳健。
2)与传统智能算法的对比实验表明,提出的融合CNN模型在故障诊断准确率方面具有显著优势,更优的稳定性,以及良好的抗干扰能力。
3)本文所构建的基分类器均为CNN模型,未来可进一步引入不同类型的基分类器,并考虑整合热力学参数、油液分析等多源监测数据,并全面评估模型的泛化能力和适用性,以提升船用柴油机故障识别精准性。
| [1] |
殷文慧, 王飞, 孙强, 等. 船用柴油机人工智能故障诊断应用综述[J]. 舰船科学技术, 2023, 45(24): 122-127. YIN W H, WANG F, SUN Q, et al. A review of the application of artificial intelligence in fault diagnosis for marine diesel engines[J]. Ship Science and Technology, 2023, 45(24): 122-127. DOI:10.3404/j.issn.1672-7649.2023.24.022 |
| [2] |
宋凯, 黄盟, 尤健, 等. 基于改进残差卷积网络的柴油机故障诊断方法[J]. 内燃机工程, 2023, 44(5): 66-73. SONG K, HUANG M, YOU J, et al. A fault diagnosis method for diesel engines based on an improved residual convolutional network[J]. Internal Combustion Engine Engineering, 2023, 44(5): 66-73. DOI:10.13949/j.cnki.nrjgc.2023.05.009 |
| [3] |
李少康, 陈龙, 陈辉, 等. 基于GAF-CNN的柴油机振动信号故障诊断[J]. 武汉理工大学学报, 2023, 47(4): 648-653. LI S K, CHEN L, CHEN H, et al. Fault diagnosis of diesel engine vibration signals based on GAF-CNN[J]. Journal of Wuhan University of Technology, 2023, 47(4): 648-653. DOI:10.3963/j.issn.2095-3844.2023.04.013 |
| [4] |
蔡一杰, 陈俊杰, 王君, 等. 基于遗传算法优化支持向量机的柴油机气门漏气故障智能诊断方法[J]. 内燃机工程, 2022, 43(2): 71-76. CAI Y J, CHEN J J, WANG J, et al. Intelligent fault diagnosis of diesel engine valve leakage using a genetic algorithm-optimized support vector machine[J]. Internal Combustion Engine Engineering, 2022, 43(2): 71-76. |
| [5] |
PAN H H, et al. An improved bearing fault diagnosis method using one-dimensional CNN and LSTM[J]. Journal of Mechanical Engineering, 2018, 7−8: 443−452.
|
| [6] |
张康, 陶建峰, 覃程锦, 等. 随机丢弃和批标准化的深度卷积神经网络柴油机失火故障诊断[J]. 西安交通大学学报, 2019, 53(8): 159-166. ZHANG K, TAO J F, QIN C J, et al. Diesel engine misfire fault diagnosis of a deep convolutional neural network with random dropout and batch normalization[J]. Journal of Xi′an Jiaotong University, 2019, 53(8): 159-166. |
| [7] |
张永祥, 王宇, 姚晓山. 基于加窗和卷积神经网络的柴油机拉缸故障诊断[J]. 车用发动机, 2019(6): 84-89. DOI:10.3969/j.issn.1001-2222.2019.06.014 |
| [8] |
路鹏. 基于改进CNN 的船舶柴油机故障诊断方法研究[D]. 武汉: 武汉理工大学, 2021.
|
2026, Vol. 48
