基于变分模态分解和Transformer模型的轴承故障诊断方法

引用本文

周博, 王振华, 韩瑞光, 孔斌, 谷守奥, 唐俊, 余涛. 基于变分模态分解和Transformer模型的轴承故障诊断方法. 舰船科学技术, 2026, 48(2): 179-185 复制到剪切板

ZHOU Bo, WANG Zhenhua, HAN Ruiguang, KONG Bin, GU Shouao, TANG Jun, YU Tao. Fault diagnosis model of rolling bearing based on VMD and Transformer. Ship Science and Technology, 2026, 48(2): 179-185 复制到剪切板

基于变分模态分解和Transformer模型的轴承故障诊断方法

周博¹, 王振华², 韩瑞光³, 孔斌¹, 谷守奥⁴, 唐俊⁴, 余涛¹

1. 武汉第二船舶设计研究所，湖北武汉 430205;
2. 中国人民解放军92351部队，海南三亚 572000;
3. 中国人民解放军92330部队，山东青岛 266102;
4. 天津大学，天津 300072

收稿日期: 2025-03-12.

作者简介: 周博（1999 – ），男，硕士，助理工程师，研究方向为振动分析、旋转机械故障诊断

摘要: 本文基于XJTU-SY全寿命周期轴承振动数据设计了信号切割与采样方法，构建了包含保持架损坏、内圈损坏和外圈损坏的数据集3类故障状态。并使用变分模态分解（VMD）方法作为信号处理模块，构建了输入序列。最后将序列输入到Transformer模型进行特征提取，再使用MLP分类器对3类故障进行诊断分析，对比了不同模态提取数下模型性能与分类效果。研究结果表明，使用VMD+Transformer的故障诊断模型在识别滚动轴承故障任务方面的准确率最高可达到90.7％。研究验证了Transformer模型在轴承故障信号处理与特征提取应用方面的可能性，可为船舶机械轴承健康管理提供技术支持。

关键词: 故障诊断深度学习振动信号处理变分模态分解注意力机制 Transformer模型

Fault diagnosis model of rolling bearing based on VMD and Transformer

ZHOU Bo¹, WANG Zhenhua², HAN Ruiguang³, KONG Bin¹, GU Shouao⁴, TANG Jun⁴, YU Tao¹

1. Wuhan Second Ship Design and Research Institute, Wuhan 430205, China;
2. No. 92351 Unit of PLA, Sanya 572000, China;
3. No. 92330 Unit of PLA, Qingdao 266102, China;
4. Tianjin University, Tianjin 300072, China

Abstract: The article designed a signal cutting and sampling method based on XJTU-SY full life cycle bearing vibration data and constructed a dataset containing three types of fault states, i.e. cage damage, inner ring damage, and outer ring damage. The Variable Modal Decomposition (Variational Mode Decomposition, VMD) method was used as the signal processing module to construct the input sequence. Finally, the sequences were input to the Transformer model for feature extraction, and then the three types of faults were diagnosed and analyzed using the MLP classifier. The experiments compare the model performance and classification effect under different modal extraction numbers. The results show that the fault diagnosis model using VMD+Transformer can reach up to 90.7% accuracy in the task of recognizing rolling bearing faults. The possibility of application of Transformer model in bearing faule signal processing and feature extraction is verified,which can provide technical support for the health management of Maring machinery bearings.

Key words: fault diagnosis deep learning vibration signal process variational mode decomposition attention mechanism transformer model

0 引　言

船舶机舱内的机电设备有推动船舶运动、改变船舶航向的作用，在船舶设备系统中具有举足轻重的地位，能确保船舶高效稳定航行和作业。但机电设备种类多样，结构复杂，需要系统性、针对性对设备进行长期的设备维护和故障检测^[1]。

目前在石油化工、电力、冶金领域较系统的设备故障诊断分析方法都基于振动分析实现，通过检测设备振动情况来预测或识别故障的技术已经得到了广泛应用^[2]，但船舶在行驶过程中的振动检测受海浪冲击等干扰较大，普通的振动分析存在一定困难，针对船舶机电设备的振动分析故障诊断应用较少。同时，考虑到船舶机电设备，如涡轮机、舵机、发电机等都是旋转机械，本文把滚动轴承这一旋转机械核心零件作为研究对象。

在机械零件工作状态的监测和诊断课题上，自动化、智能化、集成化方向发展仍是不可忽视的重要趋势。但现有研究大都通过支持向量机、多层感知机、CNN等传统机器学习方法进行故障诊断。这种方法依赖特征提取环节，即能从信号本身提取出多少可供神经网络学习的可用信息。李恒等^[3]以短时傅里叶变换为特征提取手段，将时频谱信号作为训练样本，并设计卷积神经网络进行学习，该方法针对无噪声信号有着较好的诊断准确率，最高可达到99.87％。但面对噪声干扰时鲁棒性较差，导致识别精度变低。

为更加有效地获取滚动轴承振动信号的特征频率，刘俊锋等^[4]使用快速谱相关分析（FSC）来提取振动信号的非线性特征，并利用多尺度排列熵（MPE）来量化特征，该研究中将提取到的特征分量输入到BP神经网络中进行学习，经验证，该方法在不同信噪比下均有较高的准确度，进一步提升了泛化性能。

为进一步压缩信号内时频特征信息，最大程度上获取到轴承故障不同时期的频率细节，现有研究引入了变分模态分解（VMD）方法。闫文源^[5]对基于变分模态分解的滚动轴承故障诊断方法进行了较详细的研究，通过比对滚动轴承在不同失效形式下振动信号的不同，设计了VMD参数。并使用支持向量机分类，取得较好的效果。崔桂艳等^[6]将振动信号通过变分模态分解方法分解为多个本征模态分量，并将其转化为灰度图像输入卷积神经网络进行学习，在加入噪声后获得了平均99.90％的平均准确率。

本文在使用VMD方法的基础上，创新性选择Transformer模型，将几个本征模态分量同时输入网络进行训练，在注意力机制与大参数量的支持下较好地完成故障诊断任务。

1 理论基础 1.1 振动信号的故障监测原理

当滚动轴承出现异常故障时，其振动形式会由于其工作状态的不平稳而发生变化，这种变化在一定程度上可被振动信号反应。在本质上，振动信号易于被幅度、频率、相位等物理量所描述。且机械零件的振动信号可被加速度传感器所采集，借助成熟的传感器技术和数字信号处理技术，通过查看其时频域特征，分析机械零件健康状态、早期故障与失效发生等不同时期的时频域特点，即可实现对滚动轴承的异常判断^[7]。

在轴承零件的全生命周期内，通过信号的变化可进行3类故障监测。

1）健康状态与异常状态的区分高频部分的能量增加是轴承振动出现异常的典型特征^[8]，如图1所示的2条信号是同一个轴承分别在异常状态和健康状态下的振动信号经傅里叶变换后得到的频谱。不难看出，异常信号在高频频段上的能量明显高于正常信号。

图 1 异常与健康状态振动信号频谱图 Fig. 1 Spectrogram of abnormal and healthy vibration signals

2）轴承在后期失效形式的区分轴承完全失效时，振动波形成分复杂度会急剧增加^[8]。如图2所示，分别为滚动轴承发生内圈故障末期与发生外圈故障末期的信号波形。可以很明显看出，内圈故障信号与外圈故障信号相比，其振幅成分更混杂。

图 2 内外圈故障末期振动信号波形图 Fig. 2 Waveforms of vibration signals at the end of inner and outer failures

3）同种轴承在实际工作中也可能出现不同的早期故障特征，进而出现不同的损坏流程。如图3分别展示了同种工况下的2个相同轴承，都出现外圈断裂情况但达到失效过程不同的振动波型。

图 3 两个同型号轴承外圈故障振动信号波形图 Fig. 3 Waveforms of vibration signals of two bearings of the same type with outer failure

所以，可以针对不同时期、不同程度、不同类别的振动信号变化对滚动轴承的工作状态进行分析。有经验的机械工程师可以通过查看其时域波形或提取时频域特征确认其故障来源及类型。但这种方法对工程师本身存在考验，一是因为收集记录的振动信号时间长、样本多，这使得工程师没办法较快地完成所有识别任务；二是对工程师分析振动信号特征的经验丰富程度要求较高。而正是这种依赖专家经验的人为故障信号特征分析决策在精确度和效率上确实存在劣势，本文选择采取建立深度学习模型对提取到的信号特征进行分析并分类，实现高效、自动化的设备故障检测与常态化和智能化的设备运维。

1.2 变分模态分解

在本文的信号处理流程中，最关键的一个环节为变分模态分解（Variational Mode Decomposition，VMD）。2014年，由Dragomiretskiy K提出，旨在将成分复杂的信号同时分解为几个模态函数，每一个模态函数代表原始信号在不同频率上的成分，以实现对复杂信号的时频域特征分解^[9]，经过分解后能有效实现对环境噪声的滤除^[10]，能很好解决船舶机电设备振动环境复杂的难题。

VMD方法假设原始信号可以被分解为K个分量，每一个分量都被称为一个模态IMF，IMF具有各自的中心频率，且带宽有限^[11]。其分解过程为，在满足各IMF相加能重构原始信号的约束条件下，将信号分解为满足条件的IMF，且使所有模态之和最小^[12]。即:

$ \begin{split}&\min_{\{{u}_{k},{\omega }_{k}\}}\left\{\sum _{k}{\|{\partial }^{t}\left[\left(\delta \left(t\right)+\displaystyle\frac{j}{{\text{π}} t}\right)*{u}_{k}\left(t\right)\right]{e}^{-j{\omega }_{k}t}\|}_{2}^{2}\right\}\\ & {\mathrm{s.t.}}\sum _{k}{u}_{k}=f。\end{split} $

(1)

式中：$ \delta \left(t\right)+{j}/{{\text{π}} t} $为希尔伯特变换的核函数；$ {u}_{k} $为各模态函数；$ {\omega }_{k} $为各模态中心频率；$ f $为原始信号。

于是该问题变为一个泛函的变分问题，每个IMF分量被定义为一个幅频调制信号，信号表达式为：

$ {u}_{k}\left(t\right)={A}_{k}\left(t\right)\mathrm{cos}\left({\varnothing }_{k}\left(t\right)\right)。$

(2)

式中：$ {A}_{k}\left(t\right) $为第k个IMF$ {u}_{k}\left(t\right) $的瞬时幅值；$ {\varnothing }_{k} $为$ {u}_{k}\left(t\right) $的相位函数。接下来，模态分解问题就转换成了一个非约束变分问题，可通过泛函方法求解。得到的解即为满足条件的K个变分模态分量和K个各模态中心频率。

1.3 Transformer基本模型

本文选择使用Transformer模型编码器作为提取并学习各模态特征的主要结构，并基于该结构搭建深度学习分类器，进行故障分类任务。

Transformer模型由Google Brain团队开发并被广泛地应用于序列数据处理中，其最大的革新在于引入了自注意力机制，能够更好地捕捉长期依赖关系，有效避免了卷积神经网络（CNN）、循环神经网络（RNN）等传统模型的长程依赖问题，并将残差连接技术加入模型，加强了模型的训练效果和泛化能力^[13]。

该编码器主要分为位置编码，注意力计算与残差连接、前馈网络与残差连接 3个部分，后两者组合在一起也被叫做Transformer的基本块（Basic Block）。

1.3.1 位置编码

Transformer模型针对如语音信号，文本等输入序列时，并不能像RNN一样通过隐含状态来获取输入序列中各个顺序的位置关系，于是要在自注意力计算前对序列进行位置编码，即：

$ {P}_{E}\left(X\right)=X+{\boldsymbol{P}}osition。$

(3)

式中：$ X $为输入序列的分量；$ {\boldsymbol{P}}osition $ 为位置矩阵，由正余弦数组合而来的位置编码公式计算得到。

通过叠加的方式，获取到的位置编码向量$ {P}_{E}\left(X\right) $就同时包含输入序列与位置信息。

1.3.2 自注意力计算与残差连接

自注意力机制是Transformer结构中的关键，在该计算过程中，输入序列$ X $经历不同权重矩阵线性变换分别得到查询$ q $、键$ k $和值$ v $。

如图4所示，所得到每一个$ q $与其余$ k $代入注意力点积公式计算，得到对应的注意力权重，再将权重乘在其对应的值$ v $上，得到长程含位置序列在不同位置的输出。这种计算形式更注重发掘序列中不同位置间的内在联系，且通过并行计算的方式进行计算，效率较高。

图 4 自注意力计算示意图 Fig. 4 Schematic of self-attention calculation

通过自注意力计算后，其输出通过残差连接以提高模型的拟合能力，减少学习偏差与信息丢失；并将层进行归一化稳定数据，加快训练，即：

$ \begin{array}{c}Output=LayerNorm\left(X+Sublayer\left(X\right)\right)\end{array}。$

(4)

式中：$ LayerNorm $为层归一化操作；$ Sublayer $为自注意力计算。

1.3.3 前馈网络与残差连接

Transformer经过自注意力计算与残差连接后得到的输出被输入进前馈网络。前馈网络由全连接层与激活函数组成，对输入进行线性变换以进一步提取特征，再通过激活函数以强化其非线性特性，以此增加模型的表达能力，使Transformer能学习到更多信息，提高训练效果。

经过前馈网络的结果再次使用残差连接方法提高模型学习效果，其原理与主要作用和1.3.2节相同。

模型搭建过程中常常将Transformer基本块进行串联以此增加模型的深度。

2 数据集构建与模型搭建 2.1 研究所用数据集描述

研究使用的原始数据集为西安交通大学现代设计及转子轴承系统教育部重点实验室自采集的XJTU-SY滚动轴承加速寿命试验数据集^[14]。

该数据集包含了3种工况下15个滚动轴承的全寿命周期振动信号，均在试验平台上由动态信号采集器测得。采样相关参数如表1所示。

表 1 数据集信号采样相关参数 Tab.1 Releted parameters of signals in dataset

每条记录下来的振动信号同时分为水平和竖直2个方向。按照采样频率与采样时间，每条采样信号每个方向有32768个数据点。

数据集内记录了试验轴承工作至损坏的多种失效形式，分别为外圈磨损，内圈磨损，保持架断裂、外圈裂损等。

2.2 信号预处理流程

由于原始数据集为2个方向轴承全寿命周期的振动信号，信号序列较长，样本点较多，在构建研究数据集前，还需要对数据集内每一条原始信号进行预处理。

本文选择使用XJTU-SY数据集内其中2种工况的部分数据，即转速为2100 r/min，径向力12 kN（工况1）与转速2250 r/min，径向力11 kN（工况2）下的数据，其具体信息如表2所示。

表 2 所选择数据信息 Tab.2 Selected data information

针对所选择的每一条数据，本文选择对其进行均匀采样，采样方式如图5所示。每隔2048个点进行一次抽样，取一条长度1024个连续点的信号。

图 5 信号采样方式示意图 Fig. 5 Signal sampling method schematic

2.3 研究数据集划分

通过2.2节的采样方法，经过数据清洗与筛选。在工况1下共得到6630条样本，在工况2下共得到21000条样本。

使用工况1下的样本，进行同工况同失效位置下的失效流程诊断和区分，即查看神经网络模型能否很好区分3个不同的失效流程。该工况下采样后得到的6630条样本组成研究数据集A，具体划分情况如表3所示。

表 3 研究数据集A信息 Tab.3 Information on the experimental dataset A

使用工况2下的样本进行同工况下失效的故障类型诊断，即查看神经网络模型能否区分发生或即将发生的失效是出现在内圈、外圈还是保持架。该工况下经原始数据集采样、数据清洗后得到的21000条样本组成研究数据集B，具体划分情况如表4所示。

表 4 研究数据集B信息 Tab.4 Information on the experimental dataset B

3 结果分析 3.1 基于VMD与Transformer模型的故障诊断研究 3.1.1 数据处理流程

基于Transformer模型分类的故障诊断数据处理流程如图6所示。

图 6 故障诊断处理流程图 Fig. 6 Fault diagnosis experiment flow chart

将2.3中构建的数据集先导入VMD算法进行模态分解，分解出的K个模态序列导入神经网络模型。以K=3的模态分解为例，如图7所示的采样信号经变分模态分解后被分解为3个模态函数，且3个模态在频域分布上有较强的区分度。

图 7 变分模态分解结果时频图 Fig. 7 Time-frequency plots of variational modal decomposition results

经过VMD后，信号被分解为K个模态，形成形状为(K, 1024)的张量作为神经网络的输入。

3.1.2 研究所用模型结构

研究所使用的Transformer分类器结构与参数如图8所示。输入的K的模态首先进行位置编码，以此让模型获取到各个模态的顺序。而后通过一层全连接层的线性变换，将长度为1024的信号再次进行编码，随后进行多头自注意力计算。将结果归一化后进行残差连接，输入进前馈网络。与1.3.3节不同的是，本文为了加强模型的拟合能力，在前馈网络中加入了一层Dropout层。最后再经过一次残差连接，此时输入进去的K个模态函数变成了有序的Transformer编码。针对这些编码，本文设计了一个多层感知机，Transformer编码再经过多层感知机后被转化为(3, 1)的向量以实现研究的三分类任务。

图 8 Transformer分类器结构及有关参数 Fig. 8 Transformer classifier structure and related parameters

模型的相关超参数如表5所示。

表 5 Transformer分类器相关超参数 Tab.5 Related hyperparameters of Transformer classifier

3.1.3 研究设置

研究选用python 3.11内核，使用pytorch 2.1.2架构完成模型搭建，所有训练在NVIDIA GeForce RTX 4090上进行。

故障诊断研究分为2组，第一组在数据集A上进行，以Bearing1_1、Bearing1_2、Bearing1_3三个滚动轴承信号为代表，对不同故障过程进行分类。第二组在数据集B上进行，用来检验模型对不同失效位置的故障诊断能力。这2组研究均提取研究数据集内信号的3个模态，即K=3。在第二组研究基础上，设计了2组对比研究，查看了K=4与K=5时的分类效果。

3.2 研究结果 3.2.1 研究1结果

本文通过模型在测试集上的分类准确率来判断模型在故障诊断上任务上的性能。研究一的训练损失值曲线、准确率曲线与混淆矩阵如图9所示。模型测试集上的分类准确率为93.57％。

图 9 研究1训练曲线与混淆矩阵 Fig. 9 Training curves and confusion matrices of experiment 1

3.2.2 研究2结果

图10为模型在数据集B上的训练过程与混淆矩阵，由图可知，验证集准确率最高达到96.86％，在测试集上的准确率最高达到了97.46％。说明模型具有提取输入的3个模态函数特征的能力，并能分类3种不同故障类型。

图 10 研究2训练曲线与混淆矩阵 Fig. 10 Training curves and confusion matrices of experiment 2

为测试在VMD阶段提取出几个模态能让模型学习到最多的信息同时不至出现过分解现象，文章在数据集B上设计了K=4与K=5的对照组，其模型差异与测试集表现如表6所示。

表 6 不同模态个数对照组结果 Tab.6 Results of the control group with different number of IMFs

4 结　语

本文针对船舶机电设备故障诊断问题，以滚动轴承为研究对象，提出了基于变分模态分解与Transformer的故障诊断方法。该方法通过模态分解的方式将复杂的非平稳振动信号分解为多个有固定中心频率的模态函数，保留其时域顺序的同时将其的频域特点进行了分离，一方面完美地利用了Transformer模型在序列任务上的优势；另一方面又最大程度上保留了原始信号的基本特征。

从结果来看，不管是针对不同故障位置的分类诊断，还是分类断裂位置相同轴承的不同振动过程，VMD+Transformer方法都有着较高的准确率。但针对XJTU-SY数据集而言，选择较高的模态分解数，一方面会增加神经网络的参数量，增加训练时长，另一方面面临着过分解的风险，无法让神经网络模型提取到足够明确的特征，最终导致故障诊断的准确率降低。

参考文献

[1]	朱拥勇, 李宗吉, 王世哲. 基于HHT时频分析的水声信号特性提取与建模[J]. 舰船科学技术, 2023, 45(23): 122-126. ZHU Y , LI Z , WANG S. Underwater acoustic signal characteristic extraction and modeling based on HHT time-frequency analysis[J]. Ship Science and Technology, 2023, 45(23): 122-126.
[2]	胡以怀, 蒋佳炜, 方云虎, 等. 船舶机舱旋转机械的振动测试与分析[J]. 船舶与海洋工程, 2020, 36(2): 36-40. HU Y H, JANG J W, FANG Y H, et al. Vibration test and analysis of rotating machinery in Marine engine room[J]. Naval Architecture and Ocean Engineering, 2020, 36(2): 36-40. DOI:10.14056/j.cnki.naoe.2020.02.007
[3]	李恒, 张氢, 秦仙蓉, 等. 基于短时傅里叶变换和卷积神经网络的轴承故障诊断方法[J]. 振动与冲击, 2018, 37(19): 124-131. LI H, ZHANG Q, QIN X R, et al. Research about fault diagnosis of bearing based on FFT and convolutional neural network[J]. Journal of Vibration and Shock, 2018, 37(19): 124-131. DOI:10.13465/j.cnki.jvs.2018.19.020
[4]	刘俊锋, 董宝营, 俞翔, 等. 基于FSC-MPE与BP神经网络的滚动轴承故障诊断方法[J]. 中国舰船研究, 2021, 16(6): 183-190. LIU J F, DONG B Y, YU X, et al. Rolling bearing fault diagnosis method based on FSC-MPE and BP neural network[J]. Chinese Journal of Ship Research, 2021, 16(6): 183-190. DOI:10.19693/j.issn.1673-3185.02158
[5]	闫文源. 基于变分模态分解和SVM的滚动轴承故障诊断[D]. 焦作: 河南理工大学, 2018.
[6]	崔桂艳, 钟倩文, 郑树彬, 等. 基于VMD灰度图像编码和CNN的多传感融合轴承故障诊断[J]. 振动与冲击, 2023, 42(21): 316-326. CUI G Y, ZHONG Q Y, ZHENG S B, et al. Multi sensor fusion bearing fault diagnosis based on VMD gray image coding and CNN[J]. Journal of Vibration and Shock, 2023, 42(21): 316-326.
[7]	程明. 基于声振信号滚动轴承故障诊断方法研究[D]. 合肥: 合肥工业大学, 2023.
[8]	向玲, 唐贵基, 胡爱军. 旋转机械非平稳振动信号的时频分析比较[J]. 振动与冲击, 2010(2): 4. XIANG L, TANG G J, HU A J. Vibration signal's time-frequency analysis and comparison for a rotating machinery[J]. Journal of Vibration and Shock, 2010(2): 4. DOI:10.13465/j.cnki.jvs.2010.02.047
[9]	DRAGOMIRETSKIY K, ZOSSO D. Variational mode decomposition[J]. IEEE Transactions on Signal Processing, 2014, 62(3): 531-544. DOI:10.1109/TSP.2013.2288675
[10]	杨大春. 基于集合经验模态分解的滚动轴承振动信号希尔伯特谱分析方法[J]. 机械制造, 2019, 57(8): 29-32+79. YANG D C. Hilbert spectrum analysis method of rolling bearing vibration signal based on set empirical mode decomposition[J]. Machinery, 2019, 57(8): 29-32+79.
[11]	何洋洋, 王馨怡, 董晶. 基于经验小波变换与谱峭度的船舶轴系故障特征提取方法[J]. 中国舰船研究, 2020, 15(S1): 98-106. HE Y Y, WANG X Y, DONG J. Fault feature extraction method for marine shafting based on empirical wavelet transform-spectral kurtosis[J]. Chinese Journal of Ship Research, 2020, 15(S1): 98-106. DOI:10.19693/j.issn.1673-3185.01771
[12]	唐贵基, 王晓龙. 变分模态分解方法及其在滚动轴承早期故障诊断中的应用[J]. 振动工程学报, 2016, 29(4): 638-648. TANG G J, WANG X L. Variational mode decomposition method and its application on incipient fault diagnosisof rolling bearing[J]. Journal of Vibration Engineering, 2016, 29(4): 638-648. DOI:10.16385/j.cnki.issn.1004-4523.2016.04.011
[13]	VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need[C]//Advances in Neural Information Processing Systems, 2017: 5998−6008.
[14]	雷亚国, 韩天宇, 王彪, 等. XJTU-SY滚动轴承加速寿命试验数据集解读[J]. 机械工程学报, 2019, 55(16): 1-6.


舰船科学技术 2026, Vol. 48 Issue (2): 179-185 DOI: 10.3404/j.issn.1672-7649.2026.02.028	PDF