论文题目:
Multiple path alignment generative adversarial network for rotating Machinery fault diagnosis with limited data
论文期刊:Advanced Engineering Informatics
论文日期:2025年
论文链接:
https://doi.org/10.1016/j.aei.2025.103550
作者:Yange Wang (a), Zhiqiang Lu (a), Zhang Zhiwen (b), Changhui Liu (a), Jianbo Yu (a,*)
机构:
a: School of Mechanical Engineering, Tongji University, Shanghai 201804, China;
b: Longmen Laboratory, Luoyang 471000, China
团队带头人简介:余建波老师,现任同济大学机械能源学院教授,博士生导师,研究方向包括智能制造、设备智能维护、先进质量控制及人工智能在制造业中的应用。主要研究领域涵盖:设备预诊与可靠性、复杂制造过程的质量控制、机器学习应用与生产系统优化等。主持多项国家自然科学基金(面上项目、青年基金)、教育部博士点基金、上海市优青、国家重点实验室开放基金等项目,承担并参与了上海市教委、航天科技、慈溪市等多项科研计划及企业合作课题。除了科研教学,余建波教授也活跃在国际学术界,担任了多个期刊的编委,包括:Advances in Mechanical Engineering、Chinese Journal of Engineering等国际权威期刊,覆盖工业电子、制造科学、神经网络与智能系统等多个领域。(来源: https://mefaculty.tongji.edu.cn/info/1296/3239.htm)
1 摘要
2 引言
3 多路径对齐生成对抗网络
3.1 特征生成器
3.2 判别器
3.3 多路径对齐损失
3.4 MPAGAN在机械故障诊断中的应用
4 实验与结果分析
4.1 案例一:齿轮箱故障诊断
4.2 案例二:轴承故障诊断
5 结论
在实际工业场景中,旋转机械在小样本条件下的故障诊断面临巨大挑战。近年来,生成对抗网络(GAN)在小样本故障诊断中表现出强大的能力。然而,现有研究大多侧重于对齐生成数据与真实数据之间的概率分布,却忽略了振动信号在时域与频域上的差异。为此,本文提出了一种多路径对齐生成对抗网络(MPAGAN),以生成足够的数据来支持旋转机械在小样本条件下的故障诊断。首先,设计了一种多路径对齐损失(MPAL)模块,用于引导模型在训练过程中生成在时域与频域上均接近真实数据的样本。其次,构建了一个嵌入了离散Walsh-Hadamard软阈值滤波(DWH-STF)模块的新型生成器,用于滤除生成信号中的冗余成分。最后,引入辅助分类器以增强生成信号的判别性与多样性。本文通过两个案例验证了MPAGAN在机械故障诊断中的有效性。实验结果表明,MPAGAN不仅能够生成有效的故障数据,还能在小样本条件下显著提升故障诊断性能。
关键词:旋转机械,故障诊断,振动信号,小样本数据,生成对抗网络
旋转机械在实际工业场景中扮演着至关重要的角色。然而,一旦发生故障,往往会造成严重的经济损失,甚至引发人员伤亡。故障诊断能够实现潜在问题的早期检测与识别,有效防止事故发生,保障设备的安全性与可靠性。因此,准确的故障诊断对于设备的安全稳定运行具有重要意义。
由于其出色的特征提取能力,深度学习在机械故障诊断中得到了广泛应用。尽管基于深度学习的研究在机械故障诊断领域取得了显著进展,但它们普遍基于一个基本假设:数据是充足的。然而,在实际工业场景中,受设备安全性和复杂工况的限制,采集到的数据往往较为有限,因此在小样本条件下实现有效故障诊断仍是一个难点问题。
目前,针对小样本条件下机械故障诊断问题,主要有四种常用方法:迁移学习方法、元学习方法、数字孪生方法和数据增强方法。迁移学习通过从数据充足的领域迁移已学得的特征或知识来缓解小样本问题。然而,当源域与目标域之间差异较大时,迁移学习的性能会显著下降,因为已学习的知识可能无法适用于新领域。元学习是一种强大的方法,可使模型快速适应新任务,能够从有限数据中有效提取有价值的知识,从而降低对大量标注数据的依赖,提升模型在不同场景下的适应性。数字孪生(digital twin, DT)是一种与物理系统动态同步的虚拟模型,其在整个生命周期内实时演化,能够生成高保真度的模拟故障数据,有效缓解机械故障诊断中的数据匮乏问题。然而,DT 的效果受限于高质量输入数据的获取以及多物理建模带来的计算复杂性。
生成对抗网络(GAN)为有限数据问题提供了有效的解决方案,可生成逼真的合成数据。Yang 等人开发了一种特征融合 GAN 进行图像生成,在生成器中引入多个跳跃连接以有效捕捉多尺度特征;Li 等人提出一种故障可估计自编码 GAN(FAE-GAN),通过特殊设计模块实现故障剔除映射的学习;Tang 等人提出一种嵌入物理约束的 WGAN,通过硬约束将领域知识注入神经网络中,确保工业过程数据生成的物理一致性。
尽管上述基于 GAN 的方法已在有限数据条件下的机械故障诊断中取得较好效果,但仍存在以下问题:(1) 现有方法主要通过优化损失函数实现生成数据与真实数据概率分布的对齐,未充分考虑时间域与频率域之间的差异;(2) 部件早期故障特征通常较弱且被强背景噪声所掩盖,即使 GAN 可生成信号,其生成性能仍可能受到冗余特征和噪声的影响。因此,有必要构建特征学习模块以滤除冗余成分并提升生成信号质量;(3) 现有生成模型难以生成准确捕捉类别特征的判别性信号,因此需要引入辅助分类器来引导生成器输出类别相关的故障信号。
为解决上述问题,本文提出一种新型的基于 GAN 的网络模型,用于小样本条件下的机械故障诊断。本文的主要贡献如下:
(1) 构建了一种多路径对齐生成对抗网络(MPAGAN),用于小样本数据增强与故障诊断,能够同时考虑时间域和频率域的信息;
(2) 在生成器中引入离散 Walsh-Hadamard 变换(DWHT)作为特定层,并结合软阈值滤波(STF)实现对生成信号冗余成分的滤除;
(3) 在判别器中引入辅助分类器,以保证生成数据的类别准确性并增强样本多样性。本文通过两个案例验证了 MPAGAN 的性能,实验结果表明 MPAGAN 能有效提升小样本条件下故障诊断的准确性。
图 1 多源信息融合框架
MPAGAN 中的生成器 G 用于生成与真实数据相似的数据。G 由多个上采样层、卷积层以及用于滤除生成信号中冗余特征的 DWH-STF 模块构成。DWH-STF 的结构如图 2 所示,包括一个 DWHT 层、一个用于降噪的软阈值层以及一个反离散 Walsh-Hadamard 变换(IDWHT)层。
图 2 DWH-STF 的网络结构
DWHT是一种正交变换,其基函数由一组矩形不连续波形组成,取值为 -1、0 和 1。DWHT 与离散傅里叶变换(DFT)相似,能够将信号从时域转换到频域,从而便于对其频率成分进行分析。相比于 DFT,DWHT 的计算过程仅涉及加法和减法运算,因而更为简洁。通常情况下,大多数故障相关特征集中于低频成分,也有一部分分布在高频成分中,因此有必要滤除生成信号中的无效频率特征。软阈值法因其在降噪方面的有效性,被广泛用于多种信号去噪方法中,因此本文采用软阈值方法以滤除冗余频率特征。
首先,通过 DWHT 计算信号的频率系数:
其中, 表示变换后的 DWHT 系数,用于表示频域中第 个频率分量的幅值; 表示 Walsh 函数的取值,是变换矩阵中的元素,用于定义第 个频率分量与第 个时域点之间的关系; 是任意的 Rademacher 函数; 表示 的 Gray 编码,是一种二进制编码方法。
然后,使用 STF(软阈值滤波)来筛选有效的频率系数。软阈值函数定义如下:
其中,
其中,
最后,通过逆离散Walsh-Hadamard变换(IDWHT)层将频域中经过滤波的系数重构回时域信号。
3.2 判别器
判别器 D 原本用于区分输入数据的来源。在 MPAGAN 中,判别器中加入了辅助分类器,用于识别输入数据的类别。该辅助分类器能够引导生成器学习具有判别性的类别条件特征,从而提升生成信号的多样性和准确性。判别器的结构由四个卷积层和两个全连接层组成,分别作为来源分类器和辅助分类器。判别器接受真实数据和生成数据作为输入,输出预测的数据来源及类别标签。输入数据首先被送入判别器的卷积层进行特征学习,全连接层作为分类器输出最终的分类结果。每个卷积层采用 LeakyReLU 作为激活函数,泄漏系数设为 0.02。具体计算过程如下:
其中,
其中,
谱归一化(SN)通过归一化权重矩阵
3.3 多路径对齐损失
生成对抗网络(GAN)在生成与真实数据相似的数据方面表现出卓越的能力。然而,生成数据与真实数据在概率分布、时域和频域上仍存在差异。大多数研究侧重于通过交叉熵或Wasserstein距离损失减少概率分布之间的差异,但针对时域和频域差异的有效方法仍然不足。因此,本文提出了多路径对齐损失(MPAL)模块,以进一步减少这些差异。MPAL模块的损失信息流如图3所示,包含概率分布、时域和频域的对齐损失。
图 3 MPAL 的损失信息流
在GAN中,真实数据与生成数据的概率分布对齐通常采用Jensen-Shannon(JS)散度实现。在MPAGAN中,判别器
其中,
本研究采用 L2 损失函数作为时域损失的衡量指标,用于对齐生成信号与真实信号在时域上的偏差。L2 损失函数作为一种广泛应用的误差度量,计算公式如下:
其中,
图 4 时域序列的离散傅里叶变换(DFT)
DFT的计算过程表达如下:
其中,
然后,基于频谱位置信息开发了一种频谱距离度量,用以减少频谱上样本间的差异,为生成模型性能的评估和优化提供准确的度量。根据离散傅里叶变换(DFT)的定义,
如图5所示,
图5 两个信号点的距离
因此,频域损失,即实信号与生成信号之间的频谱距离,定义如下:
最后,生成器 G 的总损失函数由概率分布对齐损失、时域损失和频域损失组成,定义如下:
判别器 D 的损失函数定义如下:
对于D,其训练目标是通过增加两个样本之间的对数似然来最大化其损失函数。
3.4 MPAGAN在机械故障诊断中的应用
本节介绍MPAGAN在小样本机械故障诊断中的应用过程。故障诊断利用先进的算法和机器学习技术,能够自主识别和分类机械故障。该方法有助于实现预测性维护,减少意外故障,提升运行可靠性。所提方法的详细流程如图6所示。
步骤1:获取机械在不同健康状态下的振动信号。
步骤2:构建MPAGAN模型,通过对抗学习训练生成器G和判别器D。
步骤3:利用训练好的MPAGAN生成新信号,扩充有限的信号数据,并从多个角度评估生成信号的质量。
步骤4:利用生成的信号辅助旋转机械在小样本条件下的故障诊断。
图6 所提方法的应用
4.1 案例1:齿轮箱故障诊断
为了验证MPAGAN的有效性,本节在齿轮箱测试平台上进行了实验。如图7所示,齿轮箱测试平台由伺服电机、齿轮箱和制动器组成。齿轮箱模数为0.6,减速比为3。振动信号通过安装在齿轮箱上的加速度传感器采集。实验中采样频率设定为20 kHz,齿轮箱在电机1200转/分钟速度下运行。
图7 齿轮箱测试平台
图8及表1展示了行星齿轮箱数据集的信息。本文测试了齿轮箱的五种健康状态:正常、复合故障、行星齿轮齿断裂、行星齿轮齿点蚀和行星齿轮齿裂纹。为验证MPAGAN在小样本条件下的性能,每类仅使用少量样本进行测试。每个样本包含1024个采样点。
图8 不同缺陷的齿轮
表1 五种健康状态的详细信息
(1)参数设置
表2列出了MPAGAN的参数设置和网络结构,其中K为卷积核大小,S为滑动步长,生成器输入的潜在维度设定为256。判别器输出样本来源标签(真实或生成)及样本类别标签。
表2 MPAGAN的详细参数
(2)可视化分析
本节对DWH-STF模块的特征进行了可视化分析。图9展示了状态L4下的降噪细节。可见,软阈值方法自适应地滤除了无效的高低频率,图中红色圈出部分显示最无效的频率被抑制为零,表明该方法能有效选择频率以实现降噪和特征学习。绿色圈出部分显示大部分噪声被有效去除。
图9 软阈值滤波结果
为验证DWH-STF的有效性,图10中进行了有无DWH-STF模块的对比实验。具体来说,图10(a)中的红色曲线为未使用DWH-STF生成的信号,图10(b)中的红色曲线为使用DWH-STF生成的信号,所有子图中的蓝色曲线均为真实信号。结果显示,带有DWH-STF模块的生成信号更接近真实信号,表明DWH-STF是生成器生成高质量信号的有效模块。
图10 有无DWH-STF模块的时域性能对比
(3)生成数据的评价
本节从概率分布、时域和频域三个方面对生成信号进行评价。采用最大均值差异(MMD)来量化生成信号与真实信号之间的概率分布差异。MMD的计算过程定义如下:
图11 L1和L2状态下生成信号与真实信号的概率分布对比
为验证MPAGAN的优越性,选取六种具有代表性的方法进行对比,分别是:辅助分类器生成对抗网络(ACGAN)、变分自编码生成对抗网络(VAEGAN)、带梯度惩罚的Wasserstein生成对抗网络(WGAN-GP)、条件多域生成对抗网络(CMDGAN)、类傅里叶变换生成对抗网络(FTGAN)及频谱引导生成对抗网络(SGAN)。
表3展示了不同方法生成信号与真实信号之间的最大均值差异(MMD)值。对所有齿轮状态下的50个真实信号和50个生成信号的平均MMD值进行了比较。MMD值越小,表示生成信号与真实信号的相似度越高。
表3 齿轮箱数据集中生成信号与真实信号的MMD值
相比其他方法,MPAGAN在五种状态下的MMD值均为最小。尽管FTGAN和SGAN在健康状态L1、L4和L5表现出一定的竞争力,但它们在所有状态下生成可靠且具有代表性的信号的一致性和整体效果仍不及MPAGAN。这表明MPAGAN有效解决了生成信号与真实信号概率分布对齐的问题。
为了进一步验证MPAGAN的有效性,本文还考虑了生成信号与真实信号在时域和频域的差异。图12展示了MPAGAN生成信号与真实信号在时域的对比,蓝线和红线分别表示真实信号和生成信号。
图12 所有健康状态下生成信号与真实信号的对比:(a)正常状态,(b)复合故障,(c)齿断裂,(d)齿点蚀,(e)齿裂纹
可以明显看出,生成信号准确捕捉了真实信号的冲击趋势特征,并在幅值上表现出相似性,表明MPAGAN有效学习了真实信号中的故障相关特征,生成了与真实信号相似的信号。图13展示了生成信号在频域的表现,显示生成信号成功捕获了真实信号的重要频率特征,说明生成信号能够真实地反映行星齿轮箱的振动信息。
图13 信号的频域分析:(a)正常状态,(b)复合故障,(c)齿断裂,(d)齿点蚀,(e)齿裂纹
为了进一步展示MPAGAN在频域的优越性,图14比较了包括MPAGAN在内的六种不同数据增强方法。所有方法均能捕捉真实信号的关键频谱趋势,而MPAGAN生成的频谱与真实信号最为接近,表明生成信号与真实信号在频域的对齐问题已成功解决。结果显示,MPAGAN在概率分布、时域和频域的信号生成方面表现优异,充分证明了MPAL模块的有效性。
图14 复合故障情况下不同方法的频域比较
(4)小样本条件下的故障诊断
为验证MPAGAN在小样本条件下的有效性,开展了故障诊断实验。本节考虑了三种具有代表性的深度学习方法,分别为一维深度卷积神经网络(1D-CNN)、一维残差学习网络(1D-ResNet18)和高效通道注意力网络(ECANet)。表4列出了1D-CNN的网络结构,该网络由四个一维卷积层和两个全连接层组成。卷积核大小为3,填充为1,最大池化层的池化大小为2。
表4 1DCNN详细参数
为体现数据量对故障诊断性能的影响,训练集分别选用每类10、15、20、25、30个真实样本,且所加入的生成数据与真实数据数量相同,均为每类50个。如图15所示,随着训练数据量的增加,三种方法的性能均有所提升。当训练数据量为30时,1D-CNN、1D-ResNet18和ECANet的诊断准确率分别达到99.5%、99.4%和100%。可见,训练数据量对测试结果具有显著影响。
图15 不同方法的诊断准确率
为了验证MPAGAN数据增强的有效性,进行了有无生成数据的对比实验,结果见图16。
图16 有无生成数据情况下的故障诊断性能对比
实验表明,加入生成数据后,各健康状态下的诊断准确率均显著提高,说明MPAGAN生成的数据与真实数据高度相似,提升了故障诊断的性能。此外,实验还考察了不同数量的生成数据(每类10、20、30、50、100个)对诊断结果的影响。为避免随机干扰,每项测试重复运行五次,结果见表5。
表5 基于1DCNN的故障诊断准确率(%)
当仅输入20个真实样本时,诊断准确率较低,仅为62.9%。随着生成数据数量的增加,诊断准确率逐步提升。加入每类100个生成样本后,诊断准确率达到99.2%,表明MPAGAN能够从有限数据中学习故障相关特征。如表6所示,当每类输入30个真实信号时,诊断准确率为85.6%,比仅使用20个真实信号时提高了22.7%。
表6 不同训练数据量下MPAGAN的故障诊断结果(%)
加入每类10个生成信号后,准确率从62.9%提升至84.1%,提升了21.2%。可见,真实信号和生成信号均显著提升了诊断性能,该趋势符合预期,进一步验证了MPAGAN的有效性。
(5)消融实验
本节为了验证MPAGAN各组成部分的重要性,进行了消融实验。表7列出了消融实验的详细信息。
表7 消融实验细节
例如,M1表示从MPAGAN中移除了辅助分类器,用以验证标签信息的重要性;M2表示移除了DWH-STF模块,用以验证特征学习模块的重要性;M3表示移除了时间域损失和频率域损失。图17展示了消融实验的测试结果。可以看出,M4(即完整的MPAGAN)取得了最高的诊断准确率。当MPAGAN的关键组件被移除时,模型性能明显下降。该结果进一步证明了DWH-STF模块在提取故障相关特征和降噪方面的重要作用。
图17 MPAGAN的消融实验结果(%)
(6)对比分析
为了进一步说明MPAGAN的优越性,本文选取了一些具有代表性的生成方法,即ACGAN、VAEGAN、WGAN-GP、CMDGAN、FTGAN和SGAN进行对比。训练数据集由真实数据和生成数据组成,其中每类真实数据为20个,生成数据数量分别设为10、20、30、50和100个。测试数据集中每类样本数量为100个。为了保证比较的公平性,诊断模型统一选用1DCNN。图18展示了不同方法的对比结果。
图18 案例1:不同方法的对比结果
当每类真实数据中额外添加50个生成数据时,MPAGAN达到了98.3%的诊断准确率,优于其他六种基于GAN的方法。其余六种对比方法的准确率分别为96.8%、94.9%、96.1%、95.7%、97.3%和97.8%。由此可见,MPAGAN在这些数据增强方法中表现出最佳的故障诊断性能。这表明MPAGAN所生成的数据与真实数据高度相似,且在有限数据条件下有效提升了故障诊断的效果。
4.2 案例二:轴承故障诊断
本节基于轴承故障诊断进一步验证MPAGAN的泛化能力。所用数据集来自东南大学(SEU)驱动系统诊断仿真平台。图19展示了轴承实验平台。选取电机的转矩信号和振动加速度信号作为原始数据,转速系统载荷设定为20 Hz-0 V。
图19 轴承实验平台
实验选取了四种轴承健康状态作为验证对象,分别为正常状态、滚动体故障、内圈故障和外圈故障,每种状态包含1024个采样点。数据集的详细信息见表8。
表8 数据集的详细信息
为说明MPAGAN的优越性,图20展示了轴承数据集中L2和L4两种状态下生成信号与真实信号的概率密度分布。
图20 L2和L4状态下生成信号与真实信号的概率分布
从图中可以观察到生成信号的概率分布与真实信号高度相似,说明MPAGAN能够生成可靠的信号。表9给出了不同方法生成信号与真实信号的最大均值差异(MMD)值。
表9 轴承数据集中生成信号与真实信号的MMD值
可以看出,ACGAN、VAEGAN、WGAN-GP、CMDGAN和FTGAN的MMD值相对较高。其中,VAEGAN和WGAN-GP在L3和L4状态下的MMD值分别达到0.7979和0.5806,表明生成信号与真实信号存在较大差异。相比之下,MPAGAN在所有健康状态下的MMD值均为最小,体现了其在生成信号与真实信号概率分布对齐问题上的有效性。
生成信号与真实信号的差异还可以通过时域和频域细节得到体现。图21和图22选取了实验中的四种信号进行对比,显然生成信号有效地捕捉到了真实信号的冲击趋势和频率特征,表明MPAGAN成功学习到了真实信号中的判别性故障特征。此外,生成信号与真实信号的高度相似性进一步验证了MPAGAN在故障诊断领域的应用潜力。
图21 各健康状态的时域信号:(a)正常,(b)滚动体故障,(c)内圈故障,(d)外圈故障
图22 各健康状态的频域信号:(a)正常,(b)滚动体故障,(c)内圈故障,(d)外圈故障
图23展示了MPAGAN与其他模型的诊断结果。为保证公平比较,诊断模型统一选用1D-ResNet18。训练数据集由真实数据和生成数据构成,每类真实数据为20个,生成数据数量分别为0、10、20、30、40、50和100个。结果表明,MPAGAN在所有生成方法中诊断准确率最高,平均测试准确率达到98.3%。而仅使用每类20个真实数据进行诊断时,准确率较低,仅为68.5%。这些结果充分证明了MPAGAN在有限数据条件下进行轴承故障诊断的有效性。
图23 案例2:不同方法的对比结果
本文提出了一种新型的生成对抗网络(GAN),即MPAGAN,用于在有限数据条件下实现故障诊断。该方法引入了MPAL模块,以减少生成信号与真实信号在时域和频域上的差异。同时,在生成器中平滑嵌入了DWHT层作为特定网络层,利用STF机制对振动信号中的噪声进行滤除。为了提升生成信号的判别性和多样性,在判别器中引入了辅助分类器。MPAGAN的有效性在两个有限数据的故障诊断案例中得到了验证。对比实验结果表明,MPAGAN不仅实现了数据增强,还有效解决了有限数据条件下的故障诊断问题。