首页/文章/ 详情

小样本旋转机械故障诊断新路径 | 多路径时频对齐的生成对抗网络模型MPAGAN

2天前浏览10
      本期聚焦于小样本条件下的旋转机械智能诊断新突破:在实际工业环境中,由于工况复杂、采样成本高等因素,故障样本稀缺已成为制约智能诊断性能提升的关键瓶颈。尽管生成对抗网络(GAN)近年来在小样本故障诊断中表现出强大潜力,但传统方法多侧重于概率分布层面的对齐,难以有效捕捉振动信号在时域与频域的深层差异。为破解这一关键难题,本文提出多路径对齐式生成对抗网络(multiple path alignment GAN, MPAGAN),以提升小样本下故障特征的生成质量与识别能力。该方法构建了多路径对齐损失(multi-path alignment loss, MPAL)模块,引导模型在训练过程中生成在时域与频域上均高度接近真实信号的样本;同时引入离散Walsh-Hadamard软阈值滤波(discrete walsh-hadamard soft threshold filtering, DWH-STF)模块的新型生成器,有效滤除冗余信息;进一步配合辅助分类器增强生成数据的判别性与多样性。实验结果表明,MPAGAN在旋转机械小样本故障诊断中展现出显著优势,为工业领域中样本受限条件下的智能诊断提供了高质量数据补充与性能提升新路径。

    论文基本信息

    论文题目:

    Multiple path alignment generative adversarial network for rotating Machinery fault diagnosis with limited data

    论文期刊:Advanced Engineering Informatics

    论文日期:2025年

    论文链接:

    https://doi.org/10.1016/j.aei.2025.103550

    作者:Yange Wang (a), Zhiqiang Lu (a), Zhang Zhiwen (b), Changhui Liu (a), Jianbo Yu (a,*)

    机构:

    a: School of Mechanical Engineering, Tongji University, Shanghai 201804, China;  

    b: Longmen Laboratory, Luoyang 471000, China

    团队带头人简介:余建波老师,现任同济大学机械能源学院教授,博士生导师,研究方向包括智能制造、设备智能维护、先进质量控制及人工智能在制造业中的应用。主要研究领域涵盖:设备预诊与可靠性、复杂制造过程的质量控制、机器学习应用与生产系统优化等。主持多项国家自然科学基金(面上项目、青年基金)、教育部博士点基金、上海市优青、国家重点实验室开放基金等项目,承担并参与了上海市教委、航天科技、慈溪市等多项科研计划及企业合作课题。除了科研教学,余建波教授也活跃在国际学术界,担任了多个期刊的编委,包括:Advances in Mechanical Engineering、Chinese Journal of Engineering等国际权威期刊,覆盖工业电子、制造科学、神经网络与智能系统等多个领域。来源: https://mefaculty.tongji.edu.cn/info/1296/3239.htm

    目录

    1 摘要

    2 引言

    多路径对齐生成对抗网络

    3.1 特征生成器

    3.2 判别器

    3.3 多路径对齐损失

    3.4 MPAGAN在机械故障诊断中的应用

    实验与结果分析

    4.1 案例一:齿轮箱故障诊断

    4.2 案例二:轴承故障诊断

    5 结论

    1 摘要

    在实际工业场景中,旋转机械在小样本条件下的故障诊断面临巨大挑战。近年来,生成对抗网络(GAN)在小样本故障诊断中表现出强大的能力。然而,现有研究大多侧重于对齐生成数据与真实数据之间的概率分布,却忽略了振动信号在时域与频域上的差异。为此,本文提出了一种多路径对齐生成对抗网络(MPAGAN),以生成足够的数据来支持旋转机械在小样本条件下的故障诊断。首先,设计了一种多路径对齐损失(MPAL)模块,用于引导模型在训练过程中生成在时域与频域上均接近真实数据的样本。其次,构建了一个嵌入了离散Walsh-Hadamard软阈值滤波(DWH-STF)模块的新型生成器,用于滤除生成信号中的冗余成分。最后,引入辅助分类器以增强生成信号的判别性与多样性。本文通过两个案例验证了MPAGAN在机械故障诊断中的有效性。实验结果表明,MPAGAN不仅能够生成有效的故障数据,还能在小样本条件下显著提升故障诊断性能。

    关键词:旋转机械,故障诊断,振动信号,小样本数据,生成对抗网络

    2 引言

    旋转机械在实际工业场景中扮演着至关重要的角色。然而,一旦发生故障,往往会造成严重的经济损失,甚至引发人员伤亡。故障诊断能够实现潜在问题的早期检测与识别,有效防止事故发生,保障设备的安全性与可靠性。因此,准确的故障诊断对于设备的安全稳定运行具有重要意义

    由于其出色的特征提取能力,深度学习在机械故障诊断中得到了广泛应用。尽管基于深度学习的研究在机械故障诊断领域取得了显著进展,但它们普遍基于一个基本假设:数据是充足的。然而,在实际工业场景中,受设备安全性和复杂工况的限制,采集到的数据往往较为有限,因此在小样本条件下实现有效故障诊断仍是一个难点问题

    目前,针对小样本条件下机械故障诊断问题,主要有四种常用方法:迁移学习方法、元学习方法、数字孪生方法和数据增强方法。迁移学习通过从数据充足的领域迁移已学得的特征或知识来缓解小样本问题。然而,当源域与目标域之间差异较大时,迁移学习的性能会显著下降,因为已学习的知识可能无法适用于新领域。元学习是一种强大的方法,可使模型快速适应新任务,能够从有限数据中有效提取有价值的知识,从而降低对大量标注数据的依赖,提升模型在不同场景下的适应性。数字孪生(digital twin, DT)是一种与物理系统动态同步的虚拟模型,其在整个生命周期内实时演化,能够生成高保真度的模拟故障数据,有效缓解机械故障诊断中的数据匮乏问题。然而,DT 的效果受限于高质量输入数据的获取以及多物理建模带来的计算复杂性。

    生成对抗网络(GAN)为有限数据问题提供了有效的解决方案,可生成逼真的合成数据。Yang 等人开发了一种特征融合 GAN 进行图像生成,在生成器中引入多个跳跃连接以有效捕捉多尺度特征;Li 等人提出一种故障可估计自编码 GAN(FAE-GAN),通过特殊设计模块实现故障剔除映射的学习;Tang 等人提出一种嵌入物理约束的 WGAN,通过硬约束将领域知识注入神经网络中,确保工业过程数据生成的物理一致性。

    尽管上述基于 GAN 的方法已在有限数据条件下的机械故障诊断中取得较好效果,但仍存在以下问题:(1) 现有方法主要通过优化损失函数实现生成数据与真实数据概率分布的对齐,未充分考虑时间域与频率域之间的差异;(2) 部件早期故障特征通常较弱且被强背景噪声所掩盖,即使 GAN 可生成信号,其生成性能仍可能受到冗余特征和噪声的影响。因此,有必要构建特征学习模块以滤除冗余成分并提升生成信号质量;(3) 现有生成模型难以生成准确捕捉类别特征的判别性信号,因此需要引入辅助分类器来引导生成器输出类别相关的故障信号。

    为解决上述问题,本文提出一种新型的基于 GAN 的网络模型,用于小样本条件下的机械故障诊断。本文的主要贡献如下:

    (1) 构建了一种多路径对齐生成对抗网络(MPAGAN),用于小样本数据增强与故障诊断,能够同时考虑时间域和频率域的信息;

    (2) 在生成器中引入离散 Walsh-Hadamard 变换(DWHT)作为特定层,并结合软阈值滤波(STF)实现对生成信号冗余成分的滤除;

    (3) 在判别器中引入辅助分类器,以保证生成数据的类别准确性并增强样本多样性。本文通过两个案例验证了 MPAGAN 的性能,实验结果表明 MPAGAN 能有效提升小样本条件下故障诊断的准确性。

    3 多路径对齐生成对抗网络

    本文提出了一种用于数据增强的生成模型 MPAGAN,以支持在小样本条件下的旋转机械故障诊断。MPAGAN 的网络结构如图 1 所示,该模型由特征生成器 G、判别器 D 和多路径对齐损失(MPAL)模块组成。为提升生成器在特征学习中的性能,在生成器中嵌入了离散 Walsh-Hadamard 软阈值滤波(DWH-STF)模块,其中 DWHT 被构建为信号处理层,STF 用于滤除生成信号中的冗余成分。为提升生成器学习准确类别特征的能力,在判别器中引入了辅助分类器,从而增强生成信号的质量和多样性。MPAL 模块用于引导 MPAGAN 的模型训练过程,以减少生成信号与真实信号在时域和频域上的差异。    
       

     1 多源信息融合框架

    3.1 特征生成器      

    MPAGAN 中的生成器 G 用于生成与真实数据相似的数据。G 由多个上采样层、卷积层以及用于滤除生成信号中冗余特征的 DWH-STF 模块构成。DWH-STF 的结构如图 2 所示,包括一个 DWHT 层、一个用于降噪的软阈值层以及一个反离散 Walsh-Hadamard 变换(IDWHT)层。

         

     2 DWH-STF 的网络结构

    DWHT是一种正交变换,其基函数由一组矩形不连续波形组成,取值为 -1 1DWHT 与离散傅里叶变换(DFT)相似,能够将信号从时域转换到频域,从而便于对其频率成分进行分析。相比于 DFTDWHT 的计算过程仅涉及加法和减法运算,因而更为简洁。通常情况下,大多数故障相关特征集中于低频成分,也有一部分分布在高频成分中,因此有必要滤除生成信号中的无效频率特征。软阈值法因其在降噪方面的有效性,被广泛用于多种信号去噪方法中,因此本文采用软阈值方法以滤除冗余频率特征。

    首先,通过 DWHT 计算信号的频率系数:

             

             

    其中,           表示变换后的 DWHT 系数,用于表示频域中第            个频率分量的幅值;           表示 Walsh 函数的取值,是变换矩阵中的元素,用于定义第            个频率分量与第            个时域点之间的关系;           是任意的 Rademacher 函数;           表示            的 Gray 编码,是一种二进制编码方法。

    然后,使用 STF(软阈值滤波)来筛选有效的频率系数。软阈值函数定义如下:

    其中,           是经过滤波后的频域系数,           是阈值,该阈值由一个专门设计的神经网络自适应确定,使得振动信号的每个片段都能拥有一组独立的阈值。阈值可在深度网络的训练过程中自动获得。首先,计算特征图            的绝对值,并通过全局平均池化(GAP)生成通道描述符           。该描述符随后经过两层全连接(FC)网络,并经过 sigmoid 函数处理。缩放参数            被约束在 (0,1) 范围内。阈值的生成通过将缩放参数            与通道描述符            相乘来实现。阈值生成过程如下所示:

             

             

             

             

             

    其中,           是频域特征,           是通道描述符,           是激活函数。

    最后,通过逆离散Walsh-Hadamard变换(IDWHT)层将频域中经过滤波的系数重构回时域信号。

             

    3.2 判别器

    判别器 D 原本用于区分输入数据的来源。在 MPAGAN 中,判别器中加入了辅助分类器,用于识别输入数据的类别。该辅助分类器能够引导生成器学习具有判别性的类别条件特征,从而提升生成信号的多样性和准确性。判别器的结构由四个卷积层和两个全连接层组成,分别作为来源分类器和辅助分类器。判别器接受真实数据和生成数据作为输入,输出预测的数据来源及类别标签。输入数据首先被送入判别器的卷积层进行特征学习,全连接层作为分类器输出最终的分类结果。每个卷积层采用 LeakyReLU 作为激活函数,泄漏系数设为 0.02。具体计算过程如下:

             

             

             

             

             

             

    其中,           是真实样本,           是采样的噪声,           是标签,           是由生成器            生成的数据,           是输入数据的来源,           是输入数据的标签。此外,基于 GAN 的生成方法训练难度较大。为提高生成对抗网络训练的稳定性,对生成器            和判别器            的每个卷积层应用了谱归一化。该方法通过限制判别器的 Lipschitz 常数,约束每一层:           的谱范数。具体计算如下:

               

               

    其中,               是权重矩阵                的谱范数(即                的 L2 矩阵范数),也就是                的最大奇异值,               是层                的 Lipschitz 范数。对于线性层               ,其映射为               ,Lipschitz 范数的计算公式如下:

                   

    谱归一化(SN)通过归一化权重矩阵                的谱范数以满足 Lipschitz 约束               ,其定义如下:

                 

    3.3 多路径对齐损失          

    生成对抗网络(GAN)在生成与真实数据相似的数据方面表现出卓越的能力。然而,生成数据与真实数据在概率分布、时域和频域上仍存在差异。大多数研究侧重于通过交叉熵或Wasserstein距离损失减少概率分布之间的差异,但针对时域和频域差异的有效方法仍然不足。因此,本文提出了多路径对齐损失(MPAL)模块,以进一步减少这些差异。MPAL模块的损失信息流如3所示,包含概率分布、时域和频域的对齐损失。

         

     3 MPAL 的损失信息流

    在GAN中,真实数据与生成数据的概率分布对齐通常采用Jensen-Shannon(JS)散度实现。在MPAGAN中,判别器                还用于信号分类,引入了分类损失。因此,损失函数由两个部分组成:正确源的对数似然                和正确类别的对数似然                

                     

                     

    其中,                 表示关于数据来源的概率分布,                 表示关于类别标签的概率分布,                 是                  的期望值。对于判别器                 ,优化目标是最大化                 ;对于生成器                 ,优化目标是最大化                 

    本研究采用 L2 损失函数作为时域损失的衡量指标,用于对齐生成信号与真实信号在时域上的偏差。L2 损失函数作为一种广泛应用的误差度量,计算公式如下:

                     

    其中,                 是信号样本的总数,                 是第                  个真实信号采样点,                 是对应生成信号的值。为了对齐生成信号与真实信号的频域,网络中采用了频域损失。首先,通过离散傅里叶变换(DFT)获得信号的频谱。DFT 通常用于频谱分析,可将离散时间信号从时域分解到频域,详细表示信号的频率成分,包括其幅度和相位。图 4 展示了时域序列的 DFT。

                 

     4 时域序列的离散傅里叶变换(DFT              

    DFT的计算过程表达如下:

                   

    其中,                 是时域信号的总采样点数,                 是频域信号的第                  个分量,通过对时域信号样本                  从                  到                  的加权求和得到。指数函数项表示如下:

                   

    然后,基于频谱位置信息开发了一种频谱距离度量,用以减少频谱上样本间的差异,为生成模型性能的评估和优化提供准确的度量。根据离散傅里叶变换(DFT)的定义,                 包含两个关键要素,幅值和相位,分别由公式给出。变换过程如下:

                   

                   

                   

    如图5所示,                 是实信号在频谱坐标                  处的频率值,                 是生成信号在相应位置的频率值。设                  和                  分别为由                  和                  映射得到的两个对应向量。

    两个信号点的距离              

    因此,频域损失,即实信号与生成信号之间的频谱距离,定义如下:

                   

                   

    最后,生成器 G 的总损失函数由概率分布对齐损失、时域损失和频域损失组成,定义如下:

                   

    判别器 D 的损失函数定义如下:              

                   

    对于D,其训练目标是通过增加两个样本之间的对数似然来最大化其损失函数。

    3.4 MPAGAN在机械故障诊断中的应用            

    本节介绍MPAGAN在小样本机械故障诊断中的应用过程。故障诊断利用先进的算法和机器学习技术,能够自主识别和分类机械故障。该方法有助于实现预测性维护,减少意外故障,提升运行可靠性。所提方法的详细流程如图6所示。

    步骤1:获取机械在不同健康状态下的振动信号。            

    步骤2:构建MPAGAN模型,通过对抗学习训练生成器G和判别器D            

    步骤3:利用训练好的MPAGAN生成新信号,扩充有限的信号数据,并从多个角度评估生成信号的质量。            

    步骤4:利用生成的信号辅助旋转机械在小样本条件下的故障诊断。

             

    图6 所提方法的应用

    实验与结果分析

    4.1 案例1:齿轮箱故障诊断

    为了验证MPAGAN的有效性,本节在齿轮箱测试平台上进行了实验。如图7所示,齿轮箱测试平台由伺服电机、齿轮箱和制动器组成。齿轮箱模数为0.6,减速比为3。振动信号通过安装在齿轮箱上的加速度传感器采集。实验中采样频率设定为20 kHz,齿轮箱在电机1200转/分钟速度下运行。

     

    图7 齿轮箱测试平台    

    图8及表1展示了行星齿轮箱数据集的信息。本文测试了齿轮箱的五种健康状态:正常、复合故障、行星齿轮齿断裂、行星齿轮齿点蚀和行星齿轮齿裂纹。为验证MPAGAN在小样本条件下的性能,每类仅使用少量样本进行测试。每个样本包含1024个采样点。

     

    不同缺陷的齿轮    

    五种健康状态的详细信息    

     

    (1)参数设置    

    2列出了MPAGAN的参数设置和网络结构,其中K为卷积核大小,S为滑动步长,生成器输入的潜在维度设定为256。判别器输出样本来源标签(真实或生成)及样本类别标签。

    2 MPAGAN的详细参数

     

    (2)可视化分析    

    本节对DWH-STF模块的特征进行了可视化分析。图9展示了状态L4下的降噪细节。可见,软阈值方法自适应地滤除了无效的高低频率,图中红色圈出部分显示最无效的频率被抑制为零,表明该方法能有效选择频率以实现降噪和特征学习。绿色圈出部分显示大部分噪声被有效去除。

     

    软阈值滤波结果    

    为验证DWH-STF的有效性,图10中进行了有无DWH-STF模块的对比实验。具体来说,图10(a)中的红色曲线为未使用DWH-STF生成的信号,图10(b)中的红色曲线为使用DWH-STF生成的信号,所有子图中的蓝色曲线均为真实信号。结果显示,带有DWH-STF模块的生成信号更接近真实信号,表明DWH-STF是生成器生成高质量信号的有效模块。

     

    10 有无DWH-STF模块的时域性能对比    

    (3)生成数据的评价    

    本节从概率分布、时域和频域三个方面对生成信号进行评价。采用最大均值差异(MMD)来量化生成信号与真实信号之间的概率分布差异。MMD的计算过程定义如下:    

         

    其中,     表示核函数,通常为高斯核函数。函数      代表对      和      之间的核映射结果,     和      分别表示真实数据和生成数据的概率分布。图11展示了L1和L2状态下生成信号与真实信号的概率密度。可以观察到,生成信号的概率分布与真实信号相似,表明生成信号具有较高的可靠性。  
     

    11 L1L2状态下生成信号与真实信号的概率分布对比    

    为验证MPAGAN的优越性,选取六种具有代表性的方法进行对比,分别是:辅助分类器生成对抗网络(ACGAN)、变分自编码生成对抗网络(VAEGAN)、带梯度惩罚的Wasserstein生成对抗网络(WGAN-GP)、条件多域生成对抗网络(CMDGAN)、类傅里叶变换生成对抗网络(FTGAN)及频谱引导生成对抗网络(SGAN)。    

    3展示了不同方法生成信号与真实信号之间的最大均值差异(MMD)值。对所有齿轮状态下的50个真实信号和50个生成信号的平均MMD值进行了比较。MMD值越小,表示生成信号与真实信号的相似度越高。

    齿轮箱数据集中生成信号与真实信号的MMD    

     

    相比其他方法,MPAGAN在五种状态下的MMD值均为最小。尽管FTGANSGAN在健康状态L1L4L5表现出一定的竞争力,但它们在所有状态下生成可靠且具有代表性的信号的一致性和整体效果仍不及MPAGAN。这表明MPAGAN有效解决了生成信号与真实信号概率分布对齐的问题。

    为了进一步验证MPAGAN的有效性,本文还考虑了生成信号与真实信号在时域和频域的差异。图12展示了MPAGAN生成信号与真实信号在时域的对比,蓝线和红线分别表示真实信号和生成信号。

     

    12 所有健康状态下生成信号与真实信号的对比:(a)正常状态,b)复合故障,c)齿断裂,d)齿点蚀,e)齿裂纹    

    可以明显看出,生成信号准确捕捉了真实信号的冲击趋势特征,并在幅值上表现出相似性,表明MPAGAN有效学习了真实信号中的故障相关特征,生成了与真实信号相似的信号。图13展示了生成信号在频域的表现,显示生成信号成功捕获了真实信号的重要频率特征,说明生成信号能够真实地反映行星齿轮箱的振动信息。

     

    13 信号的频域分析:(a)正常状态,b)复合故障,c)齿断裂,d)齿点蚀,e)齿裂纹    

    为了进一步展示MPAGAN在频域的优越性,图14比较了包括MPAGAN在内的六种不同数据增强方法。所有方法均能捕捉真实信号的关键频谱趋势,而MPAGAN生成的频谱与真实信号最为接近,表明生成信号与真实信号在频域的对齐问题已成功解决。结果显示,MPAGAN在概率分布、时域和频域的信号生成方面表现优异,充分证明了MPAL模块的有效性。

     

    14 复合故障情况下不同方法的频域比较    

    (4)小样本条件下的故障诊断    

    为验证MPAGAN在小样本条件下的有效性,开展了故障诊断实验。本节考虑了三种具有代表性的深度学习方法,分别为一维深度卷积神经网络(1D-CNN)、一维残差学习网络(1D-ResNet18)和高效通道注意力网络(ECANet)。表4列出了1D-CNN的网络结构,该网络由四个一维卷积层和两个全连接层组成。卷积核大小为3,填充为1,最大池化层的池化大小为2    

    4 1DCNN详细参数    

     

    为体现数据量对故障诊断性能的影响,训练集分别选用每类1015202530个真实样本,且所加入的生成数据与真实数据数量相同,均为每类50个。如图15所示,随着训练数据量的增加,三种方法的性能均有所提升。当训练数据量为30时,1D-CNN1D-ResNet18ECANet的诊断准确率分别达到99.5%99.4%100%。可见,训练数据量对测试结果具有显著影响。

     

    15 不同方法的诊断准确率    

    为了验证MPAGAN数据增强的有效性,进行了有无生成数据的对比实验,结果见图16    

     

    16 有无生成数据情况下的故障诊断性能对比    

    实验表明,加入生成数据后,各健康状态下的诊断准确率均显著提高,说明MPAGAN生成的数据与真实数据高度相似,提升了故障诊断的性能。此外,实验还考察了不同数量的生成数据(每类10203050100个)对诊断结果的影响。为避免随机干扰,每项测试重复运行五次,结果见表5

    基于1DCNN的故障诊断准确率(%

     

    当仅输入20个真实样本时,诊断准确率较低,仅为62.9%。随着生成数据数量的增加,诊断准确率逐步提升。加入每类100个生成样本后,诊断准确率达到99.2%,表明MPAGAN能够从有限数据中学习故障相关特征。如表6所示,当每类输入30个真实信号时,诊断准确率为85.6%,比仅使用20个真实信号时提高了22.7%

    不同训练数据量下MPAGAN的故障诊断结果(%

     

    加入每类10个生成信号后,准确率从62.9%提升至84.1%,提升了21.2%。可见,真实信号和生成信号均显著提升了诊断性能,该趋势符合预期,进一步验证了MPAGAN的有效性。    

    (5)消融实验    

    本节为了验证MPAGAN各组成部分的重要性,进行了消融实验。表7列出了消融实验的详细信息。    

    消融实验细节    

     

    例如,M1表示从MPAGAN中移除了辅助分类器,用以验证标签信息的重要性;M2表示移除了DWH-STF模块,用以验证特征学习模块的重要性;M3表示移除了时间域损失和频率域损失。图17展示了消融实验的测试结果。可以看出,M4(即完整的MPAGAN)取得了最高的诊断准确率。当MPAGAN的关键组件被移除时,模型性能明显下降。该结果进一步证明了DWH-STF模块在提取故障相关特征和降噪方面的重要作用。    

     

    17 MPAGAN的消融实验结果(%

    (6)对比分析    

    为了进一步说明MPAGAN的优越性,本文选取了一些具有代表性的生成方法,即ACGANVAEGANWGAN-GPCMDGANFTGANSGAN进行对比。训练数据集由真实数据和生成数据组成,其中每类真实数据为20个,生成数据数量分别设为10203050100个。测试数据集中每类样本数量为100个。为了保证比较的公平性,诊断模型统一选用1DCNN。图18展示了不同方法的对比结果。    

     

    18 案例1:不同方法的对比结果    

    当每类真实数据中额外添加50个生成数据时,MPAGAN达到了98.3%的诊断准确率,优于其他六种基于GAN的方法。其余六种对比方法的准确率分别为96.8%94.9%96.1%95.7%97.3%97.8%。由此可见,MPAGAN在这些数据增强方法中表现出最佳的故障诊断性能。这表明MPAGAN所生成的数据与真实数据高度相似,且在有限数据条件下有效提升了故障诊断的效果。    

    4.2 案例二:轴承故障诊断    

    本节基于轴承故障诊断进一步验证MPAGAN的泛化能力。所用数据集来自东南大学(SEU)驱动系统诊断仿真平台。图19展示了轴承实验平台。选取电机的转矩信号和振动加速度信号作为原始数据,转速系统载荷设定为20 Hz-0 V

     

    19 轴承实验平台    

    实验选取了四种轴承健康状态作为验证对象,分别为正常状态、滚动体故障、内圈故障和外圈故障,每种状态包含1024个采样点。数据集的详细信息见表8    

    数据集的详细信息    

     

    为说明MPAGAN的优越性,图20展示了轴承数据集中L2L4两种状态下生成信号与真实信号的概率密度分布。

     

    20 L2L4状态下生成信号与真实信号的概率分布    

    从图中可以观察到生成信号的概率分布与真实信号高度相似,说明MPAGAN能够生成可靠的信号。表9给出了不同方法生成信号与真实信号的最大均值差异(MMD)值。

    轴承数据集中生成信号与真实信号的MMD    

     

    可以看出,ACGANVAEGANWGAN-GPCMDGANFTGANMMD值相对较高。其中,VAEGANWGAN-GPL3L4状态下的MMD值分别达到0.79790.5806,表明生成信号与真实信号存在较大差异。相比之下,MPAGAN在所有健康状态下的MMD值均为最小,体现了其在生成信号与真实信号概率分布对齐问题上的有效性。

    生成信号与真实信号的差异还可以通过时域和频域细节得到体现。图21和图22选取了实验中的四种信号进行对比,显然生成信号有效地捕捉到了真实信号的冲击趋势和频率特征,表明MPAGAN成功学习到了真实信号中的判别性故障特征。此外,生成信号与真实信号的高度相似性进一步验证了MPAGAN在故障诊断领域的应用潜力。

     

    21 各健康状态的时域信号:(a)正常,(b)滚动体故障,(c)内圈故障,(d)外圈故障    

     

    22 各健康状态的频域信号:(a)正常,(b)滚动体故障,(c)内圈故障,(d)外圈故障    

    23展示了MPAGAN与其他模型的诊断结果。为保证公平比较,诊断模型统一选用1D-ResNet18。训练数据集由真实数据和生成数据构成,每类真实数据为20个,生成数据数量分别为01020304050100个。结果表明,MPAGAN在所有生成方法中诊断准确率最高,平均测试准确率达到98.3%。而仅使用每类20个真实数据进行诊断时,准确率较低,仅为68.5%。这些结果充分证明了MPAGAN在有限数据条件下进行轴承故障诊断的有效性。

     

    23 案例2:不同方法的对比结果

    6 结论

    本文提出了一种新型的生成对抗网络(GAN),即MPAGAN,用于在有限数据条件下实现故障诊断。该方法引入了MPAL模块,以减少生成信号与真实信号在时域和频域上的差异。同时,在生成器中平滑嵌入了DWHT层作为特定网络层,利用STF机制对振动信号中的噪声进行滤除。为了提升生成信号的判别性和多样性,在判别器中引入了辅助分类器。MPAGAN的有效性在两个有限数据的故障诊断案例中得到了验证。对比实验结果表明,MPAGAN不仅实现了数据增强,还有效解决了有限数据条件下的故障诊断问题。


    编辑:Jin
    校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、Tina、陈宇航、陈莹洁、赵诚
    该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除

    来源:故障诊断与python学习
    Mechanical振动断裂旋转机械航空航天电子海洋裂纹电机多尺度数字孪生控制人工智能
    著作权归作者所有,欢迎分享,未经许可,不得转载
    首次发布时间:2025-08-09
    最近编辑:2天前
    故障诊断与python学习
    硕士 签名征集中
    获赞 87粉丝 125文章 226课程 0
    点赞
    收藏
    作者推荐

    从航空发动机到通用时序分析:ITFormer首次系统化定义复杂时序问答

    ICML 2025 | 上海交通大学×上海创智学院×复旦大学联合出品时序数据分析在工业监控、医疗诊断等领域至关重要。然而,现有研究多聚焦于分类、预测等单一任务,与实际工业场景中专家通过自然语言进行复杂交互和决策的需求存在显著差异。上海交通大学航空航天学院李元祥教授团队以航空发动机运维为背景,首次系统性地提出并解决了复杂时序问答(Time-Series QA)问题,为时序数据建模和应用提供了新的思路。核心贡献 1.结合工业场景,系统化定义复杂时序问答 本研究深入航空发动机维护这一复杂工业场景,将专家诊断过程抽象为”理解、感知、推理、决策”四个认知层次,并首次系统性地定义为”时序问答”任务范式。 2.构建首个工业级、认知层次化时序问答数据集 基于NASA航空发动机数据,构建了包含11万余问答对的EngineMT-QA数据集。该数据集的任务设计紧密贴合专家的认知流程,为评估模型在真实工业场景下的推理能力提供了首个标准化基准。 3.提出ITFormer:高效、可迁移的时序-语言桥接架构 ITFormer以模块化设计实现了时序数据与大语言模型的高效融合,仅需训练不足1%的额外参数,便可在通用时序问答数据集上表现出优越的性能和良好的迁移能力。 研究动机与挑战 工业应用需求 在航空发动机监控等复杂工业场景中,工程师需分析海量多通道传感器数据,以判断设备状态并制定维护决策。传统方法依赖专家经验,效率有限且难以处理大规模数据。更重要的是,知识的传递与协同主要依靠自然语言,而现有分析工具普遍缺乏与语言的有效交互能力。 技术难点 1.高维数据的语义提取:单个时序样本可包含数万个数值(如32通道×600时间步),如何从中提取出有效的语义特征是首要难题。 2.抽象语义的对齐建模:时序信号的模式变化(如缓慢上升、突然波动)与物理系统的状态转换(如设备老化、突发故障)之间的对应关系高度抽象,难以直接建模。 3.多尺度时间依赖的处理:时序数据中的关键信息可能分布在不同的时间尺度上,模型必须具备处理多尺度依赖的能力。 ITFormer架构与关键模块ITFormer的设计思想是作为一个轻量级的”桥梁”,在冻结预训练时序编码器和大型语言模型(LLM)的前提下,实现两者的高效对齐与融合。 时间令牌位置编码(TPE) 为精确表征多维时序数据的结构,TPE在三个层次上进行位置编码:时间步(Temporal Steps)、通道(Channels)和时序片段(Segments),确保模型能区分不同时间点、不同传感器以及不同数据段的语义信息。 可学习指令令牌(LIT) 为了让模型理解具体的任务指令,LIT在文本查询前添加了一组可学习的令牌。这些令牌通过自注意力机制,能够从自然语言查询中自动捕获并浓缩任务相关的语义信息,从而指导后续的跨模态融合。 指令时间注意力(ITA) 作为ITFormer的核心创新,ITA通过一个高效的两阶段过程实现跨模态对齐: 1. 通道指令融合(Channel Instruct Fusing):根据LIT提供的任务指令,动态地对每个时间步上的多通道特征进行加权聚合,筛选出与任务最相关的传感器信息。 2. 时间指令注意力(Time Instruct Attention):在上一步的基础上,再次根据任务指令,在时间维度上进行注意力加权,聚合最关键的时间片段信息。 这一设计显著提升了计算效率,同时保证了对齐的精确性。 时间令牌即语言(TAL) 该策略将ITA融合后的时序特征向量直接视为语言令牌,并替换掉文本查询中预设的占位符。这使得时序信息能以一种与语言模型兼容的方式,无缝嵌入到LLM的输入序列中,从而实现端到端的建模。 EngineMT-QA数据集设计EngineMT-QA基于真实的工业应用场景设计,其任务层次反映了专家处理时序数据的认知过程。 任务类型 认知层次 典型场景 查询示例 理解 基础感知 信号模式解释 “燃油流量变化趋势说明了什么?” 感知 状态评估 设备健康判断 “低压压气机是否存在异常?” 推理 趋势预测 前瞻性分析 “未来5个周期故障概率如何?” 决策 行动规划 维护策略制定 “应该预防性维护还是继续监控?” ·数据规模:包含超过11万对高质量问答数据,源于NASA N-CMAPSS标准数据集。 ·数据维度:覆盖32个传感器通道,每个样本包含600个时间步。 ·质量保证:所有数据均经过领域专家的交叉审核,确保技术准确性。 Task Sample 实验结果与分析 1. EngineMT-QA数据集上的性能对比在EngineMT-QA数据集上,ITFormer的性能全面超越了包括主流多模态API(ChatGPT-4o, Gemini)和专用时序-文本模型(Time-LLM, AutoTime)在内的所有基线。尤其在需要深度分析的”推理”和”决策”任务上,F1分数和BLEU得分的显著领先,证明了ITFormer对复杂时序-语言关系具备强大的建模能力。 2. ITFormer模块有效性验证:消融实验 消融实验结果量化了ITFormer各核心组件的贡献。实验表明:TPE(时间令牌位置编码) 对模型性能的提升最为关键,是模型理解多维时序结构的基础。同时,ITA(指令时间注意力) 与TPE的结合能够产生显著的协同效应。最终,包含全部组件的完整架构性能最佳,验证了ITFormer系统性设计的有效性。 3. 架构通用性:适配不同时序编码器与语言模型ITFormer展现了卓越的”即插即用”特性。实验证明,它可无缝适配PatchTST、Informer、Crossformer等多种时序编码器,以及Qwen、LLaMA、GLM等不同规模和架构的大语言模型。此外,随着底层语言模型规模的提升,整体任务性能也随之稳步提高,表现出良好的可扩展性。 4. 跨域泛化与数据集价值为验证模型与数据集的通用价值,研究团队在公开基准TimeSeriesExam上进行了测试。结果显示: 1. ITFormer方法的有效性:即便不经过预训练,ITFormer直接在TimeSeriesExam上训练,其性能已在多个任务上优于通用基线,证明了其架构设计的先进性。 2. EngineMT-QA数据集的价值:在使用EngineMT-QA进行预训练后,ITFormer的性能得到进一步的巨大提升,在全部五项任务上均达到SOTA水平,其中”因果分析”准确率高达0.83。 这充分说明,EngineMT-QA作为一个时序文本对数据集,能够为模型提供关于时序-文本关系的本质性知识,从而显著提升其在其他任务上的泛化能力。 5. 推理效率验证效率测试表明,ITA机制相较于传统的跨模态注意力(cross-attention),在处理多通道、长序列数据时推理速度优势明显。同时,LIT模块也能有效降低长文本输入带来的计算开销。这些结果证明,ITFormer的架构设计兼顾了高性能与高效率,为大规模实时应用提供了可能。 总结与展望 本研究首次系统性地提出了复杂时序问答任务,并结合工业场景构建了大规模数据集,设计了高效、可迁移的ITFormer架构。实验结果充分验证了该框架在准确率、泛化能力和推理效率上的综合优势。 时序问答(Time-Series QA)这一新范式为时序分析领域带来了两个核心价值: ·在输入端,它允许通过自然语言灵活地融合领域知识与上下文信息,提升了分析的灵活性与精度。 ·在输出端,它通过可交互、可解释的自然语言反馈,极大地降低了时序数据分析的使用门槛。 ITFormer及EngineMT-QA为时序AI社区提供了新的研究范式和宝贵资源,在工程和科学领域均具有广阔的应用前景。 研究机构上海交通大学航空航天学院、上海创智学院、复旦大学数据科学学院 项目资源·项目主页:https://pandalin98.github.io/itformer_site/ ·论文仓库:https://github.com/Pandalin98/Awesome-Time-Series-QA-Papers 总结与展望:时序问答开启的新范式 这项研究不仅是时序分析领域的一次重要技术突破,更重要的是,它为时序AI研究社区提供了一个全新的视角。时序问答(Time-Series QA)这一范式有望从根本上改变我们与时序数据交互的方式: 1.在输入端,让知识融合更自然 传统的时序模型只能处理纯数值输入,无法利用人类的先验知识。而时序问答范式允许用户通过自然语言,将丰富的外部知识和上下文信息注入到分析过程中。 例如,工程师可以告诉模型:“忽略下午3点到3点10分的数据,期间在进行设备校准”,或者”重点关注振动和温度传感器的关联性,我们怀疑是轴承问题”。这种灵活的知识注入方式,能够显著提升模型在复杂场景下的分析精度和鲁棒性。 2.在输出端,让数据分析更普及 时序问答将复杂的模型输出转化为可理解的自然语言,极大地降低了时序数据分析的使用门槛。它使得非数据科学专家(如生产线经理、设备维护人员)也能通过对话的方式,与时序数据进行深度交互。 用户可以进行追问式探索:“昨天哪个设备的能耗最高?” -> “为什么它的能耗这么高?” -> “和上周同期相比情况如何?”。这种交互式的分析流程,让数据探索过程更符合人类的思维习惯,从而真正实现了数据分析的”平民化”。 ITFormer及其背后的时序问答范式,不仅仅是解决了一个具体的工业问题,更是为整个时序AI领域的发展,提供了一套富有想象力和实用价值的全新解决方案。来源:故障诊断与python学习

    未登录
    还没有评论
    课程
    培训
    服务
    行家
    VIP会员 学习计划 福利任务
    下载APP
    联系我们
    帮助与反馈