首页/文章/ 详情

SCI一区论文 | 一种用于轴承复合故障的基于仿真数据驱动的多智能体广义零样本诊断方法

1天前浏览3

    本期给大家推荐一篇SCI一区论文:一种用于轴承复合故障的基于仿真数据驱动的多智能体广义零样本诊断方法论文针对滚动轴承复合故障诊断中训练数据匮乏的问题,提出了一种基于仿真数据的多智能体广义零样本学习(GZSL)方法。该方法利用动力学模型仿真轴承振动信号,并通过CycleGAN构建语义映射模型和特征生成模型,有效地解决了传统ZSL方法中语义构建偏差和域偏移问题。此外,本文还引入了多智能体深度强化学习(MADDPG)算法,将诊断任务分解为多个子任务,由不同智能体协同完成,进一步提高了诊断准确率。

    论文链接:通过点击本文左下角阅读原文进行在线阅读及下载

    论文基本信息

    论文题目:

    Simulation-data Driven Generalized Zero-Shot Learning for Multi-agent Bearing Compound Fault Diagnosis

    论文期刊:Knowledge-Based Systems

    论文日期:2025年

    论文链接

    https://doi.org/10.1016/j.knosys.2025.113595

    作者:YQin (a,b), Xiwen Liu (a,b), Xin Li (a,b), Yongfang Mao (c)

    机构:

    a:State Key Laboratory of Mechanical Transmission for Advanced Equipment, Chongqing University, Chongqing 400044, China;  

    b:College of Mechanical and Vehicle Engineering, Chongqing University, Chongqing 400044, China;  

    c:School of Automation, Chongqing University, Chongqing 400044, China.

    通讯作者邮箱: yfm@cqu.edu.cn

    作者简介:

    秦毅,教授。2000年至2004年在重庆大学机械工程及自动化专业学习,获学士学位,并推免到重庆大学机械电子工程系攻读硕士学位;2004年至2008在重庆大学机械电子工程专业硕博连读,获工学博士学位,其博士论文获重庆市优秀博士论文;2009年1月留校任教;2013年1月至2014年1月在密西根大学安娜堡校区作访问学者。主要从事机械状态监测与故障诊断、智能制造、智能结构及其应用等领域的研究。(来自学校官网)

    目录

    摘要

    1 引言

    预备知识

        2.1生成对抗网络

        2.2 多智能体深度确定性策略梯度
    3 所提出的多智能体广义零样本故障诊断方法

        3.1 复合故障滚动轴承动力学建模

        3.2 所提出的特征与语义处理模块

        3.3 所提出的多智能体故障识别模块
        3.4 多智能体广义零样本故障诊断方法的流程
    4 实验与比较
        4.1 数据集描述和实现细节
        4.2 仿真信号和语义分析
        4.3 比较实验与讨论
        4.4 消融实验和分析
    5 结论  

    摘要

    由于训练的复合故障数据较少,单故障和复合故障的智能故障诊断面临巨大挑战。通过利用单故障与复合故障之间的耦合关系,广义零样本学习(GZSL)方法能够利用已知单故障的数据来识别未知的复合故障。然而,当前的GZSL方法存在以下关键问题:构建的故障语义与实际特征不符,且训练模型受到多种单一故障数据的影响较大。因此,本文提出了一种新的语义构建方法,通过仿真数据训练语义映射模型,以增强生成语义与实际语义的一致性。此外,还提出了一种改进的多智能体深度强化学习(MADRL)协作诊断网络,以提高分类能力,该网络通过定制交互环境,为每个智能体分配特定组件的诊断子任务。最后,建立了一个多智能体GZSL轴承故障诊断框架。该框架的有效性和优势通过三个轴承数据集在GZSL诊断任务中得到了验证。

    1 引言

    在故障诊断领域,基于深度学习的智能方法已广泛应用于齿轮[1,2]和滚动轴承[3,4]等关键设备。然而,智能算法通常需要大量的标注数据来进行模型训练[5]。尽管单故障数据促进了相对稳健的数据共享生态系统[6],但缺乏标记的复合故障数据。在实际工程中,由于连锁反应[7],多个故障更可能出现在组件的多个部分或多个系统组件之间。当复合故障发生时,其风险通常远比单一故障严重[8]。因此,制定合理的维护计划变得更加困难。因此,即使没有复合故障样本,探索诊断复合故障的方法也具有重要的价值。

    零样本学习(Zero-shot learning,ZSL)是一种先进的机器学习方法,旨在解决某些类别[9]数据不足的问题。其核心理念是利用已知类别的数据训练模型,并借助先验知识指导该模型识别未知类别。传统模型学习识别已见过样本的标签。相比之下,零样本学习(ZSL)模型则专注于预测未见过样本的标签。此外,广义零样本学习(GZSL)模型旨在对所有样本的标签进行分类,涵盖已见过和未见过的类别。由于单故障与复合故障信号之间存在耦合关系,ZSL方法已被应用于复合故障诊断。这些方法利用单故障类别的标记数据来训练智能模型。此外,通过先验知识,从单故障语义构建复合故障语义,使模型能够识别之前未见过的复合故障类别。Xu等人[10]提出了一种包含多个模块的模型,其中包括标签信息向量定义模块、特征提取器和生成模块。Wang等人[13]提出了一种基于零样本学习的自适应加权语义自动编码器,用于复合故障诊断。然而,基于零样本学习的智能诊断方法仍面临两大核心挑战

    1)由于机械设备的复杂性,复合故障与单一故障之间的映射关系本质上是难以描述的振动信号的复杂性。现有的构建复合故障语义的方法[10,11]依赖于手动定义单个故障语义的线性叠加,仅使用有限的时间-频率索引作为语义。这些方法忽略了故障之间的复杂耦合关系,导致语义与实际情况不符,从而降低了模型的性能。

    2)大多数研究,如[10,12],主要集中在零样本学习(ZSL)设置中,训练好的模型专门用于识别单一故障类别。然而,在实际工业环境中,单个故障和复合故障类别随机出现,这要求模型能够识别所有可能的健康状况。目前,少数研究[13-15]关注基于全局样本学习(GSZL)的故障诊断方法。然而,这些研究在处理单个故障类别时遇到了域偏差过大的问题,导致模型性能不佳。

    在计算机视觉领域,GZSL模型能够学习图像的类别属性,例如颜色、形状和大小[16,17]。N.Belissent等人[18]将GZSL与农业中入侵杂草的检测相结合,通过图像嵌入和基于形态学及栖息地文本描述的方法,帮助识别未见过的类别。相比之下,为机械设备定义清晰且通用的语义较为困难,因为振动信号受多种因素影响,包括设备类型、操作条件、传感器参数和环境噪声。然而,所有机械设备在不同健康状态下都能产生振动响应,通过建立和解决动力学模型[19]。

    最近的研究[20,21]将动态建模分析与智能模型诊断相结合。Dong等人[21]本文研究了一种基于动态模型和迁移学习的滚动轴承故障智能诊断框架。尽管仿真信号与实际测量信号存在显著差异,但单故障与复合故障之间的耦合物理关系依然保持一致,尤其在包络谱[22]中表现得尤为明显。因此,基于这一观察,可以利用动态建模获得的仿真信号,训练生成模型学习单故障与复合故障之间的语义映射关系,从而构建有效的故障诊断语义。

    深度强化学习(Deep reinforcement learning,DRL)将深度学习的强大感知能力与强化学习(Reinforcementlearning,RL)的决策优势相结合[23]。赵等人[24]改进了深度强化学习(DRL)算法,用于生成公式化的金融阿尔法因子,并引入信息比率作为奖励机制,这与理论结果高度一致。基于DRL的故障诊断方法研究取得了令人鼓舞的成果[25,26],展示了增强的鲁棒性和泛化能力[27]。多智能体深度强化学习(MADRL)将DRL技术扩展到涉及多个智能体的决策问题[28]。因此,在共享环境中,强调智能体之间的合作与竞争,以实现各自的目标。MADRL能够将复杂任务分解为多个子任务,每个智能体负责处理一个特定的子任务。MADRL通过利用分工与合作,提高了任务效率并确保了高鲁棒性。MADRL算法在复合故障诊断中得到了改进,以应对GZSL中域偏差导致的诊断准确性下降问题。具体而言,整个诊断任务被设计为一个涉及多个智能体的协作过程。每个子任务专注于判断某个特定组件是否出现故障。各个智能体分别处理这些子任务,它们的决策结果被整合起来,以评估整体的健康状况。

    基于上述讨论与分析,提出了一种以滚动轴承动态仿真数据为驱动的网络模型映射方法,旨在解决传统零样本学习(ZSL)故障诊断中语义构建时物理信息不足的问题。此外,针对滚动轴承符合故障,提出了一种多智能体协同诊断网络架构来实现广义零样本学习目标并降低领域偏差的影响。最后,提出了一种基于仿真数据的先进多智能体GZSL方法,用于轴承复合故障诊断。本研究的主要贡献如下:

    1)构建了一个动态模型,用于仿真不同故障类型下的轴承振动信号。在此基础上,提出了一种新的语义构建方法。首先,利用复合故障动力学模型生成的数据构建并训练了一个语义映射模型。接着,建立了一个生成模型,以学习单故障与复合故障语义之间的耦合映射关系。这种方法提高了生成的语义与实际语义的一致性。

    2)提出了一种改进的MADRL协同诊断网络,以实现高精度的GZSL诊断。每个智能体负责诊断滚动轴承的特定部件。交互环境经过定制,旨在指导多个智能体的合作,从而实现故障特征的有效识别。

    3)基于上述研究成果,构建了多智能体GZSL故障诊断框架,并通过三个轴承数据集的对比实验和消融实验验证,该方法在GZSL诊断任务上的表现优于其他先进方法。

    本文其余部分分为五个部分。第二部分简要介绍了相关的循环生成对抗网络(CycleGAN)和多智能体深度确定性策略梯度(MADDPG)。第三部分详细阐述了为轴承设计的多智能体GZSL故障诊断方法。第四部分通过在三个数据集上的实验,验证了该方法的优势。最后,在第五部分中,总结了研究结论并展望了未来的研究方向。

    2 预备知识

    2.1 生成对抗网络

    作为最知名的生成模型之一,GAN[29]及其众多变体被广泛应用于数据生成和转换。CycleGAN的核心在于学习如何从一个领域(如夏季风景)映射到另一个领域(如冬季风景)。如图1所示,CycleGAN包含两个生成器和两个判别器。生成器      负责从      领域转换到      领域,而生成器      则执行反向转换。判别器      和      用于评估输入样本是否符合相应领域的特征。

    图1 CycleGAN的结构    

    2.2 多智能体深度确定性策略梯度

    所有强化学习(智能体RL智能体)算法都依赖于智能体与环境之间的交互结果。强化学习问题被建模为马尔可夫决策过程(MDP)[30],并通过四元组      进行定义。,其中      代表状态空间智能体,      代表动作空间智能体,      表示状态转移概率,      表示奖励函数。

    多智能体深度强化学习(MADRL)将强化学习扩展到涉及多个智能体的决策问题。基于Actor-Critic框架的MADDPG算法[31]是一种专为协作与竞争环境中连续动作空间问题设计的MADRL算法。该算法通过集中训练与分散执行(CTDE)的架构,解决了多智能体系统中的非平稳性问题。在训练阶段,每个策略网络都能获取全局信息,包括所有智能体的观测值、动作和环境状态;而在执行阶段,每个智能体仅根据自身局部观测值和训练好的策略网络独立做出决策。

    3 所提出的多智能体广义零样本故障诊断方法

    通过比较计算机视觉广义零样本学习(GZSL)中先验知识定义的属性表,本文提出了一种基于动态模型仿真数据的新语义构建方法。该生成模型学习了从单一故障语义到复合故障语义的映射关系,以及从故障语义到特征向量的映射关系。最终通过多智能体的协同决策实现故障识别。

    3.1 复合故障滚动轴承动力学建模

    首先构建滚动轴承的动态模型,该模型包含任意故障(单个或复合故障),以仿真不同故障类型下的振动信号。常见的轴承故障类型包括外圈故障、内圈故障和滚动体故障。在该动态模型中,所有故障被简化为一个长      、宽      、深      的立方体坑。因此,由故障引起的最大位移激励      计算如下:

       
     

    其中      表示滚动体的直径。

    图2(a)展示了外圈故障的情况,其中      表示与外圈故障区域对应的中心角度,而      则表示故障区域外边界与X轴在初始时刻的角度。外圈故障      的位移激励函数可通过考虑半正弦激励来定义:

       
     

    图2(b)展示了内圈故障,其中      表示中心角。与外圈故障不同,滚动轴承的内圈通常随轴一起旋转。因此,      是时间      的函数,可定义如下:

       
     

    其中,      表示内圈的旋转角速度,      表示初始时刻内圈故障区域外边界与X轴之间的角度。因此,内圈故障      的位移激励函数可定义如下:

       
     

    图2(c)展示了滚子故障的情况,其中      表示内圈故障区域对应的中心角度,而      则对应于外圈。滚动球故障      的位移激励函数可定义如下:

       
     

    其中,      表示滚子的角速度。滚子与滚道之间的法向接触变形包括了轴承故障位移激励函数的影响。接触变形可表示为:

       
     

    其中      和      分别表示滚动轴承在X轴和Y轴方向的位移,      代表轴承的公差。通过设定      、      和      的存在与否,可以仿真滚动轴承的各种故障类型。

    图2 滚动轴承多位置故障缺陷示意图    

    故障轴承的2-DOF动态方程可表示如下:

       
     

    其中      表示等效承载质量,      表示力变形系数,      表示等效阻尼比。

    等式(7)可通过Runge-Kutta算法求解,得到滚动轴承在各健康状态下的仿真振动信号。

    3.2 所提出的特征与语义处理模块

    所有振动信号经过CNN特征提取器处理,得到故障特征,每个信号样本转换成低维特征向量,便于分类,所有测量的复合故障数据均未进行训练,以确保符合GZSL原则。因此,CNN仅在单故障数据上进行训练以提取有效的故障特征,其目标函数定义如下:

       
     

    卷积神经网络(CNN)的结构参数详见表1。每个“ConvBN”模块包含一个卷积层、一个批量归一化层和一个最大池化层。所有数据均输入到训练好的CNN特征提取器中。全局平均池化(GAP)层输出了所有振动样本的特征向量,作为后续特征生成和故障识别模块的输入。

    作为GZSL中的关键先验知识,故障语义弥合了单一故障与复合故障诊断之间的差距。这直接影响模型性能,使其成为识别复合故障类型的关键。

    本文提出了一种基于仿真信号的语义构建方法。通过分析轴承动力学模型,获取了仿真故障信号。这些信号作为先验知识数据,提供给CycleGAN进行自适应学习。通过神经网络实现了从单一故障到复合故障语义的映射。

    由于振动信号通常包含背景噪声、载波信号和其他干扰,因此包络频谱被用作语义信息,频谱滤除了这些噪声,并通过以下计算完全反映了故障信息:

       
     

    其中      表示振动信号,      为该信号的希尔伯特变换,而      则代表傅里叶变换。

    基于CycleGAN建立了两种生成映射模型,用于生成复合故障特征,并将所有实际测量的复合故障信号从训练过程中排除:

    •语义映射模型的主要目标是学习单故障语义(      域)与复合故障语义(      域)之间的映射关系。该模型仅使用仿真信号作为训练数据。在测试时,将测量到的单故障语义输入到训练好的生成器I中,以生成相应的复合故障语义。

    •特征生成模型,该模型的最终目标是通过故障语义生成故障特征向量,所有测量的单故障数据均作为训练数据。从等式(9)派生的故障语义构成      域,而CNN特征提取器提取的特征向量则构成      域。测试时,将语义映射网络生成的复合故障语义作为输入,以生成相应的复合故障特征。

    这两款模型的具体结构参数详见表1,其结构将在后续章节(图4)中详细展示。每个“ConvIN”模块包含一个卷积层、一个实例归一化层和一个ReLU激活层。“DeConv”模块则用反卷积层替换了卷积层。尽管这两款模型的结构和输入不同,但它们都是基于CycleGAN的生成网络,由两个生成器和两个判别器组成。它们的目标函数包括对抗损失、循环一致性损失和身份损失。对抗损失是所有生成对抗网络(GANs)的基本组成部分,确保生成的数据与目标域数据高度一致。对抗损失的定义如下:

       
     

    循环一致性损失确保生成的数据能够映射回原始数据,从而促使生成器      和      学习到相互一致的映射关系:

       
     

    身份丢失有助于神经网络更好地识别和保存目标域所需的数据特征,从而提高生成数据的质量:

       
     

    所有损失的加权和构成了CycleGAN的完整目标函数,其表达式如下:

       
     

    其中      和      是权重超参数,用于平衡各损失项对网络更新的贡献。仿真信号作为先验知识,帮助使用上述模型生成高质量的复合故障特征。

    表1 特征处理模型的结构参数

     

    3.3 所提出的多智能体故障识别模块

    图3所示,整体故障诊断任务根据机械设备的不同部件被划分为多个子任务。每个子任务负责判断特定部件(例如内圈、外圈或滚动体)是否出现故障。各个智能体被分配处理这些子任务,它们的决策综合起来以评估设备的整体健康状况。在多智能体故障识别模块中,智能体交互的环境表示为:

       
     

    其中,      表示从GAP层提取的第      个样本的特征向量,      表示对应的故障类别标签。状态空间      由多个特征向量组成,为第      个智能体在其指定的子任务范围内提供输入信息。在多智能体故障诊断任务中,动作空间被定义为特定组件发生故障的概率,该组件由某个智能体负责。对于第      个智能体,其动作      定义为:

       
     

    当      的值为0.5时,表明该智能体对其关联组件的故障概率估计为50%。每个智能体都会被分配一个动作阈值      。若某智能体的动作概率超过其设定的阈值,则判定对应的组件已发生故障:

       
     

    其中      表示第      个智能体负责的具体组件(即位置)的故障标识。在后续的诊断过程中,可以根据智能体的具体 位置和不同类型的故障特点,为智能体设置不同的阈值。这种方法确保所有微小的故障都能被彻底检测和分析。最后,将所有部件的诊断结果组合成一个整体向量,以确定设备的整体健康状况。

    奖励函数是深度强化学习的关键组成部分,旨在鼓励每个智能体准确行动。在多智能体故障诊断任务中,为每个智能体定义了个体奖励      和全局奖励      ,以促进智能体间的协作。由于子任务本质上相同,所有个体奖励均设计为提供正向反馈,确保正确评估:

       
     

    全局奖励根据训练期间所有智能体的共同决策确定。如果所有组件均被正确诊断,则会获得正向的全局奖励;反之,若任何组件被错误诊断,则会受到惩罚:

       
     

    其中      代表总智能体数量,      表示做出错误诊断的智能体数量。每个智能体的最终奖励值由其个人奖励与全局奖励之和构成:

       
     

    其中,是一个缩放因子,确保奖励值保持在适合网络学习过程中收敛的范围内。

    MADDPG用于在多智能体故障识别模块中更新智能体。每个智能体在MADDPG算法中初始化四个神经网络:策略网络(Actor)、价值网络(Critic)及其对应的靶向网络。每个智能体根据其独立的actor网络生成动作,并利用critic网络计算该动作的Q值。通过梯度反向传播更新actor和critic网络的参数,以优化策略和价值函数。actor策略网络通过最大化Q值来更新:

       
     

    每个智能体的批评值网络接收所有智能体的联合状态和动作,并输出各自智能体的Q值。该网络通过时间差分(TD)误差来更新集中式Q值函数:

       
     

    其中      表示使用即时奖励和折现未来回报计算得出的奖励目标值:

       
     

    目标actor 和 critic网络确保训练期间的学习稳定。目标网络通过软更新逐步更新:

       
     

    由于交互式环境中使用的输入是CNN特征提取器提取的特征向量,因此所有智能体网络均配置为全连接层。

    图3 多智能体故障识别模块流程图    

    3.4 多智能体广义零样本故障诊断方法的流程

    基于上述任意故障的轴承动力学模型、特征与语义处理模块以及多智能体故障识别模块,开发了多智能体广义零样本故障诊断方法,其框架如图4所示。

     

       

    为实现该方法,其详细步骤如下:

    1)建立了包含单故障和复合故障在内的任意故障目标滚动轴承的动态模型,利用Runge-Kutta算法计算了各种故障类型下的振动信号。

    2)所有振动信号,包括测量数据和仿真数据,都通过希尔伯特变换处理,以提取相应的故障语义。

    3)特征提取模型采用单个故障的振动信号进行训练,将每个振动信号样本转换为低维特征向量。

    4)语义映射模型通过仿真单故障语义和复合故障语义进行训练,使生成器I能够学习从单故障到复合故障语义的转换映射。

    5)特征生成模型通过利用测量到的单故障语义及其对应的特征向量来进行训练,从而使生成器Ⅲ具备从故障语义生成故障特征的能力。

    6)通过生成器I处理测量的单故障语义,生成相应的复合故障语义,然后输入到生成器Ⅲ中,生成最终的复合故障特征向量。

    7)将单个故障和生成的复合故障的特征向量作为多智能体故障识别模型的训练数据,基于故障特征对所有健康状态进行准确分类。

    所有测量的复合故障数据均不用于训练,以确保符合GZSL原则。在对所提出的模型进行训练后,针对目标故障的诊断过程仅包括两个连续的步骤:首先,原始信号经过特征提取模型处理,得到特征向量;然后,该特征向量经过多智能体故障识别模型分析,得到最终的诊断结果。

    4 实验与比较

    4.1 数据集描述和实现细节

    基于三个轴承数据集开展了多项消融实验和广义零样本学习诊断任务,通过与先进广义零样本学习方法的对比,验证了所提方法的有效性和优势。表2列出了三个数据集中测试滚动轴承的参数及所有故障类型的尺寸规格。以下是这三个数据集的补充细节说明。

    表2 三个数据集中滚动轴承的测试参数

     

    1)私有轴承故障检测(BFD)数据集。该数据集来源于我们自主研发的轴承故障测试台,测试台由负载电机、减速器、驱动电机和测试滚动轴承组成。采用了七种滚动轴承的健康状态:正常(NC)、内圈故障(IF)、外圈故障(OF)、滚动体故障(BF)、内圈与外圈复合故障(IO)、内圈与滚动体复合故障(IB)、外圈与滚动体复合故障(OB)。原始振动信号由两个加速度传感器采集。在实验中,测试的滚动轴承以1000 rpm 的速度运行,负载为4 Nm,采样频率设定为12 kHz。

    2)东北电力大学([32])提供的NEEPU轴承数据集。该数据集中仿真故障类型包括NC、IF、OF、BF、IO、IB和OB。实验中,轴承的输入转速在1443至1478 rpm 之间变化,同时通过磁制动施加了0.2 Nm的负载。采样频率设定为12 kHz,采样时间为55 s。

    3)PU数据集。PU轴承数据集由帕德博恩大学[33]提供。测试装置包括电动机、扭矩传感器、测试滚动轴承、飞轮和负载电机。在1500 rpm 的速度和0.7 Nm的负载下进行了轴承故障实验,包含四种健康状态:NC、IF、OF和IO。故障振动信号以64 kHz的采样频率采集。

    在所有比较实验中,单故障类别NC、IF、OF和BF被视为已见类别。相比之下,复合故障类别IO、IB和OB则被视为未见类别。因此,数据集A和B中使用了NC、IF、OF和BF作为训练数据。而数据集C中仅使用了NC、IF和OF作为训练数据。所有类别均作为测试数据。滑动窗口采样技术被应用于三个数据集,以获取足够的数据样本,采样窗口大小设定为3072。所提出的模型需要配置多个超参数,包括学习率、批量大小、训练轮数和折扣因子等。所有网络的批量大小均设为32,特征提取模型的学习率和训练轮数分别设定为0.0002和5000。折扣因子设为0.2,以鼓励智能体关注当前奖励。表3列出了所提出的模型在三个数据集上的超参数设置。此外,该模型在TensorFlow平台上使用NVIDIA2080Ti显卡实现。

    表3 针对三个数据集的模型超参数

       

    4.2 仿真信号和语义分析

    通过将表2中每个测试平台的轴承参数和故障尺寸整合到上述建立的动力学模型中,可以获取与每个数据集中的测试滚动轴承相对应的仿真振动信号。图5展示了数据集A中三种健康状态(IF、OF和IO)的测量和仿真振动信号的时间域图。与之对应,图6展示了通过希尔伯特变换得到的相应包络谱。

    图5 数据集A中三种健康状态的实测与模拟信号时域图    
    图6 数据集A中三种健康状态的测量信号和模拟信号包络谱    

    比较分析显示,由于实际场噪声的干扰,测量信号在时域图中明显不如仿真信号清晰。此外,复合故障(IO)与单个故障(OF和IF)之间的耦合关系非常复杂,难以总结和解释。包络谱中的幅度峰值集中在故障频率附近。数据集A中滚动轴承的OF故障频率为101Hz。仿真理论状态下,对应的IF故障频率为132Hz。尽管测量信号与理论仿真信号的故障频率存在偏差,但复合故障(IO)与单个故障(OF和IF)之间的耦合关系在这两种情况下依然明显。IF和OF故障频率出现在IO复合故障中。因此,选择包络频谱作为生成复合故障特征的语义。

    4.3 比较实验与讨论

    已见类识别准确率      未见类识别准确率      是广义零样本学习(GZSL)中评估域偏移和中心度问题对模型影响的关键指标。此外,这两个指标的调和平均数      被用来评估模型性能:

       
     

    为验证所提出方法,我们在三个数据集上对比了多种最先进的广义零样本学习方法,包括来自计算机视觉领域的CE-GZSL[16]以及故障诊断领域的AWSAE[13]、CGASNet[14]和ZS-BDT[15]。所有方法均在每个数据集上进行了超过三次的训练与测试,各方法在整个过程中的最佳性能记录于表4中。

    表4 三种数据集上不同方法的结果

     

    实验结果显示,大多数方法在已见过的类别上能够达到较高的分类准确率。然而,对于未见过的类别,这些方法的表现显著下降。这表明所有深度学习模型都严重依赖于训练样本。此外,GZSL方法在构建未见过类别的语义或特征时存在偏差,导致准确率下降。相比之下,所提出的方案表现最佳,在三个数据集上的      、      和      平均值分别达到了98.25%72.37%83.32%

    4.4 消融实验和分析

    为评估所提出的语义映射与多智能体诊断模块的有效性,研究进行了大量消融实验,将多种模块组合与广义零样本学习基线方法进行对比。基线方法采用CycleGAN框架,通过振动信号多个时频指标的线性叠加构建语义特征;MA(·)表示多智能体联合识别模块,SM(·)代表基于仿真信号的语义映射构建方法。实验共部署四种模型进行广义零样本学习任务:基线模型、基线+MA(·)模型、基线+SM(·)模型以及基线+SM(·)+MA(·)组合模型

    图7所示,基线方法主要识别单一故障类别(已见类别),导致显著的领域偏移问题。相比之下,基线+SM模型能更好地识别复合故障类别(未见类别)。这一结果表明,SM模块能够捕捉复合故障与单一故障类别之间的映射关系,有助于通过仿真信号识别未见类别。与传统识别网络相比,MA模块的表现更加稳定和准确。表5展示了四个模型在三个数据集上的实验结果。可以看出,所提出的方法在所有任务中都表现出强大的泛化零样本诊断能力。

    图7 数据集A上四种模型诊断结果的混淆矩阵    

    表5 四种模型诊断结果的调和平均准确度

     

    5 结论

    本文提出了一种基于仿真数据的多智能体GZSL故障诊断方法,用于仿真轴承故障。首先,建立了包含任意单一或复合故障的滚动轴承动态模型,以获取所有健康状态下的仿真振动信号。这些仿真信号作为辅助信息,用于训练语义映射模型。此外,特征生成模型利用单故障数据学习了语义与特征向量之间的映射关系。最后,除了测量的复合故障特征向量外,所有其他特征向量被用于定义多智能体故障识别模块中的交互环境,实现了高精度的GZSL诊断。在三个轴承故障数据集上进行了广泛的比较和消融实验,证明了该方法具有强大的性能。

    然而 ,所提出的方案仅专注于滚动轴承内部不同位置的故障类型 , 而未涉及其他关键部件的故障。未来的研究将扩展该方法 ,用于诊断复 杂机械系统中多个部件的复杂故障。


    编辑:陈莹洁
    校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、Tina、陈宇航、王金、赵诚、肖鑫鑫
    该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除


    来源:故障诊断与python学习
    ACTMechanicalSystem振动化学旋转机械通用航空电力电子农业理论电机
    著作权归作者所有,欢迎分享,未经许可,不得转载
    首次发布时间:2025-07-10
    最近编辑:1天前
    故障诊断与python学习
    硕士 签名征集中
    获赞 81粉丝 119文章 219课程 0
    点赞
    收藏
    作者推荐

    综述学习 | 动态系统多工况故障诊断:综述、见解与展望

    本期给大家推荐清华大学何潇教授团队的一篇最新关于多工况故障诊断的综述。论文链接:通过点击最左下角的阅读原文进行在线阅读及下载。1 论文基本信息论文题目:Multi-Condition Fault Diagnosis of Dynamic Systems: A Survey, Insights, and Prospects论文期刊:IEEE Transactions on Automation Science and Engineering论文时间:2025年作者:Pengyu Han (a), Zeyi Liu (a), Xiao He (a), Steven X. Ding (b), and Donghua Zhou (a), (c)机构:(a) Department of Automation, Tsinghua University (b) Institute for Automatic Control and Complex Systems, University of Duisburg-Essen (c) School of Automation, Southeast University作者简介:何潇,清华大学自动化系教授、清华大学安全控制技术研究中心主任、清华大学轨道交通智能控制与决策创新团队负责人及首席科学家、中国自动化学会理事会副秘书长,曾任清华大学自动化系副主任。研究方向为网络化系统、故障诊断与容错控制。在国内外期刊会议上发表论文200余篇。主持国家自然科学基金重点项目1项、面上项目2项,2015年获得国家自然科学基金优秀青年基金资助。现任中国自动化学会高级会员、IEEE Senior Member、美国Sigma Xi荣誉研究会Full Member,并任Control Engineering Practice、IEEE TNNLS、IEEE TASE等多个国际期刊的编委。目前为中国指挥与控制学会云控制与决策专业委员会副主任、智能控制与系统专业委员会副主任、中国自动化学会技术过程的故障诊断与安全性专业委员会秘书长、过程控制专委会副主任。曾获2012年SAFEPROCESS国际会议的Frank最佳理论论文提名奖、2023年北京市自然科学二等奖、2021年方崇智最佳论文一等奖、2022年张钟俊院士优秀论文奖,并获2018年吉林省科技进步一等奖、2015年与2020年中国自动化学会自然科学奖一等奖、2022年中国自动化学会技术发明一等奖。培养学生获得2018年和2022年中国自动化学会优秀博士学位论文周东华,东南大学教授、博导,智能无人系统研究院首席科学家,矿山安全检测技术与自动化装备国家地方联合工程研究中心主任。上海交通大学博士、浙江大学博士后。曾任清华大学自动化系主任,山东科技大学副校长,教育部高等学校自动化类专业教指委主任,第六、七届国务院控制科学与工程学科评议组成员,第三、四、五届中国自动化学会故障诊断与安全性专委会主任。为国家杰青、长江学者特聘教授、“万人计划”领军人才、国家基金委创新研究群体带头人、全国高校黄大年式教师团队负责人,享受国务院政府特殊津贴。兼任IFAC 技术过程故障诊断与安全性技术委员会委员、中国自动化学会副理事长等。主要研究动态系统故障诊断与容错控制、运行安全性评估理论等。以第一完成人获国家级奖励3项(含国家自然科学二等奖2项、国家级教学成果二等奖1项)、省部级和全国学会科技一等奖5项。曾获霍英东教育基金会青年教师奖、全国优秀博士后奖、第六届中国青年科技奖、国家新世纪百千万人才、全国优秀科技工作者等荣誉称号。为山东省泰山学者优势特色学科人才团队领军人才、山东省泰山学者攀登计划专家。入选全球高被引科学家、全球前2 %顶尖科学家名录,当选IEEE/ AAIA/ IET/ CAA Fellow。Steven X. Ding,德国杜伊斯堡-艾森大学终身教授,自动控制与复杂系统研究所(AKS)所长。 Steven X. Ding 1992年于德国 Gerhard-Mercator University 获电子工程专业博士学位,1995年被德国劳西茨应用技术大学聘为终身教授,并于1998年—2000年任该校副校长。2001年起任杜伊斯堡-艾森大学教授。Steven X. Ding 教授是国际控制领域过程监测与故障诊断的知名学者和专家,他领导的故障诊断与容错控制团队在国际上享有很高的声誉。他的主要研究方向涉及基于模型/数据驱动的故障诊断与容错控制、过程监测、网络化系统的集成分析与设计、实时控制以及它们在自动控制系统、化工过程和可再生能源系统中的应用等。他曾承担多项德国基金会科学研究项目、欧盟项目、国际合作项目和工业合作项目,并出版了三本英文专著,在国际重要期刊和国际会议上发表学术论文300余篇。2 摘要随着工业生产系统日趋复杂,如何实现精准的故障诊断,已成为保障系统安全稳定运行的关键。然而在实际应用中,受生产任务变动、工艺动态调整以及外部环境扰动等多种因素影响,系统往往会处于多种不同的运行工况下。这种多工况特性给传统的故障诊断方法带来了严峻挑战,也推动了多工况故障诊断成为当前学术界和工业界关注的研究重点。本文围绕这一热点问题,对多工况故障诊断领域的研究成果进行了系统梳理与深入分析。首先,文章从数学层面对多工况问题进行了清晰定义,并概述了当前的研究现状;随后,围绕主流的单模型与多模型多工况故障诊断方法,对现有文献进行了分类整理与比较分析;在此基础上,总结了多工况诊断在典型实际场景中的应用现状与实践经验;最后,针对当前面临的核心难题,提出了若干值得关注的发展趋势与研究方向。 关键词:故障诊断、多工况、数据驱动、人工智能 3 目录1 论文基本信息2 摘要3 目录4 引言5 问题描述 5.1 问题建模 5.2 MCFD研究现状 5.3 现有MCFD方法的分类6 基于单模型的MCFD方法 6.1 基于手工特征的框架 6.2 基于表示学习的框架7 基于多模型的MCFD方法 7.1 基于融合的框架 7.2 基于工况辨识的框架8 典型实际应用场景 8.1 机械系统 8.2 化工系统9 结论与展望注:本文只选中原论文部分进行分享,若想进一步拜读,请下载原论文进行细读。小编能力有限,如有翻译不恰之处,请多多指正~4 引言随着自动化的不断推进,工业生产系统的规模和复杂度也在稳步提升。现代工业系统通常由多个相互连接的子系统组成,在高度自动化的环境下运行,对系统的稳定性和可靠性提出了更严格的要求。此类系统中的故障会显著降低生产效率,扰乱正常的生产计划,造成巨大的经济损失甚至人员伤亡。在此背景下,开发高效而准确的故障诊断方法变得至关重要。准确的故障诊断不仅有助于及时发现并定位系统异常,还能防止次生危害,从而在提升系统可靠性的同时降低运维成本。因此,故障诊断近些年已成为研究热点。 故障诊断方法通常分为模型驱动方法(Ding等人,2008;Zhong等人,2023)和数据驱动方法(Fan,2024)。模型驱动方法依赖于构建系统的精确数学模型。通过对物理系统和其数学模型施加相同的控制信号,生成残差信号,并利用评估与分类函数对其进行分析,以实现故障的检测与隔离。然而,随着现代工业设备的复杂性不断增加,构建精确数学模型变得愈发困难,从而限制了模型驱动方法的应用落地。相比之下,传感器技术的进步使工业过程中能够采集大量运行数据,为数据驱动方法的发展奠定了坚实基础。数据驱动方法包括信号处理技术(Xu等人,2023;Borghesani等人,2013)和机器学习方法(Zhao等人,2023;Lu等人,2023)。值得注意的是,随着人工智能的迅猛发展,基于机器学习的故障诊断方法在复杂系统中得到了广泛应用。这些方法在特征提取和学习方面表现出优越能力,在众多故障诊断任务中取得了显著效果。 然而,在许多工业系统中,由于生产需求的变化、过程的动态调整或外部环境的复杂变化,往往会引发数据分布的显著漂移(Fan等人,2024)。这类分布漂移可能导致在特定工况下训练的诊断模型在其他条件下无法维持稳定性能,甚至完全失效(Quinones等人,2019)。这一问题在具有多样且频繁变化工况的工业场景中尤为突出,给故障诊断方法的适应性、鲁棒性和泛化能力带来了巨大挑战。多工况故障诊断(multi-condition fault diagnosis,MCFD)正是为应对这一问题而提出,其核心目标是确保诊断模型在多种工况下均能保持一致且可靠的性能。与单工况诊断不同,MCFD不仅需要应对不同工况之间显著的数据分布差异,还需应对未知工况所带来的不确定性。这些因素引入了诸多挑战,包括如何构建能够适应工况间复杂非线性关系的模型,如何缓解由数据分布漂移导致的性能退化,以及如何在未知工况下实现高效且准确的故障识别。为克服上述挑战,MCFD近年来已成为故障诊断领域的重要研究热点,受到学术界和工业界的广泛关注。 本文回顾了过去二十年多工况故障诊断领域中约210篇相关研究,旨在提供一个全面且系统的综述。为便于读者查阅,本文整理的相关资料已发布在https://github.com/THUFDD/Multi-Condition-Fault-Diagnosis,该资源库将持续更新。第二节中,本文首先给出MCFD问题的数学定义,并简要概述当前的研究现状。第三节与第四节分别聚焦于单模型和多模型MCFD方法(见图1),在深入回顾相关研究的基础上,分析了各类方法的优缺点。此外,第五节探讨了MCFD在典型应用场景中的实践,包括机械系统与化工系统。最后,第六节对全文进行总结,并展望未来的研究方向与发展前景。 图1 多工况故障诊断方法概述5 问题描述5.1 问题建模工业过程通常可以被视为随机过程(Zhang等人,2023),因为其运行会受到负载波动、外部环境扰动等多种因素的影响。这类过程可表示为: 其中, 表示该过程中的随机变量。这些随机变量的累积分布函数(cumulative distribution function,CDF)定义如下: 其中, 表示累积分布函数, 表示概率。如果对于任意时间点 以及任意时间平移量 ,都有以下等式成立: 则该过程被认为是平稳的,即其统计特性不会随时间变化(Kan等人,2015)。反之,如果上述条件不成立,则该过程为非平稳过程。 在工业生产中,平稳过程通常指系统在某一稳定工况下运行。相比之下,非平稳过程往往包含多个稳定工况,因此也被称为多工况过程。非平稳过程通常具有非线性、非高斯性以及变量分布不一致等特性,这些因素显著增加了故障诊断的难度(Zhao等人,2022)。例如,在风力发电站中,运行工况会受到风速变化和载荷变化等因素的影响而发生波动,从而导致系统参数在时间上表现出非平稳性,如图2所示。特别是在非平稳过程中,诸如转速、负载和温度等正常变化,可能与因故障引起的变化高度相似,进而导致误报率上升,且工况的变化可能掩盖故障特征,导致漏报率增加。此外,相同故障在不同工况下的可能表现出不同的特征,这进一步加大了故障的识别难度,导致诊断性能出现下降。 图2 某实际发电站中海上风力负荷的非稳态变化示意图5.2 MCFD研究现状数据驱动的故障诊断方法主要可以分为两类。第一类是故障检测与隔离(fault detection and isolation,FDI)方法,其诊断过程通常包括两个顺序步骤(Zhou等人,2016)。首先,进行故障检测以识别系统中的是否存在故障;一旦检测到故障存在,模型会继续触发故障隔离模块,以定位故障源。第二类方法则将故障诊断问题视为故障分类任务,直接利用分类模型预测故障类型。近年来,MCFD受到越来越多的关注。通过在Web of Science中进行关键词检索可以发现,该领域的研究论文数量呈现出稳定增长的趋势,如图3所示。 图3 基于Web of Science数据的多工况故障诊断相关论文的数量统计图尽管MCFD已取得了大量研究成果,但目前该领域仍缺乏对现有工作进行系统总结的综述文章。因此,本文旨在填补这一空白,对MCFD相关研究进行全面回顾,重点梳理其关键进展、主流方法以及未来的研究机遇。 在现有文献中,描述MCFD的术语多种多样,如图4所示,包括“multimode”、“multiple operating modes”、“variable working conditions”、“time-varying operating conditions”、“different working conditions”等。这些术语本质上传达的是相同的概念。因此,为保证术语统一,本文在后续讨论中将使用“multiple operating conditions”或“multi-condition”来指代如负载、转速或生产方案变动所带来的变化。 图4 多工况故障诊断不同描述方式的占比情况 5.3 现有MCFD方法的分类通过对现有文献的系统梳理可知,当前的MCFD方法大致可分为两类:单模型方法和多模型方法。单模型方法旨在构建一个统一的模型,以减少工况相关信息对故障特征提取的干扰,从而提取具有故障不变性的特征,保证在多种工况下均能实现较高的诊断准确率。相比之下,多模型方法则依赖于离线的多工况数据,为每一种工况分别构建子模型,并在诊断过程中引入工况信息。从任务适用性的角度来看,单模型方法更适用于不同工况之间数据分布差异较小的场景,尤其适用于工况多样或存在未知工况的复杂场景。而多模型方法更适用于工况数量有限且已知的情形,特别是在工况间存在显著分布差异、且每种工况下都具备充足数据的情况下,其优势更为明显。第三节和第四节将分别详细探讨上述两类方法。图5展示了在已调研的文献中,各类框架的大致占比。 图5 不同MCFD框架在已调研文献中的占比情况6 基于单模型的MCFD方法单模型方法可细分为基于手工特征和基于表示学习的两类框架。基于手工特征的方法具有直观且部分可解释的特征提取过程,但通常需要额外的分类器来生成最终的诊断结果。相比之下,基于表示学习的方法多采用端到端模型,能够一步完成诊断输出。然而,由于基于表示学习的框架依赖机器学习进行特征表示学习,通常呈现黑箱特性,解释性较弱。本节将对这两类框架下的现有方法进行详细说明。6.1 基于手工特征的框架基于手工特征的框架通常采用信号处理技术,从非平稳工况下获取的原始信号中提取故障不变特征(Qian等人,2024)。随后,利用这些特征通过人工分析或机器学习分类器识别具体故障。基于手工特征提取框架的结构示意如图6所示。通过对大量文献的系统梳理,基于手工特征提取的框架可分为三类方法:滤波方法、时频分析(time-frequency analysis,TFA)和阶次跟踪(order tracking,OT)。 图6 基于手工特征提取的框架示意图 滤波方法通过对信号进行特定变换以提取有用成分,从而实现目标特征的分离(Qian等人,2024)。常见的滤波技术包括经验模态分解(empirical mode decomposition,EMD)(Huang等人,1998)、小波包变换(wavelet packet transform,WPT)(Hu等人,2007)和经验小波变换(empirical wavelet transform,EWT)(Gilles等人,2013)等。Fu等人(2023)提出了一种改进的经验小波变换(IEWT),结合了最优脊线提取策略,并引入了高效加权能量熵(EWEE)作为信号重构的敏感指标,有效解决了传统经验小波变换中存在的过分解问题。Huo等人(2024)提出了一种自适应时频提取模态分解(ATFEMD)方法,旨在解决信号分解中时频能量不集中、瞬时频率提取鲁棒性差以及模态混叠的问题。该方法通过脊线提取捕获时频分布中的显著信息,保证模型能够很好地适应实际场景。Chen等人(2018)提出了一种基于互补集 合经验模态分解(CEEMD)、样本熵和相关分析算法(CorAA)的综合方法,以消除不同工况的影响,实现跨工况的准确故障诊断。 时频分析能够有效识别信号的频率成分并揭示其时变特性,因而特别适合于非平稳信号的特征提取。常见的时频分析技术包括连续小波变换(continuous wavelet transform,CWT)(Aguiar等人,2014)、短时傅里叶变换(short-time Fourier transform,STFT)(Griffin,1984)、同步压缩变换(synchrosqueezing transform,SST)(Li等人,2012)等。Qin等人(2023)提出了一种基于自适应最优搜索角带的自适应快速chirplet变换(AFCT),有效提取时变转速条件下的故障特征。Ding等人(2024)提出了一种低秩约束多核广义参数化时频变换(MKGPTFT),用于生成高质量的时频平面以实现准确的故障诊断。Wei等人(2022)提出了一种结合经验模态分解(EMD)和自适应时变参数短时傅里叶同步压缩变换(AFSST)的方法,旨在增强模型的特征提取能力和适应性。Wang等人(2024)提出了一种结合归一化时频熵谱(NTFES)与故障特征系数模板(FCCT)的变工况故障诊断方法,旨在缓解大幅度转速波动和强背景噪声的负面影响。Chen等人(2023)提出了一种带移窗的时频变换器(TFSwin-T)方法,利用振动信号的时频分析增强滑动轴承诊断中弱故障特征的提取,在复杂工况下显著提升诊断性能。 基于阶次追踪(OT)的方法广泛应用于旋转机械的多工况故障诊断,通过将非平稳时域信号转换为平稳的角度域信号,从而减轻因工况变化引起的影响。常见的阶次追踪方法变体包括计算阶次追踪(computed order tracking,COT)(Fyfe等人,1997)和无测速阶次追踪(tacholess order tracking,TLOT)(Lu等人,2019)等。Sapena-Bano等人(2017)提出了一种针对非平稳工况的谐波阶次追踪方法(HOTA)扩展,该方法能够获得工况不变的模式,使非专业人员也能进行可靠诊断,并简化了基于机器学习算法的自动诊断方法的开发。Wang等人(2017)提出了一种用于变速条件下滚动轴承故障诊断的混合方法,该方法结合了计算阶次追踪和基于变分模态分解(VMD)的时频表示,捕捉振动信号角度信息与故障特征阶次之间的关系。Wang等人(2019)提出了一种基于改进经验小波变换(IEWT)的增强包络阶次谱方法,结合了IEWT、COT和奇异值比谱(SVRS)去噪技术的优势,实现了变速条件下可靠高效的故障诊断。Hu等人(2024)提出了一种基于脊线提取的无测速阶次追踪方法,用于解决因转速变化引起的非平稳振动信号问题。6.2 基于表示学习的框架基于学习表征的方法通常采用深度学习手段提取故障不变特征,旨在构建可适用于不同工况的通用模型。其框架示意图如图7所示。该类方法中一种常见策略是域适应(domain adaption,DA),其核心思想是首先利用源域的数据训练模型,随后使用目标域的一部分数据对模型进行微调。通过对不同域间的数据分布进行对齐,可以将源域中的知识迁移至目标域,从而实现目标域中的准确故障诊断,如图8(a)所示。 图7 基于表示学习的框架示意图 Song等人(2024)提出了一种结合改进粒子群优化(PSO)的卷积神经网络-双向长短时记忆网络(CNN-BiLSTM)用于精确的轴承故障诊断。该方法利用时间特征,并将预训练模型迁移到新的工况中,解决了多样工况下数据匮乏的问题。Xu等人(2023)引入了一种无监督对抗域适应(UADA)模型,通过批内类惩罚(BICP)和逐步自适应对齐特征范数(SAAFN)策略,提升了模型的判别能力和迁移能力。Liang等人(2023)提出了一种将子域适应(SA)与改进视觉变换器网络(IVTN)融合的方法,该方法结合了局部和全局信息,有效应对不同转速和载荷下的分布变化,实现了滚动轴承的故障诊断。Yang等人(2023)开发了一种自监督故障诊断框架,结合了信号掩码与重构预任务。通过利用具有自注意力机制的变换器主干网络,模型增强了时间特征学习和全局依赖建模能力,实现了有限标签和非平稳工况下的有效表示学习。Pang等人(2024)提出了一种时频监督对比(TF-SupCon)学习框架,通过时间域和频率域表示之间的监督对比学习,提取转速不变特征,实现了跨转速的故障诊断。Xu等人(2023)提出了一种去噪扩散多源域适应(DDMDA)模型,解决了基于生成对抗网络方法中数据不平衡和不稳定的问题。该模型引入了Utrans-net以提升噪声预测能力,并采用多域判别器结构以实现不同工况下的鲁棒特征提取。Su等人(2022)提出了一种膨胀卷积深度置信网络-动态多层感知机(DCDBN-DMLP),利用多层最大均值差异(MMD)技术减少分布差异。An等人(2022)提出了一种无监督对比域适应网络(UCDAN),用于跨域轴承故障诊断,通过对比估计项增加不同类别样本间的距离。Yang等人(2024)提出了一种基于原型和随机神经网络的双重对抗域适应(PSNN-TADA),有效实现类别级故障特征的对齐。该方法采用基于随机神经网络的分类器,减轻了目标域中故障特征的错配,保证了更具判别性的决策边界。Zhai等人(2022)和Sun等人(2024)采用了自适应批归一化(AdaBN)策略,提升了模型对目标域分布的适应能力。 虽然上述方法在特定应用场景中取得了较好效果,但它们高度依赖于精确的工况识别(Shi等人,2025)。在实际工业场景中,由于工况的不可预测变化,常常会出现未知工况。针对这一问题,域泛化(domain generalization,DG)作为一种有前景的方法被提出,用于解决多工况故障诊断中未知工况的挑战。这些方法在缺乏目标域信息的情况下,利用已有的工况数据构建模型,以减轻工况变化的影响。当新样本到来时,无需进一步适应,直接应用离线模型即可获得令人满意的结果。其核心思想是提取多样化的域不变表示,并增强特征空间内的区分度,使模型对分布外数据更具鲁棒性,从而能够有效泛化到之前未见过的工况(Liu等人,2024)。域泛化的示意图如图8(b)所示。 图8 (a)域适应示意图 (b)域泛化示意图 Wang等人(2024)提出了一种基于ProbSparse注意力机制的变换器(PSAT)用于现场故障诊断,该方法降低了模型复杂度和诊断样本的存储成本。Guo等人提出了一种基于扩散的框架,该框架结合了用于噪声水平预测的工况引导嵌入UNet(CGE-UNet)和无监督聚类滤波器(UCFilter),以选择信息丰富的生成信号,实现了在未知工况下高质量数据的合成。Qian等人(2025)引入了一种名为自适应中间类别分布对齐(AICDA)的新型迁移学习方法,该方法通过动态中间对齐(DIA)层和AdaSoftmax损失函数,消除了手动平衡多个损失项的需求。Li等人(2023)提出了一种跨域增强(CDA)方法,用于未知工况下的故障诊断。该方法通过对抗域增强泛化(ADAG)技术,以特征-标签对的凸组合促进模型泛化,学习多源和增强域中的域不变特征。为解决故障诊断中样本有限的问题,Zheng等人(2023)引入了一种带有自适应输入和注意力机制的元学习方法,提升了特征提取和泛化能力。针对标注样本有限的问题,Zhao等人(2023)提出了一种半监督域泛化故障诊断(SemiDGFD)的互助网络,采用伪标签技术并利用基于熵的净化机制提升伪标签质量。Shi等人(2023)提出了一种可靠特征辅助对比泛化网络(RFACGN),解决智能故障诊断中缺乏解释性的问题。该方法利用对比框架最小化域特定知识,并通过多分支模块聚焦故障相关特征,同时引入置信度指标评估结果可靠性。Wang等人(2024)提出了一种带非对称损失函数的增强变换器(ETALF)方法,用于解决带噪标签的少样本故障诊断问题,该方法通过动态测量故障样本相似度和非对称损失函数提升对标签噪声的鲁棒性和诊断准确性。Liu等人(2023)提出了一种信息诱导的特征分解与增强(IIFDA)框架,用于非平稳条件下的轴承故障诊断。Zhao等人(2020)和Wang等人(2021)针对多工况下的数据不平衡问题,采用批归一化(BN)技术缓解训练数据集与测试数据集间的分布差异。 总的来说,域适应和域泛化方法适用于不同的故障诊断场景。域适应方法在训练过程中可以访问目标域数据,因此能够更好地适应已知工况,但在遇到未知工况时性能通常会下降。相反,域泛化方法仅利用源域数据进行训练,旨在学习工况不变特征以增强模型的泛化能力,但这些方法在部署后往往难以对模型进行更新。在实际应用中,基于域适应的方法更适合能够持续收集新数据且具备工况识别能力的场景,而基于域泛化的方法则更适合未知工况频繁出现的环境。为进一步突出两者的差异,表1总结了域适应和域泛化方法的不同特征。 表1 基于表示学习方法的不同特征 此外,在分析基于表示学习的方法时发现,许多最新的创新都与损失函数的修改或改进密切相关。为了更清晰地展示这些内容,表2总结了不同方法中具有代表性的损失函数。其中交叉熵作为最常用的分类损失,被广泛应用于多项监督学习研究中,如(Liu等人,2025;Zhang等人,2024;Yao等人,2023)。均方误差(MSE)通常用于重构或回归任务,在(Yao等人,2023;Chen等人,2024)中得到应用。Kullback-Leibler(KL)散度常用于变分建模或分布正则化(Zhang等人,2024;Lu等人,2023;Liu等人,2023)。Wasserstein距离用于对抗环境中的域差异度量,在(Yang等人,2023;Han等人,2021)中被采用。最大均值差异(MMD)因其在核方法特征匹配中的高效性,广泛应用于域对齐,近年相关工作包括(Shi等人,2025;Zhang等人,2024;Shi等人,2024;Che等人,2024;An等人,2023)。对抗损失通常用于域对抗训练框架,见于(Han等人,2023;Hei等人,2024)。表2 常见损失函数总结 7 基于多模型的MCFD方法多模型方法可以进一步分为两类:基于融合的框架和基于工况辨识的框架。基于融合的框架的优势在于能够整合多个子模型的结果,从而充分挖掘和利用现有信息,但该方法的诊断准确率可能会受到错误子模型的负面影响。相反,基于工况辨识的框架仅调用与当前工况对应的子模型,当工况被准确识别时,该方法通过选择最相关的子模型能够实现更优的性能,最大程度地减少无关模型的干扰风险。然而,由于子模型是基于离线数据训练的,因此该框架在遇到未知工况时适应性较差。本节将基于这两种框架对现有文献进行详细回顾。 7.1 基于融合的框架由于离线阶段可获得来自多种工况的数据,直接构建单一诊断模型可能因工况信息与故障信息相互干扰而导致诊断性能下降。为解决该问题,基于融合的框架针对每个工况分别利用离线采集的数据开发独立子模型。在线阶段,输入样本将由各子模型分别处理,随后通过决策融合策略整合各子模型输出,生成最终的故障诊断结果。该方法高效利用了多工况数据,旨在减少信息损失(Chen等人,2024)。基于融合的框架的结构示意如图9所示。 图9 基于融合的框架示意图 Ye等人(2022)提出了一种深度负相关多源域适应网络(DNC-MDAN),该方法将来自多个源域的适应特征集成到基于负相关的集成分类器中,最终结果通过子分类器输出的平均值获得。He等人(2020)提出了一种集成迁移卷积神经网络方法,该方法针对每个源域训练对应的CNN,并利用目标域数据进行微调,随后设计决策融合策略整合所有CNN的预测结果,生成综合诊断结果。Xu等人(2023)提出了一种决策自调节网络(DSRN),构建多个CNN子分类器,并利用评分单元调节各子模型在特定工况下的诊断结果,同时采用多分类器和集成学习算法解决故障诊断中的类别不平衡问题。Liu等人(2023)提出了基于证据集成偏好引导学习(EEPL)的方法,利用递归证据推理技术整合基分类器在基于集成的宽度学习系统(BLS)中的信息,并引入迭代参数更新机制,实现对不同工况的实时调整。Yu等人(2013)提出了基于贝叶斯推断的高斯混合贡献指数(BIGMC),将多个局部贡献指数融合成单一的全局贡献指数,有效识别关键故障变量。基于此,Ma等人(2018)引入了考虑工业工况与综合质量相关故障关系的贝叶斯推断鲁棒高斯混合贡献指数(BIRGMC)。Li等人(2023)提出了一种特征级和类别级多源域适应方法(FC-MSDA),通过信息融合模块整合来自域特定分类器的多重预测,该融合模块利用源域与目标域共享特征的相似性。 7.2 基于工况辨识的框架同样,基于工况辨识的多工况故障诊断方法也在离线阶段为每个已知工况构建子模型。其与基于融合的框架的主要区别在于,在线阶段首先识别当前工况,然后选择对应的子模型进行故障诊断,如图10所示。 图10 基于工况辨识的框架示意图 Jiang等人(2016)采用基于贝叶斯推断的工况识别方法,针对每个工况构建独立的局部主成分分析(PCA)模型,以消除变量间的多重共线性并提取潜在因子,同时利用遗传算法(GA)进行最优主成分(OPC)选择,随后基于OPC构建贝叶斯诊断系统进行故障诊断。Chen等人(2018)在离线阶段为每个工况建立独立的PCA子模型,在在线阶段识别出工况后,应用对应子模型对样本进行降维,利用子模型有助于故障检测与隔离,实现对电力牵引系统多工况传感器早期故障的精准诊断。Shang等人(2019)提出了一种基于贝叶斯学习的条件无关递归变换成分统计分析(CIBL-RTCSA)方法,针对多工况下的早期传感器故障问题,离线阶段独立计算各工况的参考统计量,在线阶段在完成工况识别后采用基于窗口切换的多重RTCSA方法,以提升故障检测与隔离性能。Liang等人(2022)提出了一个面向多工况固定翼无人机故障诊断的数据驱动框架,该框架基于共享最近邻距离(SNND)采用基于密度的噪声应用空间聚类(DBSCAN)和k近邻(KNN)算法实现离线工况分类与在线工况识别,工况识别后应用多工况导向动态KPCA(MDKPCA)算法进行故障诊断。 8 典型实际应用场景MCFD已广泛应用于机械系统、化工系统、能源系统和卫星系统等多个领域,如表3和表4所示。由于不同诊断对象具有各自独特的数据特性,对诊断模型所提出的挑战也各不相同。本节将围绕MCFD的两个主要应用场景展开:机械系统和化工系统。 表3 近年来基于单模型的多工况故障诊断方法汇总 表4 近年来基于多模型的多工况故障诊断方法汇总 8.1 机械系统机械部件是工业设备中的关键构成要素,其运行状态直接关系到整个系统的可靠性与安全性(Lu等人,2023)。典型的机械系统通常由多个核心部件构成,如轴承、转子和齿轮箱等,如图11所示。这些部件的协同运行不仅决定了设备的整体性能,还对其使用寿命和维护成本产生重要影响。机械系统具有广泛的应用场景,典型实例包括钻井平台机械、自动化生产线和交通运输系统等。 图11 典型机械系统实验平台示意图(Liu等人,2024) 机械系统中的故障不仅会中断生产流程,还可能对人员造成严重的安全威胁,进而导致设备损坏、经济损失甚至人员伤亡。因此,实施准确高效的机械系统故障诊断显得尤为重要。为此,通常在关键部件上安装振动传感器,以采集生产过程中产生的振动信号。随着传感器技术的不断发展,传感器的采样频率和灵敏度已显著提升,使得能够实时获取大量高质量数据(Chen等人,2023a)。这些数据通常由专家进行标注,构建成离线数据集,为故障诊断模型的训练提供了坚实基础。对于机械系统而言,速度和负载的变化频繁出现,这些变化常由生产波动或环境扰动引起。例如,在城市轨道列车运行过程中,启动、制动、加速和减速等工况会导致齿轮箱转速频繁变化;在工业机器人中,任务变化(如运动路径差异或负载重量不同)会使关节轴承的负载发生频繁波动;在风力发电系统中,风速、温度以及市场需求的波动会导致齿轮箱转速和负载呈现非平稳变化。这些变化引入了不同的工况条件,从而导致数据分布显著变化,进而削弱现有故障诊断模型的性能,给保持多工况下诊断精度带来了挑战。 从已调研文献中可以观察到,现有方法多数仍依赖于单模型方案。其中,基于手工特征的方法是一类常见的技术框架。此类方法通常结合信号处理技术以消除与工况相关的特征,从而从振动信号中提取出与故障无关的特征,有助于提高诊断精度。域适应和域泛化技术被广泛应用于减少对大规模标注数据的依赖,同时增强模型在不同工况下的泛化能力。域适应方法通常需要目标域中有足够的样本数据,以实现有效的迁移。然而,考虑到机械系统对实时性的高要求,此类方法可能难以快速适应快速变化的运行环境。相比之下,域泛化方法通过在多个源域中提取故障不变特征进行模型训练,无需目标域数据。因此,域泛化方法更适用于存在过渡工况或未知工况的机械系统应用场景。相关技术的发展为复杂工业环境下的机械系统故障诊断提供了新的可能性,推动了该研究领域的进一步进展。此外,文章对研究中常用的典型多工况机械数据集进行了整理,见表5。 表5 典型多工况机械数据集汇总 8.2 化工系统化工系统通常涉及剧烈的化学反应,伴随有大量热释放或有毒副产物的生成。典型的化工系统实验平台如图12。化工系统的典型应用包括食品加工、矿物处理、火力发电等。在发生故障时,这类反应可能导致灾难性后果,例如有害物质泄漏或爆炸。相比其他工业过程,化工系统中的故障更容易引发严重的安全事故。因此,化工系统中多工况问题近年来已成为一个重要的研究热点。化工系统本身具有高度复杂性,这使得基于传统模型的故障诊断方法难以构建精确的数学模型。在此背景下,数据驱动的故障诊断方法成为一种可行且有效的替代方案。 图12 典型化工系统实验平台示意图(Li等人,2023) 化工系统通常配备多个传感器,用于采集多维度的运行数据。然而,由于化工过程存在反应延迟,即输入与输出之间存在时间滞后,其传感器采样频率显著低于机械系统。化工过程中常见的监测参数包括温度、压力、流量、搅拌速度等,其中任意参数的异常均可能引发系统故障,导致潜在故障类型远多于机械系统。此外,受原料配比变化、生产调度波动以及启停操作等多种因素影响,化工工业中多工况过程十分常见。例如,在火力发电过程中,煤种差异、运行设定点变化及市场需求波动常导致系统处于多种运行工况下;在石油蒸馏过程中,原油质量的变化及催化剂老化会引起反应速率与产品分布的改变,进而导致运行工况发生变化。这些工况变化使得相同故障在不同工况下表现出不同的数据特征,显著增加了故障诊断的难度。因此,如何在多变工况下实现准确的故障识别,已成为当前亟需解决的关键问题。 现有文献表明,相较于机械系统,化工系统中的MCFD研究仍相对较少,展现出巨大的发展潜力。然而,近年来,化工系统多工况过程监测问题逐渐受到关注(Zhang等人,2022)。目前大多数研究主要聚焦于故障检测,但在故障隔离方面仍面临诸多挑战。这表明虽然故障的存在能够被检测到,但准确定位具体故障源仍较困难,从而显著增加了故障排查的复杂性与维护成本。如表4所示,多模型方法的应用主要集中在化工过程领域。其背后可能的原因是:在化工系统中,工况变化对传感器数据的影响更为显著,不同工况下的数据分布差异更大。因此,分别对各工况建模的方法能够更有效地捕捉故障特征。9 结论与展望本文系统梳理了MCFD领域的研究成果。本文首先对多工况问题进行了数学定义,以增强问题理解的清晰性;随后,对已有研究进行了详细分类与总结,涵盖了各类MCFD方法的技术路线;此外,还深入分析了典型应用场景及当前面临的挑战。近年来,随着研究的不断深入,多工况故障诊断已成为智能运维领域的重要研究方向。基于对现有文献的调研与分析,本文总结了未来值得关注的发展趋势: 1)样本类别不平衡问题亟待解决 现有研究普遍默认健康与故障样本数量大致平衡,但在真实工业场景中,设备一旦出现故障往往会被立即停机以避免进一步损坏,因此能够收集到的故障样本远少于正常样本。这种类别失衡极易导致模型训练偏向正常状态,影响故障识别的准确性。尤其对于依赖数据驱动的模型来说,合理处理类别不平衡是模型设计中的关键问题。重采样、样本加权等方法已被证明是有效的缓解策略,有助于提升模型的稳健性和泛化能力。 2)增强模型可解释性是实际应用的关键 尽管基于深度神经网络的MCFD方法在性能上表现优异,但其“黑盒”特性常常导致工程师对诊断结果缺乏信任,阻碍了实际应用的推进。因此,提升模型的可解释性已成为该领域的重要研究方向。当前,具有可解释能力的人工智能(XAI)技术为解决这一问题提供了新思路。通过将XAI方法融合进深度模型,不仅可以提升诊断结果的透明度与可信度,还能够辅助故障定位与隔离,从而有效降低运维成本。 3)工况辨识能力决定模型适应性 在大量文献中,工况已知常被作为前提假设,进而开展多工况适应。然而,在实际工业运行中,由于环境噪声等干扰因素,在线实时识别系统当前所处的工况并非易事。因此,构建鲁棒的工况识别模块是提升诊断系统实际可用性的重要一环。近年来,借助深度学习提升工况识别准确率成为一条可行路径,为解决实际应用中的不确定性问题提供了技术支撑。 4)需提升模型对新工况的适应能力 大多数现有方法在训练阶段采用离线建模,部署后便直接用于在线诊断,但工业现场环境复杂多变,难以在建模阶段囊括所有可能工况。为此,一些研究引入了数据生成方法,通过在已有数据基础上合成样本,增强模型的泛化能力,已在未知工况条件下展现出良好效果。此外,也有研究尝试将增量学习引入在线阶段,使模型能够随着新数据不断适应环境变化,从而持续保持高水平的诊断能力。 5)需关注工况间标签分布差异带来的影响 目前多工况故障诊断的研究多数假设不同工况间标签分布一致,仅数据分布存在差异。但在真实生产中,不同工况下的故障类型和出现频率可能存在显著差异,即“标签漂移”现象。此时,仅依赖提取“工况无关特征”的方法往往难以获得理想效果。为应对此问题,研究者已尝试引入成本敏感学习、类别对齐等策略以缓解标签漂移对模型性能的影响,并取得了初步成果,为该问题的解决提供了有益探索。编辑:李正平校核:陈凯歌、赵栓栓、赵学功、白亮、曹希铭、任超、冯珽婷、陈宇航、陈莹洁、王金、赵诚、肖鑫鑫该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除。来源:故障诊断与python学习

    未登录
    还没有评论
    课程
    培训
    服务
    行家
    VIP会员 学习计划 福利任务
    下载APP
    联系我们
    帮助与反馈