本期给大家推荐一篇SCI一区论文:一种用于轴承复合故障的基于仿真数据驱动的多智能体广义零样本诊断方法。论文针对滚动轴承复合故障诊断中训练数据匮乏的问题,提出了一种基于仿真数据的多智能体广义零样本学习(GZSL)方法。该方法利用动力学模型仿真轴承振动信号,并通过CycleGAN构建语义映射模型和特征生成模型,有效地解决了传统ZSL方法中语义构建偏差和域偏移问题。此外,本文还引入了多智能体深度强化学习(MADDPG)算法,将诊断任务分解为多个子任务,由不同智能体协同完成,进一步提高了诊断准确率。
论文链接:通过点击本文左下角的阅读原文进行在线阅读及下载。
论文题目:
Simulation-data Driven Generalized Zero-Shot Learning for Multi-agent Bearing Compound Fault Diagnosis
论文期刊:Knowledge-Based Systems
论文日期:2025年
论文链接:
https://doi.org/10.1016/j.knosys.2025.113595
作者:Yi Qin (a,b), Xiwen Liu (a,b), Xin Li (a,b), Yongfang Mao (c)
机构:
a:State Key Laboratory of Mechanical Transmission for Advanced Equipment, Chongqing University, Chongqing 400044, China;
b:College of Mechanical and Vehicle Engineering, Chongqing University, Chongqing 400044, China;
c:School of Automation, Chongqing University, Chongqing 400044, China.
作者简介:
秦毅,教授。2000年至2004年在重庆大学机械工程及自动化专业学习,获学士学位,并推免到重庆大学机械电子工程系攻读硕士学位;2004年至2008在重庆大学机械电子工程专业硕博连读,获工学博士学位,其博士论文获重庆市优秀博士论文;2009年1月留校任教;2013年1月至2014年1月在密西根大学安娜堡校区作访问学者。主要从事机械状态监测与故障诊断、智能制造、智能结构及其应用等领域的研究。(来自学校官网)
摘要
1 引言
2 预备知识
2.1生成对抗网络
3.1 复合故障滚动轴承动力学建模
3.2 所提出的特征与语义处理模块
由于训练的复合故障数据较少,单故障和复合故障的智能故障诊断面临巨大挑战。通过利用单故障与复合故障之间的耦合关系,广义零样本学习(GZSL)方法能够利用已知单故障的数据来识别未知的复合故障。然而,当前的GZSL方法存在以下关键问题:构建的故障语义与实际特征不符,且训练模型受到多种单一故障数据的影响较大。因此,本文提出了一种新的语义构建方法,通过仿真数据训练语义映射模型,以增强生成语义与实际语义的一致性。此外,还提出了一种改进的多智能体深度强化学习(MADRL)协作诊断网络,以提高分类能力,该网络通过定制交互环境,为每个智能体分配特定组件的诊断子任务。最后,建立了一个多智能体GZSL轴承故障诊断框架。该框架的有效性和优势通过三个轴承数据集在GZSL诊断任务中得到了验证。
在故障诊断领域,基于深度学习的智能方法已广泛应用于齿轮[1,2]和滚动轴承[3,4]等关键设备。然而,智能算法通常需要大量的标注数据来进行模型训练[5]。尽管单故障数据促进了相对稳健的数据共享生态系统[6],但缺乏标记的复合故障数据。在实际工程中,由于连锁反应[7],多个故障更可能出现在组件的多个部分或多个系统组件之间。当复合故障发生时,其风险通常远比单一故障严重[8]。因此,制定合理的维护计划变得更加困难。因此,即使没有复合故障样本,探索诊断复合故障的方法也具有重要的价值。
零样本学习(Zero-shot learning,ZSL)是一种先进的机器学习方法,旨在解决某些类别[9]数据不足的问题。其核心理念是利用已知类别的数据训练模型,并借助先验知识指导该模型识别未知类别。传统模型学习识别已见过样本的标签。相比之下,零样本学习(ZSL)模型则专注于预测未见过样本的标签。此外,广义零样本学习(GZSL)模型旨在对所有样本的标签进行分类,涵盖已见过和未见过的类别。由于单故障与复合故障信号之间存在耦合关系,ZSL方法已被应用于复合故障诊断。这些方法利用单故障类别的标记数据来训练智能模型。此外,通过先验知识,从单故障语义构建复合故障语义,使模型能够识别之前未见过的复合故障类别。Xu等人[10]提出了一种包含多个模块的模型,其中包括标签信息向量定义模块、特征提取器和生成模块。Wang等人[13]提出了一种基于零样本学习的自适应加权语义自动编码器,用于复合故障诊断。然而,基于零样本学习的智能诊断方法仍面临两大核心挑战:
1)由于机械设备的复杂性,复合故障与单一故障之间的映射关系本质上是难以描述的振动信号的复杂性。现有的构建复合故障语义的方法[10,11]依赖于手动定义单个故障语义的线性叠加,仅使用有限的时间-频率索引作为语义。这些方法忽略了故障之间的复杂耦合关系,导致语义与实际情况不符,从而降低了模型的性能。
2)大多数研究,如[10,12],主要集中在零样本学习(ZSL)设置中,训练好的模型专门用于识别单一故障类别。然而,在实际工业环境中,单个故障和复合故障类别随机出现,这要求模型能够识别所有可能的健康状况。目前,少数研究[13-15]关注基于全局样本学习(GSZL)的故障诊断方法。然而,这些研究在处理单个故障类别时遇到了域偏差过大的问题,导致模型性能不佳。
在计算机视觉领域,GZSL模型能够学习图像的类别属性,例如颜色、形状和大小[16,17]。N.Belissent等人[18]将GZSL与农业中入侵杂草的检测相结合,通过图像嵌入和基于形态学及栖息地文本描述的方法,帮助识别未见过的类别。相比之下,为机械设备定义清晰且通用的语义较为困难,因为振动信号受多种因素影响,包括设备类型、操作条件、传感器参数和环境噪声。然而,所有机械设备在不同健康状态下都能产生振动响应,通过建立和解决动力学模型[19]。
最近的研究[20,21]将动态建模分析与智能模型诊断相结合。Dong等人[21]本文研究了一种基于动态模型和迁移学习的滚动轴承故障智能诊断框架。尽管仿真信号与实际测量信号存在显著差异,但单故障与复合故障之间的耦合物理关系依然保持一致,尤其在包络谱[22]中表现得尤为明显。因此,基于这一观察,可以利用动态建模获得的仿真信号,训练生成模型学习单故障与复合故障之间的语义映射关系,从而构建有效的故障诊断语义。
深度强化学习(Deep reinforcement learning,DRL)将深度学习的强大感知能力与强化学习(Reinforcementlearning,RL)的决策优势相结合[23]。赵等人[24]改进了深度强化学习(DRL)算法,用于生成公式化的金融阿尔法因子,并引入信息比率作为奖励机制,这与理论结果高度一致。基于DRL的故障诊断方法研究取得了令人鼓舞的成果[25,26],展示了增强的鲁棒性和泛化能力[27]。多智能体深度强化学习(MADRL)将DRL技术扩展到涉及多个智能体的决策问题[28]。因此,在共享环境中,强调智能体之间的合作与竞争,以实现各自的目标。MADRL能够将复杂任务分解为多个子任务,每个智能体负责处理一个特定的子任务。MADRL通过利用分工与合作,提高了任务效率并确保了高鲁棒性。MADRL算法在复合故障诊断中得到了改进,以应对GZSL中域偏差导致的诊断准确性下降问题。具体而言,整个诊断任务被设计为一个涉及多个智能体的协作过程。每个子任务专注于判断某个特定组件是否出现故障。各个智能体分别处理这些子任务,它们的决策结果被整合起来,以评估整体的健康状况。
基于上述讨论与分析,提出了一种以滚动轴承动态仿真数据为驱动的网络模型映射方法,旨在解决传统零样本学习(ZSL)故障诊断中语义构建时物理信息不足的问题。此外,针对滚动轴承符合故障,提出了一种多智能体协同诊断网络架构来实现广义零样本学习目标并降低领域偏差的影响。最后,提出了一种基于仿真数据的先进多智能体GZSL方法,用于轴承复合故障诊断。本研究的主要贡献如下:
1)构建了一个动态模型,用于仿真不同故障类型下的轴承振动信号。在此基础上,提出了一种新的语义构建方法。首先,利用复合故障动力学模型生成的数据构建并训练了一个语义映射模型。接着,建立了一个生成模型,以学习单故障与复合故障语义之间的耦合映射关系。这种方法提高了生成的语义与实际语义的一致性。
2)提出了一种改进的MADRL协同诊断网络,以实现高精度的GZSL诊断。每个智能体负责诊断滚动轴承的特定部件。交互环境经过定制,旨在指导多个智能体的合作,从而实现故障特征的有效识别。
3)基于上述研究成果,构建了多智能体GZSL故障诊断框架,并通过三个轴承数据集的对比实验和消融实验验证,该方法在GZSL诊断任务上的表现优于其他先进方法。
本文其余部分分为五个部分。第二部分简要介绍了相关的循环生成对抗网络(CycleGAN)和多智能体深度确定性策略梯度(MADDPG)。第三部分详细阐述了为轴承设计的多智能体GZSL故障诊断方法。第四部分通过在三个数据集上的实验,验证了该方法的优势。最后,在第五部分中,总结了研究结论并展望了未来的研究方向。
2.1 生成对抗网络
作为最知名的生成模型之一,GAN[29]及其众多变体被广泛应用于数据生成和转换。CycleGAN的核心在于学习如何从一个领域(如夏季风景)映射到另一个领域(如冬季风景)。如图1所示,CycleGAN包含两个生成器和两个判别器。生成器 负责从 领域转换到 领域,而生成器 则执行反向转换。判别器 和 用于评估输入样本是否符合相应领域的特征。
2.2 多智能体深度确定性策略梯度
所有强化学习(智能体RL智能体)算法都依赖于智能体与环境之间的交互结果。强化学习问题被建模为马尔可夫决策过程(MDP)[30],并通过四元组 进行定义。,其中 代表状态空间智能体, 代表动作空间智能体, 表示状态转移概率, 表示奖励函数。
多智能体深度强化学习(MADRL)将强化学习扩展到涉及多个智能体的决策问题。基于Actor-Critic框架的MADDPG算法[31]是一种专为协作与竞争环境中连续动作空间问题设计的MADRL算法。该算法通过集中训练与分散执行(CTDE)的架构,解决了多智能体系统中的非平稳性问题。在训练阶段,每个策略网络都能获取全局信息,包括所有智能体的观测值、动作和环境状态;而在执行阶段,每个智能体仅根据自身局部观测值和训练好的策略网络独立做出决策。
通过比较计算机视觉广义零样本学习(GZSL)中先验知识定义的属性表,本文提出了一种基于动态模型仿真数据的新语义构建方法。该生成模型学习了从单一故障语义到复合故障语义的映射关系,以及从故障语义到特征向量的映射关系。最终通过多智能体的协同决策实现故障识别。
3.1 复合故障滚动轴承动力学建模
首先构建滚动轴承的动态模型,该模型包含任意故障(单个或复合故障),以仿真不同故障类型下的振动信号。常见的轴承故障类型包括外圈故障、内圈故障和滚动体故障。在该动态模型中,所有故障被简化为一个长 、宽 、深 的立方体坑。因此,由故障引起的最大位移激励 计算如下:
其中 表示滚动体的直径。
图2(a)展示了外圈故障的情况,其中 表示与外圈故障区域对应的中心角度,而 则表示故障区域外边界与X轴在初始时刻的角度。外圈故障 的位移激励函数可通过考虑半正弦激励来定义:
图2(b)展示了内圈故障,其中 表示中心角。与外圈故障不同,滚动轴承的内圈通常随轴一起旋转。因此, 是时间 的函数,可定义如下:
其中, 表示内圈的旋转角速度, 表示初始时刻内圈故障区域外边界与X轴之间的角度。因此,内圈故障 的位移激励函数可定义如下:
图2(c)展示了滚子故障的情况,其中 表示内圈故障区域对应的中心角度,而 则对应于外圈。滚动球故障 的位移激励函数可定义如下:
其中,
其中
故障轴承的2-DOF动态方程可表示如下:
其中
等式(7)可通过Runge-Kutta算法求解,得到滚动轴承在各健康状态下的仿真振动信号。
3.2 所提出的特征与语义处理模块
所有振动信号经过CNN特征提取器处理,得到故障特征,每个信号样本转换成低维特征向量,便于分类,所有测量的复合故障数据均未进行训练,以确保符合GZSL原则。因此,CNN仅在单故障数据上进行训练以提取有效的故障特征,其目标函数定义如下:
卷积神经网络(CNN)的结构参数详见表1。每个“ConvBN”模块包含一个卷积层、一个批量归一化层和一个最大池化层。所有数据均输入到训练好的CNN特征提取器中。全局平均池化(GAP)层输出了所有振动样本的特征向量,作为后续特征生成和故障识别模块的输入。
作为GZSL中的关键先验知识,故障语义弥合了单一故障与复合故障诊断之间的差距。这直接影响模型性能,使其成为识别复合故障类型的关键。
本文提出了一种基于仿真信号的语义构建方法。通过分析轴承动力学模型,获取了仿真故障信号。这些信号作为先验知识数据,提供给CycleGAN进行自适应学习。通过神经网络实现了从单一故障到复合故障语义的映射。
由于振动信号通常包含背景噪声、载波信号和其他干扰,因此包络频谱被用作语义信息,频谱滤除了这些噪声,并通过以下计算完全反映了故障信息:
其中
基于CycleGAN建立了两种生成映射模型,用于生成复合故障特征,并将所有实际测量的复合故障信号从训练过程中排除:
•语义映射模型的主要目标是学习单故障语义(
•特征生成模型,该模型的最终目标是通过故障语义生成故障特征向量,所有测量的单故障数据均作为训练数据。从等式(9)派生的故障语义构成
这两款模型的具体结构参数详见表1,其结构将在后续章节(图4)中详细展示。每个“ConvIN”模块包含一个卷积层、一个实例归一化层和一个ReLU激活层。“DeConv”模块则用反卷积层替换了卷积层。尽管这两款模型的结构和输入不同,但它们都是基于CycleGAN的生成网络,由两个生成器和两个判别器组成。它们的目标函数包括对抗损失、循环一致性损失和身份损失。对抗损失是所有生成对抗网络(GANs)的基本组成部分,确保生成的数据与目标域数据高度一致。对抗损失的定义如下:
循环一致性损失确保生成的数据能够映射回原始数据,从而促使生成器
身份丢失有助于神经网络更好地识别和保存目标域所需的数据特征,从而提高生成数据的质量:
所有损失的加权和构成了CycleGAN的完整目标函数,其表达式如下:
其中
表1 特征处理模型的结构参数
3.3 所提出的多智能体故障识别模块
如图3所示,整体故障诊断任务根据机械设备的不同部件被划分为多个子任务。每个子任务负责判断特定部件(例如内圈、外圈或滚动体)是否出现故障。各个智能体被分配处理这些子任务,它们的决策综合起来以评估设备的整体健康状况。在多智能体故障识别模块中,智能体交互的环境表示为:
其中,
当
其中
奖励函数是深度强化学习的关键组成部分,旨在鼓励每个智能体准确行动。在多智能体故障诊断任务中,为每个智能体定义了个体奖励
全局奖励根据训练期间所有智能体的共同决策确定。如果所有组件均被正确诊断,则会获得正向的全局奖励;反之,若任何组件被错误诊断,则会受到惩罚:
其中
其中,是一个缩放因子,确保奖励值保持在适合网络学习过程中收敛的范围内。
MADDPG用于在多智能体故障识别模块中更新智能体。每个智能体在MADDPG算法中初始化四个神经网络:策略网络(Actor)、价值网络(Critic)及其对应的靶向网络。每个智能体根据其独立的actor网络生成动作,并利用critic网络计算该动作的Q值。通过梯度反向传播更新actor和critic网络的参数,以优化策略和价值函数。actor策略网络通过最大化Q值来更新:
每个智能体的批评值网络接收所有智能体的联合状态和动作,并输出各自智能体的Q值。该网络通过时间差分(TD)误差来更新集中式Q值函数:
其中
目标actor 和 critic网络确保训练期间的学习稳定。目标网络通过软更新逐步更新:
由于交互式环境中使用的输入是CNN特征提取器提取的特征向量,因此所有智能体网络均配置为全连接层。
3.4 多智能体广义零样本故障诊断方法的流程
基于上述任意故障的轴承动力学模型、特征与语义处理模块以及多智能体故障识别模块,开发了多智能体广义零样本故障诊断方法,其框架如图4所示。
为实现该方法,其详细步骤如下:
1)建立了包含单故障和复合故障在内的任意故障目标滚动轴承的动态模型,利用Runge-Kutta算法计算了各种故障类型下的振动信号。
2)所有振动信号,包括测量数据和仿真数据,都通过希尔伯特变换处理,以提取相应的故障语义。
3)特征提取模型采用单个故障的振动信号进行训练,将每个振动信号样本转换为低维特征向量。
4)语义映射模型通过仿真单故障语义和复合故障语义进行训练,使生成器I能够学习从单故障到复合故障语义的转换映射。
5)特征生成模型通过利用测量到的单故障语义及其对应的特征向量来进行训练,从而使生成器Ⅲ具备从故障语义生成故障特征的能力。
6)通过生成器I处理测量的单故障语义,生成相应的复合故障语义,然后输入到生成器Ⅲ中,生成最终的复合故障特征向量。
7)将单个故障和生成的复合故障的特征向量作为多智能体故障识别模型的训练数据,基于故障特征对所有健康状态进行准确分类。
所有测量的复合故障数据均不用于训练,以确保符合GZSL原则。在对所提出的模型进行训练后,针对目标故障的诊断过程仅包括两个连续的步骤:首先,原始信号经过特征提取模型处理,得到特征向量;然后,该特征向量经过多智能体故障识别模型分析,得到最终的诊断结果。
4.1 数据集描述和实现细节
基于三个轴承数据集开展了多项消融实验和广义零样本学习诊断任务,通过与先进广义零样本学习方法的对比,验证了所提方法的有效性和优势。表2列出了三个数据集中测试滚动轴承的参数及所有故障类型的尺寸规格。以下是这三个数据集的补充细节说明。
表2 三个数据集中滚动轴承的测试参数
1)私有轴承故障检测(BFD)数据集。该数据集来源于我们自主研发的轴承故障测试台,测试台由负载电机、减速器、驱动电机和测试滚动轴承组成。采用了七种滚动轴承的健康状态:正常(NC)、内圈故障(IF)、外圈故障(OF)、滚动体故障(BF)、内圈与外圈复合故障(IO)、内圈与滚动体复合故障(IB)、外圈与滚动体复合故障(OB)。原始振动信号由两个加速度传感器采集。在实验中,测试的滚动轴承以1000 rpm 的速度运行,负载为4 Nm,采样频率设定为12 kHz。
2)东北电力大学([32])提供的NEEPU轴承数据集。该数据集中仿真故障类型包括NC、IF、OF、BF、IO、IB和OB。实验中,轴承的输入转速在1443至1478 rpm 之间变化,同时通过磁制动施加了0.2 Nm的负载。采样频率设定为12 kHz,采样时间为55 s。
3)PU数据集。PU轴承数据集由帕德博恩大学[33]提供。测试装置包括电动机、扭矩传感器、测试滚动轴承、飞轮和负载电机。在1500 rpm 的速度和0.7 Nm的负载下进行了轴承故障实验,包含四种健康状态:NC、IF、OF和IO。故障振动信号以64 kHz的采样频率采集。
在所有比较实验中,单故障类别NC、IF、OF和BF被视为已见类别。相比之下,复合故障类别IO、IB和OB则被视为未见类别。因此,数据集A和B中使用了NC、IF、OF和BF作为训练数据。而数据集C中仅使用了NC、IF和OF作为训练数据。所有类别均作为测试数据。滑动窗口采样技术被应用于三个数据集,以获取足够的数据样本,采样窗口大小设定为3072。所提出的模型需要配置多个超参数,包括学习率、批量大小、训练轮数和折扣因子等。所有网络的批量大小均设为32,特征提取模型的学习率和训练轮数分别设定为0.0002和5000。折扣因子设为0.2,以鼓励智能体关注当前奖励。表3列出了所提出的模型在三个数据集上的超参数设置。此外,该模型在TensorFlow平台上使用NVIDIA2080Ti显卡实现。
表3 针对三个数据集的模型超参数
4.2 仿真信号和语义分析
通过将表2中每个测试平台的轴承参数和故障尺寸整合到上述建立的动力学模型中,可以获取与每个数据集中的测试滚动轴承相对应的仿真振动信号。图5展示了数据集A中三种健康状态(IF、OF和IO)的测量和仿真振动信号的时间域图。与之对应,图6展示了通过希尔伯特变换得到的相应包络谱。
比较分析显示,由于实际场噪声的干扰,测量信号在时域图中明显不如仿真信号清晰。此外,复合故障(IO)与单个故障(OF和IF)之间的耦合关系非常复杂,难以总结和解释。包络谱中的幅度峰值集中在故障频率附近。数据集A中滚动轴承的OF故障频率为101Hz。仿真理论状态下,对应的IF故障频率为132Hz。尽管测量信号与理论仿真信号的故障频率存在偏差,但复合故障(IO)与单个故障(OF和IF)之间的耦合关系在这两种情况下依然明显。IF和OF故障频率出现在IO复合故障中。因此,选择包络频谱作为生成复合故障特征的语义。
4.3 比较实验与讨论
已见类识别准确率
为验证所提出方法,我们在三个数据集上对比了多种最先进的广义零样本学习方法,包括来自计算机视觉领域的CE-GZSL[16]以及故障诊断领域的AWSAE[13]、CGASNet[14]和ZS-BDT[15]。所有方法均在每个数据集上进行了超过三次的训练与测试,各方法在整个过程中的最佳性能记录于表4中。
表4 三种数据集上不同方法的结果
实验结果显示,大多数方法在已见过的类别上能够达到较高的分类准确率。然而,对于未见过的类别,这些方法的表现显著下降。这表明所有深度学习模型都严重依赖于训练样本。此外,GZSL方法在构建未见过类别的语义或特征时存在偏差,导致准确率下降。相比之下,所提出的方案表现最佳,在三个数据集上的
4.4 消融实验和分析
为评估所提出的语义映射与多智能体诊断模块的有效性,研究进行了大量消融实验,将多种模块组合与广义零样本学习基线方法进行对比。基线方法采用CycleGAN框架,通过振动信号多个时频指标的线性叠加构建语义特征;MA(·)表示多智能体联合识别模块,SM(·)代表基于仿真信号的语义映射构建方法。实验共部署四种模型进行广义零样本学习任务:基线模型、基线+MA(·)模型、基线+SM(·)模型以及基线+SM(·)+MA(·)组合模型。
如图7所示,基线方法主要识别单一故障类别(已见类别),导致显著的领域偏移问题。相比之下,基线+SM模型能更好地识别复合故障类别(未见类别)。这一结果表明,SM模块能够捕捉复合故障与单一故障类别之间的映射关系,有助于通过仿真信号识别未见类别。与传统识别网络相比,MA模块的表现更加稳定和准确。表5展示了四个模型在三个数据集上的实验结果。可以看出,所提出的方法在所有任务中都表现出强大的泛化零样本诊断能力。
表5 四种模型诊断结果的调和平均准确度
本文提出了一种基于仿真数据的多智能体GZSL故障诊断方法,用于仿真轴承故障。首先,建立了包含任意单一或复合故障的滚动轴承动态模型,以获取所有健康状态下的仿真振动信号。这些仿真信号作为辅助信息,用于训练语义映射模型。此外,特征生成模型利用单故障数据学习了语义与特征向量之间的映射关系。最后,除了测量的复合故障特征向量外,所有其他特征向量被用于定义多智能体故障识别模块中的交互环境,实现了高精度的GZSL诊断。在三个轴承故障数据集上进行了广泛的比较和消融实验,证明了该方法具有强大的性能。
然而 ,所提出的方案仅专注于滚动轴承内部不同位置的故障类型 , 而未涉及其他关键部件的故障。未来的研究将扩展该方法 ,用于诊断复 杂机械系统中多个部件的复杂故障。