SCI一区论文学习 | 基于年龄和状态依赖的跳变扩散过程的退化系统的剩余寿命预测_ACT_System_振动_疲劳

SCI一区论文学习 | 基于年龄和状态依赖的跳变扩散过程的退化系统的剩余寿命预测

本期给大家推荐一篇SCI论文基于年龄和状态依赖的跳变扩散过程的退化系统的剩余使用寿命预测。剩余寿命（Remaining Useful Life, RUL）的预测在预测和健康管理（Prognostics and Health Management, PHM）领域具有重要意义，可以提供有关系统的寿命信息。有效估计RUL的基础是为系统构建一个适用的退化模型。然而，现有的大多数退化模型只考虑了年龄依赖性问题，而忽略了状态依赖性。此外，系统运行环境的变化将导致退化状态跳变，这将影响退化路径和RUL估计的精度。文章提出了一种用于RUL估计的广义年龄状态依赖跳变扩散（Age-State Dependent Jump-Diffusion, ASDJD）模型。基于首达时间（First Hitting Time, FHT）推导了RUL分布的近似解析表达式。期望条件最大化（Expectation Conditional Maximization, ECM）和极大似然估计（Maximum Likelihood Estimate, MLE）用于估计模型的未知参数。通过模拟数据集和西安交通大学轴承数据集验证了所提出的模型。

论文链接：通过点击本文左下角的阅读原文进行在线阅读及下载。

论文基本信息

论文题目： Remaining useful life prognostic for degrading systems with age- and state-dependent jump-diffusion processes

论文期刊： ISA Transactions

论文时间：2025年

论文链接:

https://doi.org/10.1016/j.isatra.2024.12.019

作者：

Bincheng Wen (a), Mingqing Xiao (a), Xilang Tang (b), Yawei Ge (c), Xin Zhao (a), Haizhen Zhu (a)

机构：

a: ATS Lab, Air Force Engineering University, 710038 Xi’an, China;

b: Equipment Management and UAV Engineering College, Air Force Engineering University, 710038 Xi’an, China;

c:Strategic Evaluation and Consultation Center, Academy of Military Sciences, 100000 Beijing, China.

通讯作者邮箱:

1255292204@qq.com

摘要

剩余使用寿命（Remaining Useful Life, RUL）的预测在预测和健康管理（Prognostics and Health Management, PHM）领域具有重要意义，可以提供有关系统的寿命信息。有效估计RUL的基础是为系统构建一个适用的退化模型。然而，现有的大多数退化模型只考虑了年龄依赖性问题，而忽略了状态依赖性。此外，系统运行环境的变化将导致退化状态跳变，这将影响退化路径和RUL估计的精度。然而，现有的研究只考虑了一些影响因素，忽略了同时考虑年龄依赖、状态依赖和跳变。为了同时考虑年龄状态依赖（Age-State Dependent, ASD）和跳变，本文提出了一种用于RUL估计的广义年龄状态依赖跳变扩散（Age-State Dependent Jump-Diffusion, ASDJD）模型。基于首达时间（First Hitting Time, FHT）推导了RUL分布的近似解析表达式。期望条件最大化（Expectation Conditional Maximization, ECM）和极大似然估计（Maximum Likelihood Estimate, MLE）用于估计模型的未知参数。通过模拟数据集和西安交通大学轴承数据集验证了所提出的模型，结果表明在RUL估计过程中应考虑状态依赖性和跳变。

关键词：剩余寿命，跳变扩散，年龄-状态相关，预测

1 引言

对于关键组件和系统，随着工艺的恶化，预测方法力求获得准确的剩余使用寿命估计。基于可靠的预测结果，管理者可以确定设备维修的最佳时间，并制定相关的维护计划，旨在提高运行可靠性，降低风险和成本。目前，已采用多种方法来估算剩余使用寿命。这些方法大致可以分为基于物理模型的方法、机器学习（Machine Learning, ML）技术以及统计数据分析方法[1]。基于物理模型的方法通过分析系统的失效原理并开发相应的数学模型来表征系统的退化。这种方法常用于金属材料中裂纹扩展和疲劳退化的研究。例如，Eshwar等人[2]提出了使用扩展有限元方法对疲劳裂纹扩展进行建模，并利用卡尔曼滤波框架进行在线寿命预测。Wang等人[3]选择了帕里斯定律作为机身面板裂纹扩展模型，并使用扩展卡尔曼滤波估计模型参数。Deng等人[4]基于动态工作条件下的Archard磨损模型，提出了一种用于预测滚珠丝杠寿命的集成数据驱动粒子滤波模型。然而，各种降解系统具有独特的降解机制，因此开发一个通用的降解模型具有挑战性。此外，由于系统退化原理的复杂性，很难获取准确的物理退化模型。

与基于物理模型的方法不同，机器学习不需要考虑复杂的故障机制。目前，人工神经网络（Artificial Neural Network, ANN）[5]、相关向量机（Relevance Vector Machine, RVM）[6]、递归神经网络（Recurrent Neural Network, RNN）[7]、门控递归单元（Gated Recurrent Unit, GRU）[8]和长短期记忆（Long Short-Term Memory, LSTM）[9]等机器学习方法在PHM领域得到了广泛的应用。此外，为了应对预测不同操作环境的挑战，迁移学习在估计RUL领域的应用越来越普遍。赵等人[10]开发了一种基于Bi-LSTM和深度迁移学习的预测框架。Chen等人[11]提出了一种用于跨领域健康因素构建的迁移学习框架。ML的优点之一是它能够自动执行特征提取和融合。另一方面，多层网络增强了处理非线性映射关系的能力。然而，这种类型的模型，也称为黑盒模型，无法解释机器学习的结果。此外，数据的数量和质量对模型的训练有重大影响。在实际情况下，很难获得足够数量的退化数据。

与上述方法相比，统计数据驱动方法不需要完全了解降解机制或大量历史降解数据，并且由于RUL估计的有效性而被广泛采用[12]。Si等人[13]系统地回顾了常见的统计数据驱动方法，包括基于回归的模型[14,15]、基于马尔可夫的模型[16,17]、维纳过程（Wiener Process, WP）[18,19]、伽玛过程[20,21]。在这些方法中，WP因其能够模拟非单调退化而得到了广泛的应用。Zhang等人[22]对基于WP的退化模型及其在PHM中的应用进行了深入分析。Cai等人[23]使用线性WP研究了海底采油树系统的退化机制。Si等人[24]介绍了一种基于时空转换的非线性随机退化模型。Yu等人[12]提出了一种考虑三种不确定性来源的非线性WP模型。Gao等人[25]认为，外部环境会影响系统失效阈值，并提出了可变失效阈值的维纳退化模型。Zhang等人[26]提出了一种混合非线性函数WP，用于拟合轴承退化数据中的温度变化曲线，采用RVM进行参数学习和更新。扩展了当前的非线性情况。Chen等人[27]将非线性WP与GRU相结合，并在预测过程中使用滤波算法来更新模型参数。

尽管维纳退化模型在预测RUL方面表现出色，但它仍有两个问题需要进一步研究：（1）ASD退化过程，（2）随机跳变问题。许多工业部件的退化不仅与年龄有关，还与状态有关。例如，滚珠轴承[28]、疲劳裂纹[29]、金属合金[30]和气缸套[31]都表现出这种特性。现有文献[32]提出了一个新的表达式，该表达式假设增量与当前退化水平存在隐式依赖关系。通过著名的巴黎-埃尔多安定律来描述疲劳应力下应力强度因子范围与亚临界裂纹扩展之间的关系。同样，文献[29]提出了一种取决于裂纹状态和监测时间间隔的退化模型。因此，疲劳裂纹扩展是一个更典型的ASD退化过程。这些ASD退化现象在实践中经常遇到。然而，关于ASD的研究是有限的。Giorgio等人[30,31]提出了一个包含ASD的马尔可夫模型，该模型已应用于气缸套和金属合金的磨损过程。Orchard等人[33]考虑了退化过程中的状态依赖性，并构建了一个基于粒子滤波的预测框架来预测电池的RUL。同样，An等人[34]使用粒子滤波构建了一个状态相关的退化模型。Zhang等人[28]提出了一个包含ASD的扩散模型，用于估计轴承的RUL。Li等人[35,36]介绍了一种使用ASD扩散模型模拟退化过程的方法。该方法专门用于分析疲劳裂纹扩展和涡扇发动机。Pang等人[37]引入了ASD的退化模型，该模型考虑了单个单元之间的固有变异性。然而，在上述研究中，只有[28,35,37]与ASD扩散过程模型有关，没有发现更多相关研究。此外，马尔可夫模型[30,31]和扩散模型[28,35]都没有解释的跳变对RUL估计的影响。

在工业应用中，随着系统退化的加速，系统的稳定性逐渐恶化，系统退化状态发生跳变的概率增加[38]。这种现象通常被定义为退化-冲击依赖性。例如，文献[38]区分了轴承磨损和MEMS系统退化的不同阶段。随着系统随运行时间的累积退化，其抗冲击性降低，冲击对系统的影响将在不同阶段发生变化。此外，系统运行环境的突然变化可能会导致其退化状态的跳变。Wen等人[39]、Kong等人[40]和Zhang等人[41]通过根据跳变的位置将系统划分为不同的阶段，考虑了具有跳变的多相退化模型。然而，由于跳变次数和位置的随机性，上述模型不能准确反映实际的退化过程，导致RUL估计结果与实际情况之间存在显著差异，特别是在开始阶段。Pang等人[42]提出了一种具有跳变的单相WP，其中该模型中的跳变被描述为复合非均匀泊松过程（Compound non-Homogeneous Poisson Process, NHPP）。Zhang等人[43]提出了单相跳变-扩散模型，得到了RUL分布的解析解。Sun等人[44]得出结论，跳变对退化增量、退化速率和退化过程有影响，他们使用非线性WP构建了跳变-退化模型。时变copula函数构建了不同阶段失效过程的依赖关系。Wang等人[38]将系统分为四种状态：正常、缓慢退化、快速退化和失效退化；系统对跳变的抵抗力因州而异。然而，多相和单相模型在考虑冲击时都忽略了状态依赖性对退化过程的影响。

基于上述扩散过程分析退化模型表明，虽然已经对年龄-状态依赖的扩散模型和年龄依赖的冲击-扩散模型进行了研究，但它只考虑了影响系统退化过程的少数因素。年龄-状态依赖的扩散模型和年龄依赖的冲击扩散模型都没有同时考虑年龄依赖、状态依赖和跳变。ASD扩散模型中跳变的考虑仍然是一个很大程度上未被探索的领域。为了准确表示系统的退化状态，将随机跳变整合到ASD模型中至关重要。本文提出了一个综合考虑跳变的ASD扩散模型。使用ECM和MLE进行参数估计。本文的重要贡献总结如下：

(1)同时考虑退化中的年龄相关、状态相关和跳变问题，并构建了ASDJD模型

(2) 通过It'o公式和Larmpertier变换，得到了ASDJD模型寿命分布的解析解。此外，基于两步ECM和MLE对模型参数进行了估计和更新。

(3)利用数值模拟和西安交通大学的轴承数据对模型进行了验证。实验结果证明了ASDJD模型的有效性。

本文的其余部分结构如下：第2节介绍了。在第三节中，基于It'o公式和Larmperti变换，从理论上推导了RUL分布，并给出了一个例子。第4节介绍了一个使用ECM和MLE估计参数的框架。第5节包含一个数值模拟和一个真实案例，以验证所提出的模型。第6节总结了整篇文章。

2 ASDJD模型

设表示系统的退化过程，即具有跳跃的ASD扩散过程，变量表示系统在时间的状态值。系统的退化状态可以用以下形式表示：

其中是漂移项，是布朗随机积分，而表示复合泊松过程（Composite Poisson Process, CPP）。表示标准布朗运动，是漂移系数函数，而是扩散系数函数。和是系数函数的参数。是NHPP，即强度为的齐次泊松过程（Homogeneous Poisson Process, HPP）。表示跳变幅度，是一个独立同分布的随机变量，有。通常假设。

备注1.

(1) 如果，则表示为参考文献[42]中的年龄依赖跳变扩散模型；

(2) 如果 , 则表示为参考文献[24]中的年龄依赖扩散模型；

(3) 如果，则表示为参考文献[45]中的状态依赖扩散模型。因此，所提出的模型扩展了现有方法。

由于是由布朗运动驱动的WP，其寿命被定义为FHT。

其中寿命的概率密度函数（Probability Density Function, PDF）表示为 RUL的定义如下：

其中为RUL，其PDF为。

3 基于跳变扩散模型的RUL估计

3.1 理论推导

为了获得ASDJD模型的RUL分布，有必要将退化模型(1)转换为包含常数扩散系数的退化模型。因此，采用了Larmperti变换[47]和Ito公式[28,46]，其中前者用于将随机过程转换为随机过程。本文定义Larmperti变换如下：

为了进行推导的下一步，首先给出Ito公式中的引理1。

引理1.（[48]）:考虑随机过程，它代表一个具有跳跃的ASD扩散过程：

然后，对于任意函数，过程可以表示如下：

在本文中，被定义为(4)。我们结合(1)、(4)和引理1。经过许多数学操作，(1)被转换为一个常数扩散系数。

其中CPP 和漂移系数函数由引理1获得。

其中，描述了第次冲击时刻退化状态的左极限，而是拉姆佩蒂变换后退化状态的值。显然，是连续的。根据定积分的第一中值定理，可以简化为：

备注2. 通过利用引理1和Larmperti变换，广义ASDJD模型(1)可以等价地转换为一个具有常数扩散系数的随机过程(7)。在不牺牲一般性的前提下，接下来的部分将集中讨论具有常数扩散系数的ASDJD模型，其定义如下：

ASD模型（11）中跳变的存在性给RUL的解析解带来了挑战，首先提供引理2来解决这个问题。

引理2.对于泊松过程，均值定义为

值得注意的是，是泊松过程的参数。如果函数等于零，则退化过程的跳变不存在。如果函数为常数，泊松过程可以归类为HPP。如果表示强度函数，则泊松过程可以归类为NHPP。

为简化表达式，下文中将，记作。随机变量服从高斯分布且相互独立同分布。泊松过程的均值和方差均为。因此，基于高斯过程（[42,43]）的条件概率过程（CPP），可近似替换为高斯过程。表达式可表示为

其中，。

可将等式（11）所代表的模型的退化重新表述如下：

的寿命概率密度函数可以通过一定的数学表达式进行估算，如[24,35]的研究结果所示。

其中

有且和可以表示为：

在实际应用中，给定时间点处的退化条件可表示为。RUL的失效分布函数（FDF）被定义为退化过程首次超过预定阈值的时刻。时间点处的退化过程可描述为：

类似地，RUL的PDF可以用数学方式表示为：

其中，

有

3.2 ASDJD模型说明

在本文中，ASDJD模型被表示为M1，其中 , 。根据3.1的结果，我们可以推导出相应的变换结果。当系统起始时刻为0，时，可以得到，，，，的解析表达式。基于（15），可以计算出寿命概率密度函数。

其中，和服从高斯分布。根据全概率定律，可以得到寿命的概率分布。为了避免计算过程中的积分，这里首先引入以下公式。

当且

根据（22），寿命PDF可以基于（21）得出。

其中，

需要注意的是，（23）式中仍包含期望值。由于其计算过程较为复杂，已无法给出解析表达式。不过，（23）式仅包含单变量积分，因此可以使用Matlab进行近似计算。当，表示系统的退化状态为。时。可得到对应的函数。RUL的概率密度函数也可用类似方法获得。

根据（22），可以得到以下表达式。

其中，

4 参数估计

要实现寿命和剩余使用时间（RUL）的估计，确定所提模型的参数至关重要。我们将模型（14）的参数向量记为。是漂移系数的参数，其中。是泊松过程的参数。假设在时间区间内存在次跳跃事件，这些事件无法直接观测，可视为系统的隐变量。在此特定情况下，最大似然估计法不适用。由于隐变量具有时变特性，传统的混合高斯分布期望最大化求解方法失效。因此采用隐马尔可夫模型（ECM）进行参数估计。根据泊松过程的定义，若满足条件，则可推导出以下公式：

备注3. 根据公式（28），当足够小时，若满足条件，则概率。因此，当满足条件时，我们可以定义概率为，其中参数值由BIC或AIC [42,43]确定。

对于退化系统，设表示退化数据，表示退化状态增量。服从混合高斯分布，其均值为，方差为。为简化计算，令。时间增量表示为，其中。通常传感器的工作频率较高且固定，因此实际采样间隔足够小以保持恒定。在后续章节中，。表示隐变量的权重。

第一步： ECM参数估计

E步： 我们需要计算完整似然的期望值，其表示为Q函数如下所示。

其中

表示对应的第个参数向量。是潜在变量。

CM步骤：

CM-1：固定。令，并对其求最大值，即可得到如BoxI所示的

由于无法推导出的解析解，因此我们采用粒子群优化技术来求解方程（32）。

CM-2: 固定，我们最大化 , 可以表示为：

CM-3:固定与CM-1类似，的解析解无法推导，因此采用粒子群优化算法求解（34）。

两步法： 通过ECM方法，我们已获得参数。现在只需确定参数，利用最大似然估计法来估计该参数。

其中表示为：

通过以上讨论可知，利用ECM和MLE可以实现对所有未知参数的估计，为了便于理解，图2中总结了参数估计的步骤。

5 案例研究

本节通过数值模拟和fXJTU-SY的实际案例两个实例，验证了所提出的模型的有效性。

5.1 数值模拟

本小节验证了参数估计和RUL估计模型的准确性。首先，基于离散化退化模型（37），我们使用欧拉近似生成D条退化路径[24,42]。

模拟模型的预设参数见表1。下面给出了泊松过程的强度函数：

表1 模拟的参数设置

需要说明的是，本文采用的模拟冲击模型仅为示例模型，并不能完全反映工业退化的全貌。实际应用中，必须根据具体退化特征和运行环境构建对应的冲击模型强度函数。我们基于初始设定参数推导出退化路径：将历史数据集（即指定起始点前的数据）称为训练集，起始点后的数据则称为测试集。如图3(a)所示为退化路径示意图，图3(b)展示了数据的增量退化过程。根据图3呈现的数据，跳变频率呈现出逐步上升的趋势。

为评估所提模型的效能，我们采用蒙特卡洛（MC）模拟生成了15,000条降解轨迹，并从中获取实际概率密度函数分布。本文提出的模型标记为M1。通过两种对比方法验证模型有效性：(1)无跳跃的ASD扩散模型称为M2 [28]；(2)与年龄相关的跳跃-扩散模型则标记为M3 [43]。

根据第5节提出的ECM和MLE方法，我们成功获取了表2所列的ASDJD模型参数。初始参数通过训练数据学习获得，并在输入新测试数据时进行更新。从表2可以看出，退化参数能够通过ECM和MLE方法准确学习。

表2 多个模型的参数估计结果

图4展示了M1、M2和M3三种模型在不同初始时间点的RUL概率密度函数（PDF）结果。通过蒙特卡洛模拟获得的精确系统PDF表明，M1模型的RUL PDF与实际蒙特卡洛模拟结果高度吻合。实证研究表明，采用M1模型参数估算的解析PDF与蒙特卡洛方法得出的PDF具有极强的拟合度。值得注意的是，在秒时，M2模型的估计误差明显大于M1和M3。这种误差值的差异揭示了状态跳跃对RUL估算的影响。随着设备老化时间增加，三种模型的估计误差均呈现下降趋势，但M1模型仍保持优于M2和M3的性能优势。需要特别说明的是，M2和M3的估算结果低于实际RUL值，这可能源于未考虑状态跳跃或状态依赖性的影响，从而导致系统维护延迟并增加制造成本。

5.2 实验数据

示例验证中使用的模型的漂移和扩散系数函数如第3.2节所示，冲击的密度函数如（38）所示。由于模型函数已经过验证，所使用的退化数据应包含相应的退化特征，即指数退化，且冲击概率逐渐增加。

5.2.1数据描述和评价指标

本小节[49]采用的是XJTU-SY轴承退化数据集。该数据集包含15个滚动轴承样本，采样频率设定为25.6千赫兹（kHz），采样周期为一分钟。在评估剩余使用寿命（RUL）预测性能时，我们采用了三个关键指标：均方根误差（RMSE）、绝对误差（AE）以及累积相对精度（CRA）。

变量代表RUL的真值，而表示预测的RUL。在[49]系统中，水平和垂直振动信号的最大振幅（MA）被用作系统退化特征，即每个采样点处采样振动信号的最大值。设定的退化特征失效阈值为20 g。采用轴承1-3和2-2来评估所提模型的有效性。完整信息详见表3。

表3 XJTU-SY轴承数据集

5.2.2.剩余寿命预测实验结果

轴承退化增量如图5所示。显然，轴承1-3的增量变化趋势与仿真数据相似。预测的轴承1-3和轴承2-2的起始点分别为秒和秒。为更好地展示模型的应用效果，我们将在以下步骤中进行具体实施。模型流程如图1所示。

图5 轴承退化状态增量

首先，根据采集的振动信号，提取出模态分析（MA）作为退化数据。由此可获得模态分析的增量参数。第二，通过所提出的参数估计方法，可获取1-3号轴承和2-2号轴承的模型参数。系统将利用历史数据及预测起始点前的数据来估算初始参数。随着新数据点的获取，参数将通过ECM和MLE方法进行更新。第三，基于这些参数估计结果，我们能够预测设备剩余使用寿命（RUL）并计算其对应概率密度。图6展示了轴承1-3和轴承2-2的RUL概率密度函数（PDF）。从图6(a)和(b)可以看出，随着退化数据的累积，RUL概率分布的标准差逐渐减小，数据点也变得更加集中。在轴承1-3和2-2中，M3的概率密度分布比M1更集中，这表明考虑状态依赖性可能会影响模型的不确定性。不过M1的预测精度仍优于M3，这一优势在图7和图8中均有体现。特别是对于轴承2-2，M1的表现明显优于M2和M3。这些结果表明，具有跳跃特性的年龄-状态依赖扩散模型能更好地拟合退化数据。通过对比M1、M2和M3可以看出，M1的泛化能力比M2和M3更强。对于轴承1-3，M1和M2的预测结果呈现相似趋势；但针对轴承2-2，M1的表现则显著优于M2和M3。
图6 M1、M2和M3的RUL PDF

图7展示了RUL预测结果。黑色实线表示实际RUL值，蓝色阴影区域标示了误差的20%置信区间。在轴承1-3和轴承2-2工况下，M1和M3的预测表现优于M2，这表明考虑跳跃效应的模型能更好地拟合退化数据。对于轴承1-3工况，M1和M2的RUL估计值呈现相同趋势，但M1的预测精度更高。在轴承2-2工况中，M1的估计结果显著优于M3，这说明考虑状态依赖性能提升模型预测精度。由此可见，在轴承1-3和轴承2-2工况下，M1在多数情况下均优于M2和M3。

图7 显示RUL预测结果

为进一步验证结果的可靠性，我们采用均方根误差（RMSE）和平均绝对误差（AE）对M1、M2和M3模型进行评估。如图8所示，M1模型的平均绝对误差明显优于M2和M3，这表明所提出的M1模型在资源利用率（RUL）估计方面表现更优。值得注意的是，M2模型在两个数据集中的估计误差均最为显著，反映出其估计结果存在较大的波动性。表4展示了各模型的RMSE值：M1、M2和M3在基准方向1-3上的RMSE分别为134.02、1226.22和206.40。通过对比可以发现，M1模型的RMSE值显著低于M2和M3，这说明M1模型不仅稳定性更强，且方差更小。

图8 RUL预测的平均误差

图8 RUL预测的AE

表4 不同模型的均方根误差

图9为三个模型的CRA [12,35]，CRA是量化估计模型准确性的指标，CRA值越大，估计结果的精度越高。提出方法的结果表明，与另外两个模型相比，1-3号轴承和2-2号轴承的CRA值更高，这说明所提出的模型可以得到更精确的结果。图9 三种型号CRA的比较

图9 三种模型CRA的比较

上述对比研究表明，所提出的方法能够显著提升剩余寿命（RUL）估计的准确性。实验结果表明，在建模退化过程时，必须充分考虑跳跃效应和状态依赖性的影响。但需注意的是，轴承2-2的预测精度低于轴承1-3。通过观察图5可以发现，轴承2-2的退化增量与轴承1-3存在偏差，这说明本文提出的冲击密度函数无法很好地拟合轴承2-2的特性。因此，轴承2-2的预测结果偏差明显大于轴承1-3。

6 讨论和结论

本文提出了一种具有随机跳跃特性的ASD扩散模型构建方法，旨在实现退化系统的剩余寿命（RUL）预测。现有模型（如文献[24,37,43]所述）可视为该方法的典型实例。通过引理1和Larmperti变换，我们将退化模型转化为具有恒定扩散系统的ASDJD模型，并采用NHPP分布描述时变随机跳跃特性。借助时空变换技术，我们获得了RUL概率密度函数（PDF）的解析表达式。未知参数估计采用两步法，结合ECM算法与最大似然估计（MLE）技术完成。为验证模型有效性，我们使用西安交通大学提供的仿真数据集和方位角数据进行对比分析。将本模型与未包含跳跃特性的ASD模型、年龄依赖型跳跃模型进行比较后发现，本模型能更精准地估算RUL。现有研究仍存在若干亟待深入探讨的局限性：(1)实际应用中，由于测量对象间的个体差异和系统性误差，数据变异性普遍存在。因此，如何将这种变异性纳入模型并推导解析解仍需进一步研究。(2)工业应用中的跳跃过程并非固定高斯随机变量，可能遵循时变高斯分布。这些特性将在后续研究中重点探讨。(3)系统退化过程并不总是符合指数漂移函数，冲击过程也不总遵循非负极点过程（NHPP）。如何提升模型的泛化能力，或根据数据退化特征自动选择适用的退化模型，仍是当前亟待攻克的全新难题。

编辑：Tian

校核：李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、陈宇航、海洋

该文资料搜集自网络，仅用作学术分享，不做商业用途，若侵权，后台联系小编进行删除

来源：故障诊断与python学习

SCI一区论文 | 一种用于轴承复合故障的基于仿真数据驱动的多智能体广义零样本诊断方法

本期给大家推荐一篇SCI一区论文：一种用于轴承复合故障的基于仿真数据驱动的多智能体广义零样本诊断方法。论文针对滚动轴承复合故障诊断中训练数据匮乏的问题，提出了一种基于仿真数据的多智能体广义零样本学习（GZSL）方法。该方法利用动力学模型仿真轴承振动信号，并通过CycleGAN构建语义映射模型和特征生成模型，有效地解决了传统ZSL方法中语义构建偏差和域偏移问题。此外，本文还引入了多智能体深度强化学习（MADDPG）算法，将诊断任务分解为多个子任务，由不同智能体协同完成，进一步提高了诊断准确率。论文链接：通过点击本文左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目：Simulation-data Driven Generalized Zero-Shot Learning for Multi-agent Bearing Compound Fault Diagnosis论文期刊：Knowledge-Based Systems论文日期：2025年论文链接：https://doi.org/10.1016/j.knosys.2025.113595作者：Yi Qin (a,b), Xiwen Liu (a,b), Xin Li (a,b), Yongfang Mao (c)机构：a:State Key Laboratory of Mechanical Transmission for Advanced Equipment, Chongqing University, Chongqing 400044, China; b:College of Mechanical and Vehicle Engineering, Chongqing University, Chongqing 400044, China; c:School of Automation, Chongqing University, Chongqing 400044, China.通讯作者邮箱: yfm@cqu.edu.cn作者简介：秦毅，教授。2000年至2004年在重庆大学机械工程及自动化专业学习，获学士学位，并推免到重庆大学机械电子工程系攻读硕士学位；2004年至2008在重庆大学机械电子工程专业硕博连读，获工学博士学位，其博士论文获重庆市优秀博士论文；2009年1月留校任教；2013年1月至2014年1月在密西根大学安娜堡校区作访问学者。主要从事机械状态监测与故障诊断、智能制造、智能结构及其应用等领域的研究。（来自学校官网）目录摘要1 引言2 预备知识 2.1生成对抗网络 2.2 多智能体深度确定性策略梯度3 所提出的多智能体广义零样本故障诊断方法 3.1 复合故障滚动轴承动力学建模 3.2 所提出的特征与语义处理模块 3.3 所提出的多智能体故障识别模块 3.4 多智能体广义零样本故障诊断方法的流程4 实验与比较 4.1 数据集描述和实现细节 4.2 仿真信号和语义分析 4.3 比较实验与讨论 4.4 消融实验和分析5 结论摘要由于训练的复合故障数据较少，单故障和复合故障的智能故障诊断面临巨大挑战。通过利用单故障与复合故障之间的耦合关系，广义零样本学习（GZSL）方法能够利用已知单故障的数据来识别未知的复合故障。然而，当前的GZSL方法存在以下关键问题：构建的故障语义与实际特征不符，且训练模型受到多种单一故障数据的影响较大。因此，本文提出了一种新的语义构建方法，通过仿真数据训练语义映射模型，以增强生成语义与实际语义的一致性。此外，还提出了一种改进的多智能体深度强化学习（MADRL）协作诊断网络，以提高分类能力，该网络通过定制交互环境，为每个智能体分配特定组件的诊断子任务。最后，建立了一个多智能体GZSL轴承故障诊断框架。该框架的有效性和优势通过三个轴承数据集在GZSL诊断任务中得到了验证。1 引言在故障诊断领域，基于深度学习的智能方法已广泛应用于齿轮[1,2]和滚动轴承[3,4]等关键设备。然而，智能算法通常需要大量的标注数据来进行模型训练[5]。尽管单故障数据促进了相对稳健的数据共享生态系统[6]，但缺乏标记的复合故障数据。在实际工程中，由于连锁反应[7]，多个故障更可能出现在组件的多个部分或多个系统组件之间。当复合故障发生时，其风险通常远比单一故障严重[8]。因此，制定合理的维护计划变得更加困难。因此，即使没有复合故障样本，探索诊断复合故障的方法也具有重要的价值。零样本学习（Zero-shot learning，ZSL）是一种先进的机器学习方法，旨在解决某些类别[9]数据不足的问题。其核心理念是利用已知类别的数据训练模型，并借助先验知识指导该模型识别未知类别。传统模型学习识别已见过样本的标签。相比之下，零样本学习（ZSL）模型则专注于预测未见过样本的标签。此外，广义零样本学习（GZSL）模型旨在对所有样本的标签进行分类，涵盖已见过和未见过的类别。由于单故障与复合故障信号之间存在耦合关系，ZSL方法已被应用于复合故障诊断。这些方法利用单故障类别的标记数据来训练智能模型。此外，通过先验知识，从单故障语义构建复合故障语义，使模型能够识别之前未见过的复合故障类别。Xu等人[10]提出了一种包含多个模块的模型，其中包括标签信息向量定义模块、特征提取器和生成模块。Wang等人[13]提出了一种基于零样本学习的自适应加权语义自动编码器，用于复合故障诊断。然而，基于零样本学习的智能诊断方法仍面临两大核心挑战：1)由于机械设备的复杂性，复合故障与单一故障之间的映射关系本质上是难以描述的振动信号的复杂性。现有的构建复合故障语义的方法[10,11]依赖于手动定义单个故障语义的线性叠加，仅使用有限的时间-频率索引作为语义。这些方法忽略了故障之间的复杂耦合关系，导致语义与实际情况不符，从而降低了模型的性能。2)大多数研究，如[10,12]，主要集中在零样本学习（ZSL）设置中，训练好的模型专门用于识别单一故障类别。然而，在实际工业环境中，单个故障和复合故障类别随机出现，这要求模型能够识别所有可能的健康状况。目前，少数研究[13-15]关注基于全局样本学习（GSZL）的故障诊断方法。然而，这些研究在处理单个故障类别时遇到了域偏差过大的问题，导致模型性能不佳。在计算机视觉领域，GZSL模型能够学习图像的类别属性，例如颜色、形状和大小[16,17]。N.Belissent等人[18]将GZSL与农业中入侵杂草的检测相结合，通过图像嵌入和基于形态学及栖息地文本描述的方法，帮助识别未见过的类别。相比之下，为机械设备定义清晰且通用的语义较为困难，因为振动信号受多种因素影响，包括设备类型、操作条件、传感器参数和环境噪声。然而，所有机械设备在不同健康状态下都能产生振动响应，通过建立和解决动力学模型[19]。最近的研究[20,21]将动态建模分析与智能模型诊断相结合。Dong等人[21]本文研究了一种基于动态模型和迁移学习的滚动轴承故障智能诊断框架。尽管仿真信号与实际测量信号存在显著差异，但单故障与复合故障之间的耦合物理关系依然保持一致，尤其在包络谱[22]中表现得尤为明显。因此，基于这一观察，可以利用动态建模获得的仿真信号，训练生成模型学习单故障与复合故障之间的语义映射关系，从而构建有效的故障诊断语义。深度强化学习（Deep reinforcement learning，DRL）将深度学习的强大感知能力与强化学习（Reinforcementlearning，RL）的决策优势相结合[23]。赵等人[24]改进了深度强化学习（DRL）算法，用于生成公式化的金融阿尔法因子，并引入信息比率作为奖励机制，这与理论结果高度一致。基于DRL的故障诊断方法研究取得了令人鼓舞的成果[25,26]，展示了增强的鲁棒性和泛化能力[27]。多智能体深度强化学习（MADRL）将DRL技术扩展到涉及多个智能体的决策问题[28]。因此，在共享环境中，强调智能体之间的合作与竞争，以实现各自的目标。MADRL能够将复杂任务分解为多个子任务，每个智能体负责处理一个特定的子任务。MADRL通过利用分工与合作，提高了任务效率并确保了高鲁棒性。MADRL算法在复合故障诊断中得到了改进，以应对GZSL中域偏差导致的诊断准确性下降问题。具体而言，整个诊断任务被设计为一个涉及多个智能体的协作过程。每个子任务专注于判断某个特定组件是否出现故障。各个智能体分别处理这些子任务，它们的决策结果被整合起来，以评估整体的健康状况。基于上述讨论与分析，提出了一种以滚动轴承动态仿真数据为驱动的网络模型映射方法，旨在解决传统零样本学习（ZSL）故障诊断中语义构建时物理信息不足的问题。此外，针对滚动轴承符合故障，提出了一种多智能体协同诊断网络架构来实现广义零样本学习目标并降低领域偏差的影响。最后，提出了一种基于仿真数据的先进多智能体GZSL方法，用于轴承复合故障诊断。本研究的主要贡献如下：1)构建了一个动态模型，用于仿真不同故障类型下的轴承振动信号。在此基础上，提出了一种新的语义构建方法。首先，利用复合故障动力学模型生成的数据构建并训练了一个语义映射模型。接着，建立了一个生成模型，以学习单故障与复合故障语义之间的耦合映射关系。这种方法提高了生成的语义与实际语义的一致性。2)提出了一种改进的MADRL协同诊断网络，以实现高精度的GZSL诊断。每个智能体负责诊断滚动轴承的特定部件。交互环境经过定制，旨在指导多个智能体的合作，从而实现故障特征的有效识别。3)基于上述研究成果，构建了多智能体GZSL故障诊断框架，并通过三个轴承数据集的对比实验和消融实验验证，该方法在GZSL诊断任务上的表现优于其他先进方法。本文其余部分分为五个部分。第二部分简要介绍了相关的循环生成对抗网络（CycleGAN）和多智能体深度确定性策略梯度（MADDPG）。第三部分详细阐述了为轴承设计的多智能体GZSL故障诊断方法。第四部分通过在三个数据集上的实验，验证了该方法的优势。最后，在第五部分中，总结了研究结论并展望了未来的研究方向。2 预备知识2.1 生成对抗网络作为最知名的生成模型之一，GAN[29]及其众多变体被广泛应用于数据生成和转换。CycleGAN的核心在于学习如何从一个领域（如夏季风景）映射到另一个领域（如冬季风景）。如图1所示，CycleGAN包含两个生成器和两个判别器。生成器负责从领域转换到领域，而生成器则执行反向转换。判别器和用于评估输入样本是否符合相应领域的特征。 2.2 多智能体深度确定性策略梯度所有强化学习（智能体RL智能体）算法都依赖于智能体与环境之间的交互结果。强化学习问题被建模为马尔可夫决策过程(MDP)[30]，并通过四元组进行定义。，其中代表状态空间智能体，代表动作空间智能体，表示状态转移概率，表示奖励函数。多智能体深度强化学习（MADRL）将强化学习扩展到涉及多个智能体的决策问题。基于Actor-Critic框架的MADDPG算法[31]是一种专为协作与竞争环境中连续动作空间问题设计的MADRL算法。该算法通过集中训练与分散执行（CTDE）的架构，解决了多智能体系统中的非平稳性问题。在训练阶段，每个策略网络都能获取全局信息，包括所有智能体的观测值、动作和环境状态；而在执行阶段，每个智能体仅根据自身局部观测值和训练好的策略网络独立做出决策。3 所提出的多智能体广义零样本故障诊断方法通过比较计算机视觉广义零样本学习（GZSL）中先验知识定义的属性表，本文提出了一种基于动态模型仿真数据的新语义构建方法。该生成模型学习了从单一故障语义到复合故障语义的映射关系，以及从故障语义到特征向量的映射关系。最终通过多智能体的协同决策实现故障识别。3.1 复合故障滚动轴承动力学建模首先构建滚动轴承的动态模型，该模型包含任意故障（单个或复合故障），以仿真不同故障类型下的振动信号。常见的轴承故障类型包括外圈故障、内圈故障和滚动体故障。在该动态模型中，所有故障被简化为一个长、宽、深的立方体坑。因此，由故障引起的最大位移激励计算如下：其中表示滚动体的直径。图2(a)展示了外圈故障的情况，其中表示与外圈故障区域对应的中心角度，而则表示故障区域外边界与X轴在初始时刻的角度。外圈故障的位移激励函数可通过考虑半正弦激励来定义：图2(b)展示了内圈故障，其中表示中心角。与外圈故障不同，滚动轴承的内圈通常随轴一起旋转。因此，是时间的函数，可定义如下：其中，表示内圈的旋转角速度，表示初始时刻内圈故障区域外边界与X轴之间的角度。因此，内圈故障的位移激励函数可定义如下：图2(c)展示了滚子故障的情况，其中表示内圈故障区域对应的中心角度，而则对应于外圈。滚动球故障的位移激励函数可定义如下：其中，表示滚子的角速度。滚子与滚道之间的法向接触变形包括了轴承故障位移激励函数的影响。接触变形可表示为：其中和分别表示滚动轴承在X轴和Y轴方向的位移，代表轴承的公差。通过设定、和的存在与否，可以仿真滚动轴承的各种故障类型。故障轴承的2-DOF动态方程可表示如下：其中表示等效承载质量，表示力变形系数，表示等效阻尼比。等式(7)可通过Runge-Kutta算法求解，得到滚动轴承在各健康状态下的仿真振动信号。3.2 所提出的特征与语义处理模块所有振动信号经过CNN特征提取器处理，得到故障特征，每个信号样本转换成低维特征向量，便于分类，所有测量的复合故障数据均未进行训练，以确保符合GZSL原则。因此，CNN仅在单故障数据上进行训练以提取有效的故障特征，其目标函数定义如下：卷积神经网络（CNN）的结构参数详见表1。每个“ConvBN”模块包含一个卷积层、一个批量归一化层和一个最大池化层。所有数据均输入到训练好的CNN特征提取器中。全局平均池化（GAP）层输出了所有振动样本的特征向量，作为后续特征生成和故障识别模块的输入。作为GZSL中的关键先验知识，故障语义弥合了单一故障与复合故障诊断之间的差距。这直接影响模型性能，使其成为识别复合故障类型的关键。本文提出了一种基于仿真信号的语义构建方法。通过分析轴承动力学模型，获取了仿真故障信号。这些信号作为先验知识数据，提供给CycleGAN进行自适应学习。通过神经网络实现了从单一故障到复合故障语义的映射。由于振动信号通常包含背景噪声、载波信号和其他干扰，因此包络频谱被用作语义信息，频谱滤除了这些噪声，并通过以下计算完全反映了故障信息：其中表示振动信号，为该信号的希尔伯特变换，而则代表傅里叶变换。基于CycleGAN建立了两种生成映射模型，用于生成复合故障特征，并将所有实际测量的复合故障信号从训练过程中排除：•语义映射模型的主要目标是学习单故障语义（域）与复合故障语义（域）之间的映射关系。该模型仅使用仿真信号作为训练数据。在测试时，将测量到的单故障语义输入到训练好的生成器I中，以生成相应的复合故障语义。•特征生成模型，该模型的最终目标是通过故障语义生成故障特征向量，所有测量的单故障数据均作为训练数据。从等式(9)派生的故障语义构成域，而CNN特征提取器提取的特征向量则构成域。测试时，将语义映射网络生成的复合故障语义作为输入，以生成相应的复合故障特征。这两款模型的具体结构参数详见表1，其结构将在后续章节（图4）中详细展示。每个“ConvIN”模块包含一个卷积层、一个实例归一化层和一个ReLU激活层。“DeConv”模块则用反卷积层替换了卷积层。尽管这两款模型的结构和输入不同，但它们都是基于CycleGAN的生成网络，由两个生成器和两个判别器组成。它们的目标函数包括对抗损失、循环一致性损失和身份损失。对抗损失是所有生成对抗网络（GANs）的基本组成部分，确保生成的数据与目标域数据高度一致。对抗损失的定义如下：循环一致性损失确保生成的数据能够映射回原始数据，从而促使生成器和学习到相互一致的映射关系：身份丢失有助于神经网络更好地识别和保存目标域所需的数据特征，从而提高生成数据的质量：所有损失的加权和构成了CycleGAN的完整目标函数，其表达式如下：其中和是权重超参数，用于平衡各损失项对网络更新的贡献。仿真信号作为先验知识，帮助使用上述模型生成高质量的复合故障特征。表1 特征处理模型的结构参数 3.3 所提出的多智能体故障识别模块如图3所示，整体故障诊断任务根据机械设备的不同部件被划分为多个子任务。每个子任务负责判断特定部件（例如内圈、外圈或滚动体）是否出现故障。各个智能体被分配处理这些子任务，它们的决策综合起来以评估设备的整体健康状况。在多智能体故障识别模块中，智能体交互的环境表示为：其中，表示从GAP层提取的第个样本的特征向量，表示对应的故障类别标签。状态空间由多个特征向量组成，为第个智能体在其指定的子任务范围内提供输入信息。在多智能体故障诊断任务中，动作空间被定义为特定组件发生故障的概率，该组件由某个智能体负责。对于第个智能体，其动作定义为：当的值为0.5时，表明该智能体对其关联组件的故障概率估计为50%。每个智能体都会被分配一个动作阈值。若某智能体的动作概率超过其设定的阈值，则判定对应的组件已发生故障：其中表示第个智能体负责的具体组件（即位置）的故障标识。在后续的诊断过程中，可以根据智能体的具体位置和不同类型的故障特点，为智能体设置不同的阈值。这种方法确保所有微小的故障都能被彻底检测和分析。最后，将所有部件的诊断结果组合成一个整体向量，以确定设备的整体健康状况。奖励函数是深度强化学习的关键组成部分，旨在鼓励每个智能体准确行动。在多智能体故障诊断任务中，为每个智能体定义了个体奖励和全局奖励，以促进智能体间的协作。由于子任务本质上相同，所有个体奖励均设计为提供正向反馈，确保正确评估：全局奖励根据训练期间所有智能体的共同决策确定。如果所有组件均被正确诊断，则会获得正向的全局奖励；反之，若任何组件被错误诊断，则会受到惩罚：其中代表总智能体数量，表示做出错误诊断的智能体数量。每个智能体的最终奖励值由其个人奖励与全局奖励之和构成：其中，是一个缩放因子，确保奖励值保持在适合网络学习过程中收敛的范围内。MADDPG用于在多智能体故障识别模块中更新智能体。每个智能体在MADDPG算法中初始化四个神经网络：策略网络（Actor）、价值网络（Critic）及其对应的靶向网络。每个智能体根据其独立的actor网络生成动作，并利用critic网络计算该动作的Q值。通过梯度反向传播更新actor和critic网络的参数，以优化策略和价值函数。actor策略网络通过最大化Q值来更新：每个智能体的批评值网络接收所有智能体的联合状态和动作，并输出各自智能体的Q值。该网络通过时间差分（TD）误差来更新集中式Q值函数：其中表示使用即时奖励和折现未来回报计算得出的奖励目标值：目标actor 和 critic网络确保训练期间的学习稳定。目标网络通过软更新逐步更新：由于交互式环境中使用的输入是CNN特征提取器提取的特征向量，因此所有智能体网络均配置为全连接层。 3.4 多智能体广义零样本故障诊断方法的流程基于上述任意故障的轴承动力学模型、特征与语义处理模块以及多智能体故障识别模块，开发了多智能体广义零样本故障诊断方法，其框架如图4所示。为实现该方法，其详细步骤如下：1)建立了包含单故障和复合故障在内的任意故障目标滚动轴承的动态模型，利用Runge-Kutta算法计算了各种故障类型下的振动信号。2)所有振动信号，包括测量数据和仿真数据，都通过希尔伯特变换处理，以提取相应的故障语义。3)特征提取模型采用单个故障的振动信号进行训练，将每个振动信号样本转换为低维特征向量。4)语义映射模型通过仿真单故障语义和复合故障语义进行训练，使生成器I能够学习从单故障到复合故障语义的转换映射。5)特征生成模型通过利用测量到的单故障语义及其对应的特征向量来进行训练，从而使生成器Ⅲ具备从故障语义生成故障特征的能力。6)通过生成器I处理测量的单故障语义，生成相应的复合故障语义，然后输入到生成器Ⅲ中，生成最终的复合故障特征向量。7)将单个故障和生成的复合故障的特征向量作为多智能体故障识别模型的训练数据，基于故障特征对所有健康状态进行准确分类。所有测量的复合故障数据均不用于训练，以确保符合GZSL原则。在对所提出的模型进行训练后，针对目标故障的诊断过程仅包括两个连续的步骤：首先，原始信号经过特征提取模型处理，得到特征向量；然后，该特征向量经过多智能体故障识别模型分析，得到最终的诊断结果。4 实验与比较4.1 数据集描述和实现细节基于三个轴承数据集开展了多项消融实验和广义零样本学习诊断任务，通过与先进广义零样本学习方法的对比，验证了所提方法的有效性和优势。表2列出了三个数据集中测试滚动轴承的参数及所有故障类型的尺寸规格。以下是这三个数据集的补充细节说明。表2 三个数据集中滚动轴承的测试参数 1)私有轴承故障检测（BFD）数据集。该数据集来源于我们自主研发的轴承故障测试台，测试台由负载电机、减速器、驱动电机和测试滚动轴承组成。采用了七种滚动轴承的健康状态：正常（NC）、内圈故障（IF）、外圈故障（OF）、滚动体故障（BF）、内圈与外圈复合故障（IO）、内圈与滚动体复合故障（IB）、外圈与滚动体复合故障（OB）。原始振动信号由两个加速度传感器采集。在实验中，测试的滚动轴承以1000 rpm 的速度运行，负载为4 Nm，采样频率设定为12 kHz。2)东北电力大学（[32]）提供的NEEPU轴承数据集。该数据集中仿真故障类型包括NC、IF、OF、BF、IO、IB和OB。实验中，轴承的输入转速在1443至1478 rpm 之间变化，同时通过磁制动施加了0.2 Nm的负载。采样频率设定为12 kHz，采样时间为55 s。3)PU数据集。PU轴承数据集由帕德博恩大学[33]提供。测试装置包括电动机、扭矩传感器、测试滚动轴承、飞轮和负载电机。在1500 rpm 的速度和0.7 Nm的负载下进行了轴承故障实验，包含四种健康状态：NC、IF、OF和IO。故障振动信号以64 kHz的采样频率采集。在所有比较实验中，单故障类别NC、IF、OF和BF被视为已见类别。相比之下，复合故障类别IO、IB和OB则被视为未见类别。因此，数据集A和B中使用了NC、IF、OF和BF作为训练数据。而数据集C中仅使用了NC、IF和OF作为训练数据。所有类别均作为测试数据。滑动窗口采样技术被应用于三个数据集，以获取足够的数据样本，采样窗口大小设定为3072。所提出的模型需要配置多个超参数，包括学习率、批量大小、训练轮数和折扣因子等。所有网络的批量大小均设为32，特征提取模型的学习率和训练轮数分别设定为0.0002和5000。折扣因子设为0.2，以鼓励智能体关注当前奖励。表3列出了所提出的模型在三个数据集上的超参数设置。此外，该模型在TensorFlow平台上使用NVIDIA2080Ti显卡实现。表3 针对三个数据集的模型超参数 4.2 仿真信号和语义分析通过将表2中每个测试平台的轴承参数和故障尺寸整合到上述建立的动力学模型中，可以获取与每个数据集中的测试滚动轴承相对应的仿真振动信号。图5展示了数据集A中三种健康状态（IF、OF和IO）的测量和仿真振动信号的时间域图。与之对应，图6展示了通过希尔伯特变换得到的相应包络谱。比较分析显示，由于实际场噪声的干扰，测量信号在时域图中明显不如仿真信号清晰。此外，复合故障（IO）与单个故障（OF和IF）之间的耦合关系非常复杂，难以总结和解释。包络谱中的幅度峰值集中在故障频率附近。数据集A中滚动轴承的OF故障频率为101Hz。仿真理论状态下，对应的IF故障频率为132Hz。尽管测量信号与理论仿真信号的故障频率存在偏差，但复合故障（IO）与单个故障（OF和IF）之间的耦合关系在这两种情况下依然明显。IF和OF故障频率出现在IO复合故障中。因此，选择包络频谱作为生成复合故障特征的语义。4.3 比较实验与讨论已见类识别准确率和未见类识别准确率是广义零样本学习(GZSL)中评估域偏移和中心度问题对模型影响的关键指标。此外，这两个指标的调和平均数被用来评估模型性能：为验证所提出方法，我们在三个数据集上对比了多种最先进的广义零样本学习方法，包括来自计算机视觉领域的CE-GZSL[16]以及故障诊断领域的AWSAE[13]、CGASNet[14]和ZS-BDT[15]。所有方法均在每个数据集上进行了超过三次的训练与测试，各方法在整个过程中的最佳性能记录于表4中。表4 三种数据集上不同方法的结果实验结果显示，大多数方法在已见过的类别上能够达到较高的分类准确率。然而，对于未见过的类别，这些方法的表现显著下降。这表明所有深度学习模型都严重依赖于训练样本。此外，GZSL方法在构建未见过类别的语义或特征时存在偏差，导致准确率下降。相比之下，所提出的方案表现最佳，在三个数据集上的、和平均值分别达到了98.25%、72.37%和83.32%。4.4 消融实验和分析为评估所提出的语义映射与多智能体诊断模块的有效性，研究进行了大量消融实验，将多种模块组合与广义零样本学习基线方法进行对比。基线方法采用CycleGAN框架，通过振动信号多个时频指标的线性叠加构建语义特征；MA(·)表示多智能体联合识别模块，SM(·)代表基于仿真信号的语义映射构建方法。实验共部署四种模型进行广义零样本学习任务：基线模型、基线+MA(·)模型、基线+SM(·)模型以及基线+SM(·)+MA(·)组合模型。如图7所示，基线方法主要识别单一故障类别（已见类别），导致显著的领域偏移问题。相比之下，基线+SM模型能更好地识别复合故障类别（未见类别）。这一结果表明，SM模块能够捕捉复合故障与单一故障类别之间的映射关系，有助于通过仿真信号识别未见类别。与传统识别网络相比，MA模块的表现更加稳定和准确。表5展示了四个模型在三个数据集上的实验结果。可以看出，所提出的方法在所有任务中都表现出强大的泛化零样本诊断能力。表5 四种模型诊断结果的调和平均准确度 5 结论本文提出了一种基于仿真数据的多智能体GZSL故障诊断方法，用于仿真轴承故障。首先，建立了包含任意单一或复合故障的滚动轴承动态模型，以获取所有健康状态下的仿真振动信号。这些仿真信号作为辅助信息，用于训练语义映射模型。此外，特征生成模型利用单故障数据学习了语义与特征向量之间的映射关系。最后，除了测量的复合故障特征向量外，所有其他特征向量被用于定义多智能体故障识别模块中的交互环境，实现了高精度的GZSL诊断。在三个轴承故障数据集上进行了广泛的比较和消融实验，证明了该方法具有强大的性能。然而，所提出的方案仅专注于滚动轴承内部不同位置的故障类型，而未涉及其他关键部件的故障。未来的研究将扩展该方法，用于诊断复杂机械系统中多个部件的复杂故障。编辑：陈莹洁校核：李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、Tina、陈宇航、王金、赵诚、肖鑫鑫该文资料搜集自网络，仅用作学术分享，不做商业用途，若侵权，后台联系小编进行删除来源：故障诊断与python学习