首页/文章/ 详情

“数字孪生/故障诊断”专题 | 基于数字孪生和领域泛化的未知工况自适应故障诊断(上)

4小时前浏览1

本期给大家分享一篇小编近期阅读的数字孪生技术相关文章。如果有故障诊断相关方向研究人员希望宣传自己研究成果欢迎大家在公众 号后台与小编联系投稿,大家一起交流学习。

数字孪生是当前故障诊断领域的研究热点。本期推荐的这篇是林奈大学博士研究生迈赫迪·萨曼·阿扎里的文章,这篇文章中提出了一种结合多个范式的自适应故障诊断系统,即基于共享知识的监控-分析-规划-执行(MAPE-K)循环,领域泛化网络(DGNMs)模型和数字孪生(DT)。MAPE-K循环能够实时适应,DT生成补充数据解决标记数据不足问题,DGNM通过对抗学习和领域差异度量增强特征泛化。实验证明,该系统在相关工作操作和跨机器任务中表现优于现有技术。

由于文章篇幅过长,小编将分两次为大家翻译介绍这篇综述,本节推文是这篇文章的上半部分,希望对大家的学习有所帮助,文章质量很高同时希望大家可以多多引用,特别是对所提方法的借鉴


论文链接:通过点击最左下角的阅读原文进行在线阅读及下载

论文基本信息

论文题目: Self-adaptive fault diagnosis for unseen working conditions based on digital twins and domain generalization

论文期刊:Reliability Engineering and System Safety

Doihttps://doi.org/10.1016/j.ress.2024.110560

作者: Mehdi Saman Azari(a), Stefania Santini(b), Farid Edrisi(a), Francesco Flammini(c)
论文时间: 2024年
机构: 
a Department of Computer Science and Media Technology, Linnaeus University, Växjo, Sweden 
b Department of Electrical Engineering and Information Technology, University of Naples Federico II, Naples, Italy
c School of Innovation, Design and Engineering, Mälardalen University, Sweden

作者简介:迈赫迪·萨曼·阿扎里,于2010年在伊朗德黑兰的塔比阿特莫达雷斯大学获得电气工程硕士学位;随后,他于2014年加入瑞典林奈大学,攻读计算机科学与媒体技术博士学位。在林奈大学期间,他作为Cyber-Physical Systems研究组的一员,专注于弹性网络物理系统的研究。2018年至2020年,他在林奈大学担任研究助理,参与多个与物联网相关的研究项目,并在该领域取得显著成果。(来源:ResearchGate)

摘要

近年来,基于领域自适应的智能故障诊断技术被用于解决网络物理系统中的领域迁移问题;然而,对于获取目标数据的需求限制了其适用于未知工况的范围。为了克服这些限制,引入了领域泛化技术来增强故障诊断模型在未知工况下的操作能力。然而,现有方法假设可以访问来自各个源域的大量标记训练数据,在真实世界的工程场景中由于资源限制而面临挑战。此外,缺乏随时间更新诊断模型的机制,需要探索能够对新的未知工况自主重新配置的自适应泛化诊断模型。在这样的背景下,本文提出了一种结合多个范式的自适应故障诊断系统,即基于共享知识的监控-分析-规划-执行(MAPE-K:Monitor-Analyze-Plan-Execute over a shared Knowledge)循环,领域泛化网络模型(DGNMs:Domain Generalization Network Models)和数字孪生(DT:Digital Twins)MAPE-K循环使系统能够在动态工业环境中进行时适应,无需干预。为解决标记训练数据不足的问题,使用数字孪生生成补充数据并不断调优参数,以反映新的未知工况的动态性DGNM整合了对抗学习和基于领域差异度的度量标准,来增强特征多样性和泛化能力。多域数据增强的引入提高了特征多样性,并有利于学习多个领域之间的相关性,最终提高了特征表示的泛化性。所提出的故障诊断系统在三个公开可用的旋转机械数据集上进行了评估,证明相较于其他最先进方法,该系统在相关工作操作和跨机器任务中表现更出色。

关键词故障诊断系统;MAPE-K;领域泛化; 数据增强;旋转机械;数字孪生;未知工况

目录

1 引言

2 相关工作

   2.1 传统机器学习和深度学习

   2.2 领域自适应

   2.3 领域泛化

   2.4 数字孪生体

   2.5 MAPE-K

预备工作

   3.1 构建诊断数字孪生

   3.2 领域泛化问题设置

   3.3 混合

4 自适应故障诊断系统设计

   4.1 监视器

   4.2 分析仪

   4.3 规划者指标

   4.4 执行者

   4.5 知识

5 旋转机械案例研究

6 实验验证与性能分析

   6.1 数据集

   6.2 对比方法

   6.3 实施细则

   6.4 诊断结果与分析

7 结论


注:小编能力有限,如有翻译不恰之处,请多多指正~
     若想进一步拜读完整版,请下载原论文进行细读。

1 引言

工业传感技术和计算能力的发展极大地推动了数据驱动的方法在信息物理框架内的机械设备故障诊断[ 1 ]。在此,尽管深度学习( DL :Deep Learning )方法在从大型数据集中提取隐含的故障相关特征方面优于传统机器学习( ML:Machine Learning )方法,但它们仍然依赖于跨训练和测试阶段数据分布一致的假设。由于机械设备的高度动态性,导致工况和数据分布不断变化,这种严格的假设在实际应用中几乎不成立。由于DL模型是在特定的工况下训练的,因此上述差异(通常称为域偏移)构成了一个关键的挑战[ 2 ]。在试图克服领域迁移问题时,深度学习方法需要收集大量与新工况相关的数据,并从头开始对模型进行训练。

然而,这个过程是资源密集型的,可能并不总是实用的,因此确定了在不同的工况下增强模型适应性的替代策略的必要性[ 3 ]。

为了解决领域迁移问题,领域自适应( DA:Domain Adaptation )技术应运而生,以增强DL模型的弹性和适应性[ 2 ]。DA策略寻求最小化训练(源)和测试(目标)数据之间的差异。尽管基于DA的故障诊断方法是有效的,但其实用性取决于适应过程中目标域数据的可用性。在真实情况下,特别是当机械设备在新的工况下运行时,只有代表正常运行状态的数据可用于训练,而有缺陷的数据则无法获取。这些条件,通常被称为不可见的工况,普遍存在于高动态机械设备和不断变化的环境中,例如旋转机械[ 4 ],因此,大多数DA方法的适用性仅限于离线跨域故障诊断任务。

为了应对未知工况带来的开放性挑战,研究人员越来越关注智能故障诊断系统领域的领域泛化( DG:Domain Generalization )技术。这些技术旨在将源域中的诊断知识的适用性推广到未知的工作环境中[ 5 ]。尽管在推广性方面取得了可喜的成果,但现有的基于DG的未知工况处理方法面临以下挑战。首先,许多DG方法旨在通过将所有领域整合到单个潜在空间来学习领域不变的表示,通常忽略了对精确诊断至关重要的特定领域特征[ 6 ]。这种监督不仅限制了特征的多样性,而且增加了源域特征过拟合的风险,所以该模型可能难以有效地推广到新的、看不见的工况。由此迫切需要改进基于DG的故障诊断系统,以便更好地整合和利用特定领域的信息,从而提高其在不同工业工况下的泛化能力。其次,为了开发具有足够泛化能力的模型,这些方法依赖于从具有不同数据分布的不同源域获得大量标记训练数据的假设。然而,在实际工程场景中,从不同工况下的相同机器或从不同但相似的机器收集如此广泛的训练数据集是一个挑战。这些挑战源于与数据收集相关的高成本,包括设备设置、维护和操作停机时间。此外,现实工业环境中固有的多样性和多变性往往导致数据集稀疏或不完整,特别是涉及罕见的故障事件或特定的操作场景。这种数据的稀缺性会严重限制仅在有限且同质的数据集上训练的诊断模型的泛化能力。因此,探索一种可靠的补充源来提供训练数据集变得至关重要。第三,工业机械运行在动态和不断变化的环境中,需要能够适应和更新其评估的诊断模型,以应对新的数据和不断变化的工况。传统的方法往往缺乏持续的模型更新机制,而依赖于可能很快过时的静态数据集。因此,迫切需要探索能够自主监测运行工况变化并据此调整诊断策略的自适应广义诊断模型。这样的模型不仅可以随着时间的推移增强可靠性,而且可以确保诊断系统在不断变化的工业环境中保持有效和准确。

针对上述开放性问题,本文提出了一种将MAPE - K、领域泛化网络模型和数字孪生技术高度集成的自适应故障诊断系统。在这里,DGNM被用于处理由于特征多样性有限而导致的丢弃特定领域特征和过拟合的问题。为此,需要结合多种技术,包括多领域数据增强、对抗学习和基于领域的差异度量。更具体地说,多域增强采用基于狄利克雷分布的混合技术,生成融合了来自不同域特征的增强数据。然后将这些丰富的数据用于对抗学习和基于领域的差异度量,以提取更多样化的特征,提高网络的泛化性。DT被嵌入到所提出的平台中,作为可靠的数据供应商,从而解决了从实际机器中获取足够训练数据集的问题。事实上,DT模型是不断调整的,可以反映新的看不见的工况的运行动态,并提供了丰富的诊断知识来源。最后,为了应对工业机械环境的动态性,将MAPE - K自适应回路引入到所开发的故障诊断系统中。该循环有利于实时适应新的不可见的工况,从而减少了直接人为干预的需要,增强了系统的自主性。

因此,这项工作的关键新贡献可以概括如下:

  • 采用MAPE - K循环用于自适应故障诊断系统。
  • 集成数字孪生和适当的更新策略,以提供可靠的补充源域数据。
  • 利用多域数据增强,以提高故障诊断系统对分布外数据的泛化能力。
  • 将域判别器和基于域的差异度量模块嵌入到基于DL的泛化网络DGNM中,以学习来自多个源域的域不变和判别特征。
  • 使用三个公开的用于交叉作业操作和跨机器任务的数据集,在旋转机械案例研究中对该方法进行了实验评估。

本文的结构如下:第2节简要回顾相关研究,随后是第3节的基础知识和背景信息。在第4节,提供了对所提出的自适应故障诊断系统的全面描述。第5节阐明了将该系统应用于旋转机器作为案例研究。此外,第6节提供了实验结果及其分析。最后,在第7节中,总结论文并讨论未来研究的潜在方向。

2 相关工作

本节回顾了与本文相关的最新概念。为了增强条理性,每个概念,即传统机器学习和深度学习、领域自适应、领域泛化、数字孪生和MAPE-K,将分别进行讨论。

2.1 传统机器学习和深度学习  
在预测性维护领域,传统的ML和DL由于其在故障检测和隔离方面的能力,已被证明在开发故障诊断系统方面是有效的。例如,Rajabi等[ 7 ]提出了一种将传统ML算法与信号处理技术相结合的故障诊断系统,在数据不平衡和计算资源占用方面实现了更好的平衡。类似地,Moradi等[ 8 ]提出了一种集成贝叶斯网络( BN:Bayesian Networks )和深度学习( DL:Deep Learning )的新的数学架构,用于复杂工程系统( CES:Complex Engineering Systems )的状态和操作风险监测。此外,Zhao等[ 9 ]开发了一种模型驱动的深度展开方法,为故障诊断系统设计抗噪声攻击的可解释性DL模型,以实现事前可解释性。然而,由于机械设备运行在高度动态的环境中,这种领域迁移对现有的基于传统ML和DL的数据驱动故障诊断系统提出了重大挑战。  
2.2 领域泛化  
领域自适应方法的最新进展显著地解决了领域迁移带来的挑战。这些方法一般分为基于统计的方法和基于领域对抗的方法。基于统计的方法,如相关对齐[ 10 ]和最大均值差异(  MMD:Maximum Mean Discrepancy )[ 11 ],将差异度量集成到它们的目标函数中以最小化领域分布差异。另一方面,基于领域对抗的方法利用对抗框架来识别跨领域的可迁移特征[ 12 ]。在这一领域的显著场景包括相同机器的迁移( TIM:Transfer from Different related Machines ) [ 13 ]和不同相关机器的迁移( TDM:Transfer from Different related Machines ) [ 14 ],其中重大的挑战是由于来自真实机器( RM:Real Machines )的故障数据稀缺,因为机器故障是不频繁的,有时是罕见的。一种流行的替代方案是将诊断知识从实验室迁移到真实世界机器( TLRM :Transfer from Virtual to Real Machine) [ 15 ],但由于需要在实验室机器中诱发各种故障,往往耗时且成本较高。例如,Li等人[ 16 ]证明了在物理过程中使用模拟数据进行异常检测的潜力。然而,基于DA的故障诊断方法严重依赖于目标领域数据的可用性。  
2.3 领域自适应  
为了应对未知目标领域的挑战,研究正在探索领域泛化方法,这些方法可以分为数据增强、正则化和领域不变表示学习。数据增强技术,如Fan等人[ 17 ]探索的数据增强技术,集成领域差异和领域判别器来诊断故障,旨在通过多样化源数据来增强泛化能力。然而,Fan等人使用的传统混合技术具有局限性,因为它们只在两个域之间生成样本,而忽略了对其他域的考虑。Shi等人[ 18 ]开发了多源增强结合对抗训练来增强特征多样性,学习多个域之间的相关性,从而增强特征表示的泛化性。正则化方法,如Yang等人[ 19 ]的方法,通过应用正则化技术,优化中心损失和softmax损失来防止过拟合,以改善未知条件下的故障诊断。域不变表示学习方法,如Chen等人提出的对抗域不变泛化( ADIG:Adversarial Domain-Invariant Generalization )方法[ 20 ],通过使用特征归一化来提取不同源域的一致表示,以提高诊断精度。Wang等人[ 21 ]设计了多个特定领域的辅助分类器来显式地学习不同源域之间的特定领域特征,然后使用卷积自编码器模块通过预测不确定性和重构损失去除学习到的特定领域特征。尽管DG方法是有效的,但它们往往忽略了在看不见的工况下对故障诊断至关重要的特定私有特征,并且通常需要来自不同源域的大量、多样、有标签的训练数据,这在实际工程环境中可能具有挑战性和成本高昂的收集。  
在源域可用训练数据集有限的场景下,Jun等人[ 22 ]提出了一种单域泛化模型,称为多尺度风格生成对抗对比网络( MSG-ACN:Multi-scale Style Generative and Adversarial Contrastive Networks ),从单一工况中学习诊断知识,并将其泛化到新工况中。然而,单域泛化方法在实际应用中往往由于对新的未见域的有限泛化而陷入困境,导致性能下降、过拟合和对域偏移的敏感性。  
2.4 数字孪生体  
为了应对这些挑战并提供一种实用的替代方案,数字孪生被引入来模拟故障条件以生成训练数据[ 23 ]。总的来说,它提供了一种更有针对性的方法来生成与目标机器状态的具体特征和操作条件紧密匹配的数据,从而提高故障诊断系统的性能和可靠性。例如,Ma等人[ 24 ]利用有限元方法,结合模拟和真实世界数据,开发了一个用于DA的DT模型。类似地,Don等[ 25 ]创建了一个动态轴承模型来生成大量的合成数据,证明了其在DA中对真实旋转机械的适用性。Jia等人[ 26 ]开发了DG的DT模型,结合了模拟和真实世界数据的各种组合,以增强诊断能力。然而,需要一种策略来更新DT模型,以反映真实世界的变化,并保持与实际系统保持一致的准确性。在这种观点下,Xia等人[ 27 ]提出了一种使用DT模型和深度迁移学习的智能故障诊断框架,其中DT模型根据来自物理资产的实时数据进行更新。然而,由于机器的工况是动态变化的,并且随着时间而变化,因此开发自适应诊断模型至关重要,它可以自动更新诊断模型和DT模型,以适应新的、未知的工况。最近的方法,如Mishra等人[ 28 ]和霍等人[ 29 ],解决了这一需求,尽管为新的未知工况量身定制的模型仍然是必不可少的。  
2.5 MAPE-K  
MAPE - K循环是实现软件密集型系统自适应的广泛认可的参考模型[ 30 ],代表了对共享知识库的监视、分析、计划和执行。它起源于计算系统需要在没有人工干预的情况下自动处理复杂的管理任务[ 31 ]。通过提供一种结构化的方法来分离各种功能和相互作用,MAPE - K循环持续运行,以确保系统能够自主地适应变化并维持其目标[ 32 ]。  
MAPE - K的许多后续应用已经在不同的领域中实现,显示了它的通用性。例如,在机器人学中,MAPE - K回路被用来增强机器人系统的自主性和效率,使其能够适应动态环境,并以最小的人类监督来执行复杂的任务[ 33 ]。在智能工厂中,它被用于优化生产流程,并通过适应变化的制造条件和检测异常来确保不间断运行[ 34 ]。同样,在物联网( IoT:Internet of Things )应用中,MAPE - K支持对连接设备的动态管理,以确保它们能够有效地响应不断变化的上下文和用户需求[ 35 ]。然而,据作者所知,目前还没有研究专门针对新的和不可见的工况而设计的结构化自适应故障诊断系统。  
最后,为了解决和解决上述所有公开问题,并填补当前文献中的空白,本文介绍了一种新的自适应故障诊断框架,该框架以完全集成的方式结合了多种技术。为了清晰地勾勒出本文的贡献,表1给出了一个比较性的总结,以揭示所提出的方法相对于现有方法的改进之处。  

表1 相关工作总结和我们提出的方法

3 预备工作

3.1 构建诊断数字孪生

开发DTs是一项具有挑战性的任务,因为它需要在足够可接受的模拟性能和真实机器的复杂性之间找到平衡。换句话说,必须选择建设性地确定抽象层次,以涵盖所有相关细节。对于诊断目标,有必要定义最关键组件的详细模型,而不是整个机器的详细表示。

接下来,为了方便和提供一个标准的框架,将设计过程分解为以下4个高级步骤:

  1. 选择关键零部件。首先,需要确定哪些组件必须进行状态监测,这可以与其关键程度有关,即对机器安全和性能的影响以及故障易感性。
  2. 推导出观测下系统的动力学行为。这一步的重点是开发上一步确定的关键组件的动态模型。我们指出,只需要模拟关键机器部件的动态行为即可。关键组件的建模应遵循白盒方法,即使用确切的组件工作机制,并具有真机的任何规则和限制。
  3. 对故障进行定义和建模。该步骤解决了将适当的故障机制集成到上一步开发的动态模型中,以便注入和模拟可能导致机器故障的故障。一般而言,为了影响机械的动态行为并提供故障数据集,必须集成故障机理。
  4. 指定虚拟传感器。该步骤是通过虚拟传感器的方式来定义和指定通过DT仿真需要采集的数据。虚拟传感器,如果有必要,它们的动态,应该集成到机器的DT中。这使得用户能够收集在整个DT模型仿真过程中产生的数据。

一旦建立并初步校准了预测某些目标变量值的数字模型,其预测能力将根据工况数据和测量值进行不断更新和调整。

3.2 领域泛化问题设置
领域泛化的目标是在多个已知标注的源领域     上训练模型 ,从而使它能够有效地在未见的目标领域   上运行。在这种表示法中,    分别指代源领域和目标领域。每个源领域   , 由索引   确定,包括一组数据点    及其对应的标签   ,这些数据点从不同的分布   中抽取。领域标签    范围在   内,  表示每个领域中的样本数量。每个源领域中每个类别的标签空间定义为   ,其中   代表总类别数。  
目标域表示为     ,与源域共享相同的类别标签空间,即在本研究中没有考虑类别迁移     。目标域的分布为     ,不同于源域          的分布。  

挑战在于使用来自这K个源域的数据训练模型,并辅以增强数据,以确保其获得足够的泛化能力。这将使模型能够在未知的目标域Dt上有效地执行诊断任务,尽管源域和目标域之间的数据分布存在差异。

3.3 混合  
增强训练数据的多样性和数量是公认的提高智能诊断模型泛化性能的方法。数据增强是实现这一目标的一种广泛使用的策略,特别是在面对有限的训练数据时。  
一种特别有效的数据增强方法是混合。该技术通过两个训练样本及其关联标签的数学组合创建增广样本来生成多样化的数据,记为(    ,   )和(    ,   ),由公式定义:  

这里,   表示凸组合函数,而   是从Beta分布   (  α,   α) 中随机选择的混合因子,其中   α > 0。混合操作具有价值,因为它能够捕获不同领域和类别样本之间的关系,强调训练样本之间的线性相关性。此外,它可以补偿不同领域样本之间的遗漏信息,比如领域特定特征,使模型能够学习多样化特征并探索更丰富、领域不变的表征。  

4 自适应故障诊断系统设计

工业传感技术和计算能力的发展极大地推动了数据驱动的方法在信息物理框架内的机械设备故障诊断[ 1 ]。

故障诊断系统( FDS:The fault diagnosis system )用于检测潜在缺陷,将其隔离,并识别出具体的故障类型。在实际的应用中,真实的机器性能受到各种工作操作和环境条件的影响。在这些条件下,真实机器数据的分布通常会随着新的工况而变化。传统的基于DL和领域自适应技术的FDS在训练阶段需要同时访问新工况下的健康和故障数据,以保持其功能或适应其行为;然而,在模型训练过程中,只有健康状态是正常可用的,而故障数据往往是无法访问的。为了克服这个问题,需要消除依赖关系,并使诊断模型能够泛化到新的工况。为此,我们引入了自适应,其主要目的是使FDS能够在无法访问其故障数据的情况下对新的未知工况进行自主重构。

在信息物理系统的新兴技术和计算范式的背景下,所提出的自适应FDS的参考框架如图1所示。它包括被管理和管理元素层,而管理元素层负责实现自适应。MAPE - K循环是专门为设计、开发和实现FDS自适应而定制的,如图2所示。

 

图1 自适应故障诊断参考架构

 

图2 利用MAPE - K进行自适应故障诊断

MAPE - K环由以下四个重要的功能组件( FC:Functional Components )组成:

  •  FC1:监视器。该组件从被管元素和环境中获取数据,通过探针对其进行处理,以更新知识库。·
  • FC2:分析器。利用更新的知识,分析器确定是否需要适配,并分析适配的潜在场景。
  • FC3:规划器。如果认为适应是必要的,规划器执行最合适的适应场景,每个场景包含两个或多个适应动作。
  • FC4:执行者。执行者通过效应器执行开发的FDS,根据设计的计划调整被管理元素。      

管理元素使用这些组件之间的共享知识来协同实现自适应。在接下来的章节中,我们将详细介绍MAPE - K的各个组成部分。

4.1 监视器

监测是该循环的初始阶段,有责任为后续阶段提供必要的数据。在监测阶段,定期从FDS中的传感单元收集数据。Monitor组件处理来自传感器的数据,进行均匀化和噪声去除,使其适用于分析阶段和规划阶段。然后将处理后的信息存储在共享知识中。

4.2 分析仪

更新了通过监视器与机器最新操作数据共享的知识后,分析仪利用这些数据来检测机器工况的任何变化。为了衡量机器工况的变化,我们需要引入一些指标。首先,我们定义指标WCC(WCCWork Condition Change)如下:

其中        和        分别表示当前时刻和前一个采样时刻的工作状态。       为设计参数,由系统设计者定义,是在变化非常小的情况下防止误报的阈值。换句话说,      =      意味着检测到了工况的变化,因此需要进行适应性调整。

为了衡量新工况下DT的响应(        )与真机的响应(        )之间的差异,定义了以下指标:

其中        表示响应信号之间的计算误差,        θ 是确定响应信号之间可接受误差的调整阈值,         表示DT的响应与真实机器之间的较大差异,         表示较小且可接受的差异。这些指标的计算结果由知识中的分析器保存,以备将来参考。

4.3 规划者指标

分析器计算并存储在知识中的指标作为触发器,供规划者指导该功能组件。事实上,         的价值激活或失活了Planner。而          的价值驱动对系统变化做出适当的反应。具体来说,当检测到显著差异 (例如,          时, 表明当前DT模型已经过时,需要进行更新,因此规划者指标选择了三个适应任务,例如,更新策略、数据生成和领域泛化,分别为         ,         ,         ,更新策略详见第4.3.1节,在        中执行,而         提供来自多个域的带标签训练数据,并提供所需的数据分布,以启用后续的域泛化网络模型(见第4.3.2节)。最后,在第4.3.3节中介绍了         ,其责从多个源域中泛化已有的诊断知识。相反,在有限偏差(例如,          的情况下,即当DT不需要调整就能有效运行时,只有         和         被执行。

4.3.1          : 更新Dt模型

在所提出的自适应故障诊断系统中,DT模型的更新是一个关键的过程,该过程被视为一个优化问题。主要目标是最小化DT模型与真实机器演化条件之间的差异,确保DT与真实世界的变化保持同步。如图3所示,引入基于参数灵敏度分析的模型更新策略,使DT模型与目标真机状态对齐。该模型更新策略被定义为一个优化问题,其目标函数是最小化这些差异。

     
图3 DT更新策略      

为了实现DT更新概念,选择合适的响应信号来衡量真实目标机器状态的实际行为与DT模型预测的行为之间的相似性是至关重要的。基于所选择的响应信号,所开发的更新策略的优化函数可以定义为Eq.( 3 ) 。更新策略的成功取决于选择合适的度量标准来衡量真实系统行为和DT模型预测行为之间的相似性。例如,振动数据是监测工业系统健康状态的最具信息量的信号之一。然而,直接在时域中比较振动数据可能会具有挑战性,需要一种专门的度量标准来评估从模拟和真实场景中得出的频谱之间的相似性。

根据响应信号和定义的指标计算真实响应和模拟响应之间的相似度后,选择和调整更新参数,以减少RM与其DT之间的差异。一旦误差的平方范数落在可接受的范围内,表明DT的响应与机器新的、不可见的操作条件保持一致,则认为更新策略是成功的。

4.3.2          : 提供训练数据

从具有不同数据分布的多个领域中获取大量有标签的训练数据是使DG模型能够有效泛化的必要条件。作为对这种必要性的回应,        侧重于提供来自多个源域的训练数据集。该活动是        后续阶段的基础,分为两个步骤:

  • -多源域的定义

的范围是定义一个来自多个源域的训练数据集。第一步,执行真实机器的DT模型,构建源域数据集。因此,DT适用于不同健康状态下的仿真,包括不同的故障尺寸。为了补充这个主要数据集,我们探索了从目标机械的先前工作操作中收集的历史数据,并将其存储在知识库中。然而,在不同工作操作下从同一测试轴承中获取训练数据集的实际挑战使得该任务在某些情况下不可行。在这种情况下,可以从其他轴承中获得另一个可靠的训练数据集,其中丰富的诊断知识可在云存储库中获得,因为存在不同工业工厂、公司和数字平台的同类机器。这允许创建一个多样化的训练数据集,它作为        中领域泛化过程的基础。

  • -数据增强

其目的是通过使用来自不同领域的样本来生成新的样本(域间样本),从而探索领域相关性表示。因此,该模块在增加数据多样性的同时,在一定程度上保留了领域特异性,从而增强了学习到的特征的泛化性。此外,它确保了域间数据分布的平滑,促进了域不变表示的学习。

为了实现这一目标,我们从混搭概念(参见第3.3节)中获得了灵感。然而,传统的混合技术仅限于在两个域之间生成样本,忽略了对其他域的考虑。认识到这些在多源场景下的局限性,我们引入了多域混合,如图4所示。为了有效地利用来自多个领域的信息,我们采用狄利克雷分布代替贝塔分布对混合因子进行采样。

     
图4 传统混频与多域混频的比较      
选择Dirichlet分布比Beta分布具有显著的优势,特别是在多类和复杂场景中。狄利克雷分布通过生成和为1的混合权重来自然地处理多个类,简化了实现并保证了一致性。它对样品之间的重量分布提供了更大的控制,从而增强了混合的灵活性。相比之下,Beta分布主要适用于二分类场景,当扩展到多分类问题时效率较低。因此,狄利克雷自然地管理多类数据的能力,再加上它的简单性和灵活性,使其成为混合技术的首选。      
这种调整使得我们的多领域混合方法能够生成具有丰富信息和多样性的样本,使模型能够有效地提取全面和泛化的诊断见解。多源增强样本记为        ,是从不同源域的样本       中使用以下方程得到的:      

这里,         表示从Dirichlet分布          中随机取样的混合因子的集 合,其中          是一个m元序组数组,它的所有元素的值在本文中设置为相同.此外,为了促进域不变表示和最小化域差异,生成与增强样本相对应的软域标签用于对抗训练,如下面的方程所描述:

总之,通过强调样本级别的增强和引入软领域标签进行对抗训练,我们为领域泛化网络赋权,以更有效地提取领域不变表示。

4.3.3             :领域泛化网络模型

领域泛化网络模型在更广泛的自适应故障诊断系统中的一致性集成强调了系统将其诊断能力泛化到目标机器的未知工况的能力。更具体地说,DGNM旨在解决与多个分布偏移和无法获得新的工况数据(故障数据)有关的挑战。如图5所示,通过利用早期阶段            获得的训练数据,DGNM专注于学习领域不变的特征表示,可以有效地泛化以识别未知工况中的故障。          
         

图5  方案A2、A3的总体架构

为了保证FDS的泛化性和自适应性,我们采用了多种技术,包括对抗学习和基于领域的差异度量。DGNM由特征提取器            和分类器            组成,可以有效地处理跨域故障诊断任务。此外,基于对抗学习的判别器            有助于训练网络平等对待所有源域,从而促进跨不同运行条件的有效故障诊断所需的域不变表示的学习。此外,基于领域的差异度量            在最小化多个领域之间的分布差异方面起着至关重要的作用,从而增强了系统有效概括诊断知识的能力。最后,通过对原始数据和增广数据中的数据进行探索,对所开发的DGNM进行优化,以提取领域通用特征。

当模型训练完成后,DGNM保证了学习到的特征具有鲁棒性,从而增强了系统在目标机未见工况下的故障识别性能。

这项活动的执行分为以下基本步骤:

  •  -特征提取器和故障分类器模块

            更广泛的框架一致,特征提取器和故障分类器模块在DGNM中充当不可或缺的组件。利用基于CNN模型的广泛有效性,我们的方法使用                             作为源标签分类器和特征提取器。这种选择是由                              在处理工业机械中常见的信号,特别是振动信号的有效性所驱动的[36]。

特征提取过程涉及三个卷积层的序列,其次是平坦层和全连接层。该序列生成的高级表示记为               。我们使用LeakyReLU作为非线性激活层,并结合批量归一化来加速训练过程。这些表示作为后续故障诊断分类器模块的基础,其目的是创建依赖于域不变特征表示的判别分类器。该分类器模块以              为输入,包含两个全连接层,有效地将特征提取器的高维特征表示降为一个              维向量,表示为              。对于来自多个源域的原始样本和多域混合算法的增广数据,分类损失              可以写为:

其中             是增广样本的个数。

  • -域判别器模块

在所提框架的背景下,域判别器模块基于生成对抗网络的原理,由生成器和判别器组成,通常被描述为一个两人游戏[ 37 ]。为了培养网络公正对待所有数据源的能力,我们设计了一个使用对抗学习的多域判别器。这种方法有助于从多样化的源域获取领域不变的特征表示,最终加强了故障分类器在不同领域中的泛化性能。

领域判别器模块采用类似于分类器模块的结构来产生与特征表示Xg相关的概率。与领域对抗训练方案一致,我们采用交叉熵函数作为领域分类损失,定义为:

  • 基于领域的差异度量模块

在我们提出的DG网络模型的背景下,我们观察到监督学习和对抗训练可以将来自不同领域具有相同机器条件标签的数据样本投影到学习子空间中的相同区域。但是存在潜在的过拟合风险,不同类别的聚类效果无法得到保证。这种脆弱性在应用于新领域时可能会导致泛化性能降低。为了缓解这一挑战,我们在DGNM框架中引入了基于领域的差异度量模块。该模块的主要目标是最小化来自不同源域的数据分布之间的距离,以增强它们之间的凝聚力。从本质上讲,这使得来自不同领域的数据在一个共同的分布空间中对齐,同时保持来自同一领域的数据之间的合理距离。为了实现这一点,该模块通过对其输出施加正则化,将两个全连接层连接到特征提取器的输出,从而最大化域内距离,同时最小化域间距离。类内距离( Lintra )衡量聚类紧密度,确保同一类内的数据紧密聚类。这可以定义为:            
                        
其中              表示在我们的训练数据集中与第l台机器健康状态相关的样本集 合,它包括原始数据和增广数据。在              和              表示第j个个体样本。             表示              内的总样本数。此外,              是指由              产生的输出向量的维数,             是由              导出的均值。类似地,类间距离              量化了可分性,可定义为:            

其中                表示                在不同类中的平均值。综上所述,通过整合聚类紧致性               和可分性                的概念,我们将距离度量学习的优化目标表述如下:

                             
  • 优化目标:                

DGNM的优化涉及3个主要目标,重点关注特征提取器参数                、故障诊断分类器参数               、领域判别器参数                和基于领域的差异度量参数               。一个合适的优化目标有三个:最小化                和               的损失,同时最大化                的损失。

这样,综合目标函数L可以表示为:

其中超参数                和                用于对三个分量进行加权。

一旦建立整体损失函数L,对模型进行优化,使得:

在每个训练批次内使用随机梯度下降( SGD )算法迭代更新网络参数。SGD是机器学习中的一种基本优化技术,它利用训练数据的子集(批)计算损失函数关于网络参数的梯度,从而促进参数的有效更新。该方法使网络能够不断地优化其参数以最小化损失函数,从而增强了网络在故障诊断中跨不同领域的泛化能力。通过基于每个批次计算的梯度迭代调整参数,SGD确保网络渐进地学习到对现实场景中遇到的不同操作条件具有鲁棒性和适应性的表示。            
4.4 执行者            

Planner ( 即                )中的最后一个活动生成一个经过训练的模型,该模型存储在Knowledge中,必须由被管元素中的FDS单元执行。因此,执行器负责将开发的诊断模型加载并传递给FDS。

4.5 知识            
知识在提供所有MAPE元素协同工作和协作实现自适应的机制方面发挥着重要作用。知识包括不同的信息,如:            
  • 通过Monitor采集目标机的运行时数据,包括运行数据的相关值。
  • “ WCC ”和“                ”指标由分析器评估。

  • 数据来源于DT,包括机械的虚拟模型及其相关的几何参数,以及故障尺寸。

    活动模型(                  、                 、                ),计划者需要在每个场景中执行。

    设计参数(即阈值T ,                  ,                  ,                 )。

    历史数据,包括目标机器的先前工况,以及来自不同工业工厂、公司和数字平台的同类机器的数据。 

    编辑:赵栓栓
    校核:李正平、陈凯歌曹希铭、赵学功、白亮、任超、海洋、陈宇航、陈莹洁、Tina、王金、赵诚、肖鑫鑫
    该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除
    来源:故障诊断与python学习
System振动非线性旋转机械通用航空python海洋UM电机Electric机器人多尺度游戏数字孪生控制DAP
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-05-05
最近编辑:4小时前
故障诊断与python学习
硕士 签名征集中
获赞 77粉丝 106文章 190课程 0
点赞
收藏
作者推荐

ESWA论文学习 | 基于先验知识引导多任务动态学习的小样本下故障诊断方法

本期给大家推荐的文章是《基于先验知识引导多任务动态学习的小样本下故障诊断方法》。本文提出了一种基于先验知识引导的多任务动态学习模型,用于少样本故障诊断。作者将所提出的框架应用于两个小样本故障诊断案例,并证明与现有最先进的方法相比,所提出的解决方案在仅有20个故障训练样本的情况下,故障识别准确率可高达0.9803。适合于研究少样本学习和先验知识嵌入方法融合的学习者。论文基本信息论文题目:Prior knowledge-informed multi-task dynamic learning for few-shot machinery fault diagnosis论文期刊:Expert Systems With Applications论文日期:2025年作者:Tianci Zhang(a,b), Jinglong Chen(c), Zhisheng Ye(d), Wenting Liu(e), Jinyuan Tang(a,b)机构:a: State Key Laboratory of Precision Manufacturing for Extreme Service Performance, Central South University, Changsha, 410083, China;b: College of Mechanical and Electrical Engineering, Central South University, Changsha, 410083, China;c: State Key Laboratory for Manufacturing and Systems Engineering, Xi’an Jiaotong University, Xi’an 710049, China;d: Department of Industrial Systems Engineering & Management, National University of Singapore, Singapore 117576, Singapore;e: School of Business, Singapore University of Social Sciences, Singapore 599494, Singapore作者简介:张天赐,工学博士,中南大学机电工程学院讲师。2023年获西安交通大学工学博士学位,2022-2023年于新加坡国立大学访学。曾获陕西高等学校科学技术研究优秀成果一等奖等荣誉。研究方向为复杂装备(航空航天发动机、人形机器人等)的健康管理与智能运维,在IEEE TII、IEEE TIE、MSSP等国际著名学术期刊发表研究论文22篇(ESI高被引论文3篇),论文被引总次数1600+,单篇最高被引次数410+,H-index为16,公开授权国家发明专利1项。目录1 摘要2 引言3 方法3.1 问题描述3.2 所提出的方法3.3 先验特征集3.4 特征提取器3.5 动态学习策略 3.5.1 分类损失 3.5.2 知识不一致损失 3.5.3 动态权重分配4 实验验证与分析4.1 概述4.2 对比方法4.3 评估标准4.4 基于SQ故障实验数据的案例研究 4.4.1 实验与数据描述 4.4.2 动态权重的有效性 4.4.3 小样本下的故障诊断 4.4.4 鲁棒性分析 4.4.5 计算负担 4.4.6 多任务网络的学习机制4.5 基于TX故障实验数据的案例研究 4.5.1 实验与数据描述 4.5.2 小样本下的故障诊断 4.5.3 利用未标记数据进行故障诊断4.6 讨论5 结论1 摘要 在现代工业应用中,机器故障数据的缺乏使得少样本故障诊断变得尤为重要。如果能够在学习过程中融入先验知识,少量样本就足以训练出一个好的模型。本文提出了一种基于先验知识引导的多任务动态学习模型,用于少样本故障诊断,该模型包括一个用于故障识别的主任务和一个用于先验知识学习的辅助任务。所提出模型以信号特征指标作为先验知识的来源。之后,设计了一个动态的先验知识不一致性惩罚,该惩罚可以根据训练需求进行调整,用于辅助先验知识学习任务。辅助任务中学习到的知识通过专用的共享网络被主任务利用,从而减少了主任务对训练数据的需求。我们将所提出的框架应用于两个小样本故障诊断案例,并证明与现有最先进的方法相比,我们的解决方案在仅有20个故障训练样本的情况下,故障识别准确率可高达0.9803。关键词:机器故障诊断;小样本学习;多任务学习;先验知识2 引言 复杂设备(如航空发动机)在发生故障时可能会遭受严重损坏。故障诊断是预测性健康管理(Prognostics Health Management, PHM)的核心组成部分,它在机器监测数据与其健康状态之间起到桥梁作用。在工业环境中,状态监测和故障诊断对于降低运营和维护成本以及提高设备可靠性至关重要。振动分析是机器故障诊断中最广泛使用的技术之一。传统上,工程师使用小波变换等方法分析振动监测数据,并依赖专家知识来评估机器的健康状况。然而,这些方法严重依赖人工专业知识,给快速准确的数据分析带来了挑战。在过去十年中,机器学习的显著进展推动了深度神经网络在智能诊断模型开发中的广泛应用。这些模型能够分析大量监测数据以检测潜在的故障信息。尽管这些智能模型能够快速准确地处理数据,但它们的性能与训练数据集的丰富性直接相关,更全面的数据可以带来更好的结果。在工业环境中,机器故障是少见的,直接收集足够的故障数据非常困难。此外,在实验室中进行故障模拟实验以生成此类数据成本高昂。因此,用于训练智能模型的故障数据非常有限。因此,开发能够在有限故障数据下有效工作的故障诊断模型仍然是一个关键且实际的挑战。学者们对少样本智能故障诊断领域进行了大量研究,目标是利用有限的训练样本开发诊断模型。这些研究可以分为三种主要方法:基于数据增强的方法、基于算法优化的方法和基于迁移学习的方法。第一种方法旨在通过数据增强技术提高泛化性能。例如,Zhang, Li et al.提出了一种基于深度生成对抗网络的方法来增强机器监测数据,从而在小样本情况下提高诊断模型的泛化能力。在 Zhang, Kong et al.研究中,提出了条件最小二乘生成对抗网络来生成故障样本用于模型训练。同样,其他数据增强模型(如变分自编码器)也被应用于有限样本的机器故障诊断。第二种方法专注于从有限的故障数据中提取更丰富的故障特征。例如,Wang et al利用基于逆残差块和协作自注意力的轻量级模型进行少样本故障诊断。在 Ye et al研究中,提出了一种残差卷积融合网络,用于从有限样本中提取轴承故障特征。在Zhanget al的研究中,采用了一种基于相似性的对比学习方法,用于在有限训练样本的情况下进行机器故障诊断。第三种方法涉及利用相关数据集转移诊断知识以解决少样本诊断任务。例如,Kim and Youn提出了一种可转移的孪生网络用于故障诊断,该网络可以通过知识转移提取小样本的故障特征。Liu et al.提出了一种基于深度领域自适应的迁移学习框架,用于在目标域中样本量较小的情况下进行轴承故障诊断。在 Dong et al.的研究中,使用了一种新的动态迁移学习模型来解决小样本的轴承故障诊断问题。然而,值得注意的是,基于数据增强的方法消耗大量的计算资源,给开发人员带来了挑战。此外,基于算法优化的方法可能由于数据有限,在复杂的假设集中难以找到最优解。此外,基于迁移学习的方法需要合适的迁移对象,在某些情况下存在负迁移的风险。图1 先验知识引导的机器学习框架近年来,机器学习领域对将先验知识整合到模型学习过程中的研究兴趣日益增加,这种范式被称为先验知识引导的机器学习(Prior Knowledge-informed Machine Learning, PK-ML)(von Rueden et al., 2021)。如图1所示,PK-ML与传统数据驱动的机器学习不同,它不仅由训练数据引导,还受到先验知识约束。这种整合允许先验知识限制模型的假设集,从而缩小其搜索空间。因此,模型只需要较少的训练数据就能够找到合适的最终假设。因此,PK-ML被认为是一种减少模型开发所需训练数据的有效方法。在机器故障诊断领域,学者们积累了大量的专业知识,包括故障特征、故障机理、诊断规则等。这些知识源于对故障机理的细致分析和丰富的工程经验,因此在应用于机器故障诊断任务时既可靠又稳定。因此,将这种领域知识整合到智能诊断模型的学习过程中具有重要意义。例如,Liu et al. (2025) 提出了一个带有知识引导的有限脉冲响应滤波核网络模型,用于小样本下的故障诊断。Lu et al. (2025) 应用了一种先验知识嵌入的卷积自编码器,用于小样本下的故障诊断。因此,通过利用先验知识,即使在有限的故障数据下,也有可能开发出令人满意的诊断模型。多任务学习能够将从一个任务中学习到的知识转移到其他任务中,是整合先验知识的有效方法。在模型开发中,多任务学习通常涉及一个主任务和几个相关的辅助任务,开发者的先验知识可以嵌入辅助任务中。例如,在基于多任务学习的面部标志检测中,主任务是面部标志检测,而辅助任务包括性别识别和面部姿态识别等。这些辅助任务通过专家先验知识帮助模型学习与面部标志检测相关的面部特征。因此,通过辅助任务整合先验知识,主任务的性能得到了增强。综上所述,将先验知识整合到诊断模型的学习过程中可以显著减少其对故障数据的依赖。同时,多任务学习已被证明是整合此类知识的有效策略。基于这些见解,本文提出了一种面向少样本机器故障诊断的先验知识引导的多任务动态学习网络。所提出的方法包括一个专注于故障识别的主任务和一个专门用于学习先验诊断知识的动态辅助任务。根据故障诊断领域的知识,我们认识到振动信号的特征指标(如峰度和偏度)在一定程度上可以反映机器的健康状态。因此,我们首先选择一系列信号特征指标来形成先验特征集,这些先验特征的有效性已在许多研究中得到验证。在辅助任务中,我们的网络旨在通过优化动态知识不一致性损失从输入数据中学习这些先验特征。这种动态损失可以根据主任务和辅助任务的实时训练进度进行调整。鉴于共享的网络结构,辅助任务所获得的知识也可供主任务使用,从而减轻主任务的学习负担并减少其对大量训练数据的需求。因此,主任务有望在有限的训练数据下实现准确的故障识别。本文的贡献可以总结如下:定义了一个多任务动态学习网络,能够从输入数据中发现先验知识,从而可从小样本数据中提取高度可靠的特征。提出了一种基于多任务动态学习的先验知识引导的诊断方法,用于解决具有挑战性的少样本故障诊断问题。基于两个机械故障模拟实验台的广泛实验验证了所提方法的有效性。与现有最先进的方法相比,我们的解决方案在小样本场景下具有显著优势。本文的其余部分安排如下:第2节详细描述了所提出的方法;第3节通过两个机械故障模拟实验验证了所提方法的优越性;第4节总结了整篇文章。3 方法 表1 使用的符号和其对应含义首先,为了更清晰地表达,本节中使用的符号及其对应含义可以在表1中找到。3.1 问题描述本研究专注于旋转机械的状态监测与故障诊断,特别是轴承和齿轮这些关键部件。目标是对这些被监测部件的故障位置和严重程度进行诊断,为机器的PHM提供重要的决策支持。我们采用的是振动传感器和数据采集设备收集的机器振动信号。从轴承或齿轮收集到的振动信号被分割并标记,以创建数据集 ,其中, 表示第 个样本,包含 个振动数据点,而 是健康状态标签。考虑到样本数量有限的情况,我们将 限制为小于或等于20。利用该数据集,本研究旨在开发一种用于旋转机械的故障诊断方法,能够仅使用少量故障样本学习从振动信号到健康状态学习非线性映射 。3.2 所提出的方法图2 所提方法的框架在工业环境中,机器故障数据通常非常有限。现有的智能诊断模型,尤其是基于深度神经网络的模型,由于其众多参数,需要大量的故障数据进行训练。最近的研究表明,将先验知识整合到模型训练过程中可以显著减少模型对大量训练数据的需求。为解决这些挑战,本研究提出了一种利用先验知识的多任务动态学习网络,用于在样本量有限的情况下进行机器故障诊断,如图2所示。主任务 专注于故障诊断,而辅助任务 专注于先验特征学习,其中 表示预定义的先验特征集。主任务 通过共享特征提取器利用 获得的知识,从而减少对大量训练数据的依赖。所提出方法的训练目标可以表示为: 其中, 是主任务 中的分类损失, 是其权重因子; 是辅助任务 中的知识不一致性损失, 是其权重因子。3.3 先验特征集表2 先前的10个特征指标在故障诊断领域,专家们积累了大量的诊断知识,包括故障机理、故障特征、诊断规则和特征提取算法,这些构成了该领域的先验知识。故障特征包括信号特征指标(如峰度和偏度),这些指标可以反映机器的健康状况,它们通常基于对故障机理的严格分析和丰富的专家经验,并且其有效性已在实际应用中得到了广泛验证。在本方法中,我们选择了十个信号指标来构成先验特征集 ,其中 是第 个先验指标,如表2所示。我们从训练数据中提取这十个先验特征,并使用零均值归一化进行标准化。3.4 特征提取器表3 特征提取器架构在所提出的方法中,主任务 和辅助任务 共享特征提取器,这是该方法的骨干网络。特征提取器由卷积层、池化层和全连接层组成,其结构和参数设置如表3所示。 在特征提取器中,第u个卷积层的输出为: 其中, 是该层的特征向量, 和 分别是该层的卷积核和偏置。 表示第 个最大池化层的输出。 最大池化层的输出为: 其中, 和 分别表示窗口大小和步长。激活函数 定义为: 第u层全连接层的输出 为: 其中, 和 是该层的权重和偏置。3.5 动态学习策略如公式(1)所示,所提出方法的训练目标包含两项:分类损失 旨在识别故障类型,而知识不一致性损失 旨在最小化预测特征与先验特征之间的差异,从而使模型能够从先验知识中学习。3.5.1 分类损失 在主任务中,学习到的特征被送入Softmax分类器进行分类。Softmax分类器的操作可以表示为: 其中, 是Softmax分类器的参数。 主任务中的分类损失是一个交叉熵损失,可以表示为: 3.5.2 知识不一致性损失 在辅助任务中,学习到的特征通过一个全连接层输出一个10维向量 ,并通过优化均方误差来近似先验特征 。因此,知识不一致性损失 可以定义为: 动态权重分配算法1 所提出方法的训练过程在多任务学习中,不同任务的损失值大小可能不同。如果直接将这些损失值相加以得到最终模型损失,其中一个任务可能会主导学习过程。因此,为每个任务的损失分配适当的权重至关重要。本模型的目标是实现最优的分类准确率,通过在训练过程中动态调整辅助任务的权重 来实现。因此,我们直接将权重 设置为1,并调整辅助任务 的权重以优化主任务的性能。通过初步实验,我们观察到在训练初期, 通常小于 ,辅助任务收敛速度更快,表明模型倾向于优先学习辅助任务。因此,为了协调两个任务的训练进度,我们设计了一个动态权重分配方案,如公式(9)所示。该方案根据实时损失值调整 ,防止模型在训练初期被辅助任务主导。此外,它还能在训练后期使主任务最优收敛,最终使模型达到最高的故障分类准确率。 动态权重 的计算公式如下: 其中, 表示训练的迭代次数。 最终,所提出方法的训练过程可以总结为算法1。4 实验验证与讨论 4.1 概述在本节中,我们进行了两个机械故障测试实验:Spectra Quest(SQ)轴承故障测试实验和TianXian(TX)轴承和齿轮故障测试实验。通过这两个实验数据集验证了所提出方法的有效性,并进行了讨论。具体来说,我们使用SQ数据验证了模型在小样本场景下对轴承的诊断性能,并分析了所提出方法的学习机理。此外,鉴于工业环境中无标签数据易于获取,我们还探索了所提出方法利用无标签监测数据的潜力,并使用TX数据进行验证。 验证过程在一台64位Windows 10操作系统、Intel Core i3-4170 CPU @ 3.70 GHz的计算机上完成。编程语言为Python 3.6.12,运行环境为TensorFlow 1.13.1。 对于所有实验,所提出方法使用的优化器为Adam,学习率为0.0005。每次训练包含100个迭代周期。此外,每个实验重复10次,取平均结果用于分析。4.2 对比方法为了验证所提出方法的优越性,我们选择了六种方法进行对比实验,包括与所提出方法相关的两种方法和五种最先进的诊断方法。1:PFS:使用表2中的十个信号特征指标作为输入,并通过Softmax分类器直接输出分类结果。2:DCNN:使用深度卷积神经网络处理数据并输出健康标签。DCNN的结构、超参数和训练设置与主任务相同。3:KEAE:Chen et al提出了一种知识嵌入自编码器网络,用于小样本下的故障诊断,同样利用领域知识减少了训练数据量。4:R-Net:Yang et al构建了一种具有宽卷积核的残差卷积神经网络,并将其应用于有限故障样本下的机器故障诊断。5:S-Net:Wen et al提出了一种具有少样本学习能力的孪生神经网络,用于小样本下的机器故障诊断。6:FCGAN:Zhang et al使用基于生成对抗网络的信号增强模型,可以提高小样本条件下的诊断模型泛化能力。7:PKCA:Lu et al提出了一种先验知识嵌入的卷积自编码器,用于小样本下的轴承故障诊断。4.3 评估标准为了更全面地评估所提出方法的有效性,我们采用了三种常见的评估标准。准确率(Accuracy)反映了模型正确预测的样本数占总样本数的比例,公式如下: 其中,TP表示实际为正且预测为正的样本数,FP表示实际为负且预测为负的样本数,FN表示实际为负但预测为正的样本数,TN表示实际为正但预测为负的样本数。F1分数(F1-Score)综合考虑了模型正确预测的故障样本比例,公式如下: 曲线下面积(AUC)从概率角度评估模型的分类性能,更高的AUC分数表明模型输出的概率更准确。公式如下: 其中, 和 分别表示正样本和负样本的数量,表示第个正样本的排名索引。4.4 基于SQ故障实验数据的案例研究4.4.1 实验与数据描述图3 SQ轴承故障实验台,(a)实验台全貌,(b)被测故障轴承SQ机械故障测试实验在SQ测试台上进行。如图3(a)所示,SQ测试台包含一个感应电机、转子、磁粉制动器、数据记录器和振动传感器。根据Chen et al的研究,约40%的电机故障与轴承相关。因此,我们选择了电机的驱动端轴承进行测试,该轴承为NSK6203型号。使用灵敏度为50 mV/g的振动加速度传感器收集振动信号。在实验中,电机的转速设置为40 Hz,数据记录器的采样频率为25.6 kHz。 如图3(b)所示,在轴承的内圈和外圈上加工出六个单点损伤,以模拟不同的轴承故障。这六种故障分别为:轻微内圈故障(IF-1)、中等内圈故障(IF-2)、严重内圈故障(IF-3)、轻微外圈故障(OF-1)、中等外圈故障(OF-2)和严重外圈故障(OF-3)。此外,还包含一个正常状态(NC-0)的轴承用于测试。因此,在SQ故障测试实验中,共收集了七种不同健康状态的振动信号。我们选择1024个连续数据点作为一个数据样本。每种健康状态的信号被划分为1125个数据样本,这些数据样本是模型训练和测试的数据来源。4.4.2 动态权重的有效性图4 不同权重值下的故障分类准确率结果首先,我们希望验证所提出方法中动态权重 的有效性。由于固定权重是多任务学习中常见的选择,我们选择了从0.5到4.0的八个固定值作为辅助任务的权重。这一范围的设置基于预实验结果,我们发现在此范围内方法能够实现相对较高的准确率。实验中,从每个类别中选择10个数据样本作为训练样本,其余样本作为测试样本。方法的故障分类结果如图4所示。图5 不同权重值下的损失变化情况当使用固定权重时,方法在权重为2时能够实现最高的准确率0.9038。然而,当应用动态权重时,准确率提升至0.9300。因此,从准确率的角度来看,动态权重表现更好。此外,我们记录了训练过程中损失值和 的变化,结果如图5所示。在图5(a)中,当使用固定权重时,主任务和辅助任务的收敛速度存在显著差异,其中辅助任务的收敛速度比主任务更快。这种差异可能导致模型更倾向于辅助任务,从而无法获得最佳的诊断性能。出现这种现象的原因在于两个任务的学习难度不同,而固定权重无法平衡实时训练进度。在图5(b)中,动态权重能够有效地平衡两个任务的学习速度,使两个任务几乎同时收敛。因此,所提出的方法能够充分利用辅助任务中学到的知识,并最终在主任务中实现最高的诊断准确率。图6 训练过程中的损失值及分类准确率变化图6展示了训练过程中模型的训练损失和分类准确率的变化。可以看到,随着训练损失逐渐收敛,模型的分类准确率也逐渐达到峰值并保持稳定。4.4.3 小样本下的故障诊断表4 基于SQ实验数据的分类准确率结果表5 基于SQ实验数据的F1-Score结果表6 基于SQ实验数据的AUC结果所提出的方法旨在解决工业场景中的少样本故障诊断问题。受Zhang et al的启发,我们将小样本定义为每个类别不超过20个训练样本。与SQ实验数据集中每个类别的总样本数(1125)相比,这一阈值被认为是很小的。在实验中,我们从每个类别中分别选择了1、5、10、15和20个样本作为训练样本,其余样本用于测试。所提出方法的分类准确率结果以及六种对比方法的结果如表4所示。分类F1分数如表5所示。分类AUC结果如表6所示。上述表格中的结果可以总结如下:(1)先验特征的有效性:即使只有一个训练样本,PFS方法的准确率也能达到0.7061,显著高于其他四种对比方法。这表明先验特征在少样本故障识别中的有效性。PFS通过使用手动计算的信号特征而不是神经网络提取的特征,避免了小样本条件下参数过拟合的问题。(2)多任务学习的有效性:所提出的方法在所有任务中均优于DCNN。鉴于DCNN与所提出方法的主任务拥有相同的网络结构和参数,这些结果表明多任务学习框架在小样本条件下提升了模型的诊断性能。(3)相较于最先进方法的优越性:与五种最先进的方法相比,所提出的方法在所有场景中均展现出更高的性能。这表明所提出的方法可能更擅长解决实际工业环境中的少样本故障诊断难题。此外,从上述三个表格中呈现的结果来看,所提出方法的预测结果通常具有更小的标准差,表明该方法在有限训练样本条件下具有更强的鲁棒性。图7 10个训练样本下的故障特征提取结果此外,我们利用t-SNE技术将所提出方法提取的故障特征降维至二维并进行可视化,结果如图7所示。图7中的故障特征提取基于10个训练样本。可以看到,即使在训练样本较少的情况下,所提出的方法仍能够从大量的轴承监测数据中提取出清晰可区分的故障特征。4.4.4 鲁棒性分析在工业环境中,从机器上收集的监测信号通常包含大量的背景噪声,这些噪声可能会掩盖故障信息,阻碍诊断方法对故障的准确识别。因此,对噪声的鲁棒性是评估诊断方法在工业环境中实际应用能力的关键因素。图8 不同噪声水平下的外圈轻微故障信号图9 不同噪声水平下的故障诊断准确率结果为了模拟真实场景中噪声污染的监测信号,我们在监测信号中人为地添加了不同水平的高斯噪声。采用信噪比(SNR)来量化噪声强度,较低的SNR值表示更高的噪声强度。在实验中,我们将监测信号的SNR从20 dB逐步调整到0 dB。为了说明,图8展示了在不同SNR条件下OF-1故障类别的监测信号。此外,训练样本的数量设置为20。所提出方法与其他方法的诊断结果如图9所示。如图9所示,随着噪声强度的增加,所有方法的诊断准确率显著下降。然而,所提出的方法在几乎所有任务中均实现了最高的诊断准确率。即使在0dB时,噪声强度与原始信号相当,所提出的方法仍保持了0.7698的准确率。这表明,与其他方法相比,所提出的方法在处理工业环境中的含噪监测信号方面更为有效,从而能够满足工程应用需求。4.4.5 计算负担表7 模型计算负担分析鉴于工业环境中计算资源通常有限,计算负担已成为评估诊断模型的另一项关键指标。因此,表7列出了每种方法的训练时间、测试时间、参数数量和浮点运算次数(FLOPs)。需要注意的是,表7中的结果是基于10个训练样本得出的。在表7中,PFS方法的参数数量被省略,因为其特征是通过手动计算而非神经网络得出的。与最先进的方法(不包括PKCA)相比,所提出的方法在参数数量和计算复杂度方面略高。就训练时间而言,依赖于数据增强的FCGAN比其他方法需要更长的时间。对于测试时间,尽管所提出的方法比四种最先进的方法稍慢,但其性能在工业场景中仍然可以接受。具体来说,所提出的方法处理7×1115个样本需要12.06秒,而这相当于312.2秒的监测周期,从而能够满足状态监测的实时性要求。4.4.6 多任务网络的学习机制在本节中,我们通过检查网络权重来阐述所提出方法的学习机制。所提出方法的核心是利用辅助任务所学到的知识来指导主任务的学习过程,这意味着主任务的权重受到辅助任务所学知识的影响。为了观察和评估多任务结构的影响,我们记录了辅助任务的权重分布 和整个所提出方法的权重分布{{P}_{m}}。当方法仅执行辅助任务时获得分布 ,而初始权重分布设置为正态分布 。由于主任务和辅助任务共享特征提取器的参数,我们绘制了特征提取器的权重分布。结果如图10所示。此外,为了量化权重分布 和 之间的相似性,我们计算了它们的Wasserstein距离,它是评估分布相似性的标准度量。图10 特征提取器中的权重部分,WD代表Wasserstein距离。(a)(b)(c)(d)分别代表第1/2/3/4层卷积层的权重分布在图10中,与初始分布 相比,第一卷积层的权重分布发生了显著变化。具体来说, 和 之间的Wasserstein距离为0.003102,表明这两个分布之间具有高度相似性。这种相似性表明,多任务网络的权重受到辅助任务的显著影响。图11 特征提取器中三个权重分布的关系图此外,我们探讨了分类任务中分布 、 和 之间的关系,该分类任务仅由训练数据指导。如图11所示,当所提出的方法仅执行主任务时,得到分布 。分布呈现出一定的对称性,两侧分布较密集,中间分布较稀疏。相比之下, 的中间分布并不明显低于两侧。与此同时, 整合了 和 的特征。这一观察结果表明,多任务学习网络的权重既受到训练数据的指导,也受到辅助任务中先验特征的指导。4.5 基于TX故障实验数据的案例研究4.5.1 实验与数据描述图12 TX故障实验台,(a)为实验台全貌,(b)为被测轴承及齿轮TX故障测试实验在TX测试台上进行。如图12(a)所示,TX测试台包括电机、齿轮箱、数据记录器和振动加速度传感器。与SQ实验不同,TX实验中的测试对象包括轴承和齿轮。被测试的轴承和齿轮安装在齿轮箱中,如图12(b)所示。在实验中,我们分别为每个被测试的轴承加工了六个单点损伤,并在被测试的齿轮上加工了一个故障。我们进行了七次实验以收集这些故障对象的振动数据。此外,我们还收集了正常状态下的振动数据。所用传感器的灵敏度为50 mV/g,电机转速为800 rpm,数据记录器的采样频率为5 kHz。这八种健康状态可以缩写如下:轴承保持架故障(CF-0)、轴承滚子故障(RF-0)、轴承外圈点焊故障(OF-0)、轴承外圈轻微故障(OF-1)、轴承外圈中等故障(OF-2)、轴承外圈严重故障(OF-3)、齿轮故障(GF-0)和正常状态(NC-0)。我们使用1024个连续数据点作为一个数据样本,每种健康状态的数据被划分为774个数据样本。4.5.2 小样本下的故障诊断表8 基于TX实验数据集的分类准确率结果表9 基于TX实验数据的F1-Score结果表10 基于TX实验数据的AUC结果图13 20个训练样本下的分类结果(a)为分类结果的混淆矩阵,(b)为特征可视化结果我们基于所提出的方法和相关方法进行了实验。实验结果如表8、表9和表10所示。在上述表格中,所提出的方法优于相关方法。此外,我们还给出了当使用20个训练样本时,方法的分类混淆矩阵和特征可视化结果。结果如图13所示。从图13可以看出,所提出的方法能够使用少量训练样本区分不同类别的数据。4.5.3 利用未标记数据进行故障诊断在工业场景中,有标签监测数据较为稀缺,因为标记数据是一项劳动密集型任务。与此同时,无标签监测数据更容易获取。在故障诊断中,许多论文都专注于利用无标签数据来提高诊断模型的性能。所提出的方法也能够利用无标签数据。在所提出的方法中,辅助任务从原始数据中学习先验特征,这一过程不需要数据标签。因此,我们可以将额外的无标签数据用于辅助任务的训练。在这种情况下,所提出的方法可以从更多数据中学习先验知识,这有望进一步提高所提出方法的性能。图14 在不同无标签训练数据下的故障分类准确率结果为了验证无标签数据的增强效果,我们将有标签训练样本的数量固定为20个。我们分别取20、40、60、80和100个无标签样本用于学习辅助任务。我们记录了每种情况下的故障识别准确率,结果如图14所示。图15 在20个有标签样本及100个无标签样本下的故障诊断准确率结果从图14可以看出,无标签样本有助于所提出的方法获得更好的性能。当不使用无标签样本进行训练时,所提出方法的准确率为0.8806。当使用100个无标签样本时,准确率提高到0.9516。当无标签样本数量为100时的混淆矩阵和特征可视化结果如图15所示。与图13相比,使用无标签数据使所提出的方法获得了更强的分类能力和更具区分性的特征。4.6 讨论所提出方法的优势总结如下:(1)该方法能够在训练数据极少的情况下实现准确的故障识别,这在工业环境中故障数据有限的情况下尤为有利。(2)该方法对噪声具有鲁棒性,使其适用于实际工业环境中普遍存在的强噪声污染场景。(3)它能够利用无标签数据来增强诊断性能,从而提高了其在工业场景中的实际应用价值。与最先进的诊断方法相比,我们的方法在诊断准确率方面表现出一定的优势,在仅使用20个训练样本时,诊断准确率达到了0.9803。在计算复杂度方面,我们采用浮点运算次数(FLOPs)作为衡量指标。除PKCA外,所提出方法的计算成本在FLOPs方面略高于其他几种选定的最先进的方法。在网络骨干方面,我们的方法采用标准卷积神经网络(CNN),其设计相对简单,与其他方法中使用的骨干网络相比更容易实现。在知识利用方面,我们的方法与KEAE和PKCA一样,均利用了故障诊断领域知识。在应用可扩展性方面,我们认为其他方法经过适当调整后也有潜力应用于其他诊断场景。例如,FCGAN可以通过调整数据生成比例来解决不平衡数据集中的故障诊断问题。所提出的方法由于其简单且易于替换的网络骨干以及在故障诊断中普遍适用的先验知识,展现出更好的应用可扩展性。例如,所提出的方法可以选择对齿轮故障更敏感的信号特征作为先验特征,从而实现有限样本下的齿轮故障诊断。详细的比较结果如表11所示。最后,关于未来的研究方向,短期内我们将专注于所提出方法的理论分析和优化。这具体包括动态权重分配函数的最优设计、模型训练稳定性的增强以及对过拟合和局部最小值的控制。在中期内,我们的研究方向将是将所提出方法应用于各种场景下的轴承诊断,包括不平衡数据场景和变化的工作条件下。长期研究方向包括两个方面。首先,我们计划整合其他故障诊断领域的知识,例如故障机理。其次,我们计划将所提出方法的应用扩展到其他机械部件的诊断,例如齿轮箱和转子系统。详细的研究计划可以在表12中找到。5 结论 由于机器故障数据并不总是充足的,因此在有限样本的情况下构建数据驱动的诊断模型是一个挑战。在本研究中,我们提出了一种基于先验知识引导多任务动态学习网络的少样本故障诊断方法。该方法同时实现了先验诊断知识的学习和故障识别。由于共享的网络结构,该方法仅使用少量故障数据就能提取高度可靠的故障特征。我们设计了两个少样本故障诊断场景,以验证所提出方法在不同任务条件下的有效性。广泛的实验结果表明,与最先进的方法相比,所提出的方法能够使用极其有限的故障样本实现更可靠的故障识别。所提出的方法在仅有20个故障训练样本时实现了高达0.9803的诊断准确率。此外,通过使用无标签数据,该方法的性能可以进一步提高。因此,所提出的方法是一个强大的工具,能够克服由于故障样本稀缺而带来的诊断挑战。编辑:曹希铭校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、海洋、冯珽婷、陈宇航、陈莹洁、王金、赵诚、肖鑫鑫该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈