首页/文章/ 详情

综述 | 旋转机械智能故障诊断中的多传感器数据融合综述(上)

3小时前浏览2

    本期给大家推荐旋转机械智能故障诊断中的多传感器数据融合综述(上)。旋转机械的故障可能引发重大的经济损失和安全风险。因此,利用多传感器状态监测数据对其进行分析引起了广泛关注。然而,目前仍缺乏针对多传感器数据融合方法应用的全面综述文章。为填补这一空白,本文系统梳理并深入分析了应用多传感器数据融合技术诊断旋转机械故障的相关文献。首先,文章阐述了多传感器数据融合的基本概念,为后续讨论奠定理论基础。随后,重点分析了该融合技术在旋转机械智能故障诊断中的具体应用。此外,本文还明确指出当前该技术在实际应用中面临的关键挑战。通过剖析这些挑战,文章进一步提出了该领域未来有价值的研究方向。

    论文链接:通过点击本文左下角阅读原文进行在线阅读及下载

    论文基本信息

    论文题目:Multi-Sensor data fusion in intelligent fault diagnosis of rotating machines: A comprehensive review

    论文期刊:Measurement

    论文日期:2024年

    论文链接

    https://doi.org/10.1016/j.measurement.2024.114658

    作者:Fasikaw Kibrete (a, b), Dereje Engida Woldemichael (a, b), Hailu Shimels Gebremedhen (a, b)

    机构:

    a: Department of Mechanical Engineering, College of Engineering, Addis Ababa Science and Technology University, P.O. Box 16417, Addis Ababa, Ethiopia;

    b: Artificial Intelligence and Robotic Center of Excellence, Addis Ababa Science and Technology University, P.O. Box 16417, Addis Ababa, Ethiopia;

    通讯作者邮箱: dereje.engida@aastu.edu.et

    目录

    1 摘要

    2 引言

    多传感器数据融合的基本概念

    用于旋转机械故障诊断的多传感器数据融合

          4.1 数据级融合

    4.2 特征级融合

    4.3 决策级融合

    (以上标记章节为本文内容)

    4.4 多级融合

    5 观察、现有挑战和未来研究方向

    6 总结

    1 摘要

    旋转机械在多种工业中被广泛使用,其故障可能导致重大的经济损失和安全风险。因此,旋转机械的智能故障诊断,特别是通过利用多传感器状态监测数据,引起了越来越多的研究兴趣。然而,目前缺乏一篇专注于多传感器数据融合方法的全面综述。为了解决这一问题,本文对应用多传感器数据融合技术诊断旋转机械故障的现有文献进行了全面分析。首先提供了多传感器数据融合的基本概念,为后续讨论奠定了坚实的基础。然后,深入分析了多传感器数据融合在旋转机械智能诊断中的应用。此外,本综述论文强调了当前在多传感器数据融合用于旋转机械智能故障诊断中遇到的挑战。通过考虑这些挑战并整合来自各种来源的知识,本文提出了该领域未来的研究方向。这篇综述文章对于旋转机械智能故障诊断领域的研究人员、从业者和决策者来说是一个宝贵的资源。该综述全面洞察了多传感器数据融合技术的最新进展,并指导了测量科学领域的未来研究方向。

    关键词:状态监测,智能故障诊断,多传感器数据融合,旋转机械,传感器集成

    2 引言

    旋转机械是现代制造业运作不可或缺的部分。这些机器的可靠和高效运行对于保持生产力、提高安全性和最小化停机时间至关重要。旋转机械通常承受各种运行条件和应力,可能导致各种类型的机械故障,包括不平衡、不对中、轴承磨损和机械损伤[1]。任何此类故障都可能导致整个工业设备的意外停机、重大的经济损失,甚至潜在的健康和安全风险[2, 3]。因此,及时准确的故障诊断对于工业系统中旋转机械的可靠和高效运行至关重要。

    随着传感器和数据采集技术的巨大进步,基于数据驱动的方法,特别是基于人工智能(Artificial Intelligence, AI)的方法,已引起极大的兴趣。然而,先前在旋转机械智能故障诊断(Intelligent Fault Diagnosis, IFD)方面的研究主要依赖于单个传感器数据进行状态监测[4-7]。这种方法在覆盖范围和安装位置方面存在局限性,这使得捕捉大型旋转机械的全面信息变得具有挑战性[8]。单传感器数据可能导致漏检,并且易受外部干扰和噪声的影响[9]。此外,环境条件和运行变化会显著影响从单个传感器获得的测量结果,导致不准确的故障诊断结果。为了应对这些挑战,研究重点已转向基于多传感器数据融合的故障诊断[10-12]。通过集成多个传感器,可以捕获更广泛的故障信息,包括振动、温度、声学、电流和磨屑。多个传感器的集成使得冗余和互补的故障指标测量成为可能,这有助于更详尽地分析目标机器的状态。通过考虑多个数据源并解决单传感器方法的局限性,这种方法提高了故障诊断的准确性和可靠性。

    在过去的几十年里,研究人员为开发旋转机械IFD的多传感器数据融合方法做出了巨大努力。这些方法涉及在多个层级融合多个数据源的数据或相关信息[13]。多传感器数据融合在旋转机械故障诊断中具有若干优势。首先,通过融合多个相似传感器的数据,增强了诊断准确性,从而捕获了更广泛的信息。融合这些数据使得识别可能无法被单个传感器检测到的故障特征成为可能[14]。此外,多传感器数据融合通过减少噪声影响和最小化误报来提高故障分类性能。集成来自多个传感器的数据使得系统在区分不同故障类别和准确分类故障方面更加鲁棒和可靠。此外,多传感器数据融合能够提取更丰富的特征和模式,有助于实现更有效的故障诊断。通过考虑不同传感器测量值之间的相关性和相互作用,可以揭示隐藏的关系,从而为故障诊断算法或模型推导出更具信息量的特征。这提高了旋转机械故障诊断的准确性,并加深了对潜在故障机理的理解。

    在此之前,尽管针对旋转设备故障诊断的多传感器数据融合已开展大量研究,但专门聚焦该主题的综述文章却寥寥无几。例如,Gawde等[15]试图对多传感器数据在旋转机械故障诊断中的应用进行范围界定综述。同样,Guo等[16]专注于信息融合在轴承故障诊断中的应用。而Das等[17]则对旋转机械故障诊断的融合技术进行了综述。此外,一项研究[18]总结了用于诊断燃气轮机故障的多传感器数据融合方法。上述综述文章共同强调了利用多传感器数据融合进行旋转机械IFD日益增长的兴趣。然而,据我们所知,目前缺乏一个包含旋转机械IFD多传感器数据融合最新研究成果的全面综述。先前的综述也很少涵盖未来几年预期的发展趋势。因此,迫切需要一篇既涵盖该领域当前研究进展又涵盖未来趋势的全面综述。

    因此,本综述文章致力于对旋转机械IFD中多传感器数据融合的最新研究进展进行全面综述。通过解决表1中提出的研究问题,本研究旨在提供对该领域所取得进展的见解,并确定潜在的未来方向。通过深入研究文献,本综述工作旨在促进对该研究领域的理解,并为进一步的研究工作和实际应用提供有价值的指导。

    表1 本综述旨在解答的研究问题

    为了回答这些综述问题,作者遵循PRISMA指南[19],对旋转机械IFD中多传感器数据融合的相关研究进行了批判性分析。文献检索在Scopus索引数据库中进行,采用以下查询字符串:multi-sensor data fusion  data fusion  information fusion  sensor integration)  (fault diagnosis  fault classification  fault detection) (rotating machin rotating equipment  bearing  turbine  gear  motor  pump  engine  

    由于生成的文献数量庞大且丰富,审阅所有文献是不切实际的,一些论文不可避免地会被遗漏。因此,建立了以下纳入标准来选择最合适的文章:(i)出版年份:2012年至2023年;(ii)学科领域:工程或计算机科学;(iii)语言:英语;(iv)文章类型:期刊文章、综述、会议论文或书籍章节。还采用了一些排除标准来排除不需要的出版物:(i)出版阶段:正在印刷的文章;(ii)来源类型:行业期刊或丛书;(iii)仅发表摘要。为了确保综述的质量和相关性,缺乏关于旋转机械IFD中多传感器数据融合的足够信息的文件以及重复项被排除在分析之外。此外,我们还人工核对了每份文献的参考文献,以寻找研究领域内的相关文献。文献筛选流程如图1所示。最终共有146份符合筛选标准的文献被用于整合撰写本综述报告。

    图1 文献筛选流程示意图,其中N代表每个阶段的文献数量

    第3节概述了多传感器数据融合的基本概念。第4节深入综述了多传感器数据融合在旋转机械故障诊断中的应用。第5节介绍了研究过程中观察到的结果,指出当前研究中遇到的主要挑战,并强调了未来的研究方向。最后,第6节以总结性评论结束这篇全面的综述文章。

     

    3 多传感器数据融合的基本概念

    多传感器数据融合的概念,属于多源数据融合[20]的范畴,出现于20世纪80年代中期,最初是为军事应用设计的[21, 22]。如今,多传感器数据融合已引起广泛关注,并成为跨不同应用领域的跨学科研究领域。多传感器数据融合指的是整合和组合来自多个传感器的信息,以获得比使用单个传感器更全面和可靠的洞察的过程[23]。多传感器数据融合的基本概念包括传感器集成、数据预处理、特征提取和融合算法。传感器集成是多传感器数据融合的一个基本概念。它涉及同时使用不同类型的传感器,每个传感器提供关于目标系统的独特信息。通过整合来自多个传感器的数据,可以获得对系统更全面的理解,从而在各种应用中提高准确性和可靠性。

    数据预处理是多传感器数据融合的另一个关键概念。它涉及通过清洗、滤波和归一化技术来准备传感器数据以进行融合。此步骤旨在去除传感器数据中的噪声、异常值和不一致性,确保融合数据准确表示底层系统特性。此外,特征提取在多传感器数据融合中起着至关重要的作用。它涉及从预处理后的传感器数据中提取相关特征,这些特征捕获了关于系统的重要信息。这些特征作为融合算法的信息输入,辅助决策和模式识别任务。

    多传感器数据融合的最终概念是融合算法本身。融合算法在多个层级上进行,包括数据级(或传感器级)、特征级和决策级融合[24-26]。图2说明了不同层级的数据融合。

    图2 不同层级数据融合的说明[27]  

    数据级融合是最低级别的数据融合,其中来自多个传感器的原始同质数据被直接整合以创建统一的原始数据。此融合过程之后是后续步骤,例如从整合数据中提取特征和进行决策。  

    数据级融合策略的主要优点是能够充分利用源数据并减少信息损失[28]。与更高级别的融合方法相比,该策略需要的专家知识更少,并且保留了更多的信息,使其能够实现更的性能。常见的数据级融合方法包括加权平均、选举决策、卡尔曼滤波器[29]、扩展卡尔曼滤波器[30]、基于机器学习的融合方案和基于深度学习的融合方案。这些技术旨在有意义地整合原始传感器数据,同时考虑传感器的可靠性、准确性以及与诊断任务的相关性等因素。尽管数据级融合具有优势,但它也带来某些挑战。处理大量的原始数据可能是繁重且计算密集的。这可能导致更长的处理时间和更高的计算负担。由于处理大型数据集的要求很高,实时性能在数据级融合中可能尤其难以实现。此外,在数据级融合不同类型传感器的数据可能很困难,因为每个传感器可能具有其独特的特性、测量单位和数据格式。在这种情况下,建立一个一致的融合框架变得具有挑战性。此外,数据级融合假设数据结构高度一致,这在实际情况中可能并不总是可行或得到保证  

    特征级融合是一种融合过程,专注于从单个传感器获取的原始传感器数据中提取相关特征或特性,并将最佳特征融合作为输入传递给输出层。这种融合级别通过放宽传感器间数据需可通约的要求提供了灵活性。特征级融合旨在通过融合从不同传感器提取的特征来创建更高级别的共享表示。该融合级别通常采用各种技术,包括特征串联、特征选择、主成分分析[31]、独立成分分析[32]、典型相关分析[33]、线性判别分析[34]和基于深度学习的融合方法[35]。每种技术都有其优势并适用于特定应用。特征级融合的优点是相比于数据级融合信息损失更少。这一特性使得特征级融合在许多情况下非常实用,特别是在故障诊断中,因为准确且信息丰富的特征对于识别和表征故障至关重要[36]。然而,必须考虑与特征级融合相关的某些挑战。当融合不同的特征时,得到的特征向量可能具有很高的维度。这种高维表示可能导致计算资源需求增加,使得融合过程计算密集且耗时。此外,特征提取步骤可能引入冗余或噪声信息,导致信息丢失。  

    决策级融合涉及统一来自多个传感器的决策或输出以做出最终决策或推断[37]。与其他层级的融合不同,决策级融合通过整合各独立信息源在决策层面提供的数据在更高的抽象级别上进行。在该层级应用各种融合技术,包括多数投票、加权投票、Dempster-Shafer(D-S)理论[38]、模糊逻辑[39]、贝叶斯决策理论[40]、神经网络[41]和基于机器学习的融合方法[42]。  

    决策级融合的关键优势之一是其高度的灵活性。它允许根据应用的具体要求纳入不同的融合规则和算法。这种灵活性使融合过程能够适应不同的场景,并适应不同的传感器特性和数据源。决策级融合也表现出强大的抗干扰性能,因为它可以有效地处理不同传感器提供的冲突信息。通过整合来自多个传感器的决策,即使在某些传感器可能提供不一致或冲突的输出时,也能得出相对可靠的结论。然而,决策级融合存在某些局限性。它不允许分类器或决策系统同时训练所有数据,因为它基于个体传感器提供的决策或输出运行。如果决策系统无法访问完整的数据集,这可能导致性能次优。此外,决策级融合需要将传感器数据压缩为最终决策或推断,这可能导致高昂的处理成本。这种压缩过程可能涉及丢弃存在于原始或特征级数据中的某些详细信息,从而导致潜在的有价值信息的丢失。  

    4 用于旋转机械故障诊断的多传感器数据融合

    在本节中,我们综述了旋转机械故障诊断的多传感器数据融合方法的最新成果。故障诊断是一个关键过程,涉及基于传感数据识别和定位故障,从而能够采取适当的维护措施并防止工业系统中出现严重后果。探索多传感器数据融合的最新成果,以了解这些方法如何有助于旋转机械的有效故障诊断。

    4.1 数据级融合

    数据级融合,也称为传感器融合,涉及融合安装在旋转机械上的多个相同类型传感器收集的原始数据。原始数据被统一为单一数据集,从中提取具有代表性的故障特征。然后,这些特征被用作故障诊断算法或模型的输入。图3提供了故障诊断背景下数据级融合过程的可视化描述。

    图3 数据级融合方法(基于[28]绘制

    在旋转机械的故障诊断中,已经开发并应用了多种数据级融合方法。一种常用的方法是加权平均融合,通过计算加权平均值来整合来自多个传感器的数据。例如,Xu等[43]进行的一项研究采用加权数据融合,利用多传感器振动数据来诊断轴承故障。同样,Zheng等[44]提出了一种新颖的加权证据数据融合框架,用于机械传动系统的故障诊断。该框架利用了从油液分析中获得的状态监测数据集。基于卡尔曼滤波器的融合方法也被用于故障诊断任务。例如,Gou等[45]采用免疫融合卡尔曼滤波器,通过整合来自多个传感器的数据来诊断航空发动机控制系统的故障。Kim等[46]提出了一种基于自适应卡尔曼滤波器的方法,利用振动传感器进行电机故障诊断。此外,扩展卡尔曼滤波器已被用于旋转机械故障诊断的多传感器数据融合。Lu等[47]开发了一种基于扩展卡尔曼滤波器的融合方法,用于燃气轮机的性能监测和故障诊断。该方法通过在数据级融合多个传感器的压力数据,提高了传感器系统中的故障识别准确性。这些融合方法,如加权平均融合、卡尔曼滤波器和扩展卡尔曼滤波器,有效地处理了故障诊断中的不确定性、噪声和非线性。它们在处理实际工况和提高旋转机械故障诊断性能方面发挥着至关重要的作用,从而能够更准确地进行故障诊断。  

    近年来,基于机器学习的数据级融合方法在旋转机械故障诊断领域进行了诸多尝试。研究人员探索了各种方法来提高故障检测能力和准确性。例如,Min等[48]利用卷积神经网络(ConvolutionalNeuralNetwork,CNN)融合多个振动信号,有效地诊断了滚动轴承和齿轮箱的故障。该方法通过从融合数据中提取相关特征,增强了故障检测能力。类似地,Chen等[49]介绍了一种基于深度CNN的融合方法,利用振动信号识别行星齿轮箱的故障,提高了准确性。Huang等[50]开发了一种用于行星齿轮箱的诊断框架,该框架采用了多视图数据级信息融合方法。他们集成了注意力机制和CNN以实现准确分类。Yu等[51]提出了一种针对液压泵融合方法,该方法利用经验小波变换和方差贡献率来处理来自三个通道的原始振动信号。  

    尽管振动信号经常用于旋转机械的故障诊断,但它们存在固有的缺陷,例如易受机械共振影响、外部噪声干扰、对传感器位置敏感以及设备成本高[52]。为了解决这些限制,电机电流信号分析已成为故障诊断的一种可行替代方案。在Guo等的一项研究[25]中,提出了一种数据融合框架,该框架结合了改进的循环谱协方差矩阵和电机电流信号分析,以提高旋转机械故障诊断的准确性。同样,Azamfar等[53]开发了一种用于齿轮箱故障诊断的数据级融合方法,该方法利用二维CNN通过集成来自多个电流传感器的数据来分类故障。他们研究中提出的故障诊断方法如图4所示。  

    图4 提出的组合故障诊断方法[53]  

    此外,声发射分析作为一种监测各种旋转设备健康状况的方法受到了广泛关注[54,55]。这些研究证明了智能融合方法在提高旋转机械诊断性能方面的有效性。这些方法利用机器学习的能力来处理数据复杂性并自动提取相关特征。

    在旋转机械故障诊断中使用数据级融合带来了诸多优势,例如有效捕获故障特征、数据损失最小以及高可靠性。然而,这种方法也存在一些挑战。一个挑战是原始数据中存在冗余信息,这可能阻碍数据级融合方法充分利用多个传感器的互补性[56]。数据中的冗余可能导致融合过程效率低下,降低故障检测的准确性和有效性。另一个挑战是由融合过程导致的数据量显著增加。这需要使用能够处理大型数据集计算要求的高性能设备。处理和分析如此大量的数据需要强大的计算资源,这在成本和基础设施方面可能带来实际挑战。此外,现有的数据级融合方法通常只关注单一传感器信号类型,例如振动、电流或声发射信号。这种狭隘的聚焦限制了它们检测细微故障的能力,并将它们的适用性限制在特定的状态监测场景中[57]。在现实场景中,旋转机械可能具有不同的传感器模态,提供不同类型的信息。忽略这些不同传感器模态的融合限制了对机器健康状况的整体理解,并可能导致不完整的故障诊断。解决这些挑战需要开发先进的技术,以有效处理冗余信息、优化计算资源,并实现跨不同传感器模态的融合。鉴于当前状况,未来的研究应优先开发智能算法和方法,以有效地从多个传感器中提取相关信息,同时解决当前数据级融合方法的局限性。

    4.2 特征级融合  

    在旋转机械的故障诊断中,特征级融合技术对于整合从单个传感器数据中提取的代表性特征,然后进行故障分类非常重要。融合的特征提供了对机器状况的更全面表示,这可以改善故障检测和识别。图5展示了旋转机械故障诊断中 特征级融合的过程。

    图5 特征级融合方法(基于[28]绘制)

    在多传感器数据特征融合算法领域,研究人员开发了各种方法,大致可分为三种主要类型:基本特征融合、概率融合和AI融合方法[58]。基本特征融合技术利用简单的数学运算来整合来自不同传感器的特征。一种广泛使用的方法是加权平均,其中从每个传感器提取的特征乘以相应的权重然后进行融合[59, 60]。在这种方法中,权重可以基于专家知识分配或使用算法进行优化。其他基本融合方法包括特征串联(将来自不同传感器的特征整合成一个单一的特征向量)以及特征选择和特征排序技术[61]。这些方法为实现多传感器信息融合以进行故障诊断提供了实用途径。总体而言,这些基础融合方法实施相对简单,为实现多传感器信息融合以达成故障诊断目标提供了切实可行的解决方案。

    基于概率的融合技术已被广泛用于故障诊断领域,用来整合来自多个传感器的特征。这些方法利用统计方法纳入个体特征的概率分布,并估计融合特征集的联合概率分布。例如,Parai等人[62]利用主成分分析(PCA)来整合与不同输入刺 激相关的输出信息,从而提高了诊断模拟电路故障的精度。从PCA获得的融合特征随后用于训练支持向量机(SVM)进行故障分类。Pan等人[63]采用独立成分分析(ICA)来融合来自振动传感器的特征用于齿轮箱故障诊断。结果证明了故障诊断性能的增强,特别是对于微弱故障信号。Song等人[64]利用线性判别分析(LDA)来融合时域特征,用于电机故障诊断。所综述的研究强调了基于概率的融合技术在旋转机械故障诊断中的有效性。然而,在故障诊断中使用多个传感器的基于概率的融合技术存在局限性。这些方法通常假设特定的分布,并且可能对这些假设的偏差敏感。它们可能计算复杂,特别是对于高维数据,并且可能在处理噪声大或相关的传感器测量值时遇到困难。基于概率的融合技术对动态故障条件的适应能力可能有限,并且可能难以解释。来自多个传感器的数据的可用性和质量也会影响其性能。在故障诊断场景中应用基于概率的融合技术时,必须仔细考虑这些缺点。

    基于AI的融合技术利用机器学习算法整合来自多传感器数据的故障敏感特征,生成高级的共享表示[65]。这些技术涉及通过傅里叶频谱分析、小波变换和经验模态分解等方法从原始传感器信号中提取相关信息。随后,融合的特征通过应用机器学习算法用于故障诊断。例如,Pan等[66]利用变分模态分解和小波包算法分解振动信号以提取统计特征。这些特征经过优化、融合并用于一个双隐藏层极限学习机进行齿轮故障诊断。Saimurugan和Ramprasad[67]采用小波变换从振动和声音信号中提取相关信息,用于旋转机械的故障诊断。决策树算法用于从提取的特征集中选择最相关的特征,然后使用人工神经网络(Artificial Neural Network, ANN)进行分类。Jiang等[68]提出了一种融合模型,该模型结合了信息熵和概率神经网络来处理旋转机械中振动信号的复杂性。通过融合这些特征,该方法相比使用单个信息熵度量实现了更高的准确性。Khazaee等[69]提出了一种融合方法,该方法结合了声学和振动数据,使用小波变换和ANN来诊断行星齿轮箱的故障。同样,Wu等[70]在不同速度下从时域和频域提取故障特征。然后使用多域特征融合技术将这些特征整合起来,利用广度学习系统对轴承故障进行分类。研究结果展示了在不同运行条件下诊断可靠性的提高。Vanraj等[71]开发了一种用于固定轴齿轮箱故障诊断的融合方法,他们利用Teager-Kaiser能量算子和经验模态分解方法从声学和振动信号中提取特征。Martinez-Morales等[72]提出了一种三相感应电动机的故障诊断方法,采用特征数据融合来整合从定子电流和振动信号中提取的特征。其他研究人员也提出了旋转机械故障诊断的特征融合方法[73, 74]。虽然传统的具有浅层结构的模式识别分类器已被普遍使用并在故障诊断中被证明有效,但它们确实存在某些局限性:(1)故障特征是从各种类型的多传感器信号中手动提取的,这需要先验知识和专业知识[75];(2)故障诊断过程与特征提取和融合是分离的,这可能导致相关信息丢失。这反过来又可能导致故障诊断的准确性较低和泛化能力较弱。

    许多学者广泛探索了基于深度学习的特征融合方法在旋转机械故障诊断中的应用。与依赖特征工程的传统方法不同,深度学习(DL)模型可以自动从原始传感器数据中提取特征。这消除了对领域特定知识的需求,并使模型能够学习数据中固有的复杂模式[75]。因此,研究人员利用不同的深度学习模型来自动学习和融合来自多个传感器的特征,实现端到端的故障诊断[76]。Liu等人[75]设计了一种利用深度特征学习和多传感器融合来识别故障严重程度的旋转机械诊断方法。Wang等人[77]、Xie等人[78]和Gong等人[79]引入了基于CNN的特征级融合模型,以利用振动信号增强故障诊断。在另一项研究[80]中,提出了一种利用CNN和深度神经网络(DNN)的集成模型进行轴承故障诊断。该模型从多传感器振动数据中提取多样化的特征,并融合它们以进行准确诊断,利用了CNN和DNN两者的能力。此外,在一种不同的方法[81]中,提出了一个用于齿轮箱和滚动轴承的故障诊断框架,采用了CNN模型。

    除了基于CNN的特征级数据融合方法外,Chen等[82]开发了一种用于轴承故障诊断的特征融合方法,该方法涉及稀疏自动编码器和深度信念网络的使用。在另一项研究[83]中,使用一维卷积长短期记忆(Long Short Term Memory, LSTM)融合振动信号,改进了轴承故障诊断。该方法通过使用LSTM集成来自多个传感器的信息,提高了故障诊断的准确性。Wang等[84]提出了一种诊断方法,该方法利用瓶颈层优化的CNN进行多振动传感器数据融合。该方法通过利用加速度计的振动数据融合,有效增强了故障诊断性能。上述研究突出了基于深度学习的特征融合方法在旋转机械故障诊断中的多样化应用。这些方法有效地捕获了多传感器振动数据中存在的复杂模式和关系,展示了它们在该领域的有效性。然而,需要注意的是,在现实场景中遇到的振动信号,特别是对于复杂的旋转机械,通常具有非线性、非平稳性和噪声的特性[85]。

    为了克服这些挑战,研究人员努力使用深度学习方法在特征级融合振动和电流信号[86-88]。Shao等[89]采用深度CNN,通过整合来自振动和电流传感器的数据来诊断工业感应电机的故障。在[90]和[91]的研究中,振动和电流信号在特征级融合用于轴承和齿轮箱的故障诊断。这些研究强调了在故障诊断中结合振动和电流信号的好处,因为它们提供了关于机器机械行为、结构完整性、电气性能和负载条件的互补信息。通过基于深度学习的特征融合集成这些信号,可以实现对机器健康状况更全面的理解,从而提高故障诊断能力。

    研究人员还探索了利用深度学习模型融合振动与声学信号的方法。Wang等[92]采用一维CNN从轴承振动与声学信号中提取代表性特征,随后在另一个一维CNN模型中进行特征融合,从而提高了故障分类的准确率。Jiao等[93]开发了深度耦合密集CNN网络用于行星齿轮箱诊断,有效整合振动与声学信号以增强故障诊断能力。Ma等[94]提出深度耦合自编码器融合振动与声学信号进行齿轮箱故障诊断,显著提升了诊断效果。Li等[95]采用深度随机森林融合方法,结合声学与振动信号提取的相关特征诊断齿轮箱故障,实现了更优的诊断性能。类似地,Ma等[96]开发了深度耦合受限玻尔兹曼机用于刀具故障诊断,成功整合振动与声发射传感器数据。He等[97]提出深度多信号融合对抗模型诊断轴向柱塞泵故障,利用迁移学习与残差网络提升诊断准确率。这些研究共同证明了数据融合(特别是振动与声学数据融合)在提升各类机械故障诊断精度方面的有效性。通过整合多源传感器信息,深度学习模型能够充分发挥振动与声学信号的互补特性,从而获得更强大的诊断能力。

    在Wang等的研究[98]中,利用多传感器振动信号实现了旋转设备的故障诊断。该研究验证了通过整合来自不同传感器的振动数据来精确检测系统故障的有效性。Janssens等[99]开发了一种将振动测量与红外热数据相结合的方法,用于旋转机械的故障诊断,在不同类型机械中实现了更优的故障检测效果。Wang等[100]提出了一种三阶段特征融合方法,用于结合轴承的振动和扭矩信号。他们采用基于注意力的多维串联卷积神经网络进行特征融合,从而提高了分类准确率。类似地,Xue等[101]开发了一种通过结合双流特征融合卷积神经网络,结合粒子群优化-支持向量机分类器来检测滚动轴承故障的方法。该方法能自主学习和提取输入信号特征,并利用优化后的支持向量机分类器实现滚动轴承的精确故障诊断。Liu等[102]采用多维特征融合技术提升了梯度提升决策树在重载列车制动系统中的诊断准确率,取得了令人满意的结果。He等[103]将甲虫触角搜索算法与群分解优化、一维CNN以及特征融合相结合,用于滚动轴承故障诊断,显著提高了滚动轴承故障诊断的准确性。Shang等[104]提出了一种基于信息熵的多尺度深度特征融合方法,用于平行轴齿轮箱的故障诊断。该方法通过自动编码器进行特征提取,融合低维特征后采用深度信念网络进行分类,相比未采用特征融合技术的模型获得了更高的诊断准确率。同样地,Liu等[105]将多传感器信号的统计特征和隐性特征整合到轻量梯度提升机中进行故障分类,通过特征融合技术的应用,所开发方法的性能超越了未采用该技术的模型。

    综合研究表明,与数据级融合相比,特征级融合是多传感器信号融合的首选技术,因其比决策级融合更易实施[106]。然而,特征级融合在捕捉和保留同质信号的互补特性方面存在局限,可能导致关键故障信息的丢失。对所有特征进行同等处理,可能无法有效区分和捕捉各传感器信号中独特的故障相关特征,从而导致故障特征弱化和诊断性能下降。相比之下,基于多传感器融合的方法能充分利用多个传感器之间相关且互补的故障敏感信息,从而提升性能并更全面地理解机械状态。为克服上述局限,值得探索决策级或多级融合等替代性融合技术,这些技术有望提高旋转机械故障诊断的准确性。

    4.3 决策级融合

    决策级融合涉及组合来自多个传感器的输出或决策,以得出关于旋转机械故障状况的最终诊断或推断。在这种方法中,每个传感器基于其测量值和算法生成其诊断输出[107]。如图6所示,决策级融合使用融合规则或算法组合这些个体决策,以获得一个统一且可靠的诊断。

    图6 决策级融合方法(基于[28]绘制)

    在旋转机械故障诊断领域,已经提出了决策级融合方案来组合来自多个传感器的决策或输出。这些方法分为统计方法和机器学习方法。统计融合方法利用统计技术来组合来自多个传感器的决策或输出。加权投票、Dempster-Shafer(D-S)理论、模糊逻辑和贝叶斯决策理论是常用的统计融合方法[108, 109]。这些统计融合方法有效地利用了来自多个传感器的信息,提高了诊断的准确性和可靠性。Li等[110]提出了一种改进的加权投票融合方法,该方法利用振动数据诊断滚动轴承故障。Shao等[28]开发了一种融合方法,利用具有Morlet小波函数的堆叠小波自动编码器来映射不同工况下的非平稳振动信号,同时引入了一种改进的投票融合策略用于协作诊断。Zeng等[109]提出了一种基于组合权重和改进投票规则的决策级融合方法,以提高旋转机械的诊断准确性和可靠性。D-S证据理论已被Mi等[111]、Khazaee等[112]和Ji等[113]用于故障诊断中的传感器融合。这些研究考虑了多个传感器信号(如振动和声学信号)以提高准确率。Fu等[114]引入了一个用于齿轮箱故障诊断的决策级融合框架,该框架将对称点模式(Symmetrized Dot Pattern, SDP)图像与VGG16相结合。来自多个传感器的振动信号被转换为SDP图像,用于训练使用VGG16的故障诊断模型。该模型整合了来自不同传感器的SDP图像,并利用D-S证据理论获得诊断结果。D-S证据理论的改进版本也被应用于处理故障诊断任务中的冲突证据[115-119]。Liu等[120]引入了一种基于Sugeno模糊积分的决策级融合框架,用于融合振动和电流信号,提高了感应电机的诊断准确性。另一项研究[121]展示了使用加权平均、D-S证据推理和模糊积分对不同振动传感器的信息进行决策级融合。与使用单个传感器信息相比,这种融合方法提高了诊断准确性。此外,贝叶斯网络已被用于融合多传感器信号进行旋转机械故障诊断[122,123]。然而,需要注意的是,统计模型依赖于正态性、线性或变量独立性等假设。偏离这些假设可能会破坏模型的准确性和可靠性,导致错误的结果。因此,仔细审查和验证这些假设对于确保可靠的故障诊断至关重要。

    基于机器学习的融合方法在旋转设备故障诊断中利用机器学习算法来组合多个传感器的输出。这些方法通常采用集成学习技术,其中独立分类器被单独训练,然后合并它们的决策以获得统一的诊断结果[124]。Zhong等[125]开发了一种新颖的集成技术,在旋转设备的故障诊断中整合多个概率分类器的输出。该集成技术旨在提高诊断方案的性能,相较于单独使用个体分类器。Qiao等[126]开发了一种创新的齿轮箱故障诊断框架。该方法利用多类SVM在决策级融合来自振动和电流信号的信息,如图7所示。然而,基于机器学习的融合方法的一个挑战是从多源数据中手动提取特征,这可能非常耗时并显著影响最终结果。不同类型的传感器可能表现出不同的隐藏特征,这使得设计合适的特征提取技术具有挑战性。手动选择特征可能导致质量有限和信息丰富度不足,可能加剧特征之间的冲突并降低融合的有效性。因此,依赖手动选择的特征可能会阻碍全面学习数据中复杂模式的能力。

    图7 基于数据融合的风力涡轮机传动齿轮箱故障诊断方法

    近年来,在旋转机械故障诊断中,基于深度学习的决策级融合模型的使用显著增长。由于能够克服传统基于机器学习的融合方法遇到的挑战,这些模型变得流行起来。例如,Chao等[127]开发了一种使用CNN和多通道振动信号的自适应决策级融合框架,用于诊断轴向柱塞泵的故障。他们的方法旨在提高故障诊断性能。类似地,Di等[128]介绍了一种方法,该方法结合了集成深度迁移学习与改进的投票多传感器振动信号融合策略,用于不同工作环境中的锥齿轮故障诊断。通过将深度迁移学习技术与融合策略相结合,他们的方法旨在提高锥齿轮的诊断准确性。Hoang等[129]开发了一种结合深度学习和基于电机电流信号的数据融合的轴承故障诊断技术。该方法利用深度学习模型从电机电流信号中提取相关信息,然后融合这些信息以提高轴承的诊断准确性。在某些情况下,研究人员还提出了混合方法,将传统的决策级数据融合方法与基于深度学习的融合方法相结合用于故障诊断。这些混合方法旨在利用两种技术的优势,进一步提高诊断准确性和性能。例如,Li等[130]开发了一个用于轴承的诊断框架,该框架集成了深度CNN和改进的D-S证据理论。他们的方法融合来自两个传感器的振动信号,以提高故障分类准确性,并解决仅依赖单一模型进行诊断的缺点。通过组合多个不确定的证据片段,并合并共识信息同时排除冲突信息,该方法显著提高了准确率。  

    总体而言,在旋转设备故障诊断中使用决策级融合的好处是有效处理多样化信息并展现出强大的容错能力。然而,一个显著的缺点是与处理多源和高维数据相关的高计算成本。这可能导致诊断速度和处理效率下降。实现决策级融合也可能很复杂,需要精确的数据同步、产生通信开销,并且需要仔细选择融合策略。此外,冲突结果的存在可能影响分类准确性。因此,决策级融合仍然是该领域一个活跃的研究领域和持续的挑战。

    编辑:陈宇航
    校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、Tina、陈莹洁、王金、赵诚,肖鑫鑫
    该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除


    来源:故障诊断与python学习
    Mechanical振动疲劳断裂非线性旋转机械航空UG通信海洋UM理论电机GID材料传动人工智能
    著作权归作者所有,欢迎分享,未经许可,不得转载
    首次发布时间:2025-07-08
    最近编辑:3小时前
    故障诊断与python学习
    硕士 签名征集中
    获赞 79粉丝 118文章 216课程 0
    点赞
    收藏
    作者推荐

    顶刊论文学习 | 一种用于旋转机械故障诊断的可跟踪多域协同生成对抗网络(下)

    接顶刊论文学习 | 一种用于旋转机械故障诊断的可跟踪多域协同生成对抗网络(上),本期继续给大家推荐信号处理顶刊MSSP论文:一种用于旋转机械故障诊断的可跟踪多域协同生成对抗网络(下)。论文中提出的可追踪的多领域协作生成对抗网络(TMCGAN)在上进行了详细介绍。本篇文章主要介绍了论文中两项实际案例验证,实验证明,TMCGAN具有卓越诊断性能与可信度,为旋转机械故障诊断研究与应用开辟新路径,值得领域内研究者与从业者深入研读。论文链接:通过点击本文左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目:A trackable multi-domain collaborative generative adversarial network for rotating machinery fault diagnosis论文期刊:Mechanical Systems and Signal Processing论文日期:2024年论文链接:https://doi.org/10.1016/j.ymssp.2024.111950作者:Xin Wang, Hongkai Jiang *, Mingzhe Mu, Yutong Dong机构:School of Civil Aviation, Northwestern Polytechnical University, 710072 Xi’an, China通讯作者邮箱: jianghk@nwpu.edu.cn作者简介:姜洪开,男,1972年生,博士,西北工业大学教授/博导。西安交通大学仪器科学与技术专业博士学位。2006年5月进入西北工业大学航空宇航科学与技术博士后流动站从事博士后研究工作,并留校任教。主持航天科技创新基金、中国博士后科学基金等国家和省部级基金项目4项。参加国家973子课题项目1项、国家自然科学基金重点项目1项、国家自然科学基金面上项目2项、国家863高技术研究发展计划项目1项。(来源百度百科)目录摘要1 引言2 生成对抗网络3 所提出的方法 3.1 多域协同对抗策略 3.2 频率同步丢失 3.3 流跟踪因子 3.4 所提方法的流程4 案例一:高速航空轴承数据集 4.1 数据集描述 4.2 故障诊断的实验验证 4.3 生成数据的可信度分析5 案例二:电力机车轴承数据集 5.1 数据集描述 5.2 故障诊断的实验验证 5.3 生成数据的可信度分析 5.4 内部工作机制可信度分析6 结论(以上标记章节为本文内容)摘要获取足够的平衡数据在实际旋转机械故障诊断任务中颇具挑战。准确地从不平衡数据中诊断故障是一个紧迫的实际问题。生成对抗网络已成为解决这一问题的主流方法。然而,其复杂的训练机制和不透明的架构引发了信任危机,导致用户无法完全信任输出结果。因此,提出了一种可追踪的多领域协作生成对抗网络(TMCGAN)用于旋转机械故障诊断。TMCGAN的核心贡献在于实现全局可解释生成和可信分类,这包括三个具体方面。首先,构建了多领域协同对抗策略,依次学习来自不同领域的信号的关键特征信息,从而实现多领域协同能源供应的全面训练。其次,设计了并行频率损失,以整合多维频率细节信息,丰富反馈,形成更高效的对抗训练闭环。最后,开发了流跟踪因子,阐明内部工作机制,提供实时跟踪反馈,解释底层决策原理,从而提高可解释性。两个案例研究表明,由TMCGAN赋能的分类器在旋转机械故障诊断中表现出色,同时保持高度可信。4 案例一:高速航空轴承数据集案例一使用了来自高速航空轴承[40]的数据集来验证TMCGAN的有效性。需要强调的是,实验的比例因子设定为1,权重因子为0.1。生成器和判别器之间的训练平衡保持在1:4的比例。在VAE中,批次限制为100,每个数据点由一个样本表示。变分自编码器(VAE)、梯度惩罚和GAN的Wasserstein距离(WGAN-GP)、变分自编码生成对抗网络(VAEGAN)、DFEGAN[41]和WCGAN[33]与TMCGAN进行了比较。WGAN-GP和VAEGAN的架构与所提出的方法对齐,而DFEGAN和WCGAN的架构则遵循其原始配置。此外,所有模型中的生成器和判别器均使用Adam优化算法进行优化,学习率为0.0002,在60000次训练迭代(本文中一次训练迭代指一个iteration,下同)中,批量大小为8。这种统一配置确保了实验比较的公平性。4.1 数据集描述图6展示了实验装置。该装置由三个主要部件组成:主轴、加速度计和轴承。主轴的速度调整通过频率转换器实现,采样率为51.2kHz。表2提供了全面的数据集描述。实验选择了多种数据类型,根据负载、故障大小和速度的不同而变化。图6 实验设备表2 数据集描述备注:"内圈"表示内圈故障,"滚子"代表滚子故障。4.2 故障诊断的实验验证为了构建一个不平衡比例为10:1的实验场景,初始不平衡数据集A包含一个训练集,该训练集由200个正常状态样本和每个故障状态各12个样本组成,每个样本包含1024个数据点。每个故障状态的12个样本通过重叠采样扩展至20个样本。此外,测试集的样本量是训练集的一半。数据集B至G分别对应通过使用VAE、WGAN-GP、VAEGAN、DFEGAN、WCGAN和TMCGAN的增强技术获得的平衡数据集。关于这些数据集的详细信息见表3。表3 数据集的构建作为TMCGAN的候选分类器,采用了CNN、SVM和SAE。SVM使用了RBF核,该核函数的半径为0.2,惩罚因子为50。对于SAE,学习率设为0.1,编程了120次迭代。此外,稀疏参数设置为0.3,惩罚因子值为5。CNN的配置包括三个卷积层、三个池化层和两个全连接层。卷积核大小、步长和池化层的选择作为参数选择的基础进行了实验。这些参数实验的结果详见表4。最终参数的详细描述见表5。表4 CNN参数选择测试表5 CNN分类器的参数设置备注:在该架构中,“C”代表卷积层,其中初始参数指定滤波器数量,随后参数指定卷积核尺寸,最后参数指定激活函数。“M”代表最大池化层,使用尺寸为2的卷积核。“Fc”表示全连接层,参数依次为偏置、权重和激活函数。此外,“R”表示ReLU函数,“S”代表Softmax函数。除了关键分类器参数的影响外,TMCGAN的迭代次数也显著影响其诊断性能。通过在20,000到70,000次迭代范围内生成数据并构建平衡数据集,进行了诊断实验。如表6所示,从20,000次迭代开始,诊断性能持续提升,在60,000次迭代时达到最佳状态。然而,当迭代次数达到70,000次时,性能开始下降。因此,60,000次迭代被认为是最佳训练配置,这也解释了本节开头选择60,000次迭代的原因。表6 实验的迭代选择允许进行实验确定参数后,通过不同方法对各类数据集进行分类,并应用GAN-train技术进行诊断实验,同时进行10次不同方法分类研究的迭代,表7给出了平均准确率和标准差。表7 诊断实验结果的统计对于不平衡数据集A,使用了三种分类器。由于CNN的影响最大,因此在随后的数据集诊断测试中被用作分类器。在诊断实验中,TMCGAN增强的数据集实现了更优的分类性能。多领域协同对抗策略和并行频率损失的积极影响体现在标准差和准确性的提高上,证明了TMCGAN相对于现有方法的优势。此外,引入了消融研究来评估TMCGAN中多域组件的贡献,旨在分析不同域对模型性能的影响。原始模型被指定为R,实验按时间域、时频域和频率域的影响顺序依次进行。这些消融研究的结果见表8。时间域信息的整合提高了诊断质量,并有助于增强稳定性。时频域的加入虽然没有显著提升诊断性能,但在提高模型的可解释性方面发挥了关键作用。最后,通过引入频域,构建了更高效的反馈回路,显著提升了诊断效果。这三个领域的顺序交互形成了协作对抗机制,共同增强了TMCGAN的性能。表8 多领域协同对抗策略下的消融实验4.3 生成数据的可信度分析尽管研究证实了TMCGAN在故障识别中的有效性和优越性,但其优势的原因尚未得到解释。在此,通过使用几个核心的数据质量指标和可视化技术,对TMCGAN生成的数据进行了可信度分析,这有助于阐明TMCGAN在故障诊断中表现优异的确切原因。三个关键的评估指标,KLD、MMD和GAN测试,用于评估数据的可信度。MMD指的是最大平均差异,而KLD则代表 Kullback-Leibler 散度。通过KLD评估,可以将生成的数据分布与真实数据的分布进行比较,从而对比两个概率分布。基于核函数的度量MMD用于量化真实数据分布与生成数据分布之间的距离。GAN检验利用分类结果来判断生成的数据是否来自与真实数据相同的分布[42]。GAN检验值越高,KLD和MMD值越低,表明相应生成数据的质量越高。图7至图9展示了不同模型的指标值。尽管VAE、WGAN-GP和VAEGAN的MMD和GAN测试结果大致相似,但WGAN-GP的KLD值高于其他对比模型。在现有模型中,TMCGAN的KLD和MMD值最低,同时在GAN测试中得分最高。这表明TMCGAN生成的数据优于其他三个模型,因为它更接近原始数据。 图7 不同模型的KLD图8 不同模型的MMD图9 不同模型的GAN测试数据可信度可以通过使用可视化技术来提高,除了评估指标之外。时间域和频率域的细节有助于突出生成数据与原始数据之间的差异。图10中以视觉方式展示了七种独特的实验数据类别。右侧图展示了频率域的细节,左侧图则显示了时间域的具体情况。生成的数据用红色标记,而蓝色代表原始数据。这一事实表明了原始数据和生成数据之间惊人的相似性,证实了生成数据在时间维度和频率维度上的可信度。 图10 数据域维度引导的可信度分析t-SNE可视化解释了为什么诊断结果在数据之间的高维关系方面是合理的,而数据可视化则证明了数据本身是合理的[43]。使用t-SNE展示不同形式数据的特征差异,可以检索到七类不同数据的高维特征。图11显示了WGAN-GP、VAEGAN和TMCGAN的高维可视化结果。WGAN-GP展现了各种数据方面的相互耦合现象,这是对诊断结果影响的重要体现。VAEGAN特征耦合现象消失,但相同类型的数据特征分散仍然存在。在TMCGAN中,耦合现象消失,而相同类型的聚合效果良好。这说明TMCGAN中各种数据类型的特征可以被准确提取,同类型数据的特征可以被清晰区分,这也解释了为什么TMCGAN可以达到最佳的诊断结果,可视化解释增强了诊断结果的可信度。 图11 由t-SNE引导的高维可信度分析多领域协作对抗方法和并行频率损失提供的高效反馈循环,使TMCGAN在跨多种数据集的特征学习方面表现出色。这使得TMCGAN能够从不同类型的资料中提取出关键的区分性特征,减少特征融合现象,从而实现更优的数据生成效果。本节中,生成的数据本身及其在故障诊断中的应用是可信度分析的主题,解释了生成数据可靠性的背后原因。对于模型内部部分的可信度分析将在案例二中进行,以解释TMCGAN的内部工作机制。5 案例二:电力机车轴承数据集本案例采用我团队自行采集的电力机车轴承数据集,实验设置及模型,参数与案例一中的参数相同。5.1 数据集描述案例二采用了电力机车采集的轴承数据。在实际场景中,噪声会对数据采集造成干扰。电力机车滚动轴承所面临的恶劣工况环境使其故障模式趋于复杂化,导致各类单一及复合故障频发。图12显示了设备特定信息。此外,以12.8kHz的采样频率收集的数据如图所示表9。该信号经过第4节所述的处理。一个可信的模型应当能够产生可靠的输出。首先,需要评估TMCGAN生成的数据在故障诊断中的有效性。类似于案例一,设置了一个不平衡比为10:1的实验场景。除了故障数据本身的差异外,样本数量、样本长度和采样方法与案例一相同。值得注意的是,数据集B至E是通过VAE、WGAN-GP、VAEGAN和TMCGAN增强的平衡数据集。构建的数据集详情见表10。 图12 数据采集实验台表9 数据集描述表10 构建数据集的说明5.2 故障诊断的实验验证TMCGAN的初始验证基于诊断实验的结果。TMCGAN产生的数据被加入到初始的不平衡数据集,创建一个平衡的数据集,目的是进行故障诊断研究。每个实验重复十次,以消除其他影响的可能性。结果如图13所示。该图展示了多种方法的实验结果,使用中位数和四分位数描绘了多次实验的数据特征。每个矩形内的十个黑点分别代表每种方法的具体值。每个矩形上方的线表示上四分位数,下方的线表示下四分位数,中间的线则表示中位数。方法在垂直方向上的位置越高,诊断准确性越好。同时,水平方向上的形状越宽,诊断稳定性越高。基于数据集A的故障诊断中,CNN表现出最佳性能。因此,在后续涉及各种数据集的实验中,CNN被用作分类器。在众多研究中,TMCGAN不仅具有最低的四分位数变异,还拥有最高的诊断准确性。TMCGAN带来的诊断结果比现有技术更加可靠和准确。因此,在诊断准确性和结果波动性方面,TMCGAN生成的数据更为可信。 图13 诊断实验结果分析混淆矩阵详细展示了诊断数据的研究情况,指出了错误分类现象发生的区域,并呈现了每种故障类型的识别结果。图14展示了混淆矩阵。尽管现有方法在处理原始数据时已取得显著进步,但在与标签1和3相关的数据中,特征纠缠问题仍然存在,导致诊断不准确。TMCGAN通过多领域协作对抗策略的全面训练和并行频率损失的有效反馈,成功解决了由特征纠缠引起的误诊问题,从而实现了更优的诊断性能。诊断数据的评价除了准确度之外,还考虑了精确度、召回率和F1分数。分类模型的精度定义为正确预测的正类样本数与成功预测的正类样本数之比。分类模型准确预测为正类的样本占实际正类样本的比例称为召回率。衡量召回率和准确性表现的综合指标是F1分数。表11和表12展示了各种方法的结果。尽管VAEGAN和WGAN-GP在标签2中表现出轻微优势,但TMCGAN在评估整个数据集时始终表现出更优性能。这突显了多领域协作对抗策略和平行频率损失的积极影响。 图14 不同方法混淆矩阵的比较表11 各种方法的精确度和召回率备注:‘Pr’表示精确率,‘Re’代表召回率表12 各种方法的F1分数5.3 生成数据的可信度分析借助客观指标进行评估可以增强用户对TMCGAN的信任。这也是解释TMCGAN生成数据高质量的合理原因。类似于第4节,确定TMCGAN输出可信度的第二阶段是对结果的指标评估。首先,图15显示了七个状态下的时域和频域信息分析。时域信息显示在左侧图中,而频域信息则显示在右侧图中。在这些可视化表示中,生成的数据用红色标记,原始数据则用蓝色显示。该图展示了两组数据属性的可比性,表明在电动机车发生故障时,TMCGAN的可靠性得到了保证。 图15 不同数据源的信号生成比较此外,图16-18展示了使用三个指标KLD、MMD和GAN测试来评估数据质量。TMCGAN生成的数据质量卓越,这一点通过在GAN测试中获得最高分以及在其他两个指标中记录最低值得到了证明。定量指标表明,TMCGAN产生的输出最为可靠,且具有更优的输出效果。质量。这也可能是TMCGAN在诊断实验中表现最好的原因。 图16 KLD值的比较图17 MMD值比较图18 GAN测试值的比较在对数据本身进行领域分析和度量评估之后,展示增强数据集的高维方面是另一种有用的解释TMCGAN所实现的优越诊断的技术。因此,这里采用t-SNE进行聚类,以直观地识别不同数据组的独特特征。图19展示了TMCGAN和VAE的特征可视化。虽然VAE数据在同一类别内的特征表现出一致性,但在不同类别的特征之间缺乏明显的区分,这可能影响诊断准确性。TMCGAN出色的诊断效果可以通过其可视化来解释,该可视化显示相同的数据被很好地聚类在一起,并且可以区分出不同的故障数据特征。这表明,TMCGAN生成的数据是明显可分离的,并在高维空间中表现出一个明确定义的分类结构。图19 诊断数据的高维特征分析5.4 内部工作机制可信度分析前一节对TMCGAN的生成数据进行了可信分析。TMCGAN生成的数据因其可靠性,增强了用户对实际应用的信任。然而,尽管这种方法产生了良好的结果,但由于其复杂的训练机制和不透明的设计,实际的工作过程并未详细说明。这是GAN应用面临的主要问题之一。为了解决这一问题,TMCGAN开发了一种流跟踪因子,该因子可以贯穿整个架构,用于描述模型的内部运作。一方面,流跟踪因子阐明了TMCGAN在对抗优化过程中的训练机制,并记录了系统在整个训练过程中所做的内部决策。另一方面,流跟踪因子的决策信息在机制中从多个角度进行验证,从而阐明内部决策的正确性。本小节对相关内容进行了详细描述。在训练迭代过程中,数据由集成到TMCGAN架构中的流跟踪因子进行跟踪。如图20和图21所示,随机选择一个原始样本,TMCGAN中的流跟踪因子记录其独特的生成过程。图中详细展示了TMCGAN在第30,000次和第50,000次迭代时的内部决策过程。这涵盖了空间、时频和频率域中的生成器、判别器和损失反馈。因此,后续阶段的优化目标以及每个样本在单次训练中的学习重点对TMCGAN架构中的各个网络都是透明的。 图20 第30000次跟踪结果图21 第50000次跟踪结果生成器接收样本,在学习了各个数据通道的空间域后,根据流跟踪因子揭示关键信息。重要细节被突出并量化,以便未来的学习。生成器生成的最新学习结果是提供给判别器的新数据。判别器利用流跟踪因子,专注于生成样本的时间-频率域信息,在三个高频(H1-H3)和一个低频(L)下显示每个样本区域的兴趣分布。来自两方面的信息作为损失计算的基础,在损失反馈影响判别器和生成器之前。损失反馈中的流跟踪因子定义了后续迭代阶段样本的最佳训练目标,指导TMCGAN在训练过程中不断改进。生成器、判别器和损失反馈的内部决策通过流跟踪因子量化,在训练过程中,每个组件中重要点变化的细节可以被详细记录。这以直观的方式展示了TMCGAN的内部工作机制。例如,在30,000次和50,000次迭代中,内部决策的重要方面被清晰且易于理解地呈现出来。生成样本的质量随着每次迭代的进行而提高,表明TMCGAN的性能在不断优化。在TMCGAN的内部工作机制中,对每个样本的训练决策信息进行了规定,该决策信息的正确性对训练过程至关重要。从宏观训练的角度来看,通过迭代,从10,000到60,000次,产生的样本质量得到改善。生成的数据在图22中以红色显示,而原始数据则以蓝色显示。更高的健身水平可以提高代际质量。在时间域的左侧和频率域的右侧都明显存在持续上升的趋势。这一积极趋势表明,TMCGAN决策是正确的。 图22 不同迭代次数的生成质量回到模型的基本工作原理,对抗训练的核心在于判别器。在TMCGAN中,使用多层卷积结构作为判别器。这使得可以评估反卷积结构如何影响输出的权重和激活值。然而,图15和图22所示的结果也直接证实了内部决策过程能够准确捕捉数据的本质特征。内部工作机理的正确性,下面将重点讨论数据源和故障机制方面的故障场景。为了验证,选择了外环故障(标签3)。实验轴承参数的具体数值表明,理论上的故障特征频率为57.8赫兹。图23通过不同迭代次数下的包络谱展示了TMCGAN在不同阶段如何识别特征频率。随着训练的深入,故障特征频率逐渐显现。当训练达到60,000次时,这一频率几乎与理论值一致,此时TMCGAN已经掌握了关键的故障特征。从故障机制的角度来看,这解释了TMCGAN生成质量的稳步提升。 图23 迭代中包络谱的变化重点关注位于模型内部结构中的判别器。从机制的角度来看,局部轴承故障机制表明,故障部件和其他部件会导致周期性的短期冲击,并使轴承系统以共振频率振动,伴随高频自由衰减。此外,最重要的故障是轴承差异化的指标是各种轴承故障类别产生的低频故障特征频率。判别器采用多层卷积与小波相结合的方法,对信号进行滤波并确定高低频,重点在于样本的时间-频率域信息。如图24所示,判别器的三层L1至L3均得以展示,逐层提取数据的高低频信息。为了展示TMCGAN对不同频率特征的响应,选择了对角高频滤波(左)和低频滤波(右)。在显示之前,数据已进行了归一化处理。在第一层中,特定细节显现出来;而在第二层和第三层中,则展示了所有信息。显然,TMCGAN学习了与故障相关的低频特征,并在逐渐挖掘深层特征时建模了与故障相关的深层低频特征。此外,TMCGAN通过学习有限数量的高频特征来获得精确的故障特征检测。在实验中,低频特征的学习趋势与故障机制相吻合。从轴承故障机制的角度来看,这也阐明了TMCGAN在特征学习选择上的合理性和决策正确性。图24 判别器的逐层频率特征响应综上所述,流跟踪因子的设计通过揭示TMCGAN的内部工作机制增强了模型的透明度。通过透明的训练机制,内部决策变得显而易见,在映射和解释决策正确性时,样本、样本特征和故障机制均被考虑在内。这也阐明了TMCGAN卓越性能的具体原因。6 结论本文提出了一种解释GAN内部工作机制的方法——TMCGAN,该方法有效提高了模型的透明度,并增强了生成数据和诊断结果的可信度。模型由三个关键组件构成。首先,多域协同对抗策略顺序捕捉了多域的关键特征信息,形成了一个有机融合的对抗系统,为GAN训练提供了更丰富的信息。其次,平行频率损失引入了多维频率细节信息,加强了多域对抗系统,有效提升了对抗训练闭环的效果。最后,流跟踪因子解释了GAN的内部工作机制,揭示了动态关注点和实时决策方向。此外,许多场景已被用于验证TMCGAN在不平衡数据旋转机械故障诊断中的优越性和有效性。从数据可信度和模型可信度的角度出发,通过涵盖评估指标、可视化分析和机制分析来解释模型内部决策的原因。这实现了全局可解释生成和可信分类。目前,TMCGAN在生成器、判别器、损失反馈和结果分析等主要领域已达到可解释性,其当前范围足够广泛。然而,GAN的解释深度仍需增加。然而,作者的下一步研究将集中在创建能够深入解释的透明GAN,这将增强用户信任并开启更广泛的工程应用可能性。编辑:陈莹洁校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、Tina、陈宇航、王金、赵诚、肖鑫鑫该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除来源:故障诊断与python学习

    未登录
    还没有评论
    课程
    培训
    服务
    行家
    VIP会员 学习计划 福利任务
    下载APP
    联系我们
    帮助与反馈