首页/文章/ 详情

论文合集 | 用于预测性维护与健康管理的大型语言模型(1)

2天前浏览15

本期给大家分享由北京交通大学何超博士整理的用于预测性维护与健康管理的大型语言模型相关论文合集,本期分享20篇论文。

网页链接(详细请点击最下方阅读原文)
https://github.com/liguge/Large-language-model-for-Prognostics-and-health-management
作者简介何超1995年出生于淄博市。目前正在北京交通大学攻读载运工具与运用工程博士学位。主要研究方向可解释故障诊断工业大数据。目前已撰写并发表SCI和EI论文7篇,其中ESI高被引论文3篇

1 目录

第1篇:大型语言模型如何助力人类的设计与制造
第2篇:电机故障诊断的基础模型
第3篇:基于大语言模型和知识图谱的故障诊断与系统维护
第4篇:评估 ChatGPT 在预测性健康管理维护建议自动化中的表现
第5篇:工业生成预训练变换器用于智能制造系统
第6篇:(软件代码故障定位)大型语言模型在故障定位中的应用
第7篇:FD-LLM:用于机器故障诊断的大语言模型
第8篇:基于多模态大语言模型的工业 4.0 故障检测与诊断
第9篇:(软件代码故障定位)无需测试的大语言模型用于故障定位
第10篇:LLM-R:结合层次化代理和 RAG 的领域自适应维护方案生成框架
第11篇:Diff-MTS:面向大模型时代的工业时间序列的时序增强条件扩散生成模型
第12篇:故障解释器:利用大语言模型实现可解释的故障检测与诊断
第13篇:面向预测与健康管理的类ChatGPT大规模基础模型:综述与路线图
第14篇:DiagLLM:基于大语言模型的多模态推理用于可解释的轴承故障诊断
第15篇:面向轴承故障诊断的基础模型:基于领域知识与对比学习方法
第16篇:针对复杂系统故障诊断的预训练大语言模型微调实证研究
第17篇:利用大语言模型为数字孪生赋能,以实现全球时序特征学习
第18篇:联合知识图谱与大语言模型的故障诊断及其在航空装配中的应用
第19篇:生成式人工智能与数据增强在预测性健康管理中的应用:分类体系、研究进展与前景展望
第20篇:大语言模型在复杂系统中的可解释故障诊断集成

2 论文整理

第1篇

  • 英文标题:How Can Large Language Models Help Humans in Design And Manufacturing

  • 中文标题:大型语言模型如何助力人类的设计与制造

  • 摘要大型语言模型(LLMS)的进步,包括GPT-4,为生成设计提供了新机会。我们调查了该工具在整个设计和制造工作流程中的应用。具体来说,我们调查了LLMS在以下任务中的实用性:将基于文本的提示转换为设计规范,将设计转换为制造指令,生成设计空间和设计变体,计算设计的性能,以及搜索基于性能的设计。通过一系列的例子,我们强调了当前LLMs的优点和局限性。通过揭示这些局限性我们希望促进这些模型的不断改进和进步。

  • 发表年份:2023

  • 论文期刊:ArXiv

  • 论文链接https://ar5iv.labs.arxiv.org/html/2307.14377

  • 开源代码:无

第2篇
  • 英文标题Foundational Models for Fault Diagnosis of Electrical Motors

  • 中文标题电机故障诊断的基础模型

  • 摘要大多数关于电机故障诊断的最新进展,都是基于训练数据和测试数据来自同一分布的假设。然而,在实际运行场景中,电机的数据分布会因不同的工况而有所变化。因此,现有研究在实际应用中存在局限性,因为它们依赖于涵盖所有运行条件的完全标记的训练数据,并假设分布一致。而获取多台机器在不同故障情况和运行场景下的大量标记样本可能不可行。

    为了克服上述局限,本文提出了一种开发电气电机故障诊断基础模型的框架。该框架包括构建一个基于神经网络的骨干网络,使用自监督学习来学习高级特征,然后微调骨干网络以实现特定目标。这种方法的主要优势在于,与其他传统监督学习方法相比,骨干网络可以在使用极少训练数据的情况下,微调以实现各种目标任务。

    实验评估表明,通过微调骨干网络,该方法不仅能在不同故障场景或运行条件中,还能在不同机器间实现超过90%的分类准确率。这展现了该方法在实际应用中用于跨机器故障诊断任务的巨大潜力。

  • 发表年份:2023

  • 论文期刊:ArXiv

  • 论文链接https://arxiv.org/abs/2307.16891

  • 开源代码:无

第3篇
  • 英文标题Fault Diagnosis and System Maintenance Based on Large Language Models and Knowledge Graphs

  • 中文标题基于大语言模型和知识图谱的故障诊断与系统维护

  • 摘要大型语言模型(LLM)的不断发展推动了新一轮技术变革,在专业领域,LLM因其“幻觉”问题一直饱受诟病。为此,我们提出了一种将LLM应用于专业领域的框架。具体工作包括构建知识图谱(KG)和微调数据集,用于工业领域的模型微调和部署,以及结合多模态数据构建更详细的提示词以用于推理,并在必要时借助知识图谱实现多跳推理。本研究以计算机数控(CNC)机床为例,通过使用该框架,可有效进行故障预测并提供可靠的维护建议,从而有效避免和尽量减少设备故障造成的损失,提高生产力和效率。

  • 发表年份:2023

  • 论文期刊2023 5th International Conference on Robotics, Intelligent Control and Artificial Intelligence (RICAI)

  • 论文链接https://ieeexplore.ieee.org/document/10489566

  • 开源代码:无

第4篇
  • 英文标题Evaluating the Performance of ChatGPT in the Automation of Maintenance Recommendations for Prognostics and Health Management

  • 中文标题评估 ChatGPT 在预测性健康管理维护建议自动化中的表现

  • 摘要到目前为止,预测与健康管理(PHM)领域中维护建议的自动化一直是应用于历史案例数据的领域特定技术语言处理(TLP)任务。ChatGPT、Bard、GPT-4和Sydney等生成式大型语言模型(LLM),因其在多种领域自然语言任务中的熟练表现而备受媒体关注。对ChatGPT作为生成维护建议工具的初步探索表明,其在生成和解释工程概念及程序方面展现出潜力,但其能力与局限性的具体范围仍不确定。目前,我们尚未发现与正式衡量ChatGPT在工业用例中表现相关的性能标准。在本文中,我们提出了一种评估像ChatGPT这类LLM在自动化维护建议任务中性能的方法。我们的方法确定了与PHM相关的各种性能标准,如工程标准、风险因素、人为因素、成本考量及更正等。我们检验了ChatGPT在根据PHM模型警报生成建议时的表现,并报告了我们的发现。我们讨论了在将LLM作为规范性PHM的计算支持工具时需要考虑的各种优势与局限性,以及不同的风险和商业案例考量因素。

  • 发表年份:2023

  • 论文期刊Annual Conference of the PHM Society

  • 论文链接https://www.mendeley.com/catalogue/02fd823f-ae23-34cd-a40d-b362ab3e2d8e/

  • 开源代码:无

第5篇
  • 英文标题Industrial-generative pre-trained transformer for intelligent manufacturing systems

  • 中文标题工业生成预训练Transformer用于智能制造系统

  • 摘要:制造企业正面临如何利用工业知识和持续积累的海量未标注数据,以实现人 - 信息 - 物理协同自主智能的问题。近年来,生成式人工智能内容在多个领域和场景中表现出色。为解决各种场景任务,本文引入了一种面向智能制造系统的工业生成式预训练 Transformer(Industrial-GPT)新概念。该概念包括利用工业数据集进行预训练、基于工业场景进行微调,以及结合领域知识开展强化学习。

    为使 Industrial-GPT 更好地赋能制造业,文中将 “模型即服务”(Model as a Service)作为一种新的服务模式引入云计算。该模式通过直接调用上层通用模型并针对特定业务进行定制,提供了更高效、灵活的服务方式。随后,文章阐述了 Industrial-GPT 驱动的智能制造系统的运行机制。最后,探讨了 Industrial-GPT 在制造业应用中面临的挑战与前景。

  • 发表年份2023

  • 论文期刊IET Collaborative Intelligent Manufacturing

  • 论文链接https://digital-library.theiet.org/doi/full/10.1049/cim2.12078

  • 开源代码:无

第6篇
  • 英文标题Large Language Models in Fault Localisation

  • 中文标题(软件代码故障定位)大型语言模型在故障定位中的应用

  • 摘要:大型语言模型(LLM)在代码生成、程序修复、代码总结和测试生成等多项软件工程任务中展现出巨大潜力。故障定位对于实现程序的自动化调试和修复至关重要,也是 ChatGPT-4 发布活动中的亮点之一。然而,与现有先进方法相比,LLM 的性能以及提示设计和上下文长度对其有效性的影响尚不明确。为填补这一空白,本文深入探讨了两种先进 LLM——chatGPT-3.5 和 ChatGPT-4 在故障定位方面的能力。基于广泛采用的大型 Defects4J 数据集,我们将这两种 LLM 与现有故障定位技术进行了比较。同时,我们研究了 LLM 在故障定位中的一致性,以及提示工程和代码上下文长度如何影响故障定位的有效性。

    研究结果表明,在函数级上下文中,ChatGPT-4 的故障定位性能优于所有现有方法。额外的错误日志可进一步提高 ChatGPT 模型的定位准确性和一致性,在 Defects4J 数据集上,基于 TOP1 指标,其准确率较先进的 SmartFL 基线平均高出 46.9%。然而,当 Defects4J 数据集的代码上下文扩展到类级时,ChatGPT-4 的性能显著下降,在 TOP1 指标下,其准确率比 SmartFL 低 49.9%。这些发现表明,尽管 ChatGPT 在特定条件下能有效定位故障,但也存在明显局限性。要充分发挥 ChatGPT 等 LLM 在实际故障定位应用中的潜力,仍需进一步研究。

  • 发表年份:2023

  • 论文期刊ArXiv

  • 论文链接https://ar5iv.labs.arxiv.org/html/2308.15276

  • 开源代码:无

第7篇
  • 英文标题FD-LLM: Large Language Model for Fault Diagnosis of Machines

  • 中文标题FD-LLM:用于机器故障诊断的大语言模型

  • 摘要大型语言模型(LLM)能够从文本数据中捕捉复杂且有价值的语义表示,适用于众多实际应用场景。然而,在智能故障诊断(IFD)等学科中,纳入额外的传感器数据(如振动信号、温度读数和操作指标)至关重要,但传统文本语料库难以捕捉此类传感器数据信息。本研究提出了一种新颖的 IFD 方法,通过将 LLM 有效适配数值数据输入,从时序传感器数据中识别各类机器故障。我们提出 FD-LLM,这是一种专为故障诊断设计的 LLM 框架,将 LLM 的训练构造成一个多类别分类问题。我们探索了两种用于编码振动信号的方法:第一种方法采用基于字符串的标记化技术将振动信号编码为文本表示,第二种方法则从时域和频域提取统计特征,作为每个信号的统计摘要。基于 FD-LLM 框架,我们评估了四种开源 LLM 的故障诊断能力,并检验了这些模型在不同操作条件和机器部件下的适应性与泛化能力,具体涵盖传统故障诊断、跨操作条件以及跨机器部件场景。结果显示,诸如 Llama3 和 Llama3-instruct 等 LLM 具备强大的故障检测能力和显著的跨操作条件适应性,在许多情况下超越了最先进的深度学习(DL)方法。

  • 发表年份:2024

  • 论文期刊:ArXiv

  • 论文链接https://arxiv.org/abs/2412.01218

  • 开源代码:无

第8篇
  • 英文标题Multimodal Large Language Model-Based Fault Detection and Diagnosis in Context of Industry 4.0

  • 中文标题基于多模态大语言模型的工业 4.0 故障检测与诊断

  • 摘要:本文提出了一种基于新型多模态大型语言模型的故障检测与诊断框架,用以解决传统故障检测与诊断方法的局限性。该框架利用生成预训练Transformer-4 预览版模型,提升其在处理复杂系统及多种故障场景时的可扩展性、泛化能力和效率。此外,通过大型语言模型生成的合成数据集扩充了知识库,并提高了对不平衡场景故障检测与诊断的准确性。框架中引入了一种混合架构,整合在线和离线处理,将实时数据流与微调后的大型语言模型相结合,实现适用于工业环境的动态、精准且具有上下文感知能力的故障检测,特别关注安全问题。这一全面的方法旨在解决传统故障检测与诊断挑战,推动该领域迈向更具适应性和高效性的故障诊断系统。

    本文还开展了详细的文献综述,包括对故障检测与诊断方法及其在各个工业领域的应用的详细分类。研究探讨了案例研究结果和模型比较,展望了在工业 4.0 技术背景下,工业故障检测与诊断系统未来发展的意义。

  • 发表年份:2024

  • 论文期刊:Electronics

  • 论文链接https://www.mdpi.com/2079-9292/13/24/4912

  • 开源代码:无

第9篇
  • 英文标题Large Language Models for Test-Free Fault Localization

  • 中文标题(软件代码故障定位)无需测试的大语言模型用于故障定位

  • 摘要:故障定位(Fault Localization,FL)旨在自动定位代码中的错误行,这是许多手动和自动调试任务的关键第一步。以往的故障定位技术依赖于输入测试用例,并且通常需要进行大量的程序分析、程序插桩或数据预处理。此前基于深度学习的自动程序修复(APR)研究难以从小规模数据集中学习,并且在真实世界的程序上效果有限。

    受大型代码语言模型(LLMs)能够基于少量示例适应新任务的能力启发,我们探究了将 LLMs 应用于行级故障定位的可行性。具体而言,我们提出通过在 LLMs 学习到的表示之上微调少量双向适配器层,克服 LLMs 从左到右的处理特性,从而提出了 LLMAO——首个无需任何测试覆盖率信息即可定位错误代码行的语言模型故障定位方法。

    我们在小型的手动策划的错误程序语料库(如 Defects4J 语料库)上,对参数规模分别为 3.5 亿、60 亿和 160 亿的 LLMs 进行微调。我们发现,基于更大规模模型的技术在进行故障定位时具有更高的置信度,并且故障定位性能随着 LLM 规模的增大而稳步提升。

    我们的实证评估表明,LLMAO 在 Top - 1 结果上相较于现有的最先进机器学习故障定位(MLFL)基线方法提升了 2.3% - 54.4%,在 Top - 5 结果上提升了 14.4% - 35.6%。此外,LLMAO 也是首个利用语言模型架构进行训练、能够检测到代码行级别安全漏洞的故障定位技术。

  • 发表年份:2024

  • 论文期刊ICSE '24: Proceedings of the 46th IEEE/ACM International Conference on Software Engineering

  • 论文链接https://dl.acm.org/doi/abs/10.1145/3597503.3623342

  • 开源代码:无

第10篇
  • 英文标题LLM-R: A Framework for Domain-Adaptive Maintenance Scheme Generation Combining Hierarchical Agents and RAG

  • 中文标题LLM-R:结合层次化代理和 RAG 的领域自适应维护方案生成框架

  • 摘要:随着智能设备使用的不断增加,维护在生产活动中的关键作用日益凸显。交互式电子技术手册(IETM)是支持智能设备维护的重要工具。然而,传统的 IETM 在从图形用户界面(GUI)过渡到自然语言用户界面(LUI)以及管理复杂的逻辑关系方面面临着挑战,同时还必须满足当前对更高智能化的需求。

    本文提出了一种基于大型语言模型(LLM-R)的维护方案生成方法。该方法包含几项关键创新:我们提出了低秩适应 - 知识保留(LORA - KR)损失技术,用于按比例调整混合维护数据,以微调大型语言模型(LLM)。该方法可防止混合数据导致的知识冲突,提高模型在特定维护领域的适应性和推理能力。此外,还采用了基于层次任务的智能体和指令级检索增强生成(RAG)技术,以优化生成步骤,减轻因模型无法访问上下文信息而导致的幻觉现象。这一改进提高了模型在处理已知或未知维护对象及维护场景时的灵活性和准确性。

    为了验证所提方法在维护任务中的有效性,我们使用不同领域的对象构建了一个维护方案数据集。实验结果表明,所提方法生成的维护方案的 准确率达到 91.59%,表明该改进提高了维护方案的智能化水平,并为设备维护引入了新的技术方法。

  • 发表年份:2024

  • 论文期刊:ArXiv

  • 论文链接https://arxiv.org/abs/2411.04476

  • 开源代码:无

第11篇
  • 英文标题Diff-MTS: Temporal-Augmented Conditional Diffusion-Based AIGC for Industrial Time Series Toward the Large Model Era

  • 中文标题Diff-MTS:面向大模型时代的工业时间序列的时序增强条件扩散生成模型

  • 摘要工业多变量时间序列(MTS)是人们对工业领域中机器状态进行了解的重要视角。然而,由于数据收集的困难和隐私问题,可用于构建工业智能和工业大型模型的数据远不充分。因此,工业时间序列数据的生成具有重要意义。现有的研究通常使用生成对抗网络(GANs)来生成MTS。然而,GANs由于生成器和判别器的联合训练,导致训练过程不稳定。本文提出了一种时间增强的条件自适应扩散模型,称为Diff-MTS,用于MTS生成。该模型旨在更好地处理MTS数据的复杂时间依赖关系和动态特性。具体来说,提出了一种条件自适应最大均值差异(Ada-MMD)方法,用于控制MTS的生成,该方法不需要分类器来控制生成过程,从而提高了扩散模型的条件一致性。此外,建立了一种时间分解重建UNet(TDR-UNet),以捕捉复杂的时间模式,进一步提高合成时间序列的质量。在C-MAPSS和FEMTO数据集上进行的综合实验表明,与基于GAN的方法相比,所提出的Diff-MTS在多样性、保真度和效用方面均表现出显著优势。这些结果表明,Diff-MTS促进了工业数据的生成,有助于智能维护和工业大型模型的构建。

  • 发表年份:2024

  • 论文期刊IEEE Transactions on Cybernetics

  • 论文链接https://ieeexplore.ieee.org/stampPDF/getPDF.jsp?arnumber=10697287

  • 开源代码:无

第12篇
  • 英文标题FaultExplainer Leveraging large language models for interpretable fault detection and diagnosis

  • 中文标题故障解释器:利用大语言模型实现可解释的故障检测与诊断

  • 摘要机器学习算法越来越多地被应用于化工过程的故障检测与诊断(FDD)。然而,现有的数据驱动型 FDD 平台通常缺乏对过程操作人员的可解释性,且难以识别以前未见过的故障的根本原因。本文介绍了 FaultExplainer,这是一种专为提高田纳西东曼过程(TEP)中的故障检测、诊断和解释能力而设计的交互式工具。FaultExplainer 将实时传感器数据可视化、基于主成分分析(PCA)的故障检测以及在交互式用户界面中识别主要贡献变量的功能相结合,该界面由大型语言模型(LLM)驱动。我们在两种场景下评估了 LLM 的推理能力:一种是提供了历史根本原因的场景,另一种是没有提供(以模拟以前未见过的故障的挑战)的场景。使用 GPT-4o 和 o1-preview 模型进行的实验结果展示了该系统在生成合理且可行的解释方面的优势,同时也突出了其局限性,包括对 PCA 选择的特征的依赖和偶尔出现的幻觉现象。

  • 发表年份:2024

  • 论文期刊:ArXiv

  • 论文链接https://arxiv.org/abs/2412.14492

  • 开源代码:无

第13篇
  • 英文标题ChatGPT-like large-scale foundation models for prognostics and health management A survey and roadmaps

  • 中文标题面向预测与健康管理的类ChatGPT大规模基础模型:综述与路线图

  • 摘要预测性健康管理(PHM)技术在工业生产和维护中发挥着至关重要的作用,能够识别并预测潜在的设备故障与损伤,从而使得 proactive maintenance措施得以实施,提高了设备的可靠性并降低了生产成本。近期,基于人工智能(AI)的PHM方法取得了显著的成就,并在铁路、能源、航空等多个行业被广泛用于状态监测、故障预测以及健康管理。像ChatGPT和DALLE-E等大规模基础模型(LSF-Models)的出现,标志着AI从1.0时代迈入了多模态、多任务、海量数据和超大规模模型的新范式AI-2.0时代。ChatGPT是这一研究范式的一个标志性成果,其出色的语言理解能力为通用AI带来了希望。然而,PHM领域对于这一重大变革缺乏共识,需要系统性的评估和路线图来明确未来发展方向。因此,本文首先阐述了LSF-Models的关键组成部分和最新发展,然后系统地回答了如何构建适用于PHM任务的LSF-Models,并规划了这种研究范式的挑战和未来发展方向。

  • 发表年份:2024

  • 论文期刊Reliability Engineering & System Safety

  • 论文链接https://www.sciencedirect.com/science/article/abs/pii/S0951832023007640

  • 开源代码:无

第14篇
  • 英文标题DiagLLM: Multimodal Reasoning with Large Language Model for Explainable Bearing Fault Diagnosis

  • 中文标题DiagLLM:基于大语言模型的多模态推理用于可解释的轴承故障诊断

  • 摘要准确可靠的轴承故障诊断对于确保机械设备的安全运行至关重要。由于故障数据的稀缺和分布不一致,以前的数据驱动方法在训练高级深度学习模型方面面临挑战。此外,它们的黑盒性质以及缺乏与轴承故障物理机制相关的约束引导学习,导致可解释性和可靠性较低,限制了其在机器状态监测中的有效性。在本文中,我们旨在通过将多模态大型语言模型与包络谱分析相结合,来增强轴承故障诊断的泛化能力和可解释性。具体来说,我们提出了一个名为DiagLLM的新型框架来实现这一目标。DiagLLM利用大型语言模型的强大推理能力,并结合包络谱图像和专家知识的上下文线索,准确地诊断轴承故障。为了有效地调整DiagLLM,我们构建了诊断视觉指令跟随数据,将故障特征描述与信号特征联系起来,并使用参数高效的训练流程对整个模型进行微调。在两个公开的轴承故障诊断数据集上进行了广泛的实验,结果表明DiagLLM在有限数据和跨数据泛化场景中优于领先的基线模型。

  • 发表年份:2024

  • 论文期刊SCIENCE CHINA Information Sciences

  • 论文链接https://www.sciengine.com/SCIS/doi/10.1007/s11432-024-4333-7

  • 开源代码:无

第15篇
  • 英文标题BearingFM Towards a foundation model for bearing fault diagnosis by domain knowledge and contrastive learning

  • 中文标题面向轴承故障诊断的基础模型:基于领域知识与对比学习方法

  • 摘要:监测生产设备中的轴承故障可有效防止成品质量问题以及工厂非计划停机,进而降低供应链的不确定性及风险。因此,监测生产设备的轴承故障对于提高供应链的可持续性至关重要。

    由于神经网络模型存在泛化局限性,必须针对特定任务训练特定的模型。然而,在实际的工业场景中,标记样本严重匮乏,这使得故障诊断模型难以在车间内的大量设备上部署。

    为解决上述问题,本文提出了一种云 - 边 - 端协同的半监督学习框架,该框架为构建基础模型提供了多层次的计算能力和数据支持。提出了一种基于轴承故障机理的数据增强方法,该方法通过对频率进行归一化处理以及在特定频段添加噪声,有效保留了振动信号中的固有本质特征。设计了一种新颖的对比学习模型,该模型通过在时间维度和知识维度进行交叉比较,缩小正样本之间的距离并拉大负样本之间的距离,从而从无标签信号中提取出最具本质的特征。

    在四个数据集上进行的多组实验表明,所提出的方法仅使用 1.2% 的标记样本即可实现约 98% 的故障分类准确率。


  • 发表年份:2024

  • 论文期刊International Journal of Production Economics

  • 论文链接https://www.sciencedirect.com/science/article/abs/pii/S0925527324001762

  • 开源代码:无

第16篇
  • 英文标题Empirical study on fine-tuning pre-trained large language models for fault diagnosis of complex systems

  • 中文标题针对复杂系统故障诊断的预训练大语言模型微调实证研究

  • 摘要随着现代工业系统的复杂性和互联性不断增加,有效地诊断故障成为预测性健康管理(PHM)的核心步骤。语言模型,特别是基于海量语料库预训练的大型语言模型(LLM),已在自然语言处理(NLP)及其相关下游任务中展现出卓越的能力。然而,如何利用这些模型来促进系统故障诊断并验证其有效性,目前鲜有研究。本文结合预训练LLM的潜在理解能力,研究了微调LLM以实现高效系统故障诊断的有效性。本研究的实验涉及开源和闭源模型,并使用了仿真和真实的故障诊断数据集。结果表明,与基线模型相比,这些模型在各种指标上均能持续实现高性能。此外,我们还进行了定性和定量分析,探讨了数据集大小、数据归一化、缺失值及诊断可解释性等方面的影响,进一步展示了该方法的潜力和局限性。

  • 发表年份:2024

  • 论文期刊Reliability Engineering & System Safety

  • 论文链接https://doi.org/10.1016/j.ress.2024.110382

  • 开源代码:无

第17篇
  • 英文标题Empowering digital twins with large language models for global temporal feature learning

  • 中文标题利用大语言模型为数字孪生赋能,以实现全球时序特征学习

  • 摘要数字孪生(DT)作为一种高效的虚实交互技术,在众多行业中展现出了巨大的应用潜力。由智能代理驱动的数字孪生系统在分析、决策和控制方面表现出色,非常适合制造资源调度、诊断决策等需求。然而,当前的智能代理在适应性、数据利用和可解释性方面存在明显不足,削弱了决策的安全性和可接受性,为用户干预制造了障碍。因此,本文介绍了一种由大型语言模型(LLM)驱动的数字孪生多智能体架构。智能代理通过整合多种模态的数据来感知物理系统的特性,尤其是其时间特性。多个代理通过特定的交互机制实现洞察,同时保持可追溯性。为了展示该架构的优势和特点,我们开发了一个典型的设备维护应用场景。通过消融实验验证了框架中每个组件的有效性。实验结果表明,所提出的框架具有广阔的应用前景。

  • 发表年份:2024

  • 论文期刊Journal of Manufacturing Systems

  • 论文链接https://www.sciencedirect.com/science/article/abs/pii/S0278612524000372

  • 开源代码:无

第18篇
  • 英文标题Joint Knowledge Graph and Large Language Model for Fault Diagnosis and Its Application in Aviation Assembly

  • 中文标题联合知识图谱与大语言模型的故障诊断及其在航空装配中的应用

  • 摘要在复杂的装配行业环境中,故障定位涉及根据故障症状快速准确地识别故障源并获得排障解决方案。本研究提出了一种知识增强的联合模型,将航空装配知识图谱(KG)嵌入大型语言模型(LLMs)中。该模型利用 KG 中的图结构大数据对 LLMs 进行前缀调优。用于前缀调优的知识图谱能够在线重新配置 LLMs,避免了巨大的计算负荷。通过子图嵌入学习过程,加强了联合模型在航空装配领域的专业知识,特别是在故障定位方面。在航空装配功能测试中,联合模型可以生成知识子图,通过检索增强融合知识,最终提供基于知识的推理响应。在实际工业场景实验中,联合增强模型展示了 98.5% 的故障诊断和排障方案的准 确性。

  • 发表年份:2024

  • 论文期刊IEEE Transactions on Industrial Informatics

  • 论文链接https://ieeexplore.ieee.org/document/10463190

  • 开源代码:无

第19篇
  • 英文标题Generative artificial intelligence and data augmentation for prognostic and health management Taxonomy, progress, and prospects

  • 中文标题生成式人工智能与数据增强在预测性健康管理中的应用:分类体系、研究进展与前景展望

  • 摘要在复杂设备的预测与健康管理(PHM)中,智能故障诊断、检测和预测(DDP)取得了显著突破。工业场景中的设备通常在正常条件下运行,导致异常缺失、故障有限以及退化路径不完整。因此,从传感器读数中收集的设备状态信息有限,这严重阻碍了判别式人工智能(AI)对PHM的认知能力。以生成式AI为代表的数据增强和生成(DA&G)技术,在克服PHM应用场景限制方面显示出巨大潜力。DA&G研究取得了显著成果,但机械领域的综合性回顾仍缺失。为此,本文全面回顾了解决DDP问题的DA&G技术,将其分为数据、机制和特征三类见解。基于数据的随机化方法通过受控随机性进行增强;基于机制的领域特定技术主张通过合理推理探索物理实体与监测数据之间的关系以生成数据;基于特征的生成模型旨在识别数据的潜在空间并随后重新采样。最后,论文探讨了评估DA&G的策略,并深入分析了DA&G技术的挑战和机遇。

  • 发表年份:2024

  • 论文期刊Expert Systems with Applications

  • 论文链接https://www.sciencedirect.com/science/article/abs/pii/S0957417424013782

  • 开源代码:无

第20篇
  • 英文标题Integrating LLMs for Explainable Fault Diagnosis in Complex Systems

  • 中文标题大语言模型在复杂系统中的可解释故障诊断集成

  • 摘要本文介绍了一个集成系统,旨在增强复杂系统(如核电站)中故障诊断的可解释性,在这些系统中,操作员的理解对于做出明智决策至关重要。通过将基于物理的诊断工具与大型语言模型相结合,我们提供了一种新颖的解决方案,不仅可以识别故障,还可以清晰、易懂地解释其原因和影响。通过将该系统应用于熔盐设施,展示了其阐明诊断出的故障与传感器数据之间联系的能力,回答操作员的查询,并评估历史传感器异常。我们的方法强调了将基于模型的诊断与先进的AI相结合的重要性,以提高自主系统的可靠性和透明度。

  • 发表年份:2024

  • 论文期刊ArXiv

  • 论文链接https://export.arxiv.org/abs/2402.06695v1

  • 开源代码:无


其他Github项目推荐:

编辑:李正平
校核:何超、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、陈宇航、陈莹洁、Tina、王金、赵诚、肖鑫鑫

该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除。


来源:故障诊断与python学习
ACTSystem振动化学旋转机械通用航空电子ANSAUGpython云计算海洋声学电机数字孪生控制人工智能
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-05-30
最近编辑:2天前
故障诊断与python学习
硕士 签名征集中
获赞 79粉丝 111文章 200课程 0
点赞
收藏
作者推荐

中科院一区TOP期刊论文 | 基于图神经网络的Granger因果检验轴承故障诊断

在等待假期到来间隙,一起来学习一篇中科院一区TOP级期刊论文吧!提前祝大家五一快乐~本期给大家推荐一篇基于图神经网络结合Granger因果检验进行轴承故障诊断的论文:基于图神经网络的Granger因果检验轴承故障诊断。论文提出了一种基于Granger因果检验的图神经网络(GCT-GNN)方法,针对轴承故障诊断中存在的特征相关性依赖问题,通过量化故障和噪声对信号变化的影响,构建邻接矩阵并输入到图神经网络中进行特征映射和分类。这一创新方法有效提升了模型在实际工作条件下的抗噪能力和诊断准确性。研究在两个公开数据集上与五种主流模型进行了对比实验,验证了GCT-GNN在轴承故障诊断中的优越性能。该研究为机械设备故障诊断领域提供了新的思路和方法,具有较高的学术价值和实际应用价值。论文基本信息 论文题目:Graph neural network-based bearing fault diagnosis using Granger causality test论文期刊:Expert Systems With Applications 论文日期:2024论文链接:https://doi.org/10.1016/j.eswa.2023.122827 作者:Zhewen Zhang(a), Lifeng Wu∗(b)机构:a: Information Engineering College, Capital Normal University, Beijing 100048, China.b: Beijing Key Laboratory of Electronic System Reliability Technology, Capital Normal University, Beijing 100048, China.作者简介:吴立锋,男,博士(后),教授,博士生导师,首都师范大学青年自然科学创新团队(共融机器人安全性基础理论及关键技术研究)带头人,入选北京市高等学校青年英才计划,首都师范大学课程思政教学名师。主要研究兴趣为人工智能在电子系统故障诊断中的应用。主持国家自然基金面上项目、国家自然基金青年基金、北京市自然基金面上项目、北京市教委重点项目等11项,发表学术论文50余篇,高被引论文2篇,授权发明专利5项,授权实用新型专利若干,软件著作权若干,获北京市科技进步二等奖1项。IEEE会员,中国计算机学会会员,中国系统仿真学会智能物联系统委员会委员,中国人工智能服务专委会通信委员,技术过程的故障诊断与安全性专业委员会委员。IEEE Transactions on Industrial Electronics, IEEE Transactions on Industrial Informatics, IEEE Transactions on Neural Networks and Learning Systems, Applied Intelligence,Journal of Mechanical Engineering Science,自动化学报,计算机学报等期刊审稿人。(来自学校官网) 目录摘要1 引言2 数据预处理3 特征矩阵构造4 邻接矩阵构造 4.1 计算子样本之间的滞后阶数 4.2 计算子样本与健康轴承之间 4.3 因果关系图 5 图卷积神经网络构造6 对比实验与分析 6.1 实验设置 6.2 其他对比方法和对比实验内容 6.3 第一部分实验的进行及实验分析 6.4 第二部分实验的进行及实验分析 6.5 第三部分实验的进行及实验分析 6.6 其他数据集的实验结果 7 结论摘要检测轴承故障有助于确保机械设备的正常运行并防止严重事故。然而,基于深度学习的故障诊断方法依赖于提取的振动信号特征之间的相关性。它没有考虑故障、噪声和振动波形变化之间的因果关系,导致在实际工作条件下轴承故障诊断准确性较低。本研究提出了一种基于Granger因果检验的图神经网络(GNN)方法,称为GCT-GNN,以解决这一问题。所提出的方法首先对原始信号进行特征变换,以提取时域和频域特征,形成特征矩阵。然后,对带有噪声的故障信号和健康信号进行谱分析,计算它们之间的滞后阶数。随后,采用Granger因果检验来量化故障和噪声对信号变化的影响,并利用量化结果计算权重,构建邻接矩阵。完成的邻接矩阵和特征矩阵输入到图神经网络中进行特征映射,最后对轴承故障数据进行分类。本文选择了五种模型:深度残差收缩网络(DRSN)、图神经网络、支持向量机(SVM)、随机森林(RF)和卷积神经网络(CNN),并在两个公开数据集上进行了对比实验。结果表明,与其它模型相比,GCT-GNN具有更好的抗噪能力,在各种故障诊断中优于其他模型。关键词:轴承故障诊断,图神经网络,Granger因果检验,噪声抑制1 引言作为各种旋转机械中最为关键的部件之一,滚动轴承在诸如动力涡轮传动系统(Liu&Zhang,2020)、农业机械中使用的液压马达(Shenet al.,2021)以及工业设备中的风机、鼓风机和泵(Sampath et al.,2003)等机械系统中发挥着极其重要的作用。然而,滚动轴承的故障概率远高于其他部件(Huet al.,2020),因为轴承经常承受重载和苛刻的工作条件。因此,轴承的长期可靠性和实时健康监测具有重要意义,直接影响机器的性能和运行安全。例如,在大型感应电机中,约45%-50%的电机故障可归因于轴承问题(Kumar et al.,2022)。意外的轴承故障不仅可能导致附近机器部件的潜在损坏,还会导致非计划停机,造成巨大的经济损失。这突出表明有效的轴承故障诊断方法可以发挥关键作用,因为它可以及早检测潜在的轴承故障,甚至确定特定类型的故障。这种主动的方法有助于避免过高的维护成本和防止事故。传统的工业领域故障诊断方法已得到广泛应用(Bediaga et al.,2013),主要基于使用快速傅里叶变换、小波变换和希尔伯特变换等技术分析和处理振动信号。然而,近年来出现了许多新的信号处理技术,旨在更早地捕捉故障模式。例如,Yao等(2022)提出了一种自适应循环匹配增强的稀疏表示算法,而Ni等(2021)则引入了一种故障信息引导的变分模态分解方法。这些方法的工作原理是从传感器收集的原始数据集中提取微小的故障特征,以识别并显示故障的相关特性。尽管这些传统的信号处理方法可以发现故障相关特征,但最终的决策过程通常仍然依赖于振动专家或简单的基于规则的算法(例如基于阈值的算法)(Dou et al.,2018; Gundewar & Kane,2022)。 数据时代已经到来,这导致了数据驱动技术在状态监测和故障诊断中的广泛应用(Bagherzadeh&Shafighfard,2022;Bagherzadeh et al.,2023)。使用数据驱动轴承故障诊断的工作原理是,利用传感器收集的原始信号或特征提取后的数据作为模型的输入值,然后对轴承进行分类或评估其健康状态。为此目的,已应用了多种机器学习技术,如SVM(Yan&Jia,2018)、k-近邻(Tian et al.,2016)和随机森林(Xu et al.,2019)。例如,在一项研究中,研究人员(Yan&Jia,2018)开发了一种基于集成学习的增量SVM方法,通过利用从振动数据中提取的时间域和频域统计特征来进行故障诊断。同样,Tian等(2016)设计了一个健康指数,使用主成分分析和k-近邻方法,能够检测轴承故障并监测轴承退化。Xu等(2019)提出的方法则使用连续小波变换将振动信号转换为二维灰度图像,随后训练随机森林集成模型。然而,使用传统机器学习进行滚动轴承故障诊断存在一个很大的局限性,主要依赖于专家设计和选择的特征作为输入变量,这一过程需要大量的时间。特征提取和选择的过程既耗时又昂贵,尤其是在处理大型训练数据集时。因此,传统的机器学习可能并不适合此类场景(Lei et al.,2020)。深度学习,作为机器学习的一个新兴分支,因其能够自动学习复杂的输入-输出关系而越来越受欢迎。与传统机器学习方法相比,深度学习通常需要最少的人工干预或领域特定的专业知识。它通过使用算法自主识别训练数据集中的最优特征来实现这一点,从而自动化特征工程过程(Feng et al.,2023)。这一独特特性使得深度学习特别适合处理大规模数据集。深度学习模型建立在神经网络的基础之上,包括深度神经网络、卷积神经网络和循环神经网络等架构。例如,最新的剩余使用寿命(RUL)预测方法利用生成对抗网络(Lu et al.,2022)。Zhang等人(2023)提出使用振动信号和声发射信号作为输入数据,建立卷积残差网络作为故障诊断模型。深度神经网络由多个层组成,每层都充当特征提取器,各自独立地进行特征提取(True & Yang,2023)。这种特性使深度神经网络能够自动识别训练数据中的特征和故障相关特性,从而在轴承故障诊断等领域得到广泛应用。现有的基于深度学习的轴承故障检测方法存在两个常见问题:缺乏可解释性和对噪声的敏感性。深度学习模型通常由复杂的神经网络结构组成,包含大量参数和层次关系,这使得理解其内部机制变得非常困难。与传统机器学习模型相比,深度学习模型更像是黑箱,提供预测结果但无法清晰地揭示其决策过程。这使得人们难以理解模型为何会做出特定的预测或决策,尤其是在高维数据和复杂任务中。在实际应用中,轴承收集到的振动信号受到传感器噪声、环境噪声、外部干扰等因素的影响,这些因素可能会掩盖输入深度学习模型的数据特征,导致预测更加不确定和不可靠。 为了应对深度学习模型中的可解释性和噪声敏感性问题,本研究提出了一种基于Granger因果检验的GNN(Asif et al.,2021)方法用于轴承故障检测。通过将Granger因果检验(Panait et al.,2022)整合到模型中,提高了模型决策过程的可解释性,并增强了模型对输入数据在添加噪声后的鲁棒性,本文的主要贡献如下:1.Granger算法用于量化噪声和故障对滚动轴承信号的影响。2.使用因果关系来构建GNN模型加强了模型的可解释性。3.通过向两个公共数据集添加噪声来测试模型的鲁棒性。4.增加一个多分类任务,以测试模型对多个故障的诊断能力。GCT-GNN模型的构建过程如图1所示。本文其余部分组织如下。第2节和第3节展示了数据处理并将其转换为特征矩阵的过程。第4节描述了使用Granger因果检验算法构建邻接矩阵的过程。第5节展示了用于轴承故障分类的GNN构建过程。第6节通过与其它模型在凯斯西储大学和帕德博恩大学的轴承数据集上的对比实验,验证了所提出方法的性能。最后, 第7节总结了本文。图1 所提故障诊断方法的流程2 数据处理在轴承振动信号采集过程中,同时存在标准振动信号和故障振动信号。本文采用数据切片技术将原始数据集划分为N个子样本以便后续分析,子样本维度为 。数据切片采用非重叠滑动窗口方式进行,随后将这些 个子样本水平拼接形成数据矩阵 。3 特征矩阵构造在图神经网络中,邻接矩阵描述了节点之间的关系,这有助于信息传播和特征聚合。特征矩阵的维度为 ,其中 表示图中的节点数量。数据集切片并连接后,数据矩阵 经过特征变换以获得特征矩阵 。具体的特征变换方法如下: 选取了标准差、峰值、偏度、峰度、均方根、峰高比、方差、形状因子和脉冲因子这七个时域特征。利用小波包分解( )得到六个分解序列作为特征。公式为式(1),其中表示使用 获得的𝑖频率段的分解系数序列。应用经验模态分解( )获得六个分解序列作为特征,公式如式(2)所示,其中表示经过 后的第 个数据序列, 表示在 中使用的分解层次。数据矩阵的特征变换减少了子样本中的冗余。 4 邻接矩阵构造在图神经网络中,邻接矩阵描述了节点之间的关系,促进了信息传播和特征聚合(Asif et al.,2021)。本节介绍滞后阶数K的计算方法。接下来,使用Granger因果检验算法构建因果矩阵。最后,利用本文提出的权重计算方法构建邻接矩阵。4.1 计算子样本之间的滞后阶数滞后阶数指的是在检测时间序列之间的因果关系时需要考虑的时间延迟值。它表示用于计算因果关系的时间步数。滞后阶数的选择通常基于实际数据的特性和统计指标。选择合适的滞后阶数对于准确评估Granger因果关系至关重要。本研究中,使用功率谱估计时间序列的滞后阶数(Cusido et al.,2008),如图2中算法流程图所示。在频域中, 和 表示频率为f的两个信号段的复数表示,其中实部和虚部分别代表该频率下信号的幅度和相位。 表示频率为f的交叉功率谱密度的计算值, 表示取复共轭的操作。这个方程说明了两个傅里叶变换结果的乘积,然后取复共轭,得到交叉功率谱密度的值。 图2 计算滞后阶数的过程4.2 计算子样本与健康轴承之间的因果关系强度标准轴承振动信号如图3(a)所示,因为在实际工作条件下,轴承会因损坏和其他故障及噪声干扰而产生变化,其振动波形也会随之改变,如图3(b)和(c)所示。本文中,故障和噪声被定义为“原因”,而由振动引起的振动波形变化则被定义为“结果”。如图4所示,考虑到通过获取正常数据与故障数据之间的差异,可以突出子样本的特征,从而在获得平均值与故障数据之间的差异后,突出子样本的特征,因此对子样本和平均值数据进行Granger因果检验,可以量化“原因”对“结果”的影响。 图3 正常轴承、故障轴承和加装轴承的振动信号噪音 图4 轴承振动信号中“原因”和“结果”的表达Granger因果关系检验的基本概念如下:存在两个时间序列。首次时间序列的数据被代入线性回归模型中,然后观察第二次时间序列的预测误差。如果误差减少,则表明首次时间序列对第二次时间序列具有Granger因果效应。自回归(AR)模型是Granger方法论中广泛使用的一个框架,用于描述时间序列变量与其先前观测值之间的联系。在本研究中,AR模型被用来展示Granger因果关系,如公式(3)和(4)所示。这里, ,表示分区数据集,而 表示子样本的特定列。 公式(3)可简化为公式(4)。 将 和 定义为AR模型的系数, 表示完整模型对 的预测误差。相比之下, 表示简化模型的预测误差。 代表两个模型的滞后阶数。通过比较两个模型的预测误差 和 ,我们可以推断出,如果误差 显著小于 ,则表明在变量 的帮助下预测 有显著的改进。换句话说, 的过去影响着 的现在和未来,因此将 确定为 的Granger原因。在公式(3)和(4)中令 。如公式(5)所示,Granger因果关系可以量化为 。当 时,表明 和 之间不存在因果联系。相反,当时,则表示 和 之间存在因果联系。由于不存在负因果关系的情况,因此公式(5)不可能小于0。通过计算子样本与健康无噪声振动信号之间的Granger因果关系,推导出这些实体之间的因果强度,记作 。在此背景下, 表示第 个子样本,而 则表示健康无噪声振动信号。变量 表示 子样本与健康轴承信号之间的Granger因果强度。集 合 可以通过上述方法计算每个子样本与健康无噪声信号之间的因果强度来获得。如公式(6)所示,对于集 合U中任意两个元素的差值,计算出因果矩阵 。 4.3 因果关系图因果图是一种图形工具,用于展示变量之间的因果关系,直观地呈现变量间的因果联系、相互作用和影响。因果图的一个显著优势在于能够识别系统中的关键驱动因素,从而指导决策和干预措施。以下是构建因果图的步骤。(1)图形表示图 ,其中 表示图的节点集 合, ; 表示这些节点之间的边连接, 表示边 的权重。(2)权重矩阵构建在获得因果矩阵 后,选择最大行的前 个元素形成集 合 。与该节点具有最强因果关系的 个节点被选中连接,在本文中,权重 通过公式(7)计算得出。 (3)图形构建GNN的邻接矩阵如公式(8)所示,因果图构建流程图如图5所示。 图5 因果图构建过程5 图卷积神经网络构造传统神经网络仅限于处理欧几里得空间中的数据(Li et al.,2023),这使得它们无法处理非欧几里得空间中的数据结构。因此,GNN模型被用于有效地处理图结构数据。经过GNN提取特征后,图中的每个节点都包含了其内在信息,并吸收了来自邻近节点的特征数据。在给定的网络结构中,当 作为输入时, 可以通过GNN模型的前向传播过程获得。根据GNN的定义,获取 的公式如公式(9)所示。 输入特征矩阵 的维度为 。 是邻接矩阵,表示节点之间的邻接关系。维度为 。 是具有𝐻个特征映射的隐藏层的输入到隐藏的权重矩阵, 输入到隐藏层的偏置矩阵。GNN的权重 , 和偏置 , 使用梯度下降训练。在训练阶段,模型的输出被标记为真实值以进行比较检查,并使用损失函数计算损失。测试时,模型的输出通过𝑠𝑖𝑔𝑚𝑜𝑖𝑑函数转换为概率分布,其中概率最高的类别作为预测结果。整个算法流程如算法1所示。算法1 GCT-GNN故障诊断 GNN模型的功能基于一种信息传播机制,如图6所示。每个节点会与邻近节点进行迭代更新和信息交换,直到达到稳定状态。随着整个图中信息流的平滑,每个节点都会积累关于自身及其邻近节点的信息。 图6 图神经网络模型6 对比实验与分析实验装置采用Intel(R) Core(TM)i7-7700 3.60 GHz CPU和8 GB RAM。软件方面,平台包括必要的工具和操作系统。实现模型所需的代码的开发使用了PyCharm2020。操作系统使用的是Windows10专业版。本节将深入探讨所提出的轴承故障诊断框架的有效性,特别是在基准数据集CWRU数据集(Loparo,0000)中的表现,如图7所示。CWRU实验收集的信号类型是加速度传感器,速度和负载由扭矩传感器收集。信号类型为加速度信号,由16通道数据记录器收集并以matlab格式保存。 图7 CWRU数据集(Loparo,0000)平台和测试轴承6.1 实验设置实验验证中使用的轴承数据详情见表1。每组包含四种不同的状态:正常状态和不同故障尺寸。本文将正常样本和故障样本分为子样本,每个子样本包含300个数据点。在实际场景中,标准样本的数量远高于故障样本。因此,在划分的故障样本中随机选取20个样本作为实验对象,与标准样本结合形成第一个数据集。表1 CWRU数据集的详细信息 同时引入高斯噪声,如公式(10)所示,其中 和 分别表示信号和噪声的平均功率。该处理方法以相同方式应用于两个数据集。 6.2 其他对比方法和对比实验内容介绍为了验证本文提出的GCT-GNN方法的性能,选择了五种分类方法进行对比测试,分别是GNN、CNN、深度残差收缩网络(DRSN)、SVM和RF。实验研究分为两个主要部分。第一部分是加入信噪比为6dB的高斯噪声,以评估六种模型的鲁棒性。第二部分的目标是验证所提出的GCT-GNN模型在复杂实际操作条件下的适用性。信噪比从0dB到-6dB,以复现轴承在真实场景中的工作环境。(1)传统方法通过与传统监督方法SVM和RF进行比较,评估了所提方法的有效性。类似GCT-GNN实验,评估实验是在三个独立的数据集上进行的。在无噪声条件下和信噪比为-6dB的情况下分别获得了分类准确率。(2)基于DL的方法基于DL的方法:CNN和DRSN模型与本文提出的GCT-GNN方法进行了比较,其中模型是两层卷积结构。(3)基于图的***接矩阵是使用皮尔逊相关系数计算数据之间的相关性构建的。在选择构建邻接矩阵的前200个元素时,与本文的方法一致。网络层的数量也设置为3,这与本研究中使用的GNN网络结构相匹配。6.3 第一部分实验的进行及实验分析在实验案例1中,我们向上述三个组的原始振动信号中引入了信噪比−6dB的高斯噪声。接下来的三组对比实验了使用无噪声信号进行故障诊断的分类准确性。这一比较旨在观察各种模型在存在噪声干扰时的鲁棒性。如图8、9和10所示,GCT-GNN、CNN、DRSN和GNN等深度学习模型在无噪声条件下表现出优异的故障识别能力,准确率接近100%。SVM和RF模型的准确率略低于其他四种深度学习模型。然而,在引入-6dB的高斯噪声后,三组实验结果表明,所提出的GCT-GNN模型的准确率变化小于其他五种模型。这一结果表明,本文提出的GCT-GNN模型在噪声干扰方面具有更强的鲁棒性,优于其他5个模型。由于GCT-GNN利用无噪声无故障信号与有噪声无故障信号之间的因果关系来突出数据特征,并利用它们的因果强度来构建GNN网络结构,因此在面对有噪声的实验数据时,仍然能够保持良好的分类精度。在整个三次测试中,GCT-GNN模型的准确性下降最为微小。在第一组实验中,其准确率从100%降至98.25%,而在其他两组实验中,准确率分别降至97.09%和96.51%。当数据被噪声掩盖时,这些模型难以提取有意义的特征,导致准确率显著下降。其中,CNN表现出最明显的下降,在噪声干扰下,特别是在第三组实验中,故障分类准确率显著下降至85.47%。DRSN模型结合了残差连接,有助于在网络中更好地学习噪声残差,从输出中去除噪声信息,增强模型恢复干净信号的能力。因此,DRSN的结果优于CNN。然而,在实际应用中,故障信号的数据量远小于健康轴承的数据量。这使得DRSN难以通过训练获得更好的模型参数。尽管包含残差连接,但该模型的抗噪性受到故障数据稀缺性的限制,导致与准确的实验数据相结合时精度欠佳。另一方面,基于数据间关系构建GNN网络结构,在这三个数据集上,其分类精度优于CNN和DRSN,但仍未达到上GCT-GNN的精度。 图8 实验结果第1组 图9 实验结果第2组 图10 实验结果第3组以第二组实验为例,图11和图12展示了GCT-GNN的分类结果。该组实验旨在区分健康轴承信号与滚动体三种不同损伤尺寸的故障信号。图中纵坐标表示实际标签,横坐标表示预测标签。在坐标轴标注中:0类代表健康轴承信号,1类代表损伤尺寸0.1778毫米的滚动体故障,2类对应0.3356毫米损伤,3类则对应0.5334毫米损伤。可以观察到,在无噪声环境下GCT-GNN的分类结果完全正确;但当引入-6dB噪声时,1类样本出现了误判情况。 图11 第2组无噪声分类结果 图12 第2组的噪声分类结果6.4 第二部分实验的进行及实验结果分析在案例2中进行的实验中,目的是验证GCT-GNN模型在复杂的现实条件下的有效执行能力,为了实现这一目标,第一组实验数据加入了不同的噪声水平,信噪比分别为0dB、-2dB、-4dB和-6dB。所提出的GCT-GNN模型的故障诊断能力与上述五种模型在不同噪声干扰水平下的复杂工作条件下的表现进行了比较。如图13所示,随着噪声的增加,捕捉振动信号显著特征的能力逐渐减弱,导致六种模型的分类准确率下降。值得注意的是,所提出的GCT-GNN模型即使在信噪比为-2dB时仍能保持100%的分类准确率,但当噪声水平达到-4dB时,准确率开始下降,在最大噪声水平下准确率为98.25%。GCT-GNN模型在噪声强度增加时,诊断准确率的变化相对较小。这表明该模型具备了复杂实际应用所需的鲁棒性和适应性。 图13 随着噪声强度逐渐增加,对六种模型的分类准确率趋势进行比较6.5 第三部分实验的进行及实验结果分析在实验案例3中,来自CWRU数据集的三组实验样本被融合,构建了一个包含九个故障信号和一个健康信号的十分类别任务,以测试所提出的GCT-GNN模型对多种故障的诊断能力。如图14所示,当这些模型从四分类任务转移到十分类任务时,其准确性不同程度地下降,其中CNN和SVM的下降最为明显。CNN的准确率从100%降至86.96%,而DRSN的准确率则从100%降至88.25%。利用数据之间的相关性构建的GNN模型准确率下降到96.51%,而所提出的GCT-GNN模型准确率下降到98.83%,结果表明在多故障分类任务中,GCT-GNN比其他五种模型具有更好的故障诊断能力。 图14 多种故障条件下的诊断结果6.6 其他数据集的实验结果为了验证所提出的滚动轴承故障诊断方法是否适用于不同的轴承类型,我们使用了帕德博恩大学KAT数据中心提供的另一个公共数据集(Lessmeieretal et al.,2016)。本实验采集信号的传感器类型为电流传感器,型号为LEMCKSR15-NP型电流传感器,并采用扭矩传感器采集转速与负载。信号类型为电机电流信号,电机型号为425W永磁同步电机。我们根据故障类型将数据集分为两组:第一组为内圈故障,第二组为外圈故障。每组包含三种不同损伤方式和程度的故障信号,以及一组健康信号。实验验证所用轴承数据详情如表2所示。实验样本数量与上述实验保持一致。帕德博恩数据集的采样率为64kHz,因此需要调整滞后阶数。选取CNN和DRSN两种分类模型进行对比实验以验证所提方法的有效性,分类结果如表3所示。从两组测试结果可以看出,GCT-GNN在0dB和-6dB条件下均保持了最高的准确率。表2 Paderborn数据集的详细信息 表3 Paderborn数据集的故障诊断准确度 7 结论针对深度学习缺乏可解释性导致轴承故障诊断鲁棒性较弱的问题,提出了一种方法,通过健康信号、故障信号和噪声信号之间的因果关系来量化“原因”对“结果”的影响。该方法利用频谱分析和Granger因果检测算法,强调振动信号的数字特性。通过提出的权重计算方法生成因果图,并结合图神经网络进行轴承故障诊断。使用来自CWRU和帕德博恩大学的两个公开轴承数据集验证了GCT-GNN的有效性。与SVM、随机森林、DRSN、CNN和GNN分类模型相比,在无噪声条件下,故障诊断的准确率达到100%,在-2dB、-4dB和-6dB的噪声环境下,四分类和十分类的准确率也高于上述五种模型。通过实验发现,使用本文提出的方法量化“原因”对“结果”的影响可以提高模型的分类精度并增强其鲁棒性。 尽管该模型相比其他模型具有更强的鲁棒性,但仍有机会进一步提高其时间和空间复杂度。GCT-GNN模型需要通过因果算法预先构建GNN框架,算法的时间效率和占用空间取决于输入数据的大小。因此,在实际应用中,面对大量数据会导致故障诊断速度变慢并占用大量内存。在未来的研究中,我们将考虑使用节点融合方法来优化模型的时间和空间复杂度,以减少与图构建相关的耗时时间开销。编辑:陈莹洁校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、陈宇航、Tina、王金、赵诚、肖鑫鑫该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈