首页/文章/ 详情

最新重磅!上海交大团队发布RmGPT:面向旋转机械故障诊断与预测的生成式基础模型

1小时前浏览0

本期给大家推荐上海交大团队发布RmGPT:面向旋转机械故障诊断与预测的生成式基础模型。该文将会公开源码。

论文基本信息

论文题目 

RmGPT: A Foundation Model with Generative Pre-trained Transformer for Fault Diagnosis and Prognosis in Rotating Machinery

论文期刊
IEEE Internet of Things Journal

论文时间2025年

论文链接:

10.1109/JIOT.2025.3580823

作者

Yilin Wang(a,b); Yifei Yu(a); Kong Sun(a); Peixuan Lei(a); Yuxuan Zhang(a); Enrico Zio(c,d); Aiguo Xia; Yuanxiang Li(a)

机构

(a)School of Aeronautics and Astronautics, Shanghai Jiao Tong University, Shanghai 200240, China 

(b)Shanghai Innovation Institute, Shanghai, China 

(c)MINES Paris-PSL University, Paris, France 

(d)Energy Department, Politecnico di Milano, Milano, Italy 

(e)Beijing Aeronautical Technology Research Center, Beijing, China

作者介绍  

李元祥,上海交大航空航天学院教授、博导2001年获清华大学信号与信息处理专业博士学位;2002-2004年在新加坡国立大学计算机学院作Research Fellow。发表论文40多篇(第一作者),被SCI、EI收录30篇,论文被引用百余次,申请专利10项。近年来,主要从事目标跟踪与识别、气象信息处理、文字识别以及航电系统应用研究。主持多项国家自然基金、国家863项目;中国宇航学会光电技术专业委员会委员,新加坡模式识别与机器智能学会会员。

王艺霖,上海交通大学与国家人工智能学院联培博士,研究方向为时序智能与工业多模态大模型,聚焦人工智能在工业运维中的应用。ICML、RESS、ADVEI、IoTJ、AST等顶级会议期刊作为第一作者已发表7篇论文,总计发表20余篇。研究致力于推动大模型与工程系统的深度融合,提升新一代复杂工业系统的的智能维护能力。


目录

摘要  

1.问题的背景  

2.方法的概述  

2.1 RmGPT框架概述

2.2 问题定义与理论贡献

2.3 RmGPT的核心创新

2.4 实验数据集与测试

2.5 实验结果与性能分析  

3.总结与思考

摘 要

在工业领域,旋转机械的可靠性对于生产效率和安全性至关重要。当前的预测与维护管理(PHM)方法往往依赖于任务特定模型,这些模型在处理具有不同信号特征、故障模式和运行条件的多样化数据集时面临重大挑战。受生成式预训练模型进展的启发,我们提出RmGPT,一个用于诊断和预测任务的统一模型。RmGPT引入了一种新颖的生成式令牌框架,包括信号令牌、提示令牌、时频任务令牌和故障令牌,以在统一模型架构内处理异构数据。我们利用自监督学习进行稳健的特征提取,并引入下一个信号令牌预测预训练策略,同时结合高效的提示学习进行任务特定适应。大量实验表明,RmGPT显著优于最先进的算法,在诊断任务中达到近乎完美的准确性,并在预测任务中表现出极低的错误率。值得注意的是,RmGPT在少量样本学习场景中表现出色,在16类-shot实验中达到82%的准确性,这突显了其适应性和稳健性。这项工作将RmGPT确立为旋转机械领域强大的PHM基础模型,提升了PHM解决方案的扩展性和泛用性。代码可在以下链接获取:https://githubcom/Pandalin98/RmGPT.

关键词:旋转机械,可靠性,预测与健康管理,剩余使用寿命预测,故障诊断,基础模型,自监督学习

1. 问题的背景

旋转机械是许多工业应用中的关键组件,确保其可靠性对生产效率和安全至关重要。设备健康管理(PHM)包含一系列旨在评估和预测设备当前和未来健康状态的方法论,其结果能够实现及时维护以防止意外故障。当前的PHM故障诊断和预测方法通常依赖于针对特定设备类型、运行条件和特定故障模式定制的任务特定模型。这些方法通常涉及手工特征和机器学习算法,旨在从历史数据中识别特定的故障模式。虽然在特定场景下有效,但这些任务特定模型在应用于具有不同信号特征、故障模式和运行环境的多样化数据集时遇到重大挑战:

荐读论文解决的主要问题包括:

  • 信号动态的变异性:不同类型的诊断设备在传感器数量、安装位置、监测信号类型和采样频率方面表现出显著差异。在统一框架内建模这些多样化信号具有高度挑战性;

  • 故障机制和模式的多样性:设备类型及其不同设计和故障机制的广泛范围使得定义统一的诊断和预测任务变得复杂。每种设备类型可能表现出独特的故障行为,难以泛化到其他类型;

  • 缺乏旋转机械基础模型:输入信号和诊断任务的差异导致难以拥有一个能够使用单一参数集在多种设备类型上有效执行诊断和预测任务的基础模型;

2. 方法的概述

2.1 RmGPT 框架概述

旋转机械广泛应用于工业领域,其可靠性对生产效率和安全至关重要。传统的预测与健康管理(PHM)方法通常依赖于针对特定设备或故障模式的任务特定模型,难以适应多样化的信号类型、故障机制和运行环境。

图1展示了提出的RmGPT框架,该模型旨在解决当前PHM面临的多样性与泛化难题。受到生成式预训练模型(如ChatGPT和SAM)成功的启发,RmGPT采用生成式方法,通过自监督学习和“下一个信号Token预测”机制,从原始传感器信号中提取通用的健康特征。

 
图1 不同于当前针对不同设备采用不同模型的方法, 该研究使用相同的模型参数,实现了在传感器类型、采样频率和故障模式各异的旋转机械上进行跨工况的故障诊断与健康预测。  

与传统判别式模型不同,RmGPT基于统一的Token设计,引入了包括信号Token、提示Token、时频任务Token和故障Token在内的模块化结构,使其能够自适应处理不同设备的多源信号和故障模式。图1中体现了这一设计如何帮助模型生成一致的健康状态表示,并无缝用于故障诊断和健康预测等下游任务。RmGPT并非语言模型,而是为多变量时间序列信号量身打造的生成式基础模型。通过图1可以清晰看出,该模型实现了PHM任务的统一化、高效性与强适应性,克服了信号动态、故障机制多样性和模型泛化性的长期挑战。

2.2 问题定义与理论贡献

在旋转机械PHM领域,传统方法往往针对特定设备、工况和故障类型分别设计模型,难以实现跨设备、跨任务的统一建模。RmGPT的理论贡献在于首次将”基础模型”范式引入工业PHM领域,提出了如下统一问题定义:

  • PHM基础模型定义:论文中将PHM基础模型定义为:“一个通用模型,通过自监督学习在异构时序数据集 图片 上训练,具备共享参数 图片,能够输出任务相关的表示,无需修改模型结构即可支持不同设备、工况下的诊断与预测任务;

  • 统一输入输出建模:不同设备的数据集 图片 在信号通道数、采样频率、任务类型等方面高度异构。RmGPT通过Token化和统一架构,实现了输入和输出的统一建模;

  • 自监督学习范式:采用自监督预训练任务,在无标签数据上学习通用表征,再通过少量有标签样本微调,实现诊断(分类)和预测(回归)任务的统一。

  • Prompt学习与微调统一:通过引入可学习的Prompt Token,支持参数高效的任务适配,兼容全参数微调和Prompt微调两种范式,提升模型在小样本和新任务下的泛化能力;

  • Few-shot/One-shot能力:基础模型通过共享参数和统一表征,天然支持小样本(Few-shot)甚至单样本(One-shot)学习,极大降低工业场景下的标注成本。

RmGPT首次在旋转机械PHM领域实现了”诊断-预测-跨设备-小样本”四统一的基础模型理论框架,为工业智能诊断从”专用模型”向”通用基础模型”转变提供了理论基础和技术路径。

2.3 RmGPT的核心创新

受ChatGPT和SAM等生成式预训练模型突破的启发,提出了RmGPT,一个设计用于适应旋转机械中多样化故障诊断和预测任务的生成式基础模型。

RmGPT引入了一个统一的基于Token的框架,如图2所示。包含四种核心Token:

  • Signal Tokens(信号Token):捕获输入信号中的基本趋势和模式;

  • Prompt Tokens(提示Token):结合序列时域统计信息和可学习嵌入;;

  • Time-Frequency Task Tokens(时频任务Token):设计用于封装输入数据的健康语义

  • ·Fault Tokens(故障Token):表示不同故障模式的原型特征。

 
图2 (a) 模型Token空间中的统一Token设计。(b) 用于高效聚合可变长度多通道信号的通道-时间注意力机制。  
如图 3 所示,RmGPT作为旋转机械统一诊断与预测的基础模型,虽借鉴了大型生成模型的结构设计,但并非语言模型。它专为处理工业场景中的多变量时间序列信号而设计,不依赖文本输入或语言建模目标。该模型采用基于Token的生成框架来表示诊断和预测任务,具备基于分段Tokenizer和通道-时间注意力Transformer的优化架构,确保高效处理和良好适应性。训练过程中包括以信号Token预测为核心的预训练策略,以及基于提示(Prompt)的微调技术,用于针对特定任务进行模型调优。  
 
图3 所提出的用于诊断与预测的基础模型RmGPT包括:
(a) 预测未来信号Token的预训练策略,(b) RmGPT的内部架构,(c) 基于生成式Token和提示技术的诊断与预测通用范式。  

2.4 实验数据集与设置

1)数据集信息

论文中在多个公开旋转机械数据集上进行系统评估,涵盖轴承、齿轮等多种设备:

 

这些滚动轴承和齿轮数据集是广泛用于验证各种算法有效性的流行基准数据集。但由于这些数据集之间的显著差异,此前没有任何工作尝试在所有这些多样化数据集上使用具有相同参数的模型同时进行诊断和预测任务。


2)实验配置

  • 硬件环境:配备8块NVIDIA RTX 3090 GPU的计算服务器;

  • 数据预处理: - 所有信号统一下采样至约5kHz - 标准化输入窗口为2048时间步 - 训练/测试分割比例:8:2;

  • 模型配置: - Transformer层数:4层 - 隐藏单元:512 - 总参数量:68.50M - Tokenizer步长和patch长度:256 - Prompt Token长度:10 - Fault Token长度:1;

  • 训练参数: - 批量大小:256 - 学习率:3.00×10^(-7) - 预训练轮数:20 - Prompt学习轮数:5 - 全参数微调轮数:3。

2.5 实验结果与性能分析

1)主要实验结果

在多个公开旋转机械数据集上进行了全面评估。RmGPT在所有任务中均显著优于现有最先进算法:

故障诊断性能对比:

 

小样本学习能力:

在CWRU数据集上进行的小样本学习实验显示了RmGPT的卓越适应能力:

 

 在16类1-shot极小样本场景下,RmGPT-Prompt实现了82.46%的诊断准确率,显著超越其他模型。在4-shot场景下,RmGPT-Prompt达到98.53%的准确率,进一步突出其鲁棒性和有效性。


2)计算效率分析

提出的基于patch的分块方法和通道-时间注意力机制对降低计算复杂度和提高性能的影响显著。原始配置显示推理时间为4.970ms,FLOPS为51.097 GFLOPS。移除基于patch的分块会将推理时间增加到337.773ms,FLOPS增加到3813.998 GFLOPS。类似地,排除通道-时间注意力机制会导致推理时间为9.281ms,FLOPS为102.214 GFLOPS。

 

3)Token空间可视化分析

RmGPT能将噪声输入信号转换为具有清晰类别边界的CLS语义空间。通过t-SNE降维可视化分析发现: - RmGPT将原始噪声信号映射到结构化语义空间 - 不同故障类别在CLS Token空间中边界比原始信号空间更加清晰 - 模型学习的Fault Token准确表征了不同类别的原型特征 - 不同故障模式在不同类别中心周围紧密聚集,表明RmGPT准确学习并区分了数据中的内在故障模式

 
图4 RmGPT能够将噪声输入信号转换为具有清晰类别边界的CLS语义空间  

 

图1 DQN智能体-环境交互图解

原始的DQN算法需要大量的数据集进行训练,这可能是一个很大的限制。此外,其固有的随机性和非线性可能导致不稳定和次优策略。因此,迫切需要为DQN开发一个更稳定和可靠的训练框架,以促进更一致的学习过程。

3. 总结与思考

荐读的论文中,提出了RmGPT——一个面向旋转机械统一故障诊断与预测的基础模型。该模型在多个数据集上使用统一参数,显著优于当前最先进(SOTA)算法,在诊断与预测任务中展现出卓越的准确性与鲁棒性。RmGPT能够有效处理不同类型的设备、信号通道、故障类别及采样频率,充分验证了在PHM(预测与健康管理)领域采用统一方法的可行性与适应性。

少样本学习实验的结果进一步突出了RmGPT在数据有限情况下的强泛化能力,即便训练样本极少,依然取得了令人瞩目的表现。Token空间分析表明,RmGPT能将带噪声的输入信号转化为结构化语义空间,具备清晰的类别边界,表明其在学习与区分内在故障模式方面表现出色。

该研究是将基础模型理念引入旋转机械领域的首次尝试,初步验证了类似于自然语言和计算机视觉领域的成功基础模型,也可以适用于复杂的工业时间序列场景。论文中不仅在理论上验证了构建统一PHM基础模型的可行性,还在实践中提供了一个性能优越的模型框架,可广泛适用于多种故障类型和数据集。


编辑:李正平

校核:陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、陈莹洁、Tina、王金、赵诚、陈宇航、肖鑫鑫

该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除


来源:故障诊断与python学习

振动非线性旋转机械通用航空航天python声学理论电机人工智能气象数控
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-09-24
最近编辑:1小时前
故障诊断与python学习
硕士 签名征集中
获赞 87粉丝 128文章 243课程 0
点赞
收藏
作者推荐

振动专栏 | 第二章 从原理到实战,一次搞懂振动传感器怎么选?

上一章我们介绍了振动的基础知识,以及其在预测性维护和故障诊断中的重要作用。本章我们将深入探讨振动信号采集的关键环节——传感器选择与安装。振动测量的质量,直接决定了后续分析的可靠性,正所谓“输入决定输出”,只有高质量的数据,才能支撑准确的故障识别与诊断。目录1 高质量振动测量的基础2 振动传感器的测量原理3 常用振动传感器详解 3.1 位移传感器3.2 速度传感器3.3 加速度传感器4 传感器灵敏度选择指南5 数据采集卡选择6 传感器安装注意事项7 总结与建议1 高质量振动测量的基础常规工业场景中常采用统一的双传感器配置,安装方式也较为固定,但实际应用中并不存在"一刀切"的解决方案。例如高速与低速机械、危险区域、涡轮机轴承等特殊场景,都需要差异化的传感器选型与安装策略。 实现高质量振动测量的关键在于: 1、精准匹配传感器类型:根据测量目标(加速度、速度或位移)与环境工况(如低速、高温、危险区域等)选择最合适的传感器; 2、规范安装:确保安装位置与方式符合标准,最大限度保证信号真实性; 3、配套采集卡适配:采集卡的性能指标必须与传感器特性相匹配,确保信号无损采集。 此外,为保证数据的可比性与诊断有效性,还应做到: 1、在每次测量时,采用相同的方法收集数据; 2、同步记录设备现场状态,善用采集器的"备注"功能标记异常; 3、由熟悉设备的采集人员完整录入观测信息,为后续维护决策提供支持。2 振动传感器的测量原理振动传感器的作用是将机械振动转换为电信号,供后续软件提取振动特征。 图1 振动采集以转速同步的轴振测量为例:1、位移测量:记录轴与传感器间距的周期性变化,适用于低速及可径向移动的轴颈/套筒轴承;2、速度测量:更适用于高速旋转的滚动轴承,因其位移幅值受限,速度信号更能反映轴承内部的动态特性。 在简谐振动中,位移、速度、加速度三者互为导数关系,相位依次超前90°: 1、位移为零时,速度最大; 2、位移最大时,速度为零; 3、加速度与速度也相差90°,加速度最大时速度为零(方向反转点); 4、位移与加速度则相位相差180°。 低速时加速度幅值较小,而随着转速升高,加速度幅值按频率平方增长,位移幅值则逐渐减小。 图2 频率响应 例如,在恒定振动水平0.1 IPS下:低频区:位移显著,加速度极低;高频区:加速度急剧上升,位移大幅下降。由此可见:位移测量更适用于低速设备;加速度测量擅长捕捉高速机械振动;速度则因其在常用工业频率范围内的良好表现,成为振动烈度评估的通用指标。3 常用振动传感器详解3.1 位移传感器适用场景:主要用于涡轮机、泵与风机等采用滑动轴承的机组,常见于在线保护与振动监测系统。也可通过便携式采集器接入其动态输出,完成定期频谱与趋势分析。 工作原理:属于非接触式测量,系统由驱动器、同轴电缆和探针组成。驱动器产生射频信号,经由电缆传输至探针,探针端部线圈辐射出高频磁场。当导电轴面靠近时,因涡流效应实现无接触位移测量。 图3 位移传感器 优点:1、低频响应优良(可至0 Hz DC响应);2、能真实反映轴与轴承的相对位移。 缺点:1、安装复杂,成本较高;2、不适用于高频测量(通常低于10kHz);3、校准依赖轴材料材质;4、易受机械振动、表面毛刺等干扰产生虚假信号。3.2 速度传感器工作原理:基于电磁感应定律。传感器内部有一个弹簧支撑的线圈(惯性质量)和永磁体。当外壳随设备振动时,线圈因惯性相对于磁体运动,切割磁感线产生感应电动势。 图4 速度传感器示意图 优点:1、无需外部供电,输出信号强;2、在中频范围(通常为10–1000 Hz)线性响应良好,非常适合机器整体振动评估。 缺点:1、对温度变化敏感;2、内部存在可动部件,长期使用可能磨损;3、通常体积较大;4、低频响应受限(通常不低于10Hz)。3.3 加速度传感器加速度传感器是目前工业振动监测中应用最广泛的传感器类型,频率覆盖范围极宽,尤其擅长捕捉高频冲击信号。 压电式加速度传感器:其内部包含质量块和压电晶体。在加速度作用下,质量块对晶体施加动态力,晶体形变产生电荷,电荷量与加速度成正比。通过内置放大器(如ICP/IEPE型)将电荷信号转为电压信号输出,方便采集记录。 使用注意:ICP/IEPE传感器通电后需要几秒钟的"稳定时间",待电压稳定后再采集数据,否则初期数据可能失真。 图5 传感器通电后的效果以及频谱中的特征斜率 三轴加速度传感器:集成三只相互垂直的传感器于一体,可同步测量一个点的垂直、横向与轴向振动,全面反映测点振动状态。 除了压电式,还有应变计式、压阻式、可变电容式(MEMS)等加速度传感器类型,应对不同测量需求。4 传感器灵敏度选择指南灵敏度是传感器选型首要指标,单位常为 mV/g: 1、高灵敏度(500 mV/g - 1 V/g):适用于精密设备或低振动场景,能提供更高信噪比; 2、低灵敏度(10-50 mV/g):常用于大型、高振动设备,避免信号饱和; 3、通用灵敏度(100 mV/g):平衡动态范围与适用性,为多数工业场景首选;最终选择应综合考量振动水平、工况环境及目标频率范围。5 数据采集卡的选择选择合适的数据采集卡是确保振动信号准确数字化的重要环节。以下是几个关键选型参数:1、 通道数量与类型:根据测点数量确定通道数,预留10-20%余量以备扩展;通道类型:支持IEPE/ICP(恒流源)输入的通道对于压电加速度传感器至关重要;同步采集:所有通道应能严格同步采集,保证时间、相位一致性。 2、采样率与带宽:采样率:至少为最高分析频率的2.5倍(遵循奈奎斯特采样定理,考虑抗混叠滤波器过渡带);抗混叠滤波:采集卡应内置高性能抗混叠滤波器,防止频率混叠;带宽:满足传感器频率范围需求,通常DC到20kHz覆盖大多数工业应用。 3、分辨率与动态范围:分辨率:16位以上分辨率适合大多数振动测量应用;动态范围:至少90dB,确保既能捕捉微弱信号又不饱和。 4、接口与连接方式:接口类型:USB、以太网、PXI等,根据便携性和传输速率需求选择;连接器类型:BNC、LEMO、D-sub等,考虑现场连接可靠性和便捷性。5、软件兼容性与同步功能:驱动兼容性:支持常见分析软件(如MATLAB、LabVIEW、专用振动分析软件);同步能力:支持多机箱同步和外部时钟同步,适合大型分布式测试。6 传感器安装注意事项正确的安装是保证测量准确性的关键环节: 1、安装位置选择:应尽量靠近振源,避开节点和模态振型节点; 2、安装方式: 钢螺栓安装:最佳频率响应,适合永久监测点;磁座安装:方便临时测量,但会降低高频响应。粘合剂安装:适合大多数表面,但温度受限;探针手持:仅用于快速筛查,数据仅供参考;3、安装方向:确保传感器敏感轴与测量方向一致; 4、电缆固定:避免电缆晃动引入额外噪声,特别是对于压电传感器。完整的振动采集系统需要考虑以下因素: 1、信号调理需求:IEPE恒流源供电:多数ICP/IEPE传感器需要2-20mA恒流源。滤波设置:根据需求设置高通、低通滤波器;增益设置:根据信号电平调整增益,优化ADC量程使用。 2、系统接地与隔离:采用差分输入减少共模噪声;电气隔离防止地环路干扰;在强电磁干扰环境使用屏蔽电缆和连接器。 3、环境适应性:工业现场选择具有适当防护等级的设备;宽温操作能力适合非温控环境;抗振动和冲击设计保证现场可靠性。7 总结与建议振动传感器和采集卡的选择没有绝对标准,只有最适合现场需求的方案。掌握不同传感器的原理与特性,了解采集卡的关键参数,结合实际设备类型、工况环境与监测目标,才能制定出高效、可靠的振动监测策略。 实用建议: 1、从需求出发:明确测量目的后再选择传感器类型,避免盲目追求高参数; 2、考虑全系统:传感器、电缆、采集卡和软件需要作为一个系统来考虑兼容性; 3、重视安装质量:再好的传感器,安装不当也会导致数据失真; 4、预留扩展空间:选择略有富余的性能指标,为后续扩展留出空间。编辑:肖鑫鑫校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、Tina、陈莹洁、王金、赵诚,陈宇航该文资料参考国际标准ISO 10816(振动评价标准)、ISO 13373(状态监测与诊断)和莫比乌斯振动分析师(二级)培训资料等,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈