首页/文章/ 详情

大模型综述分享(3) | 健康管理大模型概述:概念、范式与挑战

21分钟前浏览18
PHM领域正面临泛化弱、解释差、验证难等瓶颈,传统方法已跟不上装备智能化的步伐?别急!这篇综述详细介绍了健康管理大模型”的概念融合大模型的强推理与生成能力创新三类进阶范式:从大语言模型垂直应用,到并行协同,再到全流程PHM大模型应用。详解技术路线、提升路径及挑战,为你提供从定制化到通用化的跨代蓝图,助力你的研究突破!  

由于文章篇幅较长,将分四次帮助读者快速了解大模型PHM方向,大模型综述分享,大模型综述分享(1) | 健康管理大模型概述:概念、范式与挑战;大模型综述分享(2) | 健康管理大模型概述:概念、范式与挑战点击此处即可跳转。    


论文基本信息

论文题目:An Outline of Prognostics and Health Management Large Model: Concepts, Paradigms, and Challenges

论文期刊:Mechanical Systems and Signal Processing

论文日期:2025年

作者:

Laifa Tao, Shangyu Li, Haifei Liu, Qixuan Huang, Liang Ma, Guoao Ning , Yiling Chen, Yunlong Wu, Bin Li, Weiwei Zhang, Zhengduo Zhao, Wenchao Zhan, Wenyan Cao,Chao Wang, Hongmei Liu, Jian Ma, Mingliang Suo, Yujie Cheng, Yu Ding, Dengwei Song, Chen Lu

目录

摘要

1 引言

2 系统分析:当前PHM领域面临的挑战和瓶颈

2.1 分析和描述:生命周期中PHM的问题

      2.1.1 第一阶段:概念设计阶段

      2.1.2 第二阶段:初步设计阶段

      2.1.3 第三阶段:详细的设计阶段

      2.1.4 第四阶段:研制阶段

      2.1.5 第五阶段:在役使用阶段

2.2 PHM面临的挑战和瓶颈

      2.2.1 PHM算法&模型层

      2.2.2 PHM系统层

2.3 小结

3 大模型研究现状及优势特点分析

3.1 大模型综述

      3.1.1 大模型原理

      3.1.2 大模型优势分析

      3.1.3 大模型成熟案例

3.2 大语言模型综述

      3.2.1 大语言模型原理介绍

      3.2.2 大语言模型关键技术

      3.2.3 大语言模型优势分析

      3.2.4 大语言模型的案例

3.3 小结

4 健康管理大模型概念与进阶研究范式

4.1 健康管理大模型概念

4.2 范式一:基于大语言模型的健康管理范式

      4.2.1 路线1:基于大语言模型与知识图谱的健康管理知识工程

      4.2.2 路线2:基于大语言模型的诊断专家

      4.2.3 路线3:PHM算法模型辅助开发

      4.2.4 路线4:PHM文字方案生成

      4.2.5 路线5:基于大语言模型的维修决策支持

4.3 范式二:大语言模型与健康管理模型并行范式

      4.3.1 路线1:知识与数据融合的PHM技术

      4.3.2 路线2:PHM算法智能推荐

      4.3.3 路线3:PHM算法模型逻辑性支撑

      4.3.4 路线4:PHM算法模型智能优化更新

4.4 范式三:健康管理大模型构建与应用范式

      4.4.1 健康管理大模型构建

      4.4.2 路线1:智能装备全流程PHM设计

      4.4.3 路线2:智能PHM数据生成

      4.4.4 路线3:智能PHM能力生成

      4.4.5 路线4:复杂系统PHM解决方案生成

      4.4.6 路线5:智能PHM验证评价

(以上标记章节为本文内容)

4.5 基于PHM-LM范式的实践案例

      4.5.1 案例一:基于LLM的轴承故障诊断框架

      4.5.2 案例二:基于LLM模型的轴承剩余使用寿命预测

      4.5.3 案例三:基于LLM模型的领域自适应维护方案生成

4.6 小结

5 PHM-LM面临的挑战

5.1 跨领域、多模态的PHM-LM基础数据集构建

5.2 多模态健康信息的统一表达架构

5.3 多能力、可扩展的健康管理大模型结构设计

5.4 特定对象的健康管理专属能力向通用全科健康管理能力的转化

5.5 大模型健康管理输出结果的可解释、可溯源性

5.6 基于大模型的通用化PHM方法与现有专用式方法的协同

5.7 兼顾数据隐私与共享的健康管理大模型分布式隐私训练

5.8 关键挑战的优先级分析

6 结论



4 健康管理大模型概念与进阶研究范式

随着大模型相关研究的快速涌现,大模型带来的泛化能力、涌现能力、生成能力等技术优势为健康管理领域的技术跨代发展带来了重要的机遇。因此,在解决健康管理领域面临难题与挑战时,综合运用大模型的能力、大模型的思想为健康管理的未来发展提供了新的思路和理论。本章在健康管理领域发展瓶颈与大模型优势特点分析的基础上,首次提出了健康管理大模型的概念与内涵,同时,根据大模型与健康管理的结合形式、程度,由简入深提出了健康管理大模型研究与应用进阶的三类典型创新研究范式。进而,在三类典型创新范式下,结合每种范式特点和能力,提出了大模型在不同范式下可提升的PHM关键能力,以及提升各关键能力的可行技术路线。该部分工作为开展大模型与健康管理融合研究的人员提供了较为全面的、由浅入深的技术研究路线和具体的解决思路参考。

4.1 健康管理大模型概念

一般地,健康管理大模型指的是具有庞大参数规模和复杂程度的、深度结合健康管理垂直领域特点的、能够服务于产品全生命周期健康管理业务的人工智能模型。健康管理大模型的设计与应用旨在以更加智能化、精准化、通用化的方式解决健康管理领域的各种复杂任务。鉴于健康管理的维度较多,从健康管理大模型又可细分为:

(1)对象类健康管理大模型,如:轴承健康管理大模型、齿轮健康管理大模型、电机健康管理大模型、电子产品健康管理大模型等;

(2)任务类健康管理大模型,如:数据生成大模型、方案生成大模型、验证评价大模型等;

(3)算法模型类大模型,如:故障诊断大模型、故障预测大模型、维修决策大模型等。

相比于传统的健康管理系统而言,健康管理大模型将在数据、知识、模型、能力等方面均有着显著的提升。传统健康管理模型对象单一,能够处理的数据与知识有限,健康管理大模型则能够提供泛化性好的多模态数据处理能力,面对复杂数据条件或非理想数据条件也能完成数据分析任务。另一方面,传统的健康管理模型多为功能明确的小模型,而健康管理大模型是大模型技术与健康管理模型技术的共同产物,大模型是小模型的归纳与融合。对于能力而言,健康管理大模型能够实现智能化、精准化、通用化的健康管理全寿命周期各种复杂任务的解决,是能够有效为健康管理设计人员提供帮助,为健康管理领域提供智能的顶级专家。

健康管理大模型将作为先进的生成式AI模型,其具有的多模态数据驱动能力、泛化性能与实用性能将会推动健康管理领域技术研究的创新突破与业务模式的全面革新。后文将由简入深阐述和分析健康管理大模型研究与应用进阶的三类典型创新研究范式:

范式一:大语言模型基本范式

范式二:PHM与LLM并行范式

范式三:PHM大模型范式

4.2 范式一:基于大语言模型的健康管理范式

在定制化需求的背景下,健康管理开展了大量故障预测、故障诊断及健康监测等研究工作,但是由于存在泛化性不足等问题,健康管理业务发展还有较大的优化空间。由于知识高效整合能力缺乏、文字设计重复较多、数据模态复杂、算法模型开发困难等问题,致使当前健康管理中知识检索、问答、解释补充,重复性文字工作,算法模型辅助开发,知识库诊断,维修决策等传统业务普遍存在效率低、泛化差、可解释性差等问题。生成式大语言模型凭借其强泛化、强推理、强理解能力,在金融、医疗、法律等领域已带来新的业务形式,在对应领域中提供快速检索、文本处理、案例分析等功能,从而提高各领域业务知识利用率、工作效率和泛化性,足以证明当前大语言模型技术能够为垂直领域研究带来的提升。

鉴于此,以大语言模型为基础的健康管理范式将利用基础大语言模型的语言推理和泛化能力,通过PHM领域知识的快速微调,构建领域垂直大语言模型,完成大语言模型在PHM领域典型场景中的应用,解决一系列PHM领域中存在的问题。基于该思想,范式一设计健康管理知识工程、大语言模型诊断专家、健康管理算法辅助开发、健康管理文字方案生成、大语言模型健康管理维修决策等应用形式,开展健康管理领域中知识整合、诊断专家、算法模型开发、文字方案设计、维修决策支持等传统业务的全面优化、借助新一代人工智能大语言模型技术实现健康管理业务效率、泛化能力和决策能力的全面提升。

如图4.1所示,该图展示了在多模态场景下应用此范式的框架,通过整合文本、图像、音频与结构化数据等多元输入,应对PHM服务中的知识整合、维护决策及算法开发等核心挑战。框架凸显了大语言模型在知识整合、决策推理、语言分析与泛化能力方面的优势。其架构包含五大核心任务——PHM知识工程、算法辅助开发、维护决策支持、诊断专家系统与文本生成,这些任务由数据预处理、模型选择、预训练、精调与验证组成的中央工作流提供支撑。图中箭头展示了各项任务与中央工作流之间的交互关系,确保输入数据、技术挑战与解决方案能够系统化整合,满足PHM领域的特定需求。

图4.1 基于大语言模型的健康管理范式

4.2.1 路线1:基于大语言模型与知识图谱的健康管理知识工程

基于大语言模型与知识图谱的健康管理知识工程为解决领域知识利用率低、检索效率低、决策解释性不足问题,在范式一的基于大语言模型在垂直领域上的应用来解决健康管理领域的一系列问题的思想引导下,借助大模型语言分析能力知识推理能力泛化能力优势,实现以待检索内容为输入,输出知识检索、推理决策结果的任务,以健康管理知识检索、交互问答、推理决策等典型应用,为健康管理领域发展实现高效率、高精度、高可信的知识库问答和数据库交互分析,从而推动PHM领域的技术发展,如图4.2。

图4.2 基于大语言模型与知识图谱的健康管理知识工程

大语言模型具有优异的语言分析能力、知识推理能力和泛化能力。同时,Transformer、RetNet等架构的并行性和更高的计算效率,以及其上下文学习和微调的能力,令以Transformer模型为架构的大语言模型在处理大量知识、解决复杂问题上具有难以企及的优越性。然而,当前的大语言模型依然具有数据实时性差、新生成态势适应性差等问题,在缺乏完备且具有实时性的知识库的情况下,大语言模型在健康管理的应用上存在较大的局限。由于知识图谱在数据挖掘、知识整合、信息处理上的优势,基于知识图谱的健康管理已经实现了对一定对象的智能故障诊断、故障推理与故障定位,然而仅仅依靠知识图谱技术只能做到小范围内对象的健康管理知识工程,无法提高健康管理模型的泛化能力。因此,综合大语言模型与知识图谱优势,该路线提出基于大语言模型与知识图谱的健康管理知识工程,从而同时解决大语言模型实时性差、知识缺乏的缺陷和知识图谱泛化性差、规模小的缺陷,实现快速、可信、应用范围广、支持多模态数据的知识检索问答和决策推理功能。

基于大语言模型与知识图谱的健康管理知识工程可包括知识图谱大语言模型交互服务两部分。健康管理知识图谱构建需要梳理健康管理知识来源,基于需求驱动对健康管理知识进行采集,并对数据进行清洗、向量化、结构化转换,最后存储在文档数据库中并构建相关概念和业务的知识图谱,用于大语言模型交互服务的数据提取。大语言模型交互服务部分,用于接收用户发送健康管理相关的多模态输入,解构用户需求并对问题向量化处理,通过意图泛化模块来提高大语言模型的泛化能力,并将泛化后的需求用于知识图谱数据搜索,返回相关图谱概念属性,最后通过大语言模型的自然语言处理模块来对用户输出问题结果,结合大语言模型的推理能力对检索结果进行验证评价,从而解决健康管理泛化性差、知识利用率低等问题,实现高效率、高精度、高可信的知识库问答和数据库交互分析,为各设备及其关键部件健康管理知识管理、健康管理决策提供有力的技术支持。

4.2.2 路线2:基于大语言模型的诊断专家

基于大语言模型的诊断专家为突破过去基于知识的诊断发展落后,导致基于知识诊断的专家系统知识库和推理机发展遇到的瓶颈,在范式一的基于大语言模型在垂直领域上的应用来解决健康管理领域的一系列问题的思想引导下,借助大模型知识推理决策推荐能力优势,实现以故障文字描述、振动信号等音频、故障设备图片等要素为输入,输出可供参考的故障诊断研究方向、诊断结果的大语言模型诊断任务,以诊断结果推理等典型应用形式为PHM技术发展带来故障诊断效率的提高,如图4.3。

图4.3 基于大语言模型的诊断专家信息卡

基于知识诊断的专家系统知识库和推理机发展由于自身的局限性已经进入了瓶颈,但是大语言模型的知识推理能力和决策推荐能力,使得原本落后的专家系统产生了新的发展空间。目前,在医疗、金融等其他领域已经产生了通过专家经验构建的知识库来进行推理诊断的大语言模型,证明了大语言模型在垂直领域下对诊断系统的提升效果。因此可以结合大语言模型的优势,构建由知识库与推理机形成的生成式大语言模型诊断专家系统。

用户需要提供大量的健康管理专家知识来构建知识库,从而让专家系统具有故障诊断方面的专业性。基于大语言模型的诊断专家系统需要对多模态输入如故障部位图片、FMECA表、视频等的信号处理模块,使其能够转化为大语言模型能够处理的语言。推理机需要发挥大语言模型的强推理能力,通过上下文学习、微调等能力,从而分析输入中的故障模式并比对语料库中的知识和数据,输出逻辑清晰、具有说服力的诊断结果,并且结合大语言模型的推理能力对结果是否满足需求进行评价,满足用户对诊断的需求。通过大语言模型进一步提升的诊断专家系统,能够突破传统专家系统在不同诊断场景、诊断对象、诊断现象推理能力不足的限制,实现具有强推理能力、高效率的故障诊断

4.2.3 路线3:PHM算法模型辅助开发

PHM算法模型辅助开发路线为解决开发专业知识需求高代码能力要求高问题,在范式一的基于大语言模型在垂直领域上的应用来解决健康管理领域的一系列问题的思想引导下,借助大语言模型代码生成及分析能力的优势,实现以代码需求描述、待解释代码为输入,输出所需的代码、函数、模型等或对模型的功能分析描述的算法模型辅助开发任务,以代码功能分析、代码部分补全等典型应用形式为PHM技术发展带来降低算法模型开发难度、提高算法开发效率的效果,如图4.4所示。

图4.4 大语言模型辅助下的PHM算法模型开发信息卡

为了开发性能足够优秀的健康管理算法模型,需要相关人员具有足够高的专业知识和代码能力。当前的大语言模型已经能够实现基础的代码编写及解释能力,在辅助算法模型开发方面具有巨大潜能,然而,大语言模型虽具备通用代码编写及解释能力,但在处理大规模采集数据的算法开发上达不到专业水平和使用需求。为了降低健康管理算法模型开发人员对算法模型开发能力的要求,可以充分发挥大语言模型在代码编写及代码分析等功能上的优势,利用大语言模型来进行健康管理领域的算法模型代码补全、代码功能分析等工作,从而降低用户健康管理模型开发难度,提高开发健康管理模型的效率

基于历史的健康管理算法模型及相关代码来构建健康管理算法模型语料库,并对大语言模型进行预训练,使其能够进行质量足够高的健康管理模型知识推理和模型生成。进一步,借助微调的方式,大语言模型能够解析已有的模型并且自动为开发者提供包含功能分析说明的补全代码供使用者选择,也可以为开发者检测和提示模型中含有的警告或报错内容,从而大幅降低健康管理模型开发难度。同时,该路线中也需具备对多模态输入的处理模块,通过接收用户对代码需求的描述,返回所需的代码、函数、模型等,从而以问答的形式为用户提供开发支持。基于上述路线,达到降低健康管理模型开发难度、提高健康管理模型开发效率的目的。

4.2.4 路线4:PHM文字方案生成

PHM文本生成方法旨在解决PHM领域文本设计重复性高、效率低的挑战。该方法遵循范式I确立的"聚焦大语言模型在专业领域应用"原则,充分发挥大语言模型在语言分析、知识推理、决策支持和泛化能力方面的优势。通过以解决方案生成需求等要素作为输入,最终输出符合规范要求、逻辑清晰的PHM文本解决方案文档。这一文本生成任务具体体现在设计文本和生成测试大纲等应用场景中。借助该方法,PHM技术发展可实现重复性任务的减少与文本设计效率的提升,同时受益于大语言模型的语言解析、知识推理、方案决策及泛化能力,如图4.5。

图4.5 PHM文本生成信息卡

PHM文字方案生成路线为解决PHM领域重复文字工作多,设计效率低问题,在范式一的基于大语言模型在垂直领域上的应用来解决健康管理领域的一系列问题的思想引导下,借助大语言模型语言分析能力、知识推理能力、方案决策能力、泛化能力的优势,实现以生成方案的要求等要素为输入,输出符合要求、逻辑清晰的方案文档的健康管理文字方案生成任务,以设计文字方案、测试大纲生成等典型应用形式为PHM技术发展带来减少重复工作、提升文字设计效率的效果。

在实际PHM应用过程中,由于PHM应用场景的差异性,导致健康管理方案很难具有通用性,导致针对不同的装备、不同的部件需要重复设计健康管理方案,造成健康管理方案设计的重复工作过多、定制化需求极大,综合使得PHM方案设计效率低下。当前一部分大语言模型如ChatGPT、LLAMA、GLM等,已经能够拥有初步的文字方案生成等功能。同时,在金融、医疗、法律等其他领域已经出现了大语言模型辅助专业成果,且准确率达到了93.3%, 证明了大语言模型在垂直领域设计方案生成方面具有较大的潜力。因此,可以充分利用大语言模型在语言分析能力知识推理能力方案决策能力泛化能力上的优势,设计基于大语言模型的生成式健康管理文字方案设计模型,通过多模态输入PHM设计相关需求以生成所需要的PHM设计方案,从而解决当前健康管理方案设计时重复工作过多的问题,提高健康管理方案设计的效率

用户以历史的健康管理知识、方案类文档等语料为基础,通过文档切分、数据分类器等方法对数据进行清洗过滤、结构化等预处理,形成适用于文字方案生成的预训练语料库。进一步,完成具有强泛化能力、强推理能力、多模态数据处理能力的成熟大语言模型预训练工作。为了增强大语言模型文字方案的生成效果,通过提示学习,结合使用场景和生成目标设计设计合适的prompt来引导大语言模型生成结果,比如:诊断方案、预测方案、设计方案等不同的方案类型需求在输入中有所体现。通过指令微调、对齐微调,按照垂直领域相关规范来约束大语言模型输出形式,使大语言模型能够输出符合需求、逻辑清晰的健康管理文字方案。大语言模型对生成结果进行评价,通过一定的指标来衡量生成结果是否符合输入要求。基于上述技术框架,基于大语言模型的健康管理方案生成辅助PHM技术人员开展PHM系统设计任务,减少冗余工作,提升健康管理文字设计效率。

4.2.5 路线5:基于大语言模型的维修决策支持

基于大语言模型的维修决策支持路线为解决维修知识整合与利用不足维修检索及决策效率低等问题,在范式一的基于大语言模型在垂直领域上的应用,解决健康管理领域的一系列问题的思想引导下,借助大语言模型知识整合能力、决策推理能力优势,实现以FMECA表等结构化数据或故障描述等非结构化数据为输入,输出检索得到的知识或可供参考的维修决策的维修决策支持任务,以维修知识检索、维修决策生成等典型应用形式为PHM技术发展解决由于维修人员能力不足造成的维修知识利用率低、检索效率低的问题,提高维修知识利用率和决策效率,如图4.6。

图4.6 基于大语言模型的维修决策支持信息卡

对装备的维修要求相关人员具有足够的维修知识和经验,然而由于维修对象、故障模式、维修策略等的复杂性,维修人员经常缺乏相关知识和经验。同时,由于维修手册、历史维修经验等知识的整合与利用不足,维修人员检索相关知识、生成维修计划需要耗费大量时间,导致维修效率低下。大语言模型具有的知识整合、决策推理能力,是突破维修业务目前瓶颈可能的手段之一,而像金融、医疗等其他垂直领域里大语言模型发挥的知识综合与推理能力,证明了大语言模型在垂直领域下能够发挥的作用。因此,可以利用大语言模型,实现生成式维修知识检索与决策推荐,从而解决在维修现场中维修人员知识及经验不足、知识检索效率过低的问题,提高维修知识利用和决策效率

将装备维修手册等领域内较为通用的知识,在通过数据预处理后,构建成维修领域的预训练语料库,并且对大语言模型进行预训练。为了增强模型在用户的维修领域特定任务上的表现,可以通过二次预训练的方式,将用户在维修上的私有数据如历史维修资料、装备知识等对大语言模型进行二次预训练。进一步,能够处理FMECA表等结构化数据或故障描述、知识检索等非结构化输入,采用人工标注或基于模型的方法来挑选指令,通过监督精调(SFT)或指令微调等方式,使得大语言模型更好地对齐用户需求,输出符合要求的维修决策或知识检索结果,并且对结果是否符合用户需求进行验证评价。综上,实现基于大语言模型的维修决策支持,通过大语言模型强大的泛化、知识利用和推理能力,实现高效的维修决策,从而解决维修知识利用率低、对维修人员水平要求高造成的维修效率低下问题。

4.3 范式二:大语言模型与健康管理模型并行范式

PHM数据区别于现有NLP使用的语料数据,PHM领域常用数据为多类型传感器采集到的振动、温度、声音、电信号、压力等时间序列数据,对典型信号数据的处理和分析是传统健康管理模型的强项,对此已有大量的研究工作。但是传统健康管理模型在数据条件不足的情况下,难以满足预期的健康管理需求,需要领域知识补充或外界干预来提升传统健康管理模型及其运用模式的精度和能力。大语言模型具备上述能力,能够利用自然语言处理技术实现对知识的处理和掌握,可以与健康管理模型联合组建模型,提高健康管理模型的能力,满足更高的健康管理需求。这种联合组建模型实现并行开发的思想在其他垂直领域已经开展研究。因此,范式二考虑在成熟大语言模型基础上,结合大语言模型的知识管理、推理决策、泛化等能力优势,针对性的引导健康管理模型的训练过程和强化学习过程,形成大模型与健康管理模型并行开发模式,解决PHM领域相关问题。通过联合大语言模型和健康管理模型实现并行开发,优化健康管理领域的算法推荐、算法模型优化更新等业务,提升其在知识数据融合、可解释性和可信性等方面的能力,构建新的并行模型,以解决健康管理领域当前的知识利用能力差、缺乏针对性指导和辅助、算法泛化性差等问题。大语言模型与健康管理模型并行范式框架如图4.7所示。

图4.7 大语言模型与健康管理模型并行范式框架

4.3.1 路线1:知识与数据融合的PHM技术

知识与数据融合的PHM技术路线为解决已有知识利用不充分数据知识融合差的问题,在范式二大语言模型针对性引导健康管理模型实现并行开发的思想引导下,借助大模型知识迁移能力、泛化能力优势,实现以健康管理数据和知识要素为输入,输出综合推断结果的知识和数据融合任务,以知识辅助的数据分析、基于数据信息的知识挖掘等典型应用形式下实现健康管理领域知识和数据的充分融合和利用,如图4.8。

图4.8 知识与数据融合PHM技术信息卡

数据获取不全面、质量不一致、特征提取困难、分析不充分等原因导致仅依靠数据的健康管理模型难以得到期望的结果,需要相关的专业知识辅助分析。而大语言模型以大量的文本进行训练,可以积累到大量的知识和信息。两个模型相辅相成,通过健康管理模型对数据进行处理和分析,从中发现隐藏的模式、关联和规律等特征和信息交由大语言模型处理;并且用先前积累的知识和经验来辅助数据分析过程,提高效率和准确性,最终输出由数据与知识的综合结果。因此,结合大模型强大的知识处理能力以及健康管理模型的数据处理能力,可以有效改善仅在数据驱动下,分析不全面,知识融合差的问题。

知识与数据融合PHM包括大模型健康管理模型两部分,知识和数据的融合可以弥补健康管理模型对于高质量数据的过度依赖和可解释性差的缺陷。利用健康管理模型的数据处理能力,采用一系列的数据处理算法,提取原始的数据中的可用信息,提高各类模型结果的准确性。同时,结合大语言模型强大的自然语言处理技术对文本进行理解和分析,将积累的知识进行迁移与泛化,与数据处理得到的结果进行融合,对健康管理模型的数据分析起到辅助作用,给出数据支持与专业知识结合的综合结果。在此同时,大语言模型也能通过健康管理模型处理的数据支持,挖掘数据信息,丰富知识库。这种知识与数据融合方式,既提高了健康管理模型的可泛化性,弥补仅靠数据驱动的不足,也能对大语言模型积累的知识进行验证与丰富。

4.3.2 路线2:PHM算法智能推荐

PHM算法智能推荐路线为解决当前PHM算法的涉及要素复杂多样所导致的PHM算法设计难题问题,在范式二的大语言模型和健康管理模型并行研发思想引导下,借助大模型知识内化吸收能力优势,实现以PHM任务及算法 功能需求要素、PHM算法背景工程条件要素、PHM算法性能要素等为输入,输出目标PHM算法及相关配置要素,以故障诊断算法推荐、故障检测算法推荐、故障预测算法推荐等典型应用形式加速PHM能力生成的效果,降低PHM工程师的高要求门槛,辅助PHM系统的研发并加速设计,如图4.9。

图4.9 PHM算法智能推荐信息卡

PHM算法智能推荐路线为解决当前PHM算法的涉及要素复杂多样所导致的PHM算法设计难题问题,在范式二的大语言模型和健康管理模型并行研发思想引导下,借助大模型知识内化吸收能力优势,实现以PHM任务及算法 功能需求要素、PHM算法背景工程条件要素、PHM算法性能要素等为输入,输出目标PHM算法及相关配置要素,以故障诊断算法推荐、故障检测算法推荐、故障预测算法推荐等典型应用形式加速PHM能力生成的效果,降低PHM工程师的高要求门槛,辅助PHM系统的研发并加速设计。

PHM包含故障诊断、故障预测等多个核心功能,涉及到的算法种类十分丰富,这些算法均能表现出良好的数据处理能力,但也会在不同的数据条件下表现出性能差异。因此在实际工程应用中,针对不同的工程对象,甚至同一对象的不同故障模式所选择的算法通常是不同的,如何根据特定对象的具体PHM任务要求,从大量的PHM算法中选择最合适的算法成为当下PHM面临的重大挑战。大模型具有优秀的数据处理能力和模式识别能力,通过使用PHM算法与案例数据库等相关专家知识对预训练模型进行微调,提取和学习输入数据中的关键特征,可以建立起输入数据与输出决策之间的关联模型,利用大模型优异的模式识别能力实现决策,为实现具体环境下的针对性PHM算法智能推荐,降低PHM设计过程中的时间与资源成本,提供了契机

基于大语言模型和健康管理模型并行的PHM算法智能推荐首先需要构建健康管理模型的PHM算法案例库。将健康管理领域实际工程应用案例中所用的多种算法配置要素及其使用条件,借助大语言模型的知识抽取能力和知识内化吸收能力,通过基座模型监督精调(SFT)和人工反馈的强化学习(RLHF)等微调手段,将这些案例中描述的算法配置要素、诊断知识要素、工程条件要素等相关PHM算法知识形成PHM工程经验,从而在后续使大模型基于内化的PHM经验,根据用户交互的prompt中所提示的PHM任务需求,进行智能算法推荐。在用户使用时,需要确定多个维度的需求:明确使用对象类型、所需算法是用于故障诊断、寿命预测、健康评估、维修决策等何种PHM任务维度、所具备的数据条件和算力条件、预期效果等。通过与大模型进行交互对话的方式使大模型推荐出最适宜当前PHM需求的算法模型及其相关配置要素。

为了使大模型所推荐出的算法及相关配置要素从“可信可用”的初级阶段提升呢至“高信好用”的领先阶段,需要在大预言模型与健康管理模型并行研发的范式下进行不断的进化。具体而言,大预言模型很可能由于算法案例的质量问题学习到不恰当的甚至错误的PHM工程经验,并产生严重的幻觉。如何针对于此,进行大模型与人类专家诊断偏好进行对齐是提升大模型在PHM算法推荐这一垂直领域能力提升的关键。健康管理模型的并行研发,可以同步验证大模型推荐出的PHM算法效能,基于大模型所推荐出的算法模型及其相关配置要素,进行健康管理模型的构建,通过算法的实际运行得到相关指标,例如诊断的准确率、预测的精度、故障的隔离率,来反馈评价大模型所推荐出PHM算法的质量。大模型所推荐出的PHM算法应当在实际运行后得到最佳的评价指标,如若不然,则将此失误案例反馈对大模型进行深层对齐,目的在于纠正大模型在当前应用中的失误。通过以上不断与用户交互,大语言模型精准的PHM算法推荐能力也在不断提升。综合以上,大预言模型所推荐出的PHM算法及配置要素可以在被不断地与人类和健康管理模型的交互、反馈、迭代中正向促进健康管理模型的开发。

4.3.3 路线3:PHM算法模型逻辑性支撑

PHM算法模型逻辑性支撑路线为解决黑盒算法模型缺乏逻辑推断可信度差问题,在范式二大语言模型针对性引导健康管理模型实现并行开发的思想引导下,借助大模型问题分析与知识推理、文本生成能力优势,实现以PHM算法分析过程、对象知识与特点要素为输入,输出模型推理过程和结果解释的PHM算法模型逻辑性支撑任务,以黑盒算法模型逻辑性补充、高可信PHM算法开发等典型应用形式提高健康管理领域算法模型的逻辑性与可信度,如图4.10。

图4.10 PHM算法模型逻辑支撑信息卡

逻辑性指一个论述、推理或决策的合理性和严密性,是判断一个论述或观点是否可信和可接受的重要标准之一。在机器学习中,很多模型如神经网络等被认为是黑盒模型,这些模型的算法在内部运作,过程十分复杂且不透明,我们无法直接观察和理解算法的决策逻辑,使得模型的结果难以解释和理解,也无法验证算法是否基于可靠的数据和正确的假设进行决策,因此黑盒模型的结果可信度存疑单击或点击此处输入文字。。而数据驱动算法通过对大量数据进行分析和处理,提取有用的信息进行可视化展示,增进用户对算法过程的理解,可以提高黑盒模型的可信度。对于用大量的文本数据进行支撑的大模型,具有强大的知识推理能力,可以对知识进行深入学习和推理。大模型在推理过程中,对问题进行逻辑分析和推理,从而得出更深入和全面的答案,完善了结果的逻辑过程。依赖数据驱动算法的数据处理能力以及大模型的知识推理能力,优化黑盒模型的设计和选择,从而改善其逻辑性以及结果可信度存疑的缺陷,进而帮助PHM算法实现高可信的诊断、预测、评估、推荐、决策。

结合数据驱动算法的数据处理能力和大模型的知识推理能力,大大加强了PHM算法模型的逻辑性支撑。数据驱动算法模型对大量数据进行分析和处理,利用特征选择、特征工程、可视化等一系列操作对数据进行加工,并且可以利用例如决策树等解释性模型,帮助我们更好地理解模型的决策过程和结果。大模型在知识推理过程中,将输入的文本信息进行解析和理解,在推理过程中对问题进行逻辑分析和推理,利用相关的知识点建立推理链条,例如针对故障树模型,通过各层级直接的串并联关系,由底层单元逐层推理至顶层的故障情况。大模型还可以进行类比推理,对比已有的知识库,推理现有的问题,提高算法的泛化性和逻辑性。此外,开发相应的评估指标、生成解释性输出,让大模型在输出时附带解释性的理由等方法,在知识层面提高大模型的逻辑性。综合以上线路,使得PHM模型输出的结果有过程、有解释。通过成熟大模型与健康管理模型协同开发,对知识和数据进行融合,进一步提升PHM算法模型的逻辑性和可信度。

4.3.4 路线4:PHM算法模型智能优化更新

PHM算法模型智能优化更新路线为解决对象变化、工况变化、数据条件变化等情况下算法模型准确度、性能降低问题,在范式二大语言模型针对性引导健康管理模型实现并行开发的思想引导下,借助大模型逻辑推理、决策判断、优秀数据处理能力优势,实现以算法模型参数、运行结果偏差、累计数据、条件变化、人机交互反馈等要素为输入,输出更新后的算法模型和评估结果的算法模型智能优化更新任务,以新研产品PHM算法开发、服役期间算法自适应更新等典型应用形式为PHM算法模型通用性和适应性带来全面提升,如图4.11。

图4.11 PHM算法模型智能优化更新信息卡

在PHM领域中,算法模型的参数配置对算法性能起着至关重要的作用。当前PHM算法模型通常只适用于单一对象或单一工况的条件,在面对不同对象、不同工况、不同数据条件时,其泛化性往往较差。在实际工程应用中,随着PHM算法模型应用对象发生变化,其工况条件、数据条件等也会发生变化,从而导致原有算法模型在该情况下性能较差,需要对算法模型进行更新和优化以保证其性能;同时,装备会随着使用过程产生大量新数据,PHM算法模型在部署使用后需要根据这些新数据进行更新和优化,保证算法模型的性能和精度。当前的PHM算法模型在应用到新的环境或数据集中时,往往需要手动调整参数或使用启发式算式对参数进行寻优更新以适应新的情境,提高其性能,手动调整参数的过程对经验知识要求较高,通过试错的方式寻找最佳参数配置容易出现人为误差,使用启发式算法优化参数则需要对模型约束条件、目标函数等进行大语言模型拥有较强的泛化能力,并且结合大模型微调、RLHF等技术,可实现基于不同新数据集条件下的模型微调与优化,实现PHM算法模型参数的智能优化更新。定制化设计,工作量较大。并且PHM领域的数据通常具有高维度和高复杂性等特点,算法的参数空间较大,导致参数调整工作更加困难,限制了PHM算法的泛化应用。

基于大语言模型和健康管理模型并行的PHM算法模型智能优化更新首先根据健康管理模型当前计算结果和实际诊断/预测/评估等结果计算出当前算法模型的准确度和偏差值。当算法模型准确度偏差过大,无法满足健康管理需求时,将算法模型偏差值和各算法参数输入到大语言模型中,借助大语言模型的知识抽取和推理能力,根据健康管理模型数据库中的类似算法模型及其参数设置,针对当前算法模型给出参数优化建议。健康管理模型根据所给建议对算法参数进行更新,并对更新后的算法模型进行评估,验证新的算法模型计算准确度是否提高,能否满足健康管理需求。若能够满足需求,则完成该次算法模型优化更新;若尚不能满足需求,则根据当前优化更新情况对大语言模型进行提示和反馈,给出新的参数优化建议,再次进行算法模型优化更新,直至满足健康管理需求。该方法可确保健康管理算法与模型能够持续改进,并动态适应条件与数据的变化。

4.4 范式三:健康管理大模型构建与应用范式

健康管理大模型构建与应用范式针对PHM数据生成、PHM能力生成、复杂系统PHM解决方案生成、PHM验证评价等需求,结合健康管理垂直领域特点,参考大模型经典架构全面设计PHM大模型,如图4.12所示。从健康管理和大模型融合的对象维、任务维、算法维、模态维,依次开展PHM大模型的设计、数据收集标注、模型预训练、模型微调、模型对齐、模型评估、推理等研究工作,实现PHM能力的提升、健康管理领域瓶颈问题的解决和范式一、二涉及业务的进一步优化,进而构建形成:

(1)对象类健康管理大模型,如:轴承健康管理大模型、齿轮健康管理大模型、电机健康管理大模型、电子产品健康管理大模型等;

(2)任务类健康管理大模型,如:数据生成大模型、算法推荐大模型、方案生成大模型、验证评价大模型等;

(3)算法模型类大模型,如:故障诊断大模型、故障预测大模型、维修决策大模型等;

(4)多模态健康管理大模型,如:振动模态健康管理大模型、知识模态健康管理大模型、文本健康管理大模型、图像健康管理大模型、多模态健康管理大模型等。

图4.12 健康管理大模型应用范式

4.4.1 健康管理大模型构建

传统PHM技术通常只能针对特定对象形成专属能力,但总体上讲,在过程、功能、对象等维度上尚难以实现扩展及涌现。当前,健康管理领域面临着提升通用泛化性能、提升可解释性和可信度、形成验证体系、降低设计和开发门槛、高效利用领域知识、提升交互能力与效率等方面的瓶颈问题。“基于大语言模型的健康管理范式”和“大语言模型与健康管理模型并行范式”借助现有大语言模型的架构和功能,针对健康管理垂直领域特定的多模态数据、多阶段差异化任务、全流程功能等特点,将在一定程度上解决和缓解健康管理面临的问题。然而,需要根本解决健康管理瓶颈问题,必须依赖于全面、根本的技术革新。

参照大语言模型以自然语言为基本元素的文本生成能力,如果能够利用大模型的涌现性、泛化性等优势和特点,从基础模型开始构建以健康管理领域多模态信息为基础、以PHM各种功能需求为主要业务、以生成涌现能力为目标的垂直领域健康管理大模型,打通PHM开发方案生成、数据生成、能力生成、解决方案生成、验证评价、方案更新等技术流程,支撑装备PHM设计、诊断、评估、预测、决策、推荐、验证、更新等下游任务,将在解决传统PHM面临的一系列问题同时,实现以通用化、判别式、实战性为主要特点的健康管理领域新生态及根本性技术转变。

从构建流程上看,大模型的构建包含大模型架构设计、大规模预训练、针对不同装备对象/任务/工况的指令微调、增强推理能力的强化引导等步骤。参考扩展定律,扩展模型或数据大小通常会提高下游任务的模型性能,因此数据的体量能够为大模型涌现性提供支撑;健康管理领域的信息特点是多模态,而多模态及其之间的互补性有助于提升模型感知能力。因此,构建通用的生成式健康管理大模型,需要为模型预训练阶段和微调校准阶段准备大量、多模态PHM领域数据。为了提高数据质量,需要采用合适的预处理策略,包括质量过滤、去重、隐私去除和标记等。同时,需要调动不小的人力为每种模态信息设置标记工程(token)。对于大体量健康管理领域数据和较大的大模型规模,现有研究大多使用批量训练并将之动态调整。健康管理大模型在构建时需要经过超参数搜索、大规模分布式训练、生产推理几个步骤,涉及到集群设计、机架设计和节点设计。面对万亿规模参数,需要多机多卡并行进行大模型训练,因此考虑对计算任务、训练数据和模型进行划分,进行分布式存储和分布式训练。

后续以PHM大模型为基础,以全流程PHM设计和方案开发、PHM数据生成、PHM能力生成、复杂系统PHM解决方案生成、PHM验证评价等典型PHM任务为核心,系统阐述PHM大模型对于解决各类问题的思路和可能技术途径。

4.4.2 路线1:智能装备全流程PHM设计

智能装备全流程PHM设计路线为解决PHM设计人力资源消耗大且大量依赖专家经验设计的缺陷问题,在范式三健康管理大模型框架下,借助大模型优势的推理能力与多模态融合能力,实现以任务信息与历史PHM设计案例为输入,输出装备全流程PHM设计方案的智能PHM方案设计任务,以全流程PHM开发方案设计等应用形式推动PHM设计的智能化快速发展,如图4.13。

图4.13 智能装备全流程PHM设计信息卡

PHM领域主要业务之一即为装备设计定制化、各阶段流程的故障诊断、健康评估、寿命预测等功能方案。依据一般的PHM研制阶段,全流程PHM设计需要在需求分析阶段完成PHM需求分析,在概念设计阶段对PHM方案进行论证与评估,在初步或详细设计阶段生成相应的设计方案并完成功能模型的定义,在详细设计阶段完成详细设计与评估并生成,在试制、试验阶段完成系统评估和设计定型,在批量生产和服役阶段,完成功能的验证应用和反馈设计等。不同应用场景下的不同种类装备的PHM设计需求差别很大,过往一直是以专家经验和装备特点为主要支撑,针对性地根据对象结构和用户需求、通过人工分配、安排、撰写和绘制,设计出的各阶段方案通用性和泛化性弱。为推动装备PHM方案设计向生成式、智能式、通用式、全流程方向发展,针对装备提出PHM开发需求,亟需基于健康管理垂直领域大模型智能化生成装备全流程PHM方案,减轻PHM系统设计对于专家知识的强依赖性,真正推动健康管理领域的智能技术变革。

基于大模型的全流程PHM方案设计,首先依赖于需求分析,大模型需要能够在输入具体任务信息(包括作战支持需求、使用场景、高保障代价活动、关键活动等)的条件下,利用推理能力完成需求分析并生成总体设计技术要求和初步论证方案,并匹配PHM系统相关规范和体系论证报告,进而在各阶段输出相应分析说明、设计方案和六性评估报告等,实现定型和服役保障阶段的模拟测试性分析。预期的健康管理大模型在进行目标对象PHM设计时,能够在每个阶段均智能化分析出指标分配要求、系统功能需求、服役维护需求等,并依此自动化生成状态监测、数据处理、算法模型、集成耦合、验证评估等具体方案,供技术人员借鉴和使用。在这一过程中,大模型通过向量化手段和涌现性能力,能够将阶段间和阶段内的智能匹配操作以推理形式呈现,以节省技术人员的智力和人力投入。全流程设计的一大关键是考虑强约束条件。健康管理设计的过程当中,除PHM功能以外,还会涉及到装备本体设计、外界数据库和数据资源等交互系统及约束条件,构成在健康管理总体要求和总体能力限定条件下全流程设计的约束输入。另一方面,由于全流程PHM方案时间跨度大,为强化模型推理与实际对象场景的匹配程度,需要在PHM全流程多个节点设置验证评价接口,使大模型生成的PHM开发方案在工程使用时有效、可靠。因此,全流程PHM设计需要开展“多阶段训练与微调”,借鉴模块化设计思路,结合PHM设计阶段,逐步分别地通过内置评价算法和外部人工提示等方式优化模型生成能力。

4.4.3 路线2:智能PHM数据生成

智能PHM数据生成路线为解决PHM算法模型的高质量数据需求难以满足的问题,在范式三的健康管理大模型框架下,借助大模型优势的生成能力与泛化性能,实现以装备信息与数据特征知识要素为输入,输出能够模拟装备在预定工况与环境下预定状态模拟数据的数据生成任务,以典型故障数据生成、装备任务验证数据剖面构建等典型应用形式为PHM算法模型设计、开发、验证等环境提供便利,推动PHM算法模型能力的全面提升,如图4.14。

图4.14 智能PHM数据生成信息卡

PHM数据作为PHM设计开发、算法模型的输入,在PHM技术体系中扮演着至关重要的角色。良好的数据条件可以帮助PHM能力精准、快速、可信的实现。但实际应用过程中,PHM数据受到装备复杂工况与使用的恶劣条件影响,往往存在着数据缺失、数据不平衡、数据信息量不足等非理想数据情况,导致PHM开发、测试、验证、使用效果受到严重影响。当前数据扩充技术是健康管理领域甚至人工智能领域为解决数据驱动算法模型大量数据需求难以满足问题的核心解决思路。生成式网络模型、数据迁移、变分编码等技术虽然一定程度上缓解了算法模型大量数据需求与实际工程应用数据状态不理想间的矛盾,但生成数据仍存在缺少与装备、工况、未来使用需求等要素的考量,生成数据仍与真实数据存在较大差异。为解决这一问题,健康管理大模型将从输入考量分析过程输出形式等方面对数据生成任务进行全面优化,具体流程如下:

首先,在健康管理大模型架构下,借助历史各装备在其工况、环境下的数据训练生成式预训练大模型,在输入端综合考量装备设计信息、使用环境信息、未来算法模型特点等核心要素,借由大模型预训练构建生成模型与各核心要素的关联。进一步,结合数据特点,基于一致性、多样性、任务需求性等层次引导模型强化过程,基于数据生成对象装备特点开展生成模型微调任务,提高数据生成结果与真实数据的相似性,保证生成过程的正确性与可信度。最后,再次结合大模型框架中的PHM设计要素信息,根据PHM设计算法开发需求构建PHM数据生成输出,并设计验证指标与算法案例进行数据验证,给出PHM生成数据质量评价。

健康管理大模型的生成能力在PHM数据生成任务中的应用将能为PHM数据生成带来能考量装备特点差异、使用工况与环境差异、设计要素、使用需求等多模态信息的可信数据生成,生成数据将比现有数据生成技术结果在与真实数据一致性、生成数据多样性、生成数据任务适应性等评价指标上都有更好的表现。PHM数据的数量与质量的全面提升对于当前PHM算法模型的设计、开发等任务的开展提供了诸多方便,对于传统体系下由于缺乏数据支撑的PHM算法验证任务与PHM系统层级验证与评价任务也提供了实现的途径。

4.4.4 路线3:智能PHM能力生成

智能PHM能力生成路线为解决PHM能力生成过程门槛过高且智能化程度低的问题,在范式三的健康管理大模型框架下下,借助大模型优势的生成能力与推理性能,实现以装备信息与能力需求要素为输入,输出能够满足开发需求的PHM能力的研制任务,以装备诊断能力生成、装备预测能力生成等典型应用形式大幅度降低PHM能力开发的技术门槛,提升能力生成过程智能化程度,推动PHM能力生成技术的全面革新,如图4.15。

图4.15 智能PHM能力生成信息卡

PHM能力实现依赖与PHM算法模型的底层开发,优秀的底层代码是保证PHM能力的关键。但在实际PHM研发过程中,开发人员通常难以独立地进行底层代码开发任务,多数开发任务需通过任务描述交由专业程序设计人员组织开发,由于专业程序设计人员健康管理领域知识相对薄弱,人员间信息交互效率低,且开发后代码也常出现偏离预期需求、算法模型准确度低等问题。当前,国内前沿的PHM设计辅助系统已经实现了基于已有封装代码的二次开发功能,用户可通过模块化方式进行底层代码的二次开发工作,已经一定程度上降低了PHM设计开发门槛,但二次开发任务仍然需要配置模块间传递关系,并需要对各代码模块的功能有充分了解,否则在二次开发过程中必然导致设计错误的存在,且调试十分困难。在大模型技术应用背景下,生成式大模型的生成能力为智能化PHM能力生成提供了新的解决途径。

基于健康管理大模型的智能PHM能力生成主要分为两大功能,一是PHM算法模型底层代码智能生成,二是PHM算法模型参数配置信息智能生成。底层代码智能生成将借助与历史PHM算法模型代码做为训练基础,针对诊断、预测、评估、验证、推荐等核心任务分别形成任务特色代码框架,生成底层代码时将依据整体装备PHM能力开发需求与任务特色,在综合考量装备对象特点、工况特点、使用环境与数据形式等要素下,借由大模型的推理与生成能力快速生成能够满足任务需求的底层代码。随后,通过算法模型特点与数据信息的分析给出PHM算法模型的最优参数配置,保证智能生成的PHM底层代码的任务精度,实现PHM能力高效、精确的智能生成。

随着PHM系统使用需求的日益增加与追求更好性能的PHM算法模型日渐复杂,PHM能力的生成带来的技术门槛也越来越高。在健康管理大模型生成能力的影响下,结合大模型的推理能力,快速实现准确、规范、无人的算法模型底层代码生成与能力生成任务将能为降低PHM开发门槛、缩短PHM能力生成时间、减少PHM算法开发人力与成本都具有十分重要的意义。

4.4.5 路线4:复杂系统PHM解决方案生成

复杂系统PHM解决方案生成路线为提高PHM方案设计阶段的多模态信息处理能力,在范式三的健康管理大模型思想引导下,借助其多模态信息处理能力、逻辑推理能力和文字生成能力优势,实现以多模态故障信息、结构信息、对象特点、使用场景、工况、参数指标、能力需求等多要素为输入,输出PHM解决方案,以复杂系统的PHM方案生成典型应用形式为PHM技术解决复杂系统交联耦合难题能力的提升,如图4.16。

图4.16 复杂系统PHM解决方案生成信息卡

传统的PHM方案设计往往聚焦于单一类型的信息,忽略了多模态的信息处理。若是只关注某种特定的传感器输出,而忽视了声音、振动、温度等其他模态的信息,则会导致方案设计不完整。除了多模态输入信息,传统PHM方案设计中还常常忽略结构信息。复杂系统通常由多个部分组成,这些部分之间存在着复杂的交联和耦合关系。这意味着,任何一个部分的变化都可能影响到其他部分,甚至整个系统。因此,针对复杂系统的PHM方案,需要考虑到这些交联和耦合关系,以及它们对系统健康状态的影响。对象特点也是一个常被忽视的方面,不同的设备、部件或软件具有其独特的运行特性和故障模式。如果PHM方案不能针对每个对象的特点进行调整,那么其预测和诊断的准确性会大打折扣。另外,使用场景、工况和参数指标对PHM方案设计的重要性不言而喻。这些指标为我们提供了系统健康状态的量化信息。总的来说,为了有效地应对复杂系统中的各种挑战,我们需要一个更加全面、综合的PHM方案。这个方案应该不仅仅关注单一部分的运行状况,而是要充分利用多模态信息、结构信息、对象特点、使用场景、工况和参数指标,确保系统的健康和稳定运行。

在这样的背景下,健康管理大模型提供的PHM方案无疑为系统的高效稳定运行带来了有力的保障。健康管理大模型的引入可以充分利用设备和算法模型的信息,通过其多模态信息处理能力、逻辑推理能力和文字生成能力,可以生成一套完整的PHM方案。具体来说,大模型具备了多模态信息处理能力,可以处理来源于设备的文本、声音、图像,以及结构化的传感器数据。这为PHM方案提供了一个完备的数据基础分析。并且大模型拥有强大的逻辑推理能力。在复杂系统的运行中,微小的变化可能会诱发一系列的连锁效应。而大模型通过逻辑推理,不仅能追踪到这些变化的关系,还能与历史设备和相似设备信息进行结合。在另外一方面,健康管理大模型的文字生成能力能够将复杂的分析结果转化为文本描述。无论是设备的当前运行状况、参数信息,还是算法模型的信息,都能被明确地、条理地整理成PHM方案。

4.4.6 路线5:智能PHM验证评价

智能PHM验证评价路线为解决传统PHM的缺乏验证评价的问题,在范式三的健康管理大模型思想引导下,借助大模型逻辑推理能力优势,实现以设备结构信息、输入信息和故障模式等要素为输入,输出验证结果和评价,以PHM验证与评价典型应用形式为健康管理领域带来新的技术突破,如图4.17。

图4.17 智能PHM验证评价信息卡

传统PHM验证评价中,由于设备的复杂性和多样性,很难为每种设备制定统一的评价标准。不同的设备可能有不同的工作原理、设备参数、使用环境和故障模式,这使得为它们制定一个通用的评价标准变得非常困难。并且传统的PHM方法往往依赖于技术人员的经验。虽然这些经验在某些情况下可能是有价值的,但它们也可能导致偏见和误解。另一方面,为了验证PHM方法的准确性,需要大量的故障数据,然而在许多情况下,这些数据是不可得的或很难获得的。例如,某些设备可能很少出现故障,或者故障数据可能被视为敏感信息而不被公开。这使得对PHM方法进行充分的验证变得非常困难。在PHM评价中,PHM方法的性能需要一些有效的评价指标。然而,这些指标可能不适用于所有的设备和应用。因此,我们需要为不同的设备和应用开发更为合适的评价指标。

健康管理大模型可以理解和处理大量的信息,并且与传统方法相比,大模型具有更强的逻辑推理能力,能够处理更复杂的问题,并提供更准确、更客观的验证评价。考虑到大模型的优势,我们可以将其应用于PHM的评价。通过输入设备结构信息、输入信息和故障模式,健康管理大模型可以快速地理解设备的工作原理和可能的故障原因。通过模拟设备的工作过程,进行预测和诊断,并与实际数据进行比较,从而验证PHM结果的准确性。此外,大模型还可以为PHM方法提供评价。通过分析设备的实际运行数据,模型根据评价指标可以评估PHM方法的性能。这些评价指标可以帮助我们了解PHM方法的优点和缺点,从而进行进一步的优化。


编辑:曹希铭

校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、Tina、陈宇航、海洋、陈莹洁、王金、赵诚、肖鑫鑫、张优

该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除



来源:故障诊断与python学习
MechanicalSystem振动化学二次开发通用电子海洋参数优化理论电机六性知识工程控制试验
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-11-23
最近编辑:21分钟前
故障诊断与python学习
硕士 签名征集中
获赞 87粉丝 137文章 259课程 0
点赞
收藏
作者推荐

中科院一区Top论文学习|基于两阶段更新数字孪生的轴承剩余寿命预测

本期给大家推荐基于两阶段更新数字孪生的轴承剩余寿命预测。在工业生产中,轴承作为核心部件直接影响系统运行稳定性,精准预测其剩余寿命(Remaining useful life, RUL)是保障生产的关键。当前主流RUL预测方法普遍忽略轴承实时运行健康状态,导致预测结果偏差较大。针对这一问题,本文提出融合两阶段更新数字孪生与双关联动态图卷积网络的轴承RUL预测方案:构建具有外圈缺陷扩展特性的轴承缺陷演化模型,建立孪生模型与真实轴承的实时交互机制,并校准缺陷优化全生命周期缺陷曲线,借助双向长短期记忆网络关联真实轴承振动特征与孪生缺陷,完成实时映射;最后将映射缺陷纳入RUL预测特征空间,提取物理与数字空间特征关联,实现最终预测。论文链接:通过点击最左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目:Prediction of bearing remaining useful life based on a two-stage updated digital twin 论文期刊:Advanced Engineering InformaticsDoi:https://doi.org/10.1016/j.aei.2025.103123作者:Deqiang He (a), Jiayang Zhao (a), Zhenzhen Jin* (a,d), Chenggeng Huang (b), Fan Zhang (c), Jinxin Wu (a) 论文时间: 2025年 机构: a: Guangxi Key Laboratory of Manufacturing System & Advanced Manufacturing Technology, School of Mechanical Engineering of Guangxi University, Nanning 530004, China b: School of Automation Engineering, University of Electronic Science and Technology, China c: Southwest Jiaotong University School of Design, China d: Guangxi Key Laboratory of Precision Navigation Technology and Application, Guilin University of Electronic Technology, Guilin 541004, China作者简介:靳震震,近五年围绕载运装备故障诊断与智能运维开展研究,主持和参与国家自然科学基金联合基金重点项目、面上项目、广西科技计划项目等项目10余项,发表高水平学术论文50余篇,其中第一作者或通讯作者30篇,ESI热点论文3篇,ESI高被引论文7篇,《光明日报》刊发文章1篇,申请发明专利24件,谷歌学术引用次数共计超1600次,H指数20,I10指数29。参编地方标准1部。获2024年广西大学优秀博士学位论文、2025年广西科技进步一等奖(排名第八)、2025年中国物流与采购联合会科学技术奖一等奖(排名第三)、2024年中国机械行业产教融合教育教学创新大赛全国二等奖(排名第六)、2025年广西大学本科教学成果一等奖(排名第三)、2025年广西大学研究生教学成果特等奖(排名第四)、2025年中国机械行业产教融合教育教学创新大赛全国一等奖(排名第四)各1项,入选全球前2%顶尖科学家榜单、广西青年科技人才托举工程。(来源于广西大学教师信息网) 通讯作者邮箱:sdkjdxjz@163.com 摘要轴承作为工业生产中的关键部件,对系统的平稳运行至关重要。准确预测轴承剩余寿命(Remaining useful life, RUL)十分必要。然而,目前的RUL预测方法未考虑轴承运行的实时健康状态,导致RUL预测精度较低。为解决上述问题,本文提出一种基于两阶段更新数字孪生和双关联动态图卷积网络(Dual correlation dynamic graph convolutional network, DC-DGCN)的轴承RUL预测方法。首先,建立具有外圈缺陷扩展特征的轴承缺陷演化模型,通过多目标优化在第一阶段得到初始缺陷扩展曲线,实现孪生模型与真实轴承的实时交互。随后,利用第二阶段的校准缺陷进一步更新全生命周期缺陷曲线。采用双向长短期记忆网络(Bi-directional long short-term memory, Bi-LSTM)将真实轴承的振动特征与孪生缺陷相关联,完成实时映射。最后,将映射得到的缺陷融入用于RUL预测的特征空间,通过所提出的DC-DGCN方法提取物理空间与数字空间特征之间的关联性,实现最终预测。实验结果表明,该方法有效提高了轴承RUL预测的真实性。关键词:轴承,剩余寿命,实时健康状态,数字孪生,图卷积网络 目录1 引言2 基础理论2.1 数字孪生2.2 动态建模3 数字孪生模型的两阶段更新3.1 孪生建模3.2 两阶段动态更新3.3 基于双向长短期记忆网络的实时映射4 动态图神经网络4.1 图卷积网络4.2 动态图卷积网络5 模型有效性验证5.1 数据集描述5.2 孪生模型有效性验证5.3 两阶段动态模型更新验证5.4 缺陷尺寸实时映射5.5 基于数字孪生的剩余寿命预测6 总结1 引言随着《中国制造2025》和工业4.0等发展战略的持续推进,智能运维已成为各国制造业发展的主要趋势[1-3]。轴承在工业设备中起着关键作用,广泛应用于轨道交通、航空航天、风力发电等行业[4-6]。同时,工业设备中的大多数轴承在恶劣工况下工作,更容易发生腐蚀、磨损等故障。轴承故障不仅会影响系统的正常运行,严重时还可能引发重大安全事故[7, 8]。准确高效的剩余寿命(Remaining useful life, RUL)预测能够指导工业设备维护工作,制定合理的维护计划,避免因轴承意外故障造成的经济损失和人员伤亡。因此,为提高轴承RUL预测的真实性,工业界和学术界正积极探索和研究更优的预测方法[9, 10]。近年来,随着人工智能技术的进一步发展,轴承RUL预测技术逐渐成熟。总体而言,预测方法可分为以下四类:基于物理模型的方法、基于数据驱动的方法、基于专家知识库的方法以及混合预测方法。基于物理模型的方法 会考虑设备的运行环境和退化趋势,结合物理结构建立表征轴承退化状态的数学函数。这类方法往往具有较高的预测精度,但需要深入了解被监测对象的物理特性,且预测真实性很大程度上依赖于物理模型的准确建立[11]。当前机械系统日益精密和复杂,构建能够准确反映轴承退化机理的物理模型面临巨大挑战。基于数据驱动的方法可直接对传感器获取的数据进行处理,从与退化趋势相关的历史状态信号中提取特征信息。基于这些信息,在状态监测数据与轴承RUL之间建立模糊函数关系,用于RUL预测。由于无需详细解释和建模轴承的失效机理,该方法特别适用于复杂机械系统[12-15]。基于专家知识库的方法利用专家系统特有的领域知识,通过将状态监测数据与预先定义的寿命数据进行对比,得出轴承的实时RUL[16]。但由于对领域知识要求较高,这类方法的应用范围并不广泛。混合预测方法将数据驱动技术与物理模型相结合,既利用了物理模型预测的准确性,又兼具数据驱动方法的实用性,能够有效捕捉轴承退化过程中的不确定性[17,18]。然而,这类方法的模型复杂度通常较高,且可能受到物理模型要求的限制。随着大数据的发展与普及,基于数据驱动的方法逐渐成为RUL预测的主流。图神经网络(Graph convolutional network, GNNs)凭借其独特的关联性提取能力,在该领域受到越来越多的关注。图神经网络由顶点、边和图构成:顶点代表每个节点的特征,边代表节点之间的关系或相似性,图则是所有顶点和边的综合特征表示。捕捉特征之间的关联性能够有效从监测数据中提取退化信息,从而提高网络模型的鲁棒性和准确性。然而,现有文献常将多个传感器视为节点,将传感器之间的位置关系视为边。例如,Li等[19]建立了多传感器图神经网络用于轴承RUL预测,采用余弦相似度计算节点间的边权值。在单传感器领域,现有研究往往只考虑特征通道数据单维度的关联性。例如,Yang等[20]提出了一种基于单传感器的图神经网络,以时间序列作为节点连接判断的依据。仅考虑单维度关联性的图神经网络会丢失部分关联信息,导致预测精度下降。上述所有方法在轴承RUL预测方面均取得了一定成果,但它们都未关注轴承退化过程中的运动行为,且忽略了特征空间与轴承物理空间之间的实时交互。数字孪生(Digital twin, DT)为连接物理实体与状态监测数据提供了可行途径[21]。DT作为一种多尺度、多学科的仿真模型,能够实时模拟真实物理实体的运动,是连接物理空间与数字空间的桥梁[22]。同时,DT包含丰富的运行数据,可从中获取真实工况下难以得到的健康状态信息,这些信息能够为机械设备的制造、改进和维护提供指导[23]。利用DT技术可大幅降低实验成本,减少资源浪费[24]。目前,已有大量研究将DT应用于轴承全生命周期管理。Ma等[25]构建了一个融合领域自适应和注意力机制的增强元迁移学习模型,并将其与基于有限元的DT模型相结合,实现了基于少量标记目标域数据的轴承故障诊断。Qin等[26]针对轴承故障诊断中的样本不平衡问题,提出了一种基于DT的数据集生成方法。他们构建反向物理信息神经网络来调整模型参数,以优化孪生信号的匹配度,并设计边界损失辅助网络实现快速收敛。实验结果表明,该方法在不同工况和故障模式下均能提高轴承故障诊断的准确性。Li等[27]对轴承的故障演化模式进行了研究,将其分为裂纹、剥落和缺陷三类,提出了轴承全生命周期的多尺度DT模型,并通过实验验证了该模型具有良好的准确性。DT的发展时间相对较短,目前尚无公认的最优轴承数值模型。此外,许多技术尚未成熟,如高精度模型构建、虚实数据传输、数据预处理等。在轴承RUL预测领域,DT的应用也处于逐步完善阶段。Desai等[28]提出了一种基于摩擦学感知的DT模型,并将其与具有因果膨胀卷积的卷积神经网络相结合用于RUL预测,实现了无需磨损测量的自主维护。Liu等[29]基于振动现象构建了轴承DT模型,并采用领域对抗神经网络减小数字域与真实域之间的差异,该方法无需先验标记即可实现RUL预测。Zhang等[30]考虑到轴承RUL预测中未来数据缺失的问题,构建了基于敏感特征的DT框架,利用联合DT的集成学习Catboost方法对数据集进行补全,并通过实验验证了完整数据集的有效性。Zhao等[31]提出了一种通过DT模型生成样本数据的小样本RUL预测方法,采用多源回归对抗领域自适应方法对模拟数据进行领域转换。对现有文献的分析表明,目前用于轴承的DT更倾向于建立仿真模型来模拟轴承的运行过程。然而,上述仿真模型并未实现DT的核心目标——实时交互与数据反馈。这导致现有RUL预测研究无法获取轴承的实时运行状态,且忽略了物理空间与数字空间数据之间的关联性。同时,大多数现有DT模型未考虑DT与物理实体之间的实时差异,无法准确反映轴承的退化过程。为解决上述问题,本文提出一种基于DT模型两阶段更新的RUL预测方法。在孪生模型初始化后,通过多目标粒子群优化捕捉数字空间与物理空间之间的实时关联,更新孪生模型的动态响应,使其匹配最优的轴承全寿命缺陷尺寸。在第二阶段,通过校准缺陷尺寸进一步更新缺陷曲线。随后引入Bi-LSTM,将轴承的振动特征有效映射到孪生缺陷特征,以提高RUL预测的真实性。本文的主要贡献如下:(1)提出了两阶段更新DT模型,与传统动态建模不同。该模型通过多目标优化捕捉两类空间之间的实时关联,更新模型参数以实现孪生模型与真实轴承的交互,并在第二阶段利用高保真校准缺陷进一步更新缺陷曲线。(2)构建了基于Bi-LSTM的实时映射网络,并以DT模型两阶段更新得到的缺陷尺寸作为数据集对其进行训练。(3)提出了基于双关联的动态图神经网络,能够更好地提取物理空间与数字空间之间的特征关联性。 2 基础理论DT为轴承RUL预测提供了新的可能,其核心是动态建模。构建能够充分反映轴承真实运行状态的动态模型,有助于DT更好地发挥作用,从而更准确地指导物理空间的RUL预测。 2.1 数字孪生Grieves在产品生命周期管理课程中首次提出数DT概念,引入了镜像空间模型[32]。此后,DT受到全球广泛关注,并在产品故障预测与健康管理领域不断发展。DT模型是物理对象的虚拟表示,通过与物理实体的实时交互,使孪生模型不断接近物理实体的真实运行状态。当达到一定相似度阈值后,可通过多种方法从孪生模型中获取数据,进而对物理实体进行优化,指导维护决策[33]。DT具有提高可靠性、降低成本等优势,已在多个领域成功应用[34, 35]。基于DT的轴承全生命周期管理一般流程如图1所示。 图1 DT2.2 动态建模本文引入赫兹接触理论建立轴承动力学模型,该模型能更准确地反映轴承局部缺陷的扩展过程,所建立的动力学模型由微分方程推导得出: 其中,M为系统质量,C为阻尼系数,K为刚度,F为激励载荷。为方便研究轴承动力学特性,假设滚动体与滚道之间的接触变形为非线性弹簧-阻尼单元。当滚动体经过缺陷位置时,会产生时变位移激励,进而引发动力学响应。本文建立模型时做出如下必要假设:(1)轴承运行过程中温度恒定;(2)滚动体等距排列,质量可忽略不计,且相互之间无作用力;(3)仅考虑轴承径向方向的作用力,忽略轴向振动;(4)轴承经过缺陷时发生局部接触变形,但轴承整体尺寸不变。3 数字孪生模型的两阶段更新本节构建了具有参数更新机制的两阶段DT模型,整体RUL预测框架如图2所示。首先,根据轴承的物理参数模拟其全生命周期的动力学响应;通过两阶段更新与物理实体交互,实时更新轴承的缺陷尺寸,更准确地捕捉轴承全生命周期的缺陷状态;随后,为提高DT交互的实时性,采用Bi-LSTM建立轴承物理空间特征与孪生缺陷之间的实时映射;最后,将实时缺陷融入特征空间,以提高轴承RUL预测的准确性。 图2 基于DT的RUL预测框架3.1 孪生建模DT系统的动力学模型如图3所示。应用牛顿第二定律并结合式(1),可推导出考虑阻尼和恒定外载荷的滚动轴承二自由度动力学方程,其关系如式(2)所示: 其中, 为轴承的等效质量, 为轴承的等效阻尼, 、 分别为x、y方向的振动速度, 、 分别为x、y方向的振动加速度, 、 分别为外圈与滚动体在x、y方向的接触力分量, 、 分别为轴承的载荷分量。 图3 孪生模型将接触力视为非线性接触力,根据赫兹接触理论计算,可推导出式(3): 对于圆柱滚子轴承,n=10/9;对于球轴承,n=3/2。将其代入式(2),可得到滚动轴承孪生模型的最终缺陷扩展模型,如式(4)所示: 其中, 为轴承的总接触刚度, 为滚动体数量, 为滚动体 与外圈是否接触的判断因子,可由式(5)表示: 为滚道与滚动体i的接触变形,可由式(6)表示: 其中, 为时变位移激励, 为 时刻滚动体 的角位置,可通过式(7)-(9)计算:首先将轴的转速转换为弧度制,然后计算轴承保持架的转速,最后通过式(9)计算滚动体的位置。 其中, 为旋转系统中轴的转速, 为轴的角速度, 为滚动体直径, 为轴承的节圆直径, 为轴承保持架的转速, 为滚动体总数。 对于时变位移激励 ,为模拟真实轴承缺陷演化产生的位移激励,通常将轴承全生命周期分为两个阶段进行计算。为简化动力学模型,忽略缺陷边缘与滚动体之间的接触变形,将缺陷视为长度为 、深度为 的矩形。本文所考虑的轴承局部缺陷扩展过程如图4所示,据此建立两个阶段的位移激励函数表达式。 图4 缺陷扩展过程在初始缺陷生成阶段,由图4(a)可知,由于此时缺陷长度较小,滚动体无法完全接触到缺陷底部,其最大位移激励 始终小于缺陷深度 ,可由式(10)计算: 此时,时变位移激励函数可表示为式(11):其中, 为时刻 第 个滚动体的剩余角位置, , 为缺陷中心对应的角度, 为缺陷对应的跨度角。图4(b)为缺陷扩展阶段:随着缺陷尺寸增大,最大位移激励逐渐增加,直至等于缺陷深度 。此时滚动体将完全陷入缺陷中,这种现象通常在故障中后期出现。时变位移激励函数定义如式(12)所示:其中, 为滚动体接触缺陷底部时球心对应的跨度角。3.2 两阶段动态更新 基于3.1节的孪生建模,可调整各动态参数(如阻尼比、外载荷等)以匹配滚动轴承的真实动态响应。同时,为更准确地建模轴承全生命周期的缺陷尺寸,提出两阶段动态更新方法:采用多目标优化算法对孪生模型的缺陷参数进行持续迭代,得到帕累托最优前沿,使孪生模型生成的动态响应与真实响应高度匹配;在准确确定轴承全生命周期缺陷尺寸后,采用所提计算方法获取特定时刻的高保真缺陷尺寸,进而优化全生命周期缺陷曲线,最终得到精度更高的结果。 3.2.1 多目标参数优化 为使真实轴承与孪生轴承的动态响应差异最小化,首先获取初步的全生命周期缺陷尺寸。本文采用多目标优化对孪生模型参数进行迭代,优化目标同时考虑频域和时域相似度,以确保获得最匹配的缺陷参数。多目标优化的数学表达式如下: 其中, 为优化后的缺陷参数(包括缺陷长度 、缺陷深度 ), 、 分别为孪生轴承和真实轴承的动态响应, 表示快速傅里叶变换, 表示动态时间规整距离, 表示皮尔逊相关系数。 多目标粒子群优化算法由Carlos A. Coello Coello等人提出,是将传统粒子群算法扩展到多目标优化问题的算法。粒子群算法作为一种群智能进化算法,其核心原理是将优化问题的最优解类比为食物位置,将粒子的运动类比为鸟类的飞行方向和速度。在种群更新过程中,每只“鸟”(粒子)通过同时考虑自身对食物位置的记忆以及群体记忆的影响来调整飞行方向,通过迭代更新种群位置,引导种群向最优解收敛,最终获得全局最优解。其具体更新过程可表示为式(14): 其中, 为第 次迭代后粒子i的速度向量, 为第 次迭代后粒子 的位置向量, 为惯性系数, 、 为[0,1]范围内的随机数, 为个体学习因子, 为社会学习因子, 为第 次迭代中粒子 的最优位置, 为第 次迭代中种群的最优位置。计算得到第 次迭代的速度后,采用式(15)更新每个粒子的位置: 引入自适应网格算法和帕累托支配实现基于粒子群优化的多目标优化:多目标粒子群优化算法采用自适应网格算法和轮盘赌选择法,从每次迭代得到的一系列非支配关系粒子中选择历史最优解,在外部存档中存储分布更均匀的帕累托前沿。3.2.2 校准缺陷获取通过多目标优化求解后,可得到轴承全生命周期缺陷尺寸。为进一步减小其与真实轴承缺陷尺寸的差异,需采用尽可能接近真实的缺陷尺寸对3.2.1节得到的全生命周期缺陷曲线再次调整。然而,在轴承运行过程中拆解轴承测量缺陷尺寸既不合理又成本高昂。为解决这一问题,本文引入文献[36]中的方法,通过分析轴承时域振动信号确定特定时间段内更准确的缺陷尺寸。 滚动体经过局部缺陷时的物理过程如图5所示:当滚动体到达A点时,开始进入缺陷区域;此时由于接触面积减小,动态响应降低,直至到达最低局部点B(B点位置无需用于缺陷尺寸计算,故图中未标出);随后动态响应逐渐增大,并在C点达到峰值,此时滚动体即将脱离滚道;经过C点后,滚动体穿过缺陷到达D点,与缺陷边缘碰撞并产生高频响应。图中部分变量的几何关系如式(16)所示: 其中, 、 为A点、C点相对于缺陷入口E的角度, 为轴承节圆半径, 为保持架旋转频率, 为轴承从C点旋转到D点的时间, 为滚动体半径。由上式可知,从振动信号中提取各点位置后,可求得缺陷的跨度角 ,再通过式(17)得到精度更高的轴承缺陷长度: 获取部分时刻的校准缺陷尺寸后,采用式(18)对第一阶段生成的轴承全生命周期缺陷曲线进行修正,得到最终的两阶段更新缺陷尺寸: 其中, 为与第一个校准缺陷对应的第一阶段优化缺陷尺寸, 为轴承运行至失效的总时间, 为获取的校准缺陷数量, 为第 个时刻的校准缺陷尺寸。 图5 滚动体通过缺陷区域需说明的是,本文仅选择特定时刻计算校准缺陷,原因如下:1.上述校准缺陷计算过程基于轴承的双脉冲现象,而在轴承故障早期,该现象通常难以捕捉,因此该方法仅在缺陷扩展到一定尺寸后才具有较高精度;2.计算标定缺陷的成本较大,对轴承每一时刻计算标定缺陷是不切实际的,也是不合理的;3.计算每个轴承时刻的标定缺陷是不现实的,也是不合理的。3.3 基于双向长短期记忆网络的实时映射 为增强物理实体与孪生实体之间的交互性,加快信息交互速度,考虑到缺陷尺寸的增长是一个连续过程,且某一时刻的缺陷尺寸与其前后状态相关联,本文提出采用双向长短期记忆网络建立虚实空间之间的关联。该关联基于神经网络优异的学习能力,可接收轴承实时振动信号,通过训练后的神经网络输出孪生模型的实时缺陷尺寸,并反馈给真实轴承,为其RUL预测提供指导。 由于缺陷尺寸也可视为一维特征,为实现最优关联效果,需选择合适的特征进行映射。均方根值受噪声影响较小,且能有效描述动态响应的大小,因此本文选择均方根值作为缺陷映射的特征。具体步骤如下:(1)通过3.2节的两阶段模型更新,获取轴承全生命周期缺陷尺寸;(2)计算轴承全生命周期的均方根值;(3)以均方根值为输入、全生命周期缺陷尺寸为输出,训练双向长短期记忆网络;(4)将轴承实时均方根值直接输入模型,得到实时映射的缺陷尺寸。 4 动态图神经网络为将孪生模型的退化特征更好地融入真实轴承的RUL预测,考虑到图卷积网络(Graph Convolutional Networks, GCNs)能够捕捉特征间的关联关系,且聚合该关联关系可提高轴承RUL预测的准确性,本文提出一种考虑双关联的动态图卷积网络(Dual correlation dynamic graph convolutional network, DC-DGCN)。基于DGCN的轴承RUL整体流程如图6所示,该网络主要包括三部分:真实轴承特征提取与孪生轴承特征映射、动态空间关联提取、时间关联提取。首先,通过与真实轴承交互得到最优全生命周期孪生模型,并将真实轴承特征与孪生模型缺陷特征融合;然后,划分时间步数据,构建动态空间关联图以提取融合特征通道的动态空间关联,并将其输入带有门控循环单元(Gated Recurrent Unit, GRU)的DGCN模块,提取双关联特征;最后,通过全连接层输出轴承RUL。图6 DC-DGCN模型的框架4.1 GCNGCN可聚合具有关联信息的相邻节点,以更好地表示节点特征。图的结构可定义为 ,其中 表示节点的特征信息, 为节点数量(即特征数量), 为特征维度(即时间步长度), 表示节点之间的连接关系, 表示节点间关联的邻接矩阵。本文采用余弦相似度定义节点间的相似度矩阵,余弦相似度矩阵 中的元素 可通过式(19)计算,其中 为第 个轴承第 次采样数据第 行的特征, 为向量的二范数: 对余弦相似度矩阵 的元素应用式(20)定义的函数 ,可得到邻接矩阵 的元素 ,其中 为人工定义的阈值。 表示在时间关联图中两个时间节点无边线连接,即无时间关联性; 表示在时间关联图中两个时间节点有边线连接,即存在时间关联性。 计算空间关联邻接矩阵,并将其与输入特征矩阵结合。GCN模型将在傅里叶域构建图滤波器,该滤波器可作用于图节点,聚合一阶邻域特征,从而捕捉节点间的关联信息。归一化图拉普拉斯矩阵定义如式(21)所示: 其中, 为度矩阵, , 为单位矩阵。GCN模型的信息传递过程可表示为式(22): 其中, 为带有自环的邻接矩阵(即在原始邻接矩阵中加入自连接), 为第 层的可训练权重矩阵, 为ReLU激活函数, 为第 层的输入(当 时, , 为输入特征矩阵)4.2 DGCN由4.1节可知,GCN通过聚合相邻节点能够很好地捕捉特征间的空间关联,但仅依靠GCN无法获取特征间的时间依赖关系(即时间关联)。因此,本文设计DGCN模块,以同时获取融合特征通道的时空关联,并将其用于RUL预测。 图7展示了动态图卷积网络模块的结构,其中 为时刻 的输入, 为隐藏层状态, 、 、 分别为细胞状态、更新门和重置门。 图7 DGCN模块的构建 该模块的具体计算过程可表示为式(23),其中 为Sigmoid激活函数, 为图卷积网络处理过程, 和 分别为可训练权重矩阵和偏置: 综上,该模块在保留有效历史信息的同时,能够捕捉当前时空域的关联关系,因此其隐藏层同时包含融合特征通道的时间关联和空间关联信息。5 模型有效性验证为验证本文所提模型的有效性,本节采用公开数据集进行实验。所有实验均在搭载I7-11800H@2.30 GHz处理器和NVIDIA GeForce RTX 3090显卡的服务器上运行,RUL预测算法采用Pytorch框架实现。5.1 数据集描述采用XJTU-SY数据集的轴承退化数据验证所提两阶段动态更新DT模型的有效性,实验平台如图8所示。该数据集提供了15个轴承在三种不同工况下的全生命周期数据,表1列出了三组轴承的详细信息,采样间隔为1分钟,每个样本采样时长为1.28秒,采样频率为25.6kHz。 图8 XJTU-SY轴承实验台 表1 XJTU-SY数据集中轴承的工况 表2列出了实验轴承的实际参数,为最小化孪生模型与真实轴承的差异,将孪生模型的动力学参数设置为实际值。 表2 实验轴承的主要参数 XJTU-SY数据集每个样本包含32768个采样点,为便于观察和分析,每次仅使用总采样点中的10000个数据点优化孪生模型的动态参数。动态仿真参数如表3所示。采用上述动力学参数在Simulink中进行仿真,并在Matlab中使用ode45求解器执行后续多目标优化。 表3动态仿真的主要参数 5.2 孪生模型有效性验证 孪生模型的动态响应如图9所示,其与真实信号的包络分析对比如图10所示。可以看出,由于局部缺陷的存在,孪生模型的动态响应具有明显的周期性。由于外圈缺陷位置固定,产生的冲击信号间隔均匀,滚动体经过缺陷产生冲击的周期 ( 为外圈故障特征频率)。结合实验轴承的实际参数,通过式(24)可计算出其外圈故障特征频率为108Hz。由图10可知,孪生信号与真实信号的包络信号基本一致。由于真实轴承运行环境中存在噪声,其动态响应表现出不规则性,且振幅略大于孪生信号;相比之下,孪生信号更为规则。仿真数据的包络谱清晰地显示出轴承故障特征频率及其倍频,与真实轴承的包络谱差异极小。因此,可认为该孪生模型能够在一定程度上反映真实轴承的运行状态。 其中, 为滚动体数量, 为轴承旋转频率, 为滚动体直径, 为轴承节圆直径, 为轴承接触角。 图9 时域孪生信号 图10 实际信号与孪生信号的包络分析对比:(a)包络信号,(b)包络谱5.3 两阶段动态更新模型验证 DT的关键过程是与物理空间的实时交互。为使孪生模型更准确地反映轴承的实时健康状态,采用两阶段孪生缺陷尺寸更新来跟踪真实缺陷尺寸。 5.3.1 多目标优化求解 在验证孪生模型有效性后,利用真实轴承的动态响应对其进行两阶段动态更新,以获取最优全生命周期缺陷尺寸。本节选择XJTU-SY数据集的Bearing1_1和Bearing1_3作为测试对象,通过两阶段更新得到两个轴承的全生命周期缺陷曲线,用于后续实时映射。 多目标优化后得到的第一阶段轴承缺陷曲线如图11所示,每个时刻对应的不同缺陷尺寸为此时多目标优化求解得到的帕累托最优解。 图11 多目标优化结果:(a)Bearing1_1,(b)Bearing1_3 对每个时刻得到的缺陷尺寸取平均值,得到基于多目标优化的轴承第一阶段全生命周期缺陷尺寸曲线,如图12所示。 图12第一阶段的缺陷尺寸:(a)Bearing1_1,(b)Bearing1_3 5.3.2 校准缺陷尺寸计算 获取第一阶段轴承缺陷尺寸后,计算校准缺陷尺寸并进行第二阶段更新至关重要。文献研究表明,仅当轴承动态响应表现出明显的双脉冲现象时,该计算方法才具有较高精度。从第一阶段轴承缺陷尺寸曲线可以看出,Bearing1_1在78分钟时动态响应发生较大变化,可认为此时轴承缺陷尺寸已满足产生双脉冲现象的条件。因此,计算78分钟后的多个缺陷尺寸,对第一阶段轴承缺陷曲线进行更新;Bearing1_3采用类似方法进行推断和计算。表4列出了Bearing1_1的计算校准缺陷尺寸及其对应时刻的第一阶段缺陷尺寸。 表4 Bearing1_1的高精度校准缺陷 采用式(18)对第一阶段缺陷曲线进行修正,得到第二阶段更新缺陷尺寸,如图13所示。观察图13可知,第一阶段得到的轴承缺陷曲线能够大致跟踪整体趋势,但在轴承故障后期,多目标优化算法得到的缺陷尺寸曲线与两阶段更新后的曲线存在一定差异。原因是在缺陷较大的时间段内,轴承动态响应的不稳定性更强,导致缺陷匹配出现误差。两阶段校准缺陷可指导第一阶段缺陷曲线进行再次更新,从而得到高保真的轴承全生命周期缺陷曲线。 图13 二阶段更新过程:(a)Bearing1_1,(b)Bearing1_3 5.3.3 全生命周期缺陷尺寸验证 为进一步验证两阶段更新得到的全生命周期缺陷尺寸的有效性和准确性,将其与最新研究成果进行对比,包括Li等[27]提出的多尺度故障演化DT模型、Shi等[32]提出的新型DT模型以及Qin等[38]提出的基于CycleGAN的DT模型。需说明的是,为便于对比,对部分相关文献的缺陷尺寸曲线进行了处理,但保留了其主要趋势和特征。对比结果如图14所示,可以看出,两阶段更新后的全生命周期缺陷尺寸曲线与其他相关文献的曲线趋势基本一致,验证了本文所提DT模型的有效性。由于本文采用多目标优化拟合第一阶段曲线,缺陷尺寸曲线的性能更稳定,有利于后续RUL预测。 图14 缺陷尺寸的对比 5.4 缺陷尺寸实时映射 本节选择Bearing1_1数据的80%作为双向长短期记忆网络的训练集,剩余20%的Bearing1_1数据及Bearing1_3数据作为测试集,以验证缺陷曲线的准确性和模型将振动特征实时映射到缺陷尺寸的有效性。 本文设计的双向长短期记忆网络在输出时仅分别获取前向和后向部分的最后一步结果。通过调整隐藏层维度确定最优配置,实验表明隐藏层维度对预测结果的影响较小,因此将隐藏层维度设置为10,在保证预测性能的同时平衡参数数量。此外,采用Adam优化器对模型进行优化。 模型的映射效果如图15所示,可见映射曲线与两阶段更新得到的缺陷尺寸曲线差异极小,验证了映射模型的有效性,该模型能够很好地将真实轴承的动态响应映射到孪生模型的缺陷尺寸。这种实时映射能够以优异的实时性和准确性揭示轴承振动信号与运行缺陷尺寸之间的关系。随后,采用训练后的模型获取轴承的实时运行状态,并将该信息融入RUL预测。 图15 基于Bi-LSTM的缺陷尺寸映射:(a)Bearing1_1,(b)Bearing1_3 5.5 基于数字孪生的剩余寿命预测 上述小节从时域、包络谱等方面验证了DT模型的有效性,并通过两阶段更新校准了轴承的全生命周期缺陷尺寸,训练得到性能较优的映射模型。为实现整体DT框架的实时交互目标,本部分将模型映射得到的缺陷尺寸作为特征加入RUL预测,并通过与其他先进预测方法对比,验证所提方法的优越性。 5.5.1 超参数设置 在本节的RUL预测实验中,共提取8个时域特征、11个频域特征和8个时频域特征。其中,8个时域特征包括方差、峰度、熵、最大最小值、峰峰值、偏度、均方根和标准差;频域特征通过对原始信号进行快速傅里叶变换提取,包括中心频率、平均频率、最大振幅、最大功率谱密度、平均功率谱密度、功率谱密度方差、偏度、峰度、频率标准差、频率分布不对称系数和频率分布峰度;时频域特征通过采用Daubechies小波基函数进行三层小波包分解得到,8个特征分别对应不同子带的能量占比。研究表明,这些特征在轴承RUL预测中具有有效性[37]。 所提模型的超参数包括隐藏层维度和时间步长:时间步长设置过小时,门控模块难以有效捕捉时间信息;时间步长设置过大则会导致模型参数过多,延长训练过程,因此将时间步长推荐范围设置为20-35。隐藏层维度决定模型的信息记忆能力,设置范围为2-10。通过网格搜索法优化,综合考虑预测性能后,最终确定时间步长为30,隐藏层维度为6。 5.5.2 实验设计和结果 基于XJTU-SY数据集设计三组RUL预测任务,以验证所提方法在不同工况下的有效性,具体配置如表5所示。 表5 预测任务的具体设置 本文采用故障预测与健康管理领域广泛使用的均方根误差(Root mean square error, RMSE)和平均绝对误差(Mean square error, MAE)作为评价指标,衡量模型预测水平。这两个指标反映真实值与预测值之间的平均偏差,数值越小表示预测准确性越高。其中,均方根误差对异常值更敏感。此外,设计Score指标评价模型预测精度,该指标对预测值与真实值的差异高度敏感,且当真实值大于预测值时Score会显著增大,这一特性更符合实际需求。指标计算公式如下: 其中, 为测试样本数量, 为第 个样本的真实值, 为第 个样本的预测值。为验证本文获取的映射缺陷尺寸的有效性,将实验分为两种场景:S2表示仅提取上述特征;S1表示在提取上述特征的基础上加入全生命周期缺陷尺寸。 在对比模型选择方面:首先选择仅提取原始特征序列时间特征的时间卷积网络(Temporal Convolutional Network, TCN);其次,为验证图神经网络特征提取的优越性,选择两种具有空间提取能力的模型——卷积门控循环单元(Convolutional GRU, ConvGRU)和卷积长短期记忆网络(Convolutional LSTM, C-LSTM),这两种模型既能提取时间特征,又能利用卷积神经网络提取空间特征;最后,选择图卷积网络(GCN)进行对比,以验证所提模型在双关联特征提取方面的优越性。此外,为更好地体现所提模型的优越性,选择文献[20]中的ChebGCN-LSTM模型进行对比,该模型将特定时刻的特征序列作为节点特征,以时间顺序作为节点间连接的判断依据,并采用长短期记忆网络获取时间依赖关系。 训练过程采用Adam优化器,批大小设置为32,学习率设置为0.001,损失函数选择均方误差。 各模型在两种场景下的预测结果如表6和表7所示。场景S2的对比数据表明,所提方法的预测准确性总体优于其他模型:其平均均方根误差比表现最优的对比模型ConvGRU低0.011,这得益于图神经网络提取的关联关系能够更有效地揭示轴承退化过程,最终提高RUL预测准确性;此外,所提模型的均方根误差比标准图卷积网络和ChebGCN-LSTM分别降低0.026和0.013,表明双关联提取考虑了更广泛的特征信息,验证了所提模型的优越性。同时,同时提取时间和空间特征的模型比仅提取时间特征的模型表现出更优的预测性能。 综合场景S1来看,时间卷积网络在加入全周期缺陷尺寸作为特征后,预测性能未得到显著提升,表明仅提取时间特征的模型难以将实时缺陷尺寸很好地融入RUL预测;而ConvGRU、ChebGCN-LSTM和C-LSTM在加入该特征后,预测性能均有不同程度提升,总平均均方根误差分别降低0.11、0.10和0.12,验证了所提两阶段更新DT模型的有效性——通过映射得到的实时缺陷尺寸可提高模型的RUL预测能力。所提方法在S1场景下的平均均方根误差比S2场景降低0.020,降幅显著,表明与采用卷积神经网络进行空间特征提取相比,所提方法能更有效地提取实时缺陷特征与其他特征之间的关联关系。值得注意的是,所提模型的均方根误差降幅大于ChebGCN-LSTM,这得益于动态图的构建,使模型能够更有效地跟踪轴承退化趋势,获取适应性更强的关联信息。 表6 不同场景下各模型的RMSE值 表7 不同场景下各模型的MAE值 Score指标对比如图16和图17所示,可见所提模型的Score值最低,表明其预测精度最高,预测结果更有利于指导实际工作。尽管ConvGRU的均方根误差表现较好,但在Score指标上表现较差,说明其预测曲线难以很好地应用于实际场景。 图16 场景S2的Score值 图17 场景S1的Score值为进一步验证所提方法的有效性,图18和图19分别展示了部分轴承在场景S2和S1下的RUL预测结果曲线。可以看出,大多数模型在整体趋势上能够反映轴承退化过程,但时间卷积网络的预测精度未能达到理想效果;与仅提取时间关联的模型相比,同时提取时空关联的模型表现出更高的准确性;且在加入全寿命缺陷尺寸作为特征后,各模型的预测曲线更接近实际寿命曲线。在两种场景下,动态图卷积网络均能比其他模型更好地跟踪轴承退化趋势,具有更优的RUL预测能力。 两种场景的对比表明,动态图卷积网络在加入实时缺陷尺寸后,预测曲线的改善更为明显,说明所提方法通过融合缺陷尺寸特征,有效捕捉了轴承的整体退化特征,提高了轴承RUL预测的准确性,尤其在轴承寿命后期效果显著。这对RUL预测至关重要,因为轴承寿命前期的RUL通常无需过多关注,而准确的寿命后期RUL预测能够帮助提高设备可靠性,减少因突发故障造成的损耗。 此外,需注意的是,所提方法在部分轴承的预测中,加入缺陷尺寸特征后预测效果未得到显著提升,推测原因是这些轴承在运行过程中未出现明显的外圈缺陷,而本文构建的孪生模型仅描述了外圈的缺陷扩展过程。 为更清晰地说明所提方法的有效性和优越性,对比所提模型在两种场景下的预测结果,图20给出了部分轴承在两种场景下的预测曲线及误差大小。场景S1的模型预测精度更高,在预测后期的误差小于场景S2。这一优势源于动态图卷积网络能够有效利用全生命周期缺陷尺寸,且模型捕捉的关联关系显著提升了RUL预测性能。 图18 场景S2下各模型的预测曲线:(a)Bearing1-3,(b)Bearing1-4,(c)Bearing2-4,(d)Bearing3-3 图19 场景S1下各模型的预测曲线:(a)Bearing1-3,(b)Bearing1-4,(c)Bearing2-4,(d)Bearing3-3 图20 所提模型在两种场景下的对比6 总结针对当前轴承RUL预测未考虑运行实时健康状态的问题,本文提出一种DC-DGCN轴承RUL预测方法。首先,通过构建含局部缺陷的孪生动力学模型来模拟真实轴承的运行过程,并采用第一阶段多目标优化方法实时更新孪生模型参数,使孪生模型生成的信号与真实轴承的动态响应更加吻合。在获取轴承全生命周期缺陷尺寸后,通过第二阶段校准进一步优化缺陷尺寸,并引入Bi-LSTM建立实时映射关系。最终,结合从DT中获取的缺陷尺寸特征,利用所提出的双关联动态图卷积网络实现轴承RUL预测。实验结果表明,本文提出的动态孪生模型能够更准确地复现真实轴承的运行状态;在双关联动态图卷积网络的作用下,通过两阶段更新获取的缺陷特征显著提升了轴承RUL预测的准确性。此外,实验验证表明,本文所提方法的性能优于其他先进模型。该模型将实时健康状态监测与先进数据分析技术相融合。随着人工智能技术的不断发展,该模型可进一步融入智能决策系统,实现设备的自动化维护与故障预警,有望为工业制造等领域的智能化转型提供重要支撑。 编辑:陈宇航校核:李正平、陈凯歌、曹希铭、赵学功、白亮、任超、海洋、赵栓栓、陈莹洁、Tina、王金、赵诚、肖鑫鑫、张优该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈