论文题目:An Outline of Prognostics and Health Management Large Model: Concepts, Paradigms, and Challenges
论文期刊:Mechanical Systems and Signal Processing
论文日期:2025年
作者:
摘要
1 引言
2 系统分析:当前PHM领域面临的挑战和瓶颈
2.1 分析和描述:生命周期中PHM的问题
2.1.1 第一阶段:概念设计阶段
2.1.2 第二阶段:初步设计阶段
2.1.3 第三阶段:详细的设计阶段
2.1.4 第四阶段:研制阶段
2.1.5 第五阶段:在役使用阶段
2.2 PHM面临的挑战和瓶颈
2.2.1 PHM算法&模型层
2.2.2 PHM系统层
2.3 小结
3 大模型研究现状及优势特点分析
3.1 大模型综述
3.1.1 大模型原理
3.1.2 大模型优势分析
3.1.3 大模型成熟案例
3.2 大语言模型综述
3.2.1 大语言模型原理介绍
3.2.2 大语言模型关键技术
3.2.3 大语言模型优势分析
3.2.4 大语言模型的案例
3.3 小结
4 健康管理大模型概念与进阶研究范式
4.1 健康管理大模型概念
4.2 范式一:基于大语言模型的健康管理范式
4.2.1 路线1:基于大语言模型与知识图谱的健康管理知识工程
4.2.2 路线2:基于大语言模型的诊断专家
4.2.3 路线3:PHM算法模型辅助开发
4.2.4 路线4:PHM文字方案生成
4.2.5 路线5:基于大语言模型的维修决策支持
4.3 范式二:大语言模型与健康管理模型并行范式
4.3.1 路线1:知识与数据融合的PHM技术
4.3.2 路线2:PHM算法智能推荐
4.3.3 路线3:PHM算法模型逻辑性支撑
4.3.4 路线4:PHM算法模型智能优化更新
4.4 范式三:健康管理大模型构建与应用范式
4.4.1 健康管理大模型构建
4.4.2 路线1:智能装备全流程PHM设计
4.4.3 路线2:智能PHM数据生成
4.4.4 路线3:智能PHM能力生成
4.4.5 路线4:复杂系统PHM解决方案生成
4.4.6 路线5:智能PHM验证评价
4.5 基于PHM-LM范式的实践案例
4.5.1 案例一:基于LLM的轴承故障诊断框架
4.5.2 案例二:基于LLM模型的轴承剩余使用寿命预测
4.5.3 案例三:基于LLM模型的领域自适应维护方案生成
4.6 小结
5 PHM-LM面临的挑战
5.1 跨领域、多模态的PHM-LM基础数据集构建
5.2 多模态健康信息的统一表达架构
5.3 多能力、可扩展的健康管理大模型结构设计
5.4 特定对象的健康管理专属能力向通用全科健康管理能力的转化
5.5 大模型健康管理输出结果的可解释、可溯源性
5.6 基于大模型的通用化PHM方法与现有专用式方法的协同
5.7 兼顾数据隐私与共享的健康管理大模型分布式隐私训练
5.8 关键挑战的优先级分析
6 结论
(以上标记章节为本文内容)
精准诊断轴承故障对维持旋转机械高效运行至关重要。然而,由于应用环境的多样化,传统诊断方法面临着跨工况适应性不足、小样本学习困难以及跨数据集泛化能力有限等挑战。这些难题制约了现有方法的有效性,限制了其应用范围。大语言模型为提升诊断模型泛化能力提供了新的可能,但如何将大语言模型与传统诊断技术深度融合以实现最优泛化效果,仍是当前待探索的研究方向。
基于范式一,以大语言模型为核心的故障诊断专家研究思路,我们针对轴承泛化性问题开发了典型应用案例,并成功展示了卓越的泛化效果。为解决前述挑战,我们提出了一个基于大语言模型的轴承故障诊断框架。首先,我们创新性地提出了信号特征量化方法,通过融合时域与频域特征提取技术,并建立在统计分析框架之上,有效解决了振动数据语义信息提取的难题。
本研究构建了故障诊断特征体系,并提出基于LoRA与QLoRA的振动数据模型精调框架,如图4.18所示。该故障诊断特征体系系统化识别并整合关键故障指标与参数,构建了能有效捕捉设备运行状态与潜在故障信号的综合特征系统。模型精调框架引入了基于时序数据的大语言模型精调新策略,通过优化超参数平衡时间效率与预测精度,从而增强了模型在实际应用中的性能与适应性。最终通过单数据集、跨工况及跨数据集诊断实验,对比了完整数据迁移与有限数据迁移的效果。结果表明,基于大语言模型的故障诊断方法能够有效增强故障诊断的泛化能力,满足跨工况、小样本与跨数据集的实际工程需求。
图4.18 案例一:基于LLM的故障诊断框架
该方法有效提升了故障诊断的准确率,并增强了模型的泛化能力。案例研究表明,所设计的框架在三种泛化任务中均展现出良好的适应性。因此,在跨数据集学习后,诊断准确率实现了约10%的提升。
为验证所提出范式一的有效性,我们开展了基于大语言模型的旋转机械剩余使用寿命预测案例研究,如图4.19所示。本研究旨在利用旋转机械寿命退化数据集,结合经典可靠的精调方法,使开源大语言模型能够适配该预测任务。通过该方法,大语言模型在保持其学习与推理能力的同时,可实现对旋转机械振动数据的分析并输出准确的剩余使用寿命预测值。
图4.19 案例二:用于轴承剩余使用寿命预测的LLM模型
在方法论层面,我们实现了三项关键创新。首先,通过对振动信号特性整合信号分析与处理技术、位置编码及标记化方法,我们对大语言模型的输入层进行了针对性适配优化。其次,我们采用选择性精调策略——通过观察发现不同神经网络层呈现功能分化特性,为最大限度保留模型固有能力同时确保灵活迁移至RUL预测任务,仅对特定网络层进行精调。第三,我们完成了输出层的结构性改造,将其调整为生成序列化长期数值输出,而非自然语言形式的概率分布建模。
实验结果表明,我们提出的LM4RUL方法在长期RUL预测精度方面显著超越常见深度学习模型及针对性迁移学习模型,展现出更优异的泛化能力。具体实验成果详见我们同期发表的研究论文。
随着智能设备的普及应用,设备的维护维修工作日益重要。传统交互式电子技术手册存在信息检索效率低、逻辑结构复杂等问题,难以满足智能化系统需求。为此,本文提出一种基于大语言模型的维护方案生成方法(LLM-R)。
为验证该方法的实际效果,我们聚焦于维护方案生成任务。通过混合数据的监督微调,增强大语言模型在垂直维护领域的适应性,并创新性引入任务级智能体与指令级检索增强生成技术,以优化维护方案生成流程并减少幻觉现象。其架构如图4.20所示:用户输入维护需求后,LLM-R首先进行相关信息过滤;随后由智能体1执行任务解析与选择;智能体2负责工具调用与信息检索;最终由智能体3完成维护方案的优化生成。在技术实现层面,我们选择R=8的参数进行模型精调,构建了专业维护方案数据集,并以航空与海事维护典型场景作为测试案例,验证LLM-R在复杂任务环境下生成智能维护方案的能力。
图4.20 案例三:基于LLM模型的领域自适应维护方案生成
实验结果表明,针对复杂维护任务,LLM-R生成的维护方案准确率达到91.59%。具体而言,在航空领域当某型飞机发动机无法启动时,维护人员通过自然语言描述故障现象即可快速获取故障排查步骤与解决方案,显著提升了维护效率与准确性。在船舶维护任务中,该方法在样本数据有限的条件下仍能生成高效可靠的维护方案,展现出强大的泛化能力。通过上述案例研究,我们验证了LLM-R方法在实际维护任务中的应用价值,为智能维护技术的发展提供了新路径。
本节提出了PHM-LM的三大范式,并结合典型PHM场景给出了可行的技术路线。这些路线一方面通过发挥大模型的优势与能力改进和优化现有技术能力,另一方面为突破PHM领域当前无法解决的技术瓶颈提供了途径。文末提供了三个案例验证。在下一节中,我们将分析PHM-LM落地实施过程中的关键挑战,并补充PHM-LM范式实践中需要考量的风险因素。
健康管理大模型是健康管理垂直领域的行业大模型,因此在发展健康管理大模型若干技术路径和应用部署时,不可避免地会遇到AI大模型面临的技术挑战。研究报告指出,大模型厂商需要在技术、生态、AI治理等方面应对AI大模型发展的多重挑战,包括算力需求大、训练成本高昂、数据质量不佳、算法可解释性差和AI伦理安全问题等等,这些也是企业的关键成功因素。
构建健康管理大模型时会遇到大模型发展遇到的共性问题,主要体现在效率、部署、训练规则等方面,同时也会面临不同于通用大模型和其它行业领域大模型的特异性问题。图5.1展示了健康管理大模型在未来发展过程中可能会遇到技术难点,下面将展开阐述。
图5.1 PHM-LM的技术挑战梳理
庞大的数据集支撑是任何大模型构建时的重要要素。健康管理大模型所使用的数据集具有跨领域、多模态、大规模等显著特点。一方面,使用传统方法开展PHM相关工作时,除PHM技术知识外,会同时交叉涉及对象物理机理、性能指标分配、信号数学处理、系统控制设计等多领域技术手段,因此仅狭义健康管理领域数据,并不能满足构建这一垂直领域大模型的资源需要。另一方面,健康管理领域数据涉及多类模态。具体而言,数据方面,包含缓变数据特点的温度、压力等数据,具有高频动态变化特点的振动数据,语音数据等,即传感器数据;知识方面,包括维护维修方面的文本知识、条款、规则,FMECA、FTA等故障知识,以及其他存储形式的知识如已知的物理规律等;案例方面:类似于医学病例,PHM领域包含各对象诊断、预测在特定场景下的经典案例,这些案例存在的形式和样式也各有不同。
因此,收集的数据应当覆盖各种领域装备对象、各种任务应用场景和各种模态资料信号等,并不断补充和丰富以支持大模型微调和对齐。然而,根据模型大小、数据大小和总计算量的参考比例,大模型的数据库体量至少应该在7B级及以上。在多模态、跨领域数据的限制及需求下,获取如此大规模的健康管理领域数据会遇到隐私性、特异性等问题,如限于行业壁垒而难以获取,特定对象的特定能力数据存在很大差异,进而由于隐私、特定对象、特定功能、特点条件等的综合影响导致分散性的出现。在健康管理领域尚缺少成熟的公开数据集及API的情景下,如何获取基础数据集是一大难题。
PHM领域健康信息表达形式的显著特点是多模态。上面提到,健康管理领域的多模态内涵包括数据、知识、案例三个方面,并且现有大语言模型通常将输入信息转化为向量格式存储与使用,这也符合计算机运算的底层逻辑。大语言模型就是将语料或文本根据token划分转化,如GPT-4用向量格式支撑NLP预测和奖励模型的标签,这样的架构不仅能够统一数据的表达格式,便于简化模型和提高运算效率,更能够帮助囊括更多模态,提高模型生成能力和迁移、泛化能力。面向健康管理大模型健康信息多模态的特点,统一表达架构是必要且有益的。在实际操作时,可以沿用现有大模型较为成熟的向量转化策略,这就将涉及到将健康管理领域特色多模态信息统一转化表达的相关技术手段。现有研究在多模态处理上仍处于探索阶段。针对除文本型以外的第二模态的处理上,大语言模型一般采用将第二模态适配到(Adaptor)文本型模态、或针对第二模态重新标记并输入扩展降维向量化层等改造方案。健康管理大模型的多模态信息借鉴技术手段还是创新多模态统一表达架构,是大模型构建中必须面临的问题。
在构建健康管理行业垂直领域大模型时,本文根据多种预期能力设计了多条技术路线,而这些能力的实现在预期情况下都应基于健康管理大模型的基础架构。因此,构建健康管理大模型时应充分考虑和提前规划诊断、预测、评估等多能力实现要求和在线监测、维修保养等多业务需求。理想的健康管理大模型结构应该在支持设计能力的基础上具备扩展能力,以适应规划之外的更多用户需求,结合技术发展不断更新调整。为达到上述目标,需要在结构设计和搭建阶段从多模态数据表达、模型使用、训练推理、指令微调、人工提示等多方面融入多能力生成需求,力图使结构底层基座通用化、模态理解能力广泛化、推理应用算法模块化、输入输出接口规范化等。从健康管理大模型实现角度出发,也需要考虑选择合适的基础架构,以减少对算力的依赖。
由于健康管理的特殊性,在健康管理大模型构建和能力生成过程中,必将经历从对轴承、机电系统等特定产品对象的特定能力(诊断、预测等能力)向多层次对象的全任务能力跨越发展。例如,借助大模型的涌现与泛化能力优势,可建立轴承故障诊断大模型,具备针对轴承故障诊断需求和强泛化能力。在此基础上,可以向对所有多层次对象的全科健康管理能力转化,其中的多层次对象包括如轴承、齿轮、作动、惯组等同层次的设备对象以及像飞机、卫星、船舶等甚至是星网、体系网络等集群层次对象。
而这一过程的实现,需要在大模型构建的各个步骤解决相关问题,而其泛化能力的体现主要依赖预训练和微调阶段。仍以轴承为例,在预训练阶段,通过大规模健康管理领域资料,大模型能够学习到轴承故障诊断的内在感知、隔离和判定的逻辑,进而泛化到轴承的评估和预测等能力,以及其他更多对象的健康管理能力。但预训练后的模型不具备推理能力,需要进一步让AI更充分地理解轴承和同层次其它对象甚至是集群层次对象的差异与联系,更合理地通过诊断学习到全科健康管理能力,这便是需要突破的技术问题。
目前研究界尚且缺乏对大模型优越能力的关键因素进行深入、详细的研究调查,因而健康管理大模型在构建后也难以了解模型能力的来源途径。AI伦理问题有待研究界探索,但使用黑盒原理的生成结果,在应用于重要装备时的有效性始终存疑。目前的解决方案是增加人类监督和专家评估,而未来全自动化PHM生成任务的输出结果的可溯源性将引起关注。
另一方面,健康管理大模型作为AI助手,其能力产出不能保证与人类偏好和价值观一致,即使具有出色的能力,在比较严重的情况下,也仍可能产生有害、虚构或有负面影响的内容。比如,幻觉现象是指(Hallucination)生成的信息与现有来源相冲突(内在幻觉)或无法通过现有来源验证(外在幻觉),导致大模型生成看似合理实际完全不符合装备特性的输出,这样的结果是灾难性的。
大语言模型领域,InstructGPT设计了有效的微调方法,其中包括基于人类反馈的强化学习技术,通过提供人类指令提高LLM在未见任务上的泛化能力。在健康管理大模型上,强化学习技术也是可用的,但是如何增强AI助手的产出可解释性是大模型研究界长期面临的挑战。
本文所讨论的三种范式涉及了文字生成、方案生成、能力生成、知识管理、算法推荐、辅助开发、验证评价等功能,可形成基于大模型的通用化PHM系列方法,而现有专用式方法以专家经验、业内规范、人工代码开发、人工试验验证等非AI手段为主。健康管理大模型固然在智能化、通用化、生成能力上优势明显,但研究表明,大模型在某些领域获得出色时,可能在其它领域受阻。新旧知识发生冲突时,NLP的灾难性遗忘问题就凸显出来;“幻觉”现象对于GPT来说也是一大难题,在健康管理领域应用便存在输出有害结论和恶劣后果的隐患。在特定的装备、工况及业务需求下,生成能力的专业性会受到限制;在重要任务上,能力产出可能与专家知识相去甚远,严重危害装备剩余寿命和人员使用安全。因此,在通用化PHM方法出现之后,现有专用式方法也应当保留,并使二者协同并行。在训练层面,可不断用专用知识来对齐微调大模型,聘用专家人员通过指令遵循使大模型学习特定设备和场景下推理方式,使专用式方法融入通用化模型训练,不断接近预期结果;在应用层面,也不应完全依赖通用化PHM方法的输出结果,而应该在通过验证评估后投入方案实施。
前文提到,鉴于健康管理数据的隐私性、分散性等特点,需要整合健康管理领域业内广泛的资源和数据,这一过程涉及到分布式训练,进而涉及到数据隐私的问题。将健康管理大规模数据集中由同一机器训练时,会遇到数据隐私安全上的约束。联邦学习(FL)是一种机器学习框架,是指将分散的训练数据分配给许多客户机,这些服务器在中央服务器的协调下一起协作训练同一模型的训练方式,体现了集中收集和数据最小化的原则,以此减轻系统性隐私风险和成本。健康管理大模型应用联邦训练方式即可在保障数据合法合规的基础上,实现数据共享和共同建模,这样也为大模型投入应用后的实施效果提供保障。然而,健康管理大模型使用联邦学习训练,在实际应用中面临一些技术挑战,如客户机在存储、计算和通信能力上存在异构性,各个客户机的本地数据可能不是独立同分布,各个客户机根据其应用场景不同存在模型异构性问题,可能遭到黑客攻击导致隐私泄露等等。由于联邦学习技术仍处在起步阶段,需要进一步探讨将其作为健康管理大模型的训练框架的合理性及涉及问题的解决方案。
(1)数据可用性和质量是主要挑战
数据是PHM-LM发展的基础。若缺乏充足优质的多模态数据,模型训练与优化将无从谈起。PHM领域的数据收集受到隐私限制、行业壁垒与数据碎片化的制约。解决这一挑战是后续发展的先决条件——无论其他技术方案如何完善,若没有足够的数据支撑,模型的可靠性与适用性都将无法保证。因此,数据问题必须作为首要解决任务。
(2)可解释性与可追溯性直接决定应用安全
在关键应用场景中,PHM-LM的输出必须具备高度的可解释性与可追溯性。这不仅是技术完善的要求,更是实现安全应用的底线。若模型的输出结果无法被理解或验证,其在真实工业环境中的应用将受到严重限制。因此,模型透明度相关的挑战在优先级上紧随数据问题之后,因其直接关系到模型的安全性与可信度。
(3)通用方法与专用方法的融合决定适用性
PHM-LM必须在通用能力与专用能力之间实现平衡。若无法实现有效融合,模型的通用能力在特定任务中可能反而不及传统方法,从而限制其实际应用价值。只有通过模块化训练与精调确保专用能力与通用能力相互补充,才能使模型在多样化场景中发挥最优性能。因此,这一挑战的优先级高于架构设计,因其直接决定了模型在真实应用中的适用性与有效性。
(4)可扩展架构设计保障长期竞争力
虽然架构设计对于支撑多模态数据处理与未来能力拓展至关重要,但其优先级略低于前述挑战。这是因为架构优化的影响更具长期性,对模型开发与应用的即时效果不如其他因素显著。只有在解决数据、可解释性及专业化能力融合等问题后,架构设计才能得到有效引导与实施。因此,可扩展架构虽优先级相对次要,但对保障PHM-LM的长期竞争力仍不可或缺。
为了应对现有PHM面临的挑战,并响应未来装备型号的需求,本论文在分析PHM技术发展瓶颈与调研大模型技术发展与优势后,提出了生成式多模态健康管理大模型的相关概念,并结合大模型技术优势、健康管理系统全寿命周期研制的系统工程过程、健康管理面临的问题,提出了健康管理大模型研究与应用进阶的三类典型创新范式,研究了传统大语言模型向PHM大模型整个转变过程的技术流程,提出了健康管理大模型的垂直领域应用设计,打破了传统健康管理的设计模式、研发模式、验证模式、应用模式,构建了健康管理大模型新技术体系框架蓝图和新生态圈,为实现健康管理技术从传统的定制化向通用化、从判别式向生成式、从理想化条件向实战化的跨代发展与根本变革提供重要参考和指导。
编辑:曹希铭
校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、Tina、陈宇航、海洋、陈莹洁、王金、赵诚、肖鑫鑫、张优
该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除