大模型综述分享（4） | 健康管理大模型概述：概念、范式与挑战_Mechanical_System_振动_化学

论文学习| SCI一区：融合大语言模型与领域知识图谱实现数控机床的智能故障诊断

本期推送一篇2025年发表于Engineering（中科院1区）论文，作者系统提出“大语言模型+领域知识图谱”双轮驱动的CNC故障诊断框架：构建多源知识图谱、设计KG-RAG多轮交互、引入路径权重学习机制，实验显示GGUF版Qwen2.5-7B在41个真实场景得分超越2年经验工程师，为LLM工业落地提供了可复制范式。论文链接：通过点击最左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目: Intelligent Fault Diagnosis for CNC Through the Integration of Large Language Models and Domain Knowledge Graphs论文期刊：EngineeringDoi：https://doi.org/10.1016/j.eng.2025.04.003作者: Yuhan Liu(a),Yuan Zhou(b),Yufei Liu(c), Zhen Xu(a),Yixin He(a) 论文时间: 2025年机构: a: School of Mechanical Science and Engineering, Huazhong University of Science and Technology, Wuhan 430074, Chinab: School of Public Policy and Management, Tsinghua University, Beijing 100084, Chinac: Center for Strategic Studies, Chinese Academy of Engineering, Beijing 100088, China作者简介：刘宇涵，华中科技大学机械科学与工程学院2021级博士生，属于陈吉红老师团队成员。陈吉红，华中科技大学教授、博士生导师，现任国家数控系统工程技术研究中心主任、武汉华中数控股份有限公司董事长、 “高档数控系统创新团队”国家重大领域创新团队负责人。组织和承担完成了国家重大科技攻关项目、国家重大科技专项、国家863项目、国家自然科学基金等四十余项。2009年至今，组织国家数控系统工程中心和华中数控，获得“高档数控机床与基础制造装备”国家重大专项的12项课题立项，获得中央国拨经费3亿多元。2014年，“高档数控系统创新团队”入选科技部重点领域创新团队,2016年,该团队被评为“'十二五'机械工业优秀创新团队”。获得发明专利25项、实用新型6项、软件著作权20多项；制订和起草了数控系统国家标准和行业标准11项；在国内外学术期刊和会议上发表学术论文近百篇(来源：学校官网）摘要随着大语言模型（LLMs）在处理复杂任务方面展现出越来越强的能力，它们在知识密集型工业场景中的价值也日益凸显。故障诊断作为工业领域中的关键任务，长期以来面临两大挑战：一是如何有效管理大量的经验知识，二是如何提升人机协作效率。传统的故障诊断系统主要基于专家系统，存在三大局限： 1. 故障诊断知识组织效率低； 2. 静态知识框架难以适应动态工程环境； 3. 专家知识与实时数据流难以融合。这些系统性缺陷限制了传统方法处理不确定性的能力。本研究提出了一种融合大语言模型与知识图谱（KG）的数控机床（CNC）智能故障诊断系统。首先，构建了一个综合性的知识图谱，整合多源数据以实现结构化表达；其次，设计了一个基于知识图谱的检索增强生成（RAG）框架，支持多轮交互式故障诊断，并将实时工程数据纳入决策过程；最后，引入了学习机制，实现知识的动态更新。实验结果表明，该系统显著提升了故障诊断准确率，在构建的基准数据集上，其表现超过了具有两年专业经验的工程师。通过融合大语言模型与知识图谱，本框架突破了传统专家系统在符号推理方面的局限，为工业中非结构化知识建模与动态环境适应的认知难题提供了新思路关键词：大语言模型；领域知识图谱；基于知识图谱的检索增强生成；学习机制；决策支持系统目录1 引言2 文献综述 2.1 大语言模型在垂直领域的应用 2.2 现有智能故障诊断系统研究3 方法论 3.1 系统框架 3.2 故障诊断知识图谱构建 3.3 基于大语言模型的诊断系统 3.4 学习机制4 实验结果与讨论 4.1 面向CNC系统的大语言模型基准测试 4.2 提示工程 4.3 面向RAG的知识图谱应用 4.4 故障诊断系统 4.5 讨论5 结论1 引言新一代智能制造代表了新一代人工智能（赋能技术）与先进制造系统（基础技术）的深度融合，正成为新一轮工业革命的核心驱动力[1]。大语言模型的快速发展正在加速这一变革，使其成为人-信息-物理系统（HCPS）中强化核心能力与激发创新路径的双重催化剂。大语言模型在理解、推理、内容生成和人机交互等方面表现出色，展现出在工业场景中的广泛应用潜力。然而，大语言模型在工程场景中的应用仍面临诸多挑战。工业应用对可靠性要求极高，不能容忍错误或“幻觉”现象。此外，如何融合领域知识（如技术文档、操作数据、设计原理和专家经验）仍是一个复杂问题[2]。在故障诊断领域，这些问题尤为突出。故障通常具有高度动态性，成因复杂多样，新故障案例不断涌现[3,4]。因此，如何有效融合领域知识、复杂故障场景、持续生成的新故障案例以及动态反馈信息，成为大语言模型在故障诊断应用中面临的主要挑战。故障诊断对于提升数控机床的运行可靠性与效率、实现预测性维护、延长系统寿命以及保障生产线平稳运行具有重要意义[5–7]。传统CNC系统故障诊断主要依赖经验丰富的工程师。尽管人工诊断直接有效，但耗时较长，且高度依赖个人经验，诊断效果受限于工程师的专业水平[8,9]。当系统发生故障时，往往需要较长的诊断周期，可能导致生产停滞和重大经济损失。专家系统的出现提升了故障诊断能力，使其在特定领域具备接近人类专家的解决问题能力，并能有效处理知识推理问题[10,11]。然而，专家系统高度依赖专家知识的输入，若知识更新不及时或知识库不完善，将影响推理准确性[12,13]。此外，专家系统在交互设计方面往往不够友好，非专业人员难以理解和操作。随着CNC系统与人工智能技术的不断发展，为CNC系统的智能故障诊断奠定了基础。现代传感器技术的进步使得CNC系统能够实时采集关键性能指标，如振动信号、电流信号等[14–16]。当故障发生时，系统会自动记录报警信息并传输至后台，为故障信息处理提供了良好前提。大语言模型的快速发展为CNC系统故障诊断提供了新的方法和视角。大语言模型具备强大的数据处理能力，拥有先进的语言理解与生成能力，能够高效、准确地完成语言相关任务[17]。作者认为，检索增强生成（RAG）是将大语言模型应用于垂直领域的有效方式。特别是结合领域知识库的RAG方法，能够在一定程度上缓解大语言模型的“幻觉”问题，提高垂直领域问答的准确性[18]。微软发布的GraphRAG验证了设计思路，但也认识到，通用图谱无法完全解决领域中的特定问题。在本研究中，作者首先设计了一个面向CNC系统的大语言模型基准测试，以解决模型适配性问题；其次，针对传统RAG响应准确率低、难以处理复杂任务的问题，开发了一个基于知识图谱的RAG框架，不仅解决了传统RAG的固有问题，还通过将多轮对话映射为知识图谱中的路径遍历，更好地支持多轮交互；然后，为满足不同任务需求，设计了定制化的提示工程，提升模型对用户意图的理解能力；最后，为持续提升系统在垂直领域的适用性，设计了一个基于大语言模型与专家输入的动态学习机制，使系统在实际使用中通过用户交互不断学习、优化知识图谱并提升诊断能力。最终，将整个系统集成至远程运维系统中，实现了智能化的故障诊断与维护。2 文献综述2.1 大语言模型在垂直领域的应用在垂直领域中，大语言模型的主要任务是语言理解，支持实体抽取、关系抽取和文档分类等任务[19]。这些模型已广泛应用于医疗、工业等领域[18,20]。目前，基于提示（prompt）的方法仍是主流。例如，在医疗领域，ERQA[21]、MentaLLaMA[22]、ArgMed-Agents[23]和诊断推理提示[24]等模型表现突出。此外，部分研究将大语言模型与知识图谱结合，利用知识图谱组织复杂信息，从而增强模型的适用性。在提示方法的基础上，微调（fine-tuning）也成为将大语言模型应用于垂直领域的常见方式。微调可以深化领域知识与模型的融合，在生物医学领域已有相关研究[28]。例如，Li等人[29]指出，如何有效利用领域特定数据集进行微调是关键挑战。Liu等人提出了一种将知识图谱与大语言模型微调结合的制造领域典型应用，知识图谱为微调提供了高质量数据支持。此外，部分研究探索了对大语言模型进行“底层”修改的微调方式，这在早期研究中较为常见，已被证明可提升模型在特定领域的适应性。然而，随着模型规模增大，预训练成本显著上升。因此，当前垂直领域研究更倾向于基于已有的高性能开源基准模型，通过微调或RAG方法进行适配[32]。这种方式不仅提升了模型解决领域问题的能力，也有效控制了成本。部分研究还探索了通过预训练增强领域能力的方式。预训练在早期研究中较为常见[30,31]，可提升模型在特定领域的适应性。但随着模型规模扩大，预训练成本显著增加。因此，当前研究者更倾向于基于已有开源大模型，通过微调或RAG方法进行领域适配[32]，以提升模型性能并降低成本。 2.2 现有智能故障诊断系统研究早期故障诊断系统主要基于专家系统[33,34]，但专家系统在知识更新方面存在固有缺陷。因此，数据驱动和信号分析方法成为故障诊断的重要工具[5,35]。随着机器学习和深度学习的普及，这些方法也被广泛应用于各类工业场景的故障诊断中。随着知识图谱技术的成熟，越来越多的研究开始探索基于知识图谱的故障诊断方法，典型应用包括基于知识图谱的故障诊断问答系统[38–40]。在大语言模型出现后，研究人员尝试将知识图谱与大语言模型结合，以提升故障诊断系统的智能化水平。例如，Liu等人[41]将知识图谱中的过滤信息输入大语言模型，以缓解“幻觉”问题。Guo等人[42]进一步考虑在知识图谱中进行多跳路径查找，以支持最优检索路径，从而提升故障诊断准确性。这些研究为基于大语言模型与知识图谱的CNC领域智能故障诊断系统提供了宝贵的启发与支持。3 方法论3.1 系统框架本研究提出的智能故障诊断决策支持系统如图1所示。系统主要分为三个部分： 1、数据基础阶段：构建面向CNC系统的综合性知识图谱，收集并整合与故障诊断相关的知识；同时，采用先进的数据处理技术从工程数据中提取特征，提升数据的可用性与诊断准确性。 2、基于知识图谱的诊断阶段：包括对大语言模型进行基准测试与微调，确保其性能最优；并实现模型的本地部署，保障实时响应与数据安全。在此基础上，系统采用基于知识图谱的检索增强生成技术，实现多轮问答能力，使其能够准确理解并响应复杂的诊断查询，从而提升交互效率与质量。 3、系统评估与持续演化阶段：构建了CNC系统评估数据集，用于评估故障诊断系统的性能，并采用两种学习机制实现系统的持续演化：基于大语言模型的交互内容回顾机制，以及基于专家输入的知识更新机制。图1 基于 LLM 的故障诊断决策支持系统框架 3.2 故障诊断知识图谱构建3.2.1 知识图谱本体设计知识图谱本体的构建依赖于领域专家知识与数据分析的结合，采用自上而下与自下而上相结合的方法[43,44]。自上而下方法利用专家系统与已有数据模式指导知识图谱构建；自下而上方法则通过信息抽取技术从半结构化或非结构化数据中识别并整合相关知识。这些策略不仅充分利用了深入的领域知识，也体现了数据驱动方法在知识发现与验证中的重要作用。在本研究的CNC系统故障诊断知识图谱项目中，本体设计基于故障诊断的通用标准与专家经验[45]。作者定义了七类关键实体：设备（机床）、设备模块、参数、报警编号/信息、现象（症状）、原因、解决方案。这些实体之间的关系如图2所示。本体结构保持适度复杂性，既确保基本的故障诊断能力，又具备良好的通用性，便于扩展到更广泛的应用场景。部分设备模块还引入了工程数据作为特征，为深入故障分析提供支持。图2 数控机床系统故障诊断知识图谱的本体设计3.2.2 从PLC梯形图中提取知识在由可编程逻辑控制器（PLC）控制的CNC系统中，故障可分为硬件故障与软件故障[46]。通过利用CNC系统特有的PLC报警信息，可以快速定位并处理这些故障。梯形图因其直观、易调试的特性，成为表示离散控制点的有效工具[47]。它不仅通过结构化、可视化的信息简化了故障诊断过程，还显著提升了诊断过程的管理能力与决策支持能力。然而，PLC梯形图的专业性可能给工程师的故障诊断带来挑战。为此，本文提出了一种将梯形图转换为文本信息并提取知识以构建知识图谱的新方法[48]。通过分析梯形图中开关状态及其对应的串并联逻辑，将故障分类为操作动作与故障发生条件，并将其作为知识图谱中的节点。结合故障报警数据与对应解决方案，构建了完整的知识图谱路径。这种方法不仅有助于快速、准确地定位故障，也提升了后续诊断工作的有效性。 3.2.3 从历史工单中提取知识在CNC系统运行过程中，故障需由工程师现场处理，并填写详细的故障工单。这些工单记录了重要的故障案例，包括故障现象与工程师的解决策略，是丰富故障诊断知识库的重要资源。然而，这些工单通常为非结构化数据，数量庞大且内容质量参差不齐，给数据处理带来巨大挑战。本研究利用大语言模型强大的深度语义理解能力，结合提示工程技术，引导模型从历史工单中有效提取“故障现象”、“故障原因”、“解决方案”等关键信息。通过设计模板引导模型输出，确保提取的信息符合知识图谱需求。随后，经过数据清洗与专家审核等步骤，将提取的数据转化为高质量的结构化信息，用于构建与扩展故障诊断知识图谱。 3.2.4 从工程数据中提取特征在CNC系统故障诊断研究中，从工程数据中提取特征是关键步骤[49]。深度学习技术已成为振动信号处理与故障分析的主流方法，提升了诊断的准确性与效率。随着图神经网络与基于物理的机器学习等新技术的引入，该领域展现出巨大的发展潜力。本文提出了一个三阶段工程数据特征提取策略，为CNC系统故障诊断提供更精细的特征支持。特征提取框架如图3所示：单通道特征提取：从单一传感器信号中提取特征，作为识别关键故障指标的基础[50,51]；多通道特征提取：整合不同传感器的数据，实现设备状态的全面分析，提升故障预测准确性[52]；基于指令的多通道特征提取：利用机器学习算法深入分析多源数据，不仅捕捉时间依赖性，还基于操作指令变化预测潜在异常，从而提供更高级的故障诊断能力。在此基础上，作者构建了工程数据特征与设备模块故障之间的关联关系。基于历史数据构建训练集，训练故障分类模型。在实际故障诊断中，工程数据特征有助于更准确、高效地定位故障设备模块或报警信息，从而实现更精准的故障诊断。图3 数控机床系统工程数据特征提取框架3.3 基于大语言模型的诊断系统 3.3.1 基于知识图谱的检索增强生成（RAG）系统在实际工业应用中，传统的RAG模型通过将外部知识检索与大语言模型结合，提高了模型回答的准确性，从而在一定程度上缓解了“幻觉”问题。然而，在CNC系统等特定故障诊断任务中，传统RAG仍面临诸多局限[54–56]。在CNC系统故障诊断中，模型回答不仅需要准确，还需简洁明了，以便工程师能快速用于故障排查。这对知识库的组织提出了更高要求。此外，由于CNC系统结构复杂，用户往往需要通过多轮交互才能准确诊断故障，这对数据库中相关信息的管理能力提出了更高要求，以支持长时间、高质量的对话。为克服这些局限，本研究提出了一种创新的基于知识图谱的RAG方法。在该方法中，诸如“故障症状”、“故障原因”、“解决方案”等诊断要素被作为知识图谱中的实体。当系统接收到用户报警或描述信息时，通过实体识别与语义理解，在知识图谱中快速定位相关实体及其子图。在与用户的多轮交互过程中，系统持续识别用户意图与反馈，优化知识图谱中的路径遍历方向，从而提供更准确的诊断支持。该方法通过识别用户输入中的实体与语义信息，缩小了知识检索范围，有效减少了幻觉现象，并提升了回答的针对性与准确性。此外，系统支持用户交互以引导知识图谱中的路径遍历方向，更好地满足用户需求。这一改进显著提升了模型在故障诊断领域的效率与可靠性。 4.3.2. 面向知识图谱RAG的提示工程提示（Prompt）是用于引导模型生成特定输出的文本或指令。提示越具体，大语言模型的回答越符合用户需求[59]。在本研究中，将提示分为两类：角色提示（role prompts）与任务提示（task prompts）。 ● 角色提示：通过构建一个具有独特视角、专业知识与行为模式的虚拟角色，引导大语言模型以特定身份进行交流。在本项目中，人工智能扮演CNC故障诊断助手的角色。不断添加指令，深化模型对其职责的理解。 ● 任务提示：用于引导或指示模型执行特定任务的文本输入。在生成诊断结果时，作者特别强调了任务提示设置的精确性，尤其是在面向知识图谱的路径遍历（KG-directed walks）中[60]。这些精心设计的提示对于确保诊断输出的准确性至关重要。作者构建任务提示，以约束知识图谱中的路径遍历方向，并生成与CNC系统故障领域高度相关的答案。 3.4 学习机制学习机制是人工智能系统实现持续学习与自我优化的关键组成部分[61]。在本项目中，作者通过扩展知识图谱中边的属性并引入路径权重的概念，增强了知识图谱的表现力，使系统能够在交互过程中识别潜在错误或不足之处。系统通过分析用户对当前回答的满意度，动态调整知识图谱中路径的权重。具体而言，对于未收到用户反馈的回答，系统会提升对应路径的权重，以确保这些路径在未来的检索中被优先使用；而对于收到反馈的回答，系统会利用大语言模型提取其中的路径，并将其加入反馈数据库[57,58]。工程师会定期审核反馈数据库中的路径，审核通过的路径将被正式纳入知识图谱。这种方法使得知识库能够持续扩展，进一步提升系统的故障诊断能力。该学习机制的框架如图4所示。通过这一机制，系统不仅能够从用户交互中不断学习和优化，还能结合专家知识实现知识的动态更新，从而在实际应用中不断提升诊断准确性与用户满意度。图4 数控机床系统工程数据特征提取框架 Q&A：问答4 实验结果与讨论4.1 面向CNC系统的大语言模型基准测试由于不同大语言模型在预训练过程中存在差异，其对各领域的适配性也各不相同。为评估大语言模型在CNC系统领域的应用效果，基于大规模多任务语言理解（MMLU）方法[62]，构建了一个选择题数据集，命名为CNC语言理解数据集（CNCLU）。该数据集包含200道题目，涵盖CNC系统的基本术语定义、功能介绍及操作流程等核心知识点。每道题提供1个正确答案和3个干扰项，干扰项模拟常见误解与错误，以更准确地评估和比较不同大语言模型在CNC系统专业知识理解与运用方面的能力。作者还引入了AI2推理挑战数据集（AI2-ARC），用于评估大语言模型的基本推理能力，作为模型选择的补充参考。在模型选择上，重点评估了以下在中文任务中表现优异的模型： ● ChatGLM3-6B ● GLM4-9B-Chat ● Qwen1.5-7B-Chat ● Qwen2-7B-Instruct ● Qwen2.5-7B-Instruct 综合考虑准确性、并发资源占用与响应速度，选取了参数量在6B至9B之间的模型进行测试。该范围可确保系统在满足并发与实时性要求的同时，最大化诊断准确性。在实际部署中，模型量化是关键考量因素。量化技术可显著降低模型的存储与计算需求，使其更适合资源受限环境。本研究评估了两种量化方法： ● GPTQ：生成式预训练变换器的精确后训练量化方法[65] ● GGUF：GPT生成的统一格式量化方法通过在MMLU、AI2-ARC及CNCLU任务上的性能对比，获得了如表1与图5所示的结果： ● 量化方法对比： ○ GPTQ虽减小了模型体积，但推理时间未显著缩短； ○ GGUF实现了更高的压缩率，同时显著提升了推理速度； ○ 在准确性方面，使用GGUF量化的模型在12组可比数据中，有11组表现更优。 ● 模型选择结论： ○ 在未量化模型中，GLM4-9B-Chat在AI2-ARC与CNCLU上表现最佳； ○ 在MMLU任务上，新发布的Qwen2.5-7B-Instruct表现更佳； ○ 在GGUF量化模型中，Qwen2.5-7B-Instruct与GLM4-9B-Chat在AI2-ARC与CNCLU上表现相近； ○ 由于Qwen2.5-7B-Instruct体积更小、推理效率更高，最终选用GGUF量化的Qwen2.5-7B-Instruct作为基线模型。表1 本地部署大语言模型及其量化方法的对比图5 LLM在MMLU、AI2-ARC和CNCLU上的基准测试结果 (a) 不同任务及不同量化方法下LLM的得分（%）；(b) 不同任务及不同量化方法下LLM所耗时间（s） 4.2 提示工程 ● 角色提示（Role Prompts）：确保系统以“CNC故障诊断AI助手”的身份提供对话服务，提升用户体验，并通过拒绝非故障诊断相关问题增强系统安全性。 ● 任务提示（Task Prompts）：进一步细化用户查询，使大语言模型生成更准确的回答。系统在接收用户查询后，首先进行意图识别，然后基于识别结果设计相应的任务提示，包括故障代码查询、故障现象询问、用户反馈等类型。 ○ 故障代码与现象类查询将进入基于知识图谱的RAG阶段； ○ 用户反馈将触发系统的学习机制。该方法使系统能够更有效地理解与响应用户需求，并在实际应用中不断学习与优化，从而提升整体诊断准确性与效率。 4.3 面向RAG的知识图谱应用本研究的故障诊断决策支持系统使用了四类数据： 1. 故障诊断案例：由华中数控提供，涵盖约500个典型故障模式，包括机械、电气与软件故障。每条案例包含故障描述、诊断结果、故障类型、受影响部件及发生时间等信息。 2. 历史工单：来源于企业内部维修记录，约5000条，包含工单编号、设备类型、维修日期、维修内容、故障原因、处理过程及人员信息。 3. 设备信息：来自机床制造商及后续维护记录，包括设备型号、生产日期、运行日志、配置参数、维护记录与运行状态。 4. 工程数据：来源于CNC系统驱动记录器，特别是报警前10秒内的“黑匣子”数据，包括温度、振动频率、电流电压波动、温度变化率与运动速度等传感器数据，为故障诊断提供实时运行状态依据。基于上述数据，构建了一个包含1549个实体与1334条关系的知识图谱（如图6所示）。图谱中既包含复杂图结构，也包含简单路径，覆盖了广泛的故障场景，为后续诊断与知识推理提供了坚实基础。使用Neo4j图数据库进行知识图谱的存储与查询，确保高效检索与更新。图6 数控机床系统故障诊断知识图谱为应对传统RAG模型在多轮对话与复杂故障场景中的局限性，提出了一种改进的RAG模型，融合深度学习与知识图谱技术，采用动态子图划分与多轮对话机制： ● 子图划分：以故障现象描述与报警代码为划分依据，将知识图谱划分为多个子图，每个子图对应一组与特定故障原因相关的解决路径。该策略不仅缩小了检索范围，也提升了系统处理复杂故障的能力。 ● 多轮对话机制：系统首先在用户输入中识别关键实体与语义信息，快速定位相关子图，并提供最可能的故障原因与解决方案（如图7a所示）。随着对话深入，系统根据用户反馈动态优化子图内的解决路径（如图7b所示），显著提升了对话连贯性与诊断准确性。此外，系统将工程数据与知识图谱融合，在运行过程中持续监测传感器信号与环境条件，提取关键特征并通过故障分类模型进行分析，结果可用于进一步筛选子图，提升诊断效率与准确性。知识图谱也会不断整合新的诊断数据与用户反馈，优化特征与故障类别之间的关联，使系统具备更强的适应性，支持更主动与预防性的维护策略。图7 基于子图遍历的多轮故障诊断交互 (a) 识别实体以定位相关子图并提供故障原因与解决方案；(b) 基于知识图谱的多轮故障诊断流程。4.4 学习机制为了使基于大语言模型的生成式故障诊断系统具备自我学习与持续进化的能力，本研究引入了一套学习机制，旨在不断优化与提升系统性能。该机制具备以下核心功能： ● 知识自动提取与更新：系统可从持续产生的故障诊断工单中自动提取知识，并将新知识动态整合进知识图谱，从而不断丰富故障诊断案例库，显著提升知识库的增长性与可扩展性。 ● 知识图谱结构优化：通过扩展知识图谱中关系的属性并引入“路径权重”概念，使系统能够根据用户反馈识别哪些知识路径更有效。具体而言： ○ 对于未收到反馈的诊断路径，系统会提升其权重，使其在后续检索中被优先使用； ○ 对于收到反馈的路径，系统会利用大语言模型提取其中的知识路径，并将其加入反馈数据库； ○ 工程师会定期审核反馈数据库中的路径，审核通过的路径将被正式纳入知识图谱，确保知识库持续演化并与实际场景保持一致。为验证学习机制的有效性，构建了一个包含41个常见故障场景的测试数据集，由故障诊断系统生成回答，并邀请经验丰富的工程师对回答进行评分，最终转换为百分制分数。系统性能随时间变化如图8所示。结果显示： ● 在未引入学习机制的情况下，系统诊断能力已优于具备1年经验的工程师； ● 在引入学习机制后，系统性能持续提升，最终超过了具备2年经验的工程师； ● 这表明该系统具备在实际应用中持续自我优化的潜力。图8 数控机床故障诊断中不同学习机制与工程师诊断能力的对比在真实工业环境中，故障类型与诊断需求可能快速变化，且不同用户的反馈可能存在冲突。为解决这一问题，系统在反馈审核环节引入了专家组评审机制： ● 初期由专家定期审核用户反馈； ● 当反馈数据积累到一定程度后，将训练一个基于大模型的审核过滤器，辅助专家进行初步筛选； ● 最终由领域专家进行复审，确保纳入知识图谱的内容准确可靠。这一机制不仅提升了知识更新的效率，也保障了知识库的质量与可信度。 4.5 故障诊断系统在本研究中，开发了一套基于大语言模型的生成式故障诊断决策支持系统，旨在为用户提供CNC系统故障的原因分析与解决方案。该系统已集成至华中数控的“数控云管家”App中，用户可通过扫描二维码与CNC系统建立连接，获取设备基本信息及当前故障报警代码。在交互过程中，用户可根据实际情况向系统提出问题。系统通过以下步骤生成回答： 1. 分析用户输入：识别故障代码、现象或用户描述； 2. 调用知识图谱：基于知识图谱的RAG方法检索相关知识； 3. 生成诊断建议：结合提示工程与上下文信息，生成准确的故障原因与解决方案； 4. 学习优化：系统记录用户反馈，并通过学习机制持续优化知识图谱与诊断能力。此外，系统还具备以下功能： ● 实时数据采集与监控：支持实时获取传感器信号，评估CNC系统运行状态，实现实时监测与维护； ● 多通道特征提取：结合单通道与多通道特征提取方法，对多个传感器数据进行综合分析，提升故障识别精度； ● 指令域特征分析：基于操作指令的多通道特征提取，进一步挖掘设备运行状态与故障之间的潜在关联； ● 参数异常诊断：系统内置了37类由CNC系统参数异常引起的故障案例，涵盖63个相关参数。系统在提供故障原因与解决方案后，用户可通过手机扫描二维码连接CNC系统，下载并查看相关参数，系统可辅助用户进行参数检查与修改，帮助快速定位与解决问题。 4.6 讨论本研究系统探讨了不同大语言模型在CNC系统中的适配性，并提出了一种简单有效的评估方法。基于MMLU方法构建了一个选择题数据集，用于测试模型对CNC领域专业知识的理解与运用能力。评估结果显示，不同模型在领域适配性方面存在差异，其中GLM4-9B模型在CNC系统任务中表现最佳。此外，还进行了量化测试，以提升模型效率、降低计算资源消耗，同时尽可能保持模型性能。有效的量化意味着在相同的计算资源下，系统可接入更多设备并提供更快速的故障诊断服务，这对于实际生产过程至关重要。在系统设计中，采用知识图谱作为结构化知识表示方式，显著提升了系统对复杂故障模式的识别与响应能力。通过将角色提示与任务提示融入提示工程设计，进一步提升了系统的整体性能。基于上述基础，所提出的知识图谱驱动的RAG模型在CNC系统故障诊断中展现出以下优势： 1. 回答简洁准确：系统能针对特定报警代码或故障现象提供精准的原因与解决方案，用户无需从冗长文本中筛选信息； 2. 多轮对话能力强：系统支持多轮交互，能深入理解用户问题并提供递进式诊断建议，显著提升用户体验； 3. 持续学习能力：系统通过分析用户反馈，实时优化诊断过程，展现出良好的适应性。尽管偶尔会受到错误反馈影响，引入了两阶段反馈审核机制： a. 第一阶段由大模型初步筛选无效反馈； b. 第二阶段由领域专家复审并纳入知识图谱。相比传统人工审核机制，该方式显著提升了审核效率，为知识图谱的持续优化提供了有力支持。5 结论本研究成功开发了一套融合大语言模型与知识图谱的智能故障诊断系统，并在CNC系统中验证了其有效性，证明了该方法在实际工业环境中的可行性。主要成果如下： 1. 多源数据融合：通过知识图谱整合多源数据，构建了涵盖广泛故障案例与相关信息的统一知识库，为高效故障诊断提供了坚实基础； 2. 精准响应机制：系统采用定制化提示工程与知识图谱驱动的RAG框架，能够高效、准确地响应用户的故障诊断请求； 3. 多轮交互能力：引入多轮对话与交互式查询机制，显著提升了系统的易用性与用户体验； 4. 持续学习优化：系统具备学习机制，可通过分析用户反馈持续优化性能，展现出良好的适应性与长期有效性。本研究为大语言模型在工业领域的应用提供了标准化框架与实施模板，具有重要的实践价值。未来，将进一步探索： ● 更复杂的工业场景适配； ● 更多故障类型的覆盖； ● 提示设计、微调策略乃至预训练模型的深度定制； ● 提升系统在更广工业范围内的适用性与诊断精度。编辑：肖鑫鑫校核：李正平、陈凯歌、曹希铭、赵学功、白亮、任超、海洋、陈宇航、陈莹洁、Tina、王金、赵诚、赵栓栓该文资料搜集自网络，仅用作学术分享，不做商业用途，若侵权，后台联系小编进行删除来源：故障诊断与python学习

大模型综述分享（4） | 健康管理大模型概述：概念、范式与挑战

论文基本信息

目录

4 健康管理大模型概念与进阶研究范式

4.5 基于PHM-LM范式的实践案例

4.5.1 案例一：基于LLM的轴承故障诊断框架

4.5.2 案例二：基于LLM模型的轴承剩余使用寿命预测

4.5.3 案例三：基于LLM模型的领域自适应维护方案生成

4.6 小结

5 PHM-LM面临的挑战

5.1 跨领域、多模态的PHM-LM基础数据集构建

5.2 囊括多模态健康信息的统一表达架构

5.3 多能力、可扩展的健康管理大模型结构设计

5.4 特定对象的健康管理专属能力向通用全科健康管理能力的转化

5.5 大模型健康管理输出结果的可解释、可溯源性

5.6 基于大模型的通用化PHM方法与现有专用式方法的协同

5.7 兼顾数据隐私与共享的健康管理大模型分布式隐私训练

5.8 关键挑战的优先级分析

6 结论

论文学习| SCI一区：融合大语言模型与领域知识图谱实现数控机床的智能故障诊断