首页/文章/ 详情

综述 | 动态系统的增量学习故障诊断综述

3小时前浏览73

    本期给大家分享一篇增量学习的故障诊断综述。由清华大学何潇教授团队发表。该综述总结了基于增量在线学习和离线学习的故障诊断最新进展,讨论了将增量学习应用于故障诊断时面临的主要挑战及解决方案,为该领域的研究人员和从业者提供了及时且全面的参考。

    论文链接:通过点击本文左下角阅读原文进行在线阅读及下载

    论文基本信息

    论文题目:Incremental Learning-Enabled Fault Diagnosis of Dynamic Systems: A Comprehensive Review

    论文期刊:IEEE Transactions on Cybernetics

    论文日期:2025

    论文链接https://ieeexplore.ieee.org/document/11104131  

    作者:Zeyi Liu, Xiao He (Senior Member, IEEE), Biao Huang (Fellow, IEEE), Donghua Zhou (Fellow, IEEE)

    机构:

    a: 清华大学自动化系  

    b: Fragum Global, Mountain View, CA, USA  

    c: 瑞典吕勒奥理工大学

    通讯作者邮箱: 

    hexiao@tsinghua.edu.cn

    作者简介:

    何潇,清华大学自动化系教授、清华大学安全控制技术研究中心主任、清华大学轨道交通智能控制与决策创新团队负责人及首席科学家、中国自动化学会理事会副秘书长,曾任清华大学自动化系副主任。研究方向为网络化系统、故障诊断与容错控制。在国内外期刊会议上发表论文200余篇。主持国家自然科学基金重点项目1项、面上项目2项,2015年获得国家自然科学基金优秀青年基金资助。现任中国自动化学会高级会员、IEEE Senior Member、美国Sigma Xi荣誉研究会Full Member,并任Control Engineering Practice、IEEE TNNLS、IEEE TASE等多个国际期刊的编委。目前为中国指挥与控制学会云控制与决策专业委员会副主任、智能控制与系统专业委员会副主任、中国自动化学会技术过程的故障诊断与安全性专业委员会秘书长、过程控制专委会副主任。曾获2012年SAFEPROCESS国际会议的Frank最佳理论论文提名奖、2023年北京市自然科学二等奖、2021年方崇智最佳论文一等奖、2022年张钟俊院士优秀论文奖,并获2018年吉林省科技进步一等奖、2015年与2020年中国自动化学会自然科学奖一等奖、2022年中国自动化学会技术发明一等奖。培养学生获得2018年和2022年中国自动化学会优秀博士学位论文

    周东华,东南大学教授、博导,智能无人系统研究院首席科学家,矿山安全检测技术与自动化装备国家地方联合工程研究中心主任。上海交通大学博士、浙江大学博士后。曾任清华大学自动化系主任,山东科技大学副校长,教育部高等学校自动化类专业教指委主任,第六、七届国务院控制科学与工程学科评议组成员,第三、四、五届中国自动化学会故障诊断与安全性专委会主任。为国家杰青、长江学者特聘教授、“万人计划”领军人才、国家基金委创新研究群体带头人、全国高校黄大年式教师团队负责人,享受国务院政府特殊津贴。兼任IFAC 技术过程故障诊断与安全性技术委员会委员、中国自动化学会副理事长等。主要研究动态系统故障诊断与容错控制、运行安全性评估理论等。以第一完成人获国家级奖励3项(含国家自然科学二等奖2项、国家级教学成果二等奖1项)、省部级和全国学会科技一等奖5项。曾获霍英东教育基金会青年教师奖、全国优秀博士后奖、第六届中国青年科技奖、国家新世纪百千万人才、全国优秀科技工作者等荣誉称号。为山东省泰山学者优势特色学科人才团队领军人才、山东省泰山学者攀登计划专家。入选全球高被引科学家、全球前2 %顶尖科学家名录,当选IEEE/ AAIA/ IET/ CAA  Fellow。

    刘泽夷清华大学自动化系的博士研究生,在安全控制技术研究中心师从何潇教授和周东华教授,研究兴趣包括在线学习及其在动态系统(如机器人群、工业自动化系统和安全关键信息物理系统)的实时安全评估安全保障控制多条件故障诊断中的应用。

    目录

    摘要

    1 引言 

    2 基础理论

        2.1 故障诊断的基本概念

        2.2 ILFD方法的不同视角

    3 问题表述与动机

        3.1 问题表述

        3.2 动机分析

    4 基于增量在线学习(OL)的FD方法的最新进展

        4.1 处理故障分布漂移的方法

        4.2 管理新型故障模式的方法

    5 基于增量离线学习的FD方法的最新进展

        5.1 处理故障分布漂移的方法

        5.2 管理新型故障模式的方法

    6 ILFD方法的研究趋势

    7 典型的实际应用

        7.1 机械系统

        7.2 化学系统

    8 结论与展望

    摘要

    有效的故障诊断对于维持工业系统的可靠性和安全性至关重要。增量学习(Incremental Learning)能够使模型持续更新并适应新数据或新出现的故障类别,而无需完全重新训练,近年来已成为解决故障诊断应用中非平稳数据流问题的一种有前景的方案。然而,现有的大多数故障诊断综述文章都采用宽泛的视角,主要讨论深度学习和迁移学习等通用技术,并未专门聚焦于增量学习策略。据我们所知,本文是首篇专门聚焦于基于增量学习的故障诊断方法的综述。本文系统回顾了最先进的基于增量学习的故障诊断方法,并根据其增量学习策略和应用背景将其分为不同的组别。此外,还讨论了将增量学习应用于故障诊断时面临的主要挑战(如概念漂移和灾难性遗忘),以及为解决这些问题而提出的新兴解决方案。本文提出了一种关于基于增量学习的故障诊断方法的新分类法和视角,为该领域的研究人员和从业者提供了及时且全面的参考。

    关键词:人工智能,动态系统,故障诊断,增量学习

    1 引言

    动态系统在航空航天、制造和能源等各种工业应用中起着至关重要的作用[1]-[3]。随着现代系统的快速发展,这些系统变得越来越复杂。有效的故障诊断方法对于及时识别潜在故障、预防系统失效、提高系统可靠性和安全性、避免事故以及保护人员和设备至关重要。传统的故障诊断方法通常分为知识驱动、模型驱动和数据驱动三大类[11]-[13]。知识驱动方法依赖于领域专家长期实践中积累的专业知识来建立知识库,以模拟人类专家的推理和决策过程[14]-[17]。模型驱动方法使用系统的精确数学模型生成残差信号,反映系统预期行为与实际运行之间的差异[18]-[21]。故障诊断则基于对这些残差信号的分析进行。尽管这些方法采用不同的技术并服务于不同的目的,但所有故障诊断系统都有一个共同特点:实施过程中需要处理系统运行期间获得的测量数据。然而,现有方法的有效性往往取决于对系统模型的全面理解,这限制了其适用性[22]。在过去的几十年里,数据驱动的故障诊断方法越来越受到学术界和工业界的关注[23]。这些方法分析和处理运行数据以进行故障诊断,而不需要系统的精确解析模型。从专家经验到全自动化或智能化系统的发展,推动了数据驱动方法的快速发展,包括多元统计分析、信号处理和机器学习方法。由于自21世纪以来人工智能的快速发展,具有深度架构的机器学习方法在复杂系统故障诊断中展现出显著优势,这归功于其强大的特征提取和模式识别能力。因此,这些方法已被证明在特定诊断任务中取得了显著成果[24]。传统的基于学习的故障诊断方法通常依赖于离线构建诊断模型,然后将其直接部署到在线环境中。这些方法的核心在于如何在离线训练阶段更准确地构建故障数据与故障模式之间的映射,以确保诊断准确性。然而,现有方法往往未能充分考虑现实世界系统的动态特性。这些局限性不仅在实际应用中带来了若干实施限制,而且在学术研究与工业部署之间造成了显著差距。由于故障场景的复杂性和退化过程的不可预测性,在离线阶段获取全面的故障信息仍然是一个重大挑战。离线阶段收集的故障数据通常无法覆盖全部实际运行工况[25],导致训练数据集不完整或存在偏差。特别是,工业环境受到各种不断变化的因素影响,如设备老化、负载变化、维护操作和环境变化(例如温度、湿度和灰尘),所有这些都可能导致底层数据分布随时间发生偏移。这些分布变化意味着离线阶段观察到的故障模式可能不再完全代表实际运行中遇到的,如果不进行适应,将导致模型性能下降。此外,新型故障模式的出现进一步加剧了这一挑战。新型故障模式是指在初始训练阶段未捕获到的新的或先前未见过的故障类型。这些故障可能由于设备设计修改、系统组件之间的意外交互或新操作流程的引入而产生。由于离线训练的模型本质上仅限于识别已知故障类别,因此它们通常缺乏检测或正确分类这些新故障的能力。因此,如果没有在线模型更新或增量学习机制,此类模型可能无法为关键但先前未遇到的故障模式提供及时警告,从而可能导致严重的安全风险或运营损失。为了应对这些挑战,诊断方法在处理复杂的动态环境(如未知故障或长期退化效应)时必须具备更高的动态适应性。最近的研究探索了基于增量学习的故障诊断(ILFD)方法。这些方法动态地调整模型以适应新的故障模式或系统变化,而无需完全重新训练。ILFD方法可以逐步学习新的运行工况和故障特征,提高模型对复杂动态环境的适应性。尽管仍处于发展的早期阶段,这些方法在解决与故障数据稀缺、动态运行条件和模型鲁棒性相关的挑战方面显示出巨大的潜力。在本文中,我们旨在对这些不断发展的领域进行全面概述。我们首先回顾了故障诊断方法和增量学习技术的发展历史、概念定义和技术分类。通过比较批量学习故障诊断(BLFD)方法和ILFD方法之间的区别和联系,突出了每种范式的独特优势和挑战。然后,我们从两个角度彻底回顾了文献中的最新进展,以提供对最先进发展的更全面理解。并进一步从三个不同的角度讨论和分析了相关的研究趋势。还分析了ILFD方法在代表性应用场景中遇到的挑战。

    2 基础知识 

    2.1 故障诊断的简要概念

    动态系统的故障诊断技术是提高系统可靠性和降低事故风险的关键方法。根据国际自动控制联合会(IFAC)认可的官方声明,故障被定义为系统的至少一个特征属性或参数偏离可接受/通常/标准条件的未被允许的偏差[26]。传统上,一个全面的故障诊断过程必须包括在动态系统内进行故障检测、故障隔离和故障识别的任务,这可描述为[27]和[28]:  

    1) 故障检测  :确定系统中存在的故障及其检测时间。  

    2) 故障隔离  :在故障检测后,确定故障的类型、位置和检测时间。  

    3) 故障识别  :在故障隔离后,确定故障的大小和时变行为。  

    自20世纪70年代以来,一个面向问题解决的框架已初步建立。经典的模型驱动故障诊断方法通常按照上述三个步骤进行,从而产生关于故障的具体分析结果。故障诊断过程的一般框架如图1所示。

    1  故障诊断过程的一般框架  

    模型驱动故障诊断方法假设系统的输入/输出(I/O)符合特定的模型结构(例如状态空间模型),且参数已知。在过去的几十年里,这些方法受到了广泛关注,特别是对于线性系统。它们已完全集成到车辆控制系统、机器人、运输系统、电力系统、制造过程和过程控制系统中[29]。然而,它们通常需要精确识别系统模型参数,这对更复杂系统的故障诊断提出了挑战。随着近年来人工智能技术的快速发展,一些研究人员尝试直接建立从系统测量到故障模式的非线性映射。这些方法往往侧重于故障检测和故障隔离任务。以化学系统为例,经典的故障诊断方法通常需要彻底理解系统模型,以分析动态关系并描述系统状态随时间的变化,从而形成有效诊断的基础。然而,对于大型复杂系统,精确建模通常是不切实际的。因此,数据驱动的故障诊断方法受到了广泛关注,因为它们可以有效地克服这些限制[24]。因此,近年来,越来越多的故障诊断研究逐渐从先故障检测后故障隔离的逻辑演变为直接对故障模式进行分类。换句话说,这些方法使用故障分类任务来描述故障诊断,并实现经典的故障检测与隔离(FDI)任务。

    2.2 ILFD方法的不同视角

    传统的机器学习范式通常以批量学习(batch learning)方式运行,需要事先收集完整的训练数据集 合,然后通过某种学习算法来训练学习器。这种范式要求在整个训练数据集在学习任务开始之前就已提供,并且由于训练成本高昂,训练过程通常在离线环境中完成。如[30]和[31]所述,传统的批量学习方法有几个局限性:1)时间和空间效率低;2)对大规模应用的可扩展性差,因为学习器通常需要为新训练数据从头开始重新训练。在这种情况下,尽管传统的批量学习方法在某些故障诊断任务中取得了良好效果,但在广泛应用于实际场景之前仍需要取得重大进展。与批量学习算法相比,增量学习是机器学习的一个分支,它处理按顺序到达的数据,其目标是学习器逐步学习和更新对未来数据的最佳预测器[32]。增量学习克服了批量学习的缺点,因为预测学习器可以用任何新数据更新。因此,考虑到工业应用中系统测量的特点,增量学习的思想更适合工业应用场景,并已在许多特定应用中得到使用,例如预测性维护。在故障诊断的背景下,各种场景的方法根据图2所示的结构进行组织。大多数现有的基于机器学习的故障诊断方法都是受批量学习启发的,假设用于构建诊断模型的初始数据是完整的。在离线阶段,诊断模型可以利用充足的数据执行训练过程。当初始训练数据不完整时,增量学习方法可以更新诊断模型以处理更复杂的任务。根据更新的具体时间,这些方法可以进一步分为  基于增量在线学习(OL)的FD方法  和  基于增量离线学习的FD方法  。前者通常在线阶段执行实时更新。理想情况下,部署过程应在系统测量到达之前完成。后者的更新过程通常发生在离线阶段。  备注1  :在现有文献中,增量在线学习方法通常被简化为在线学习(OL),它通常假设数据以数据流的形式到达(逐个或分批),并在接收到每个样本后更新诊断模型。更新过程要求是实时的。相比之下,增量离线学习通常假设在积累一定量的数据后可以离线进行更新,然后在线阶段重新部署。此类方法的更新过程通常具有更高的复杂性。持续学习(Continual learning)通常被视为一种代表性方法,侧重于解决增量学习过程中潜在的灾难性遗忘问题。更多信息请参阅[30]-[34]。

    图2 基于数据完整性和模型更新部署时间的故障诊断方法分类

    通常,基于学习的故障诊断方法的性能会受到分布漂移的显著影响,而增量学习在适应此类变化方面比传统批量学习更具优势。ILFD和BLFD的对比示意图如图3所示。在理想情况下,运行阶段的数据分布应遵循独立同分布(i.i.d.)假设。理想性能曲线由红线描绘。当发生分布漂移(即数据分布发生变化)时,BLFD方法的性能显著下降。相反,ILFD方法旨在更新模型以适应新的数据分布,从而提高性能。  

    图3 故障分布漂移下,ILFD方法与BLFD方法相比具有更优适应性的示意图  

    虽然增量学习可以在在线和离线两种设置中实现,但这两种方法在模型更新机制及其对故障诊断的适用性方面存在显著差异。基于增量在线学习的故障诊断方法在新数据到达时实时更新诊断模型,使其特别适合快速变化的环境。诊断模型需要实时部署,这在实时故障监控等场景中至关重要,这些场景需要及时的检测和响应。这些方法非常适合机械健康监测或在变化条件下运行的工业系统等应用,这些应用中故障必须在出现时立即检测到。通过使用每个传入数据点持续更新模型,它可以保持与最新运行状态的相关性,提供在具有不可预测变化或中断的环境中所需的灵活性。相比之下,基于增量离线学习的故障诊断方法需要随时间积累数据并分批执行模型更新。诊断模型应在满足条件时(例如当对新运行模式下的故障信息有足够理解时)部署一次。通常,这些方法不需要特定的部署时间。在这种情况下,故障诊断任务受益于增强的稳定性和鲁棒性,因为更新是在受控环境中执行的,有更多时间进行彻底分析。这种方法适用于故障诊断可以在收集到足够数据后执行的情况,例如故障模式复杂且需要广泛分析的情况。增量离线学习确保了对数据进行更彻底的分析,从而带来稳定且精确的模型更新,这在需要全面理解各种运行模式下的故障条件时特别有价值。

    3 问题表述与动机

    在本节中,首先阐述一些问题。随后,分析了ILFD方法的一般研究动机。 

    3.1  问题表述

    为了后续讨论的清晰性,我们提供一个通用的定义。如图1所示,通常可能存在组件故障、执行器故障和传感器故障。对于线性动态系统,系统模型可表示为:

           (2)

    其中                是系统矩阵,具有适当的维度。令    分别表示状态变量和测量变量的维度。    和      是系统状态和测量值。     和     是未知噪声。    表示系统的组件故障。    执行器故障下的控制输入表示为 ,可建模为:

        (3)

    其中    表示乘性执行器故障,    表示加性执行器故障。    是整数,表示维数。对于非线性动态系统,系统模型可表示为:

         (4)

          (5)

    其中         表示非线性算子。如公式3所示。 备注2  :值得注意的是,现有的动态系统数据驱动故障诊断方法通常忽略传感器故障问题。因此,在构建如(1)和(4)所示的系统模型时通常不考虑此类问题。 与大多数基于机器学习的故障诊断方法一致,ILFD过程通常需要事先获得测量值对应的故障信息。在文献中,它通常被称为故障标签集。在离线阶段,可以收集不同系统状态对应的测量值以形成训练数据集    。假设总共有    个测量值和    种故障模式    。为了与现有文献保持一致,变量    在指代样本时用于表示测量值。在这种情况下,    可以表示为:

        (6)

    其中    和     分别表示     中的第    个实例及其故障模式。 通常,诊断模型    可以在离线阶段构建,表示为:

        (7)

    在线阶段,诊断模型需要根据实时测量值预测动态系统的故障模式。将时间收集的样本表示为     。预测的诊断结果可以表示为:

       (8)

    其中    表示     的模型参数。如第2.2节所述,ILFD通常尝试在离线或在线阶段执行增量更新。用于更新的数据可以表示为:

       (9)

    其中    表示用于更新的样本数量。诊断模型可以在离线阶段或在线阶段通过以下表达式进行更新:

       (10)

    其中    表示更新函数。其具体形式受多种因素影响,例如更新阶段(离线或在线)和诊断模型的架构。主要目的是最小化增量更新后的预期风险,可以定义为:

       (11)

    其中    表示给定实例及其故障模式时诊断模型的预测误差或损失。考虑到主要特性,ILFD过程的一般工作流程可总结为图4。

    ILFD流程  


    3.2  动机分析

    在实践中,数据是连续生成和更新的,历史样本随时间积累。在设备生命周期的早期阶段,故障设备的数量通常远少于正常设备的数量。因此,从故障设备提取的统计特征和模式可能不完整,导致可能不正确的诊断结果[35],[36]。此外,对潜在系统故障的初始理解可能不足。如果诊断模型仅依赖于离线阶段积累的样本进行推理,则其对故障特征的理解可能存在偏差[37]。捕获不同运行模式或环境下的系统变量信息涉及高成本和实践限制。罕见的故障事件尤其难以捕获,并且系统动态通常未被完全表征。因此,在离线阶段获取全面的故障信息仍然是一个重大挑战。此外,系统的动态特性带来了进一步的挑战。离线阶段收集的故障数据通常无法覆盖全部实际运行工况。实验室环境通常是受控的,与实际工业环境大不相同。传统的机器学习模型通常假设数据是独立同分布的,但在动态系统中这种假设很少成立。如图5所示,由于运行条件变化、环境因素和退化效应,故障分布可能会发生漂移,这进一步使故障诊断复杂化[38]。在动态环境中,运行工况的自然变化(例如过程参数的调整或环境条件的波动)和未知故障通常共存。区分这两个因素至关重要但具有挑战性。系统特性的正常变化可能表现为性能指标的非线性漂移或随机波动,这可能被误认为是故障,导致高误报率[39]。相反,未知故障可能被这些正常变化所掩盖,导致漏报。现有方法未能充分探索这种区别,这些方法通常依赖于静态阈值设置或统计特征分析。因此,无法有效处理实时更新的传统批量学习方法无法应对此类动态环境带来的复杂性。  

    性能下降和运行条件转变导致的数据分布变化示意图  

    这些挑战凸显了对能够实时学习和更新的诊断模型的需求。现有文献已经确定了在此背景下的两个关键问题:  

    • 1)故障分布漂移    

    • 2)新型故障模式    

    这些问题需要更多关注以实现有效的故障诊断。这些问题的概念性说明如图6所示,而这些问题详细描述总结在表I中。  

    概念图展示了特征空间中的故障分布漂移及新型故障模式。虚线表示决策边界 (a)原始诊断任务 (b)故障分布漂移 (c)新型故障模式

      表I ILFD过程需要考虑的主要问题   

    注:C表示测量值X和故障信息Y的增量变化,指示了动态调整两个组件行为的变异。  

    一方面,由于运行条件变化和性能退化等因素[40]-[42],动态系统通常在非平稳环境中运行,导致故障样本的分布发生一定程度的变化。一个被称为概念漂移(concept drift)的关键现象经常被观察到。实际上,工业应用通常涉及混合漂移类型,这意味着多种类型的漂移可以同时发生[44],[45]。在机械系统中,设备的运行可能由于部件的磨损和老化而导致故障模式和频率发生变化,从而改变故障数据的数据分布。在化学系统中,过程参数的调整、原材料的变化或环境条件的波动可以改变系统的运行状态,从而影响故障分布。这主要是由于在不同条件下反应过程和设备性能的变化所致。在现实生活场景中,上述漂移的发生可能导致数据分布发生变化,从而影响基于机器学习的故障诊断方法的实时性能。增量学习方法使诊断模型能够实时更新,适应故障分布变化,从而提高系统可靠性和稳定性,减少误报和漏报,优化维护计划,并降低设备维护成本。另一方面,新型故障模式的出现对传统的FD方法构成了重大挑战。新材料、新技术的应用以及不断变化的运行环境可能导致以前未见过的故障模式[46]-[48]。在机械系统中,新材料和制造技术的应用可能由于材料特性和新技术的复杂性而引入新的故障模式。在化学系统中,新化学过程或催化剂的引入可能导致新故障模式的出现,因为这些新过程和催化剂在初始运行期间可能揭示未知的故障风险。如果诊断模型不能及时识别和适应这些新型故障模式,严重的故障可能无法被检测到,从而损害系统安全[43]。在实践中,大多数情况下,模型需要在新故障模式出现时快速学习和更新,这增强了灵活性和准确性。因此,它们提供了对设备健康状况的全面监控,并有助于预防潜在的重大故障。

    4 基于增量在线学习(OL)的FD方法的最新进展

    随着数据量的增加,基于增量在线学习的FD方法需要能够在线快速更新,而不影响实时性能,尤其是在动态环境中。为了应对第III-B节概述的挑战,必须彻底考虑以下特性:    

    1. 具有实时部署的快速更新速度:考虑到诊断模型需要实时部署,它们应该能够在新数据到达时快速学习和更新。在这种情况下,此类诊断模型的更新速度通常要求更高[49]-[51]。  

    2. 具有最少监控数据的高效更新能力:该方法应能够用最少量的新样本有效更新模型,最小化对大型数据集的依赖,同时确保性能而不需要大量计算资源[52]-[54]。  

    3. 有效利用时间关系  :诊断模型应有效利用时间关系来捕捉系统随时间的动态行为和趋势,从而提高诊断模型的准确性和鲁棒性[55],[56]。  

    这些特性使此类诊断方法能够在线实现高效的增量更新,使其成为现有文献方法设计的核心焦点。因此,基于增量在线学习的FD方法可以显著增强诊断系统的适应性、灵活性和准确性,为动态系统的可靠运行提供有力支持。在此背景下,基于增量离线学习的FD方法在过去几年中取得了令人印象深刻的发展。基于增量在线学习的FD方法的示意图如图7所示,以更清晰地概述其结构和关键组件。  

    基于OL的增量式FD方法示意图

    4.1 处理故障分布漂移的方法

    为了有效应对故障分布漂移带来的挑战,诊断模型需要执行及时有效的更新。已经探索了各种模型架构以适应这些更新,这一直是广泛讨论的主题。  

    鉴于基于增量在线学习的诊断方法需要在当前阶段及时响应,浅层学习技术的结构在研究的早期阶段经常被用作设计更新策略的主要框架。为了解决传统局部线性嵌入(LLE)在机械故障诊断中的局限性,引入了一种增量监督LLE(I-SLLE)用于潜水泵的故障诊断[57]。I-SLLE算法采用矩阵分解技术来处理样本外数据。它更新旧的低维坐标子集以提高精度,并通过应用于所有数据的迭代更新来实现。随后,测试数据在特征空间中使用支持向量机(SVM)进行分类。类似地,还引入了一种增量增强监督LLE用于非线性降维,有效地将数据嵌入到低维流形结构中[58]。新故障样本的低维表示然后被输入到自适应最近邻分类器中。它通过基于表示距离选择最近的训练样本来识别故障模式,并采用加权策略来提高准确性。  

    一种改进的增量高斯朴素贝叶斯(I-IGNB)学习算法已被用于通过更新关键参数(如先验概率和条件概率)来提高模型更新效率[59]。增量SVM也被考虑用于更有效地适应新数据[60]-[62]。提出了一种结合增量学习的多核SVM。它旨在提高准确性并降低维护成本,并已成功在两种大规模生产的复杂工业板上得到验证[63]。与单核SVM和人工神经网络方法相比,其优越性已得到很好验证。此外,一些方法尝试使用浅层学习技术进行诊断,这涉及检测和隔离[64],[65]。  

    近几十年来,基于随机化神经网络(RNNet)结构的学习架构,以随机向量函数链接神经网络(RVFL)[66]、极限学习机(ELM)[67]和广度学习系统(BLS)[68]为代表,已被用于设计诊断模型架构,考虑到其良好的增量更新能力[69]-[71]。这些方法,尽管是神经网络结构的一部分,但通常基于最小二乘法执行增量更新,避免了通过反向传播技术在优化过程中进行参数调整的时间成本。例如,Mao等人引入了一种在线序列ELM预测方法,考虑到在线收集的故障数据量比正常数据少[72]。  

    在线阶段,为顺序到达的轴承数据重新建立颗粒和主曲线。通过过采样和欠采样过程形成平衡样本集,以动态更新诊断模型。基于RNNet的诊断方法近年来发展迅速,主要关注问题如时变运行条件和性能退化[73]-[75]。提出了一种基于ELM的分析增量学习(AIL)方法,以解决电力变压器早期故障诊断中的性能退化问题[76]。提出了一种BP增量BLS,旨在应对非平稳振动信号带来的挑战,以加速模型更新[77]。还开发了一种使用证据集成偏好的实时多模式故障诊断新方法,指导运行工况的识别过程,并使用增量BLS进行诊断,取得了优异的诊断结果[73]。为了解决多个运行工况之间的增量更新问题,提出了一种新的跨域类增量广度网络(CDCIBN)来处理非独立同分布连续流数据的诊断问题[78]。在[55]中,提出了一种潜在变量引导的BLS(LVGBLS)来构建诊断模型。然后使用伪标签学习开发了一种增量更新程序,旨在适应动态过程变化,同时最小化标记成本。这些方法充分利用了随机化结构的快速更新能力,在多个任务中取得了令人印象深刻的性能。  

    尽管上述方法在某些应用中取得了成功,但其泛化仍需进一步增强以应对更复杂的诊断任务。大多数方法需要初步确定收集的系统测量值是否属于已知故障模式。在这种情况下,集成学习的概念已在文献中被考虑。有重要证据表明,集成学习可以有效且灵活地处理非平稳环境中的数据模式变化[79],[80]。主要原因是集成学习方法可以灵活调整弱学习器的权重分配,从而快速改变集成学习器的理解。因此,已经引入了几种专注于解决故障分布漂移的设计。  

    例如,Zhang等人[81]提出了一种基于多元集成增量支持向量机的方法,该方法利用现有模型参数逐步学习新的故障信息,而无需先前的监控数据。它通过将多个监控变量与其对应的缺陷类型相关联,有效地检测各种故障,包括复杂故障和不同严重程度的故障。同样,Jing和Zhenya[82]利用半监督学习来减少对先前故障知识的依赖。新生成的系统测量数据首先通过核主成分分析(KPCA)映射到几个聚类标签向量。然后,根据互信息选择一个多样化的子集进行增量更新[83],引入了在线半监督学习的概念,以充分利用离线阶段中的故障信息。这降低了在线过程中收集故障信息的依赖性,从而提供了实际价值[84]一种自适应集 合故障诊断方法已被提出,旨在解决复杂系统中的两个实际挑战:  

    1) 缺乏足够的历史故障实例;  

    2) 被诊断设备的个性化特征缺失。  

    构建隐马尔可夫模型(HMMS)是为了从历史故障和正常实例中提取模式。然后,通过HMMS识别的隐藏状态,将由有监督和无监督方法进行的诊断整合起来,从而克服历史故障实例不足的挑战。在文中提出了一种有趣的方法[85]从数学的角度讨论了数据变化的形式。提出了一种根据最小风险来适应这些变化的战略。遵循这一战略,开发了一种自适应增量诊断模型,该模型在实际应用中已被证明是有效的工业场景,如田纳西伊士曼(TE)工艺以及多相流设施(MPFF)。

    4.2 管理新型故障模式的方法 

    此外,这类基于增量在线学习的FD方法已被广泛用于解决一个关键问题:  如何有效管理在线阶段出现的新型故障模式  。传统的BLFD方法通常需要假设对故障模式的认知是全面的。然而,正如第III-B节所述,新型故障模式在实际场景中经常出现,可能削弱了经典方法的诊断性能。大多数方法都需要先确定所收集的系统测量是否属于已知的故障模式然后,会设计特定的策略来执行更新过程。这些方法通常包括用于故障模式的新颖性检测模块。  

    在过去十年中,已经进行了大量的探索来解决这问题。一个常见的思路是在检测到当前系统测量不属于已知故障模式后,识别与这些新故障模式相对应的数据的故障方向,从而有助于更好地进行故障隔离。这些方法通常旨在解决FDI任务,而不是将其视为故障分类任务。例如,Yang等人。[86]提出了一种新颖的类增量FDA方案,该方案涉及基于部分F值与累积百分比变化(CPV)从已知故障模式中识别新的故障模式一旦F方向确定,新断层样本与断层模式之间的角度余弦值可以添加到数据库中。刘等人。[87]使用了-种具有在线更新能力的最大-最小偏差规则来确定新样本是否源自新的故障模式。该方法通过考虑最大类别后验概率和熵的加权和来实现。此外,还提出了一种基于贝叶斯增量学习的在线故障诊断方法[88]由于FDA和朴素贝叶斯的结构优势,这些方法可以通过对先验概率的增量更新来方便地解决上述问题,而无需保留所有历史信息。然而,此类结构处理更复杂任务相对起来困难。  

    在文献[89]中,  增量支持向量数据描述(ISVDD)   被用于连续设备监控中新型故障模式的快速检测。随后引入了具有增量输出结构(IOELM)的ELM,通过添加输出节点来适应新故障模式的识别。而Fu等人[90]也使用了ISVDD来检测新型故障模式。他们设计了一种具有  类增量学习能力  的广度自编码器(BAE),以适应新输入的故障样本和新型故障模式。关于未知故障模式,Shi等人[91]通过提出的  半监督类增量广度网络(SSCIBN)   进一步解决了故障样本数量有限的问题。受益于RNNet的结构优势,文献[92]和[93]使用  类增量闭式解  来解决新型故障模式下诊断模型的更新问题。类似地,  集成学习的概念也被用于管理新型故障模式  。对于新型故障模式,可以通过添加新的基学习器来增强集成学习器对此类故障的诊断能力。例如,Razavi-Far等人[94],[95]将  Learn++算法  引入在线学习(OL)用于故障分类。通过引入基于集成的增量诊断方案来识别新型故障模式。这些算法能够检测监控数据流中未见过的故障模式,对未知故障模式进行分类,直到为其分配正确的标签。Sankavaram等人[96]研究了一种用于集成分类器的  基于年龄的增量学习  方法,该方法具有不断演化的数据库。其有效性在汽车控制子系统的数据集上得到了验证。

    5 基于增量离线学习的FD方法的最新进展

    另一种常见的范式是基于增量离线学习的FD方法  。这些方法通常专注于任务级别  的增量更新,更新后的诊断模型仅在满足特定条件时才会在在线阶段部署。为了应对第3.3节概述的挑战,必须考虑以下特性:  

     非线性特征提取能力:鉴于系统行为固有的复杂性和可变性,诊断模型应能够从收集的数据中提取非线性特征,这对于捕捉复杂的故障模式和关系至关重要。  

     累积监控数据信息的丰富性:累积的监控数据应足够丰富和多样,以避免因故障特征信息不足而产生的认知局限,确保诊断模型能够在不同运行条件下良好泛化并做出准确预测[97]-[99]。  

     缓解灾难性遗忘效应 :诊断模型架构的设计应包含学习新信息而不忘记先前获得知识的能力,防止更新后性能显著下降[100],[101]。  

    手工制作的特征的有效性通常需要工程师对运行过程有透彻的理解。为了更好地解决这些问题,深度学习技术通常被用于设计模型架构[102]。可以以端到端的方式捕捉更复杂的故障特征,从而避免经典特征工程在实际诊断任务中的局限性。  持续学习(Continual Learning/Lifelong Learning) 技术的应用引起了广泛关注[102]。基于增量离线学习的FD方法的示意图如图8所示,以便更清晰地概述其结构和关键组件。  

    图8 基于增量离线学习的FD方法示意图  

    5.1 处理故障分布漂移的方法 

    与第4节提到的基于增量在线学习的FD方法不同,一些方法旨在积累足够丰富的历史数据后,在离线阶段增量更新模型。该技术思路也很直观。如果发生故障分布漂移,更新后的模型可以有效地执行诊断任务,从而在一定程度上解决性能下降和多工况故障诊断等问题。  

    一种常见的方法是使用在线阶段获得的新样本重新训练诊断模型的关键组件,以适应新的故障模式[103]。Carino等人[104]提出了一种基于SVM的新颖检测方法,用于识别先前未考虑的故障模式。一旦检测到新的故障模式,诊断模型就会被重新训练。其有效性在汽车终端测试机上得到了验证。类似地,在文献[105]中,采用深度学习算法从新生成的数据中提取特征模式。将这些新数据特征与从历史数据中提取的故障模式进行比较,以调整训练集中不同故障模式对应的权重。最后,使用SVM对加权模式进行监督分类。  

    鉴于基于深度神经网络(DNN)的诊断模型通常具有大量参数,频繁重新训练这些模型被认为是耗时的。因此,解决诊断模型中的灾难性遗忘(Catastrophic Forgetting) 已成为一个重要研究课题。在不同负载条件、环境温度和其他运行环境下,故障特征的分布可能会有显著差异。此外,现实世界的设备通常由多个关键组件组成,每个组件表现出不同的故障特征。因此,诊断任务随着时间的推移而不断演变。一个理想的诊断模型应该能够持续从新任务中学习关键信息,同时保留从先前任务中获得的知识。  

    为了解决故障诊断任务中的灾难性遗忘问题,现有文献中提出了各种增量学习策略。例如,文献[106]提出了伪排练(Pseudo-Rehearsal)   方法,通过生成合成数据来近似过去的知识,从而减轻遗忘。然而,伪数据的质量和真实性仍然是关键挑战。样本记忆策略,如中心样本记忆[107],保留了获得的知识,因此保留了重要信息,但需要大量的存储资源。基于  知识蒸馏(Knowledge Distillation, KD)的FD方法也受到了关注[108]-[110]。例如,Guan等人[111]利用自适应知识蒸馏和代表性样本选择来处理性能退化,而[112]应用KD损失来保留关键的先验信息。此外,Hu等人[113]提出了一种  动态校正算法  来平衡模型的稳定性和可塑性,尽管计算复杂度增加了。此外,还探索了动态网络扩展技术[114]、任务增量学习策略[115]和回放增强方法[116]来增强模型的适应性而不发生灾难性遗忘。最近,提出了诸如任务感知动态掩码[117]和弹性扩展机制[118]等策略来优化学习灵活性。  

    总体而言,尽管这些方法在不断变化的环境中保存先前的诊断知识方面表现出强大的潜力,但计算成本、存储需求以及稳定性与性能之间的权衡等挑战仍然是活跃的研究领域。

    5.2 管理新型故障模式的方法  

    由于工业系统的动态和复杂性,管理新型故障模式也至关重要。文献中提出了各种方法来解决这一挑战[119]-[122]。例如,Zhang等人[123]利用  稀疏自编码器  来识别和生成新标签,使诊断模型能够适应和识别新型故障模式。类似地,提出了一种  增量分层扩展DNN  的方法来处理不断输入的新型故障模式[124]。通过使用模糊聚类将相似故障分组为超类,他们的方法允许子模型共享相同的架构并并行训练,从而促进高效的模型更新。为了平衡故障诊断模型中的稳定性和可塑性,Chen等人[125]引入了  双分支聚合网络  。它使用聚合权重来确保模型在保留旧知识的同时学习新信息,从而解决了在复杂运行条件下引入新型故障模式导致的模型失效问题。遵循元学习(Meta-Learning)的思想,Liu等人[126]提出了一种基于权重空间元表示(WSMR)的持续学习模型,用于柱塞泵的类增量故障诊断。在文献[127]中,提出了特征增强持续学习来维持故障诊断模型的核心结构。通过使用有效的蒸馏策略去除冗余参数和特征维度,这种方法确保了诊断模型随着时间的推移保持高效和准确。基于回放(Replay-based)的策略 在[128]和[129]中也得到了充分考虑。Liu等人[129]专注于终身学习的生成特征回放,旨在保留持续故障诊断的基本特征,这在某种程度上与[127]的工作相辅相成,解决了保留关键信息的挑战。少样本学习(Few-shot Learning)   近年来已成为另一个重要的研究热点,无论是在系统级还是组件级[130]-[135]。  

    此外,文献[136]还提出了一种两阶段诊断模型  ,首先将故障样本聚类到不同的特征组中,然后根据样本与这些聚类之间的相似性来识别故障模式。它利用现有特征有效识别新型故障模式,符合持续学习策略。类似地,Liu和Wu[137]提出了一种基于下采样和模型无关元学习(CL-DMAML)的持续学习方法,进一步强调了平衡故障信息的新旧知识的重要性。Huang等人[138]将多保真度信息融合(MFIF-CIL)与类增量学习相结合,用于滚动轴承故障诊断,这与先前工作的持续学习策略一致,确保模型适应新故障模式的同时保留基本知识。文献[139]和[140]中讨论的工作解决了故障频率差异和需要完全重新训练模型的问题。

    6 ILFD方法的研究趋势

    基于以上分析,很明显ILFD方法在学习架构、主要挑战和系统对象方面表现出独特的研究趋势,总结如下:

     学习架构(Learning Architectures):近年来,增量学习架构已逐渐从传统的浅层学习和集成学习方法转向具有更广或更深架构的诊断模型。对于基于增量离线学习的FD方法,深度学习框架正变得越来越占主导地位。特别是,终身学习和迁移学习等技术为解决新型故障模式和时变运行条件相关的挑战提供了机会[149]。相比之下,基于增量在线学习的FD方法仍然主要依赖于具有浅层架构的诊断模型。这些范式通常是轻量级的、训练快速且能够实时更新。因此,越来越多的方法利用这些范式来解决对模型部署要求高的任务,例如性能退化[55]。与经典的浅层学习或集成学习方法相比,基于RNNet的浅层学习方法因其能够平衡灵活性和模型容量而受到关注。  

       主要挑战(Main Challenges):在过去的十年中,关于ILFD的研究显著增长,特别是自2018年以来。随着应用需求的发展,现有研究的重点已从快速适应转向更复杂的挑战,例如在时变运行条件下有效处理故障分布漂移和新型故障模式。这些问题在高维复杂系统中尤其相关。同时,灾难性遗忘问题已成为一个重大问题。在学习过程中,诊断模型不断整合新信息,这可能导致忘记先前获得的知识,从而影响模型的长期性能。在模型更新效率、学习结果和数据多样性之间保持平衡已成为一个关键的研究重点。  

       系统对象(System Objects)  :ILFD的应用在近年来显著多样化。最初,增量学习方法主要应用于机械系统的故障模式识别。随着研究的进展,其范围逐渐扩展到包括化学和其他复杂系统。此外,工业互联网和智能制造的快速发展推动了这些方法从组件级应用转向系统级应用。相关技术越来越期望整合来自各种来源和维度的数据,从而能够处理更复杂的故障模式,特别是那些与复杂交互和多因素影响引起的系统故障相关的模式。  

      注3:虽然准确率和F1分数等常用指标在故障诊断研究中被广泛采用,但目前尚无普遍标准化的评估框架,特别是对于ILFD。不同的研究根据应用特定需求、数据特征和实验设置选择评估指标。在ILFD场景中,  时间敏感指标如实时误报率(RTFAR)、实时漏报率(RTMAR)和累积平均指标(例如累积准确率和累积F1分数)已被提出,以更好地捕捉模型的适应性和长期稳定性。然而,这些专业指标尚未在学术界得到普遍标准化。

    7 典型的实际应用

    如表II所示,ILFD方法已应用于一系列领域。在本节中,我们简要讨论两个代表性的应用领域:1)机械系统;2)化学系统。   

    表II 近期典型基于增量学习的FD方法总结    

    注:SL表示浅层学习;SL*表示基于RNNet的浅层学习;EL表示集成学习;DL表示深度学习。    

    7.1. 机械系统    

    机械故障诊断具有重要的实际意义[150]。机械系统中的故障可能导致严重的安全隐患,对操作人员的人身安全构成威胁。此外,它们可能导致生产过程中断,对产品质量产生负面影响。机械系统通常包括轴承、齿轮箱、转子和泵等关键部件[54],[151]。这些系统通常配备大量传感器,能够收集高频数据,如振动、温度、压力和转速[152]。高采样率与先进特征提取技术的结合能够及时反映系统的运行状态。尽管有这些能力,在设计有效的诊断模型方面仍然存在若干挑战。  性能退化  是机械系统故障诊断中的一个关键问题,因为它直接影响离线阶段开发的评估方法的有效性[153]。随着时间的推移,系统部件应力和结构的变化可能导致功能故障,而退化过程通常是复杂且高度不可预测的。如图9所示,性能退化通常表现为监控数据分布的逐渐和连续变化。这些挑战凸显了在线操作期间诊断模型有效部署和持续适应的必要性。在这方面,  增量在线学习方法  具有更强的适应性,特别适合解决性能退化问题[55]。例如,He等人[55]提出了一种基于增量自适应更新的FD方案,在XJTU-SY轴承数据集的不同运行条件下达到了高达99.6%的准确率,这证明了增量学习在不断发展的工业环境中保持可靠诊断性能的实际优势。  

    图9 性能退化的可视化[55]。颜色表示轴承处于不同程度的退化过程中

    7.2. 化学系统    

    化学过程的故障诊断多年来一直是一个重要的研究焦点。与其他工业过程中的故障类似,化学过程中的故障更有可能导致严重事故,例如有毒气体泄漏和爆炸[154],[155]。化学反应的速率通常是非线性的,许多遵循阿伦尼乌斯方程[156]。为了将过程参数维持在期望范围内,广泛采用反馈控制系统。然而,这些系统也在其响应和控制策略中引入了非线性。由于化学过程精确建模存在固有困难,  数据驱动的故障诊断方法  被普遍使用[157]。现代化学过程通常配备有传感器,用于收集复杂、高维和稀疏的故障诊断数据。温度、压力、流速和浓度等过程参数通常是相互依赖的,这些参数的异常变化都可能引发故障。与机械系统不同,化学过程中的采样频率通常较低,并且执行器输入通常具有延迟效应,导致响应滞后。这种延迟为增量在线学习方法  创造了有利条件,这些方法可以快速适应运行条件的变化,使其特别适合适应季节变化和生产调整。此外,化学过程的运行模式通常难以精确控制。例如,在高炉故障诊断中,煤粉质量的变化影响燃烧效率,进而影响运行条件。化学过程通常涉及多步和副反应,使新型故障模式的预测复杂化。如图10所示,时变过渡条件通常是不可避免的,并且由于操作差异,离线阶段的过渡条件数据通常不可用。在这种情况下,  增量更新策略  对于实时调整诊断模型至关重要。基于增量离线学习的故障诊断方法确保了在不同运行条件下的诊断效果。  

    图10 来自CSTR模拟的数据集示例[158]  


    8 结论与展望

    在本综述中,我们首先简要回顾了故障诊断方法和增量学习技术的发展历史、概念定义和技术分类。讨论并分析了批量学习故障诊断(BLFD)方法与增量学习故障诊断(ILFD)方法之间的联系和区别。然后从两个角度彻底回顾了现有文献,并从三个不同的角度进一步讨论和分析了相关研究趋势。我们还分析了ILFD方法在代表性应用场景中应面对的挑战。需要注意的是,由于新出版物不断涌现,我们对任何遗漏表示歉意。  

    基于对现有文献的回顾,我们总结了未来研究的潜在方向如下:   

    1) 平衡及时性与数据需求:增量学习用于故障诊断的一个关键挑战是在及时进行故障检测与隔离(FDI)和获取足够数据进行有效学习之间取得平衡。现有方法通常假设系统在运行期间能够积累足够丰富的故障样本。然而,在实践中,一旦检测到严重故障,操作员通常会立即关闭系统。此外,考虑到故障通常发生在系统内部,专家很难实时为故障样本提供标注[159]。大多数现有方法忽略了标注过程的实施。未来的研究可以探索智能样本选择策略,优先选择信息量最大的数据进行更新,从而在保持学习质量的同时确保及时的FDI[143],[160]。  

    2)  时间感知更新策略:在现有文献中,诊断模型架构的设计取得了显著进展。然而,当前方法的更新策略通常不考虑系统测量之间的时间关系,而这在实际应用中是一个关键因素。在现实场景中,工业过程本质上是连续的。因此,设计  时间感知的诊断模型更新策略具有重要的研究意义,特别是对于基于增量在线学习的故障诊断方法。  

    3) 处理性能退化与模式转换:如第7节所述,在实际应用中,系统性能会随着时间的推移而退化。故障特征在不同运行条件下通常差异很大,而这些条件会极大地影响系统行为。现有方法通常假设系统在在线阶段能够保持在稳定过程中。ILFD诊断过程并未针对处理性能退化和运行模式转换进行精心设计。因此,研究 主动检测和适应机制的部署 对于解决这些挑战和提高系统鲁棒性至关重要。  

    4) 可解释性与动态XAI  :尽管基于DNN的ILFD方法已表现出卓越的性能,但其缺乏可解释性限制了工程师对诊断结果的理解和信任。提高诊断模型的可解释性将极大地促进这些技术在实际生产中的采用。此外,将时间关系纳入模型解释过程,即动态可解释人工智能(XAI)术,对于理解动态系统中的状态变化至关重要,从而有助于故障定位等任务。  

    5) 资源受限下的优化:在实际工业环境中,终端计算资源通常有限,这对复杂诊断模型的更新提出了重大挑战。现有的基于增量离线学习的FD方法通常需要大量的计算资源。在资源受限的条件下,模型更新的有效性可能会受到影响。通过研究  轻量级模型架构和高效计算方法  ,有可能在终端设备上实现有效的故障诊断。因此,在资源限制下优化模型性能对于确保准确高效的实时ILFD至关重要。

    编辑:李正平
    校核:陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、Tina、陈宇航、陈莹洁、王金、赵诚、肖鑫鑫、张优
    该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除


    来源:故障诊断与python学习
    ACTSystem振动非线性多相流燃烧化学通用航空航天轨道交通汽车ANSAUM理论电机CST材料数字孪生人工智能
    著作权归作者所有,欢迎分享,未经许可,不得转载
    首次发布时间:2025-11-22
    最近编辑:3小时前
    故障诊断与python学习
    硕士 签名征集中
    获赞 87粉丝 137文章 259课程 0
    点赞
    收藏
    作者推荐

    中科院一区Top论文学习|基于两阶段更新数字孪生的轴承剩余寿命预测

    本期给大家推荐基于两阶段更新数字孪生的轴承剩余寿命预测。在工业生产中,轴承作为核心部件直接影响系统运行稳定性,精准预测其剩余寿命(Remaining useful life, RUL)是保障生产的关键。当前主流RUL预测方法普遍忽略轴承实时运行健康状态,导致预测结果偏差较大。针对这一问题,本文提出融合两阶段更新数字孪生与双关联动态图卷积网络的轴承RUL预测方案:构建具有外圈缺陷扩展特性的轴承缺陷演化模型,建立孪生模型与真实轴承的实时交互机制,并校准缺陷优化全生命周期缺陷曲线,借助双向长短期记忆网络关联真实轴承振动特征与孪生缺陷,完成实时映射;最后将映射缺陷纳入RUL预测特征空间,提取物理与数字空间特征关联,实现最终预测。论文链接:通过点击最左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目:Prediction of bearing remaining useful life based on a two-stage updated digital twin 论文期刊:Advanced Engineering InformaticsDoi:https://doi.org/10.1016/j.aei.2025.103123作者:Deqiang He (a), Jiayang Zhao (a), Zhenzhen Jin* (a,d), Chenggeng Huang (b), Fan Zhang (c), Jinxin Wu (a) 论文时间: 2025年 机构: a: Guangxi Key Laboratory of Manufacturing System & Advanced Manufacturing Technology, School of Mechanical Engineering of Guangxi University, Nanning 530004, China b: School of Automation Engineering, University of Electronic Science and Technology, China c: Southwest Jiaotong University School of Design, China d: Guangxi Key Laboratory of Precision Navigation Technology and Application, Guilin University of Electronic Technology, Guilin 541004, China作者简介:靳震震,近五年围绕载运装备故障诊断与智能运维开展研究,主持和参与国家自然科学基金联合基金重点项目、面上项目、广西科技计划项目等项目10余项,发表高水平学术论文50余篇,其中第一作者或通讯作者30篇,ESI热点论文3篇,ESI高被引论文7篇,《光明日报》刊发文章1篇,申请发明专利24件,谷歌学术引用次数共计超1600次,H指数20,I10指数29。参编地方标准1部。获2024年广西大学优秀博士学位论文、2025年广西科技进步一等奖(排名第八)、2025年中国物流与采购联合会科学技术奖一等奖(排名第三)、2024年中国机械行业产教融合教育教学创新大赛全国二等奖(排名第六)、2025年广西大学本科教学成果一等奖(排名第三)、2025年广西大学研究生教学成果特等奖(排名第四)、2025年中国机械行业产教融合教育教学创新大赛全国一等奖(排名第四)各1项,入选全球前2%顶尖科学家榜单、广西青年科技人才托举工程。(来源于广西大学教师信息网) 通讯作者邮箱:sdkjdxjz@163.com 摘要轴承作为工业生产中的关键部件,对系统的平稳运行至关重要。准确预测轴承剩余寿命(Remaining useful life, RUL)十分必要。然而,目前的RUL预测方法未考虑轴承运行的实时健康状态,导致RUL预测精度较低。为解决上述问题,本文提出一种基于两阶段更新数字孪生和双关联动态图卷积网络(Dual correlation dynamic graph convolutional network, DC-DGCN)的轴承RUL预测方法。首先,建立具有外圈缺陷扩展特征的轴承缺陷演化模型,通过多目标优化在第一阶段得到初始缺陷扩展曲线,实现孪生模型与真实轴承的实时交互。随后,利用第二阶段的校准缺陷进一步更新全生命周期缺陷曲线。采用双向长短期记忆网络(Bi-directional long short-term memory, Bi-LSTM)将真实轴承的振动特征与孪生缺陷相关联,完成实时映射。最后,将映射得到的缺陷融入用于RUL预测的特征空间,通过所提出的DC-DGCN方法提取物理空间与数字空间特征之间的关联性,实现最终预测。实验结果表明,该方法有效提高了轴承RUL预测的真实性。关键词:轴承,剩余寿命,实时健康状态,数字孪生,图卷积网络 目录1 引言2 基础理论2.1 数字孪生2.2 动态建模3 数字孪生模型的两阶段更新3.1 孪生建模3.2 两阶段动态更新3.3 基于双向长短期记忆网络的实时映射4 动态图神经网络4.1 图卷积网络4.2 动态图卷积网络5 模型有效性验证5.1 数据集描述5.2 孪生模型有效性验证5.3 两阶段动态模型更新验证5.4 缺陷尺寸实时映射5.5 基于数字孪生的剩余寿命预测6 总结1 引言随着《中国制造2025》和工业4.0等发展战略的持续推进,智能运维已成为各国制造业发展的主要趋势[1-3]。轴承在工业设备中起着关键作用,广泛应用于轨道交通、航空航天、风力发电等行业[4-6]。同时,工业设备中的大多数轴承在恶劣工况下工作,更容易发生腐蚀、磨损等故障。轴承故障不仅会影响系统的正常运行,严重时还可能引发重大安全事故[7, 8]。准确高效的剩余寿命(Remaining useful life, RUL)预测能够指导工业设备维护工作,制定合理的维护计划,避免因轴承意外故障造成的经济损失和人员伤亡。因此,为提高轴承RUL预测的真实性,工业界和学术界正积极探索和研究更优的预测方法[9, 10]。近年来,随着人工智能技术的进一步发展,轴承RUL预测技术逐渐成熟。总体而言,预测方法可分为以下四类:基于物理模型的方法、基于数据驱动的方法、基于专家知识库的方法以及混合预测方法。基于物理模型的方法 会考虑设备的运行环境和退化趋势,结合物理结构建立表征轴承退化状态的数学函数。这类方法往往具有较高的预测精度,但需要深入了解被监测对象的物理特性,且预测真实性很大程度上依赖于物理模型的准确建立[11]。当前机械系统日益精密和复杂,构建能够准确反映轴承退化机理的物理模型面临巨大挑战。基于数据驱动的方法可直接对传感器获取的数据进行处理,从与退化趋势相关的历史状态信号中提取特征信息。基于这些信息,在状态监测数据与轴承RUL之间建立模糊函数关系,用于RUL预测。由于无需详细解释和建模轴承的失效机理,该方法特别适用于复杂机械系统[12-15]。基于专家知识库的方法利用专家系统特有的领域知识,通过将状态监测数据与预先定义的寿命数据进行对比,得出轴承的实时RUL[16]。但由于对领域知识要求较高,这类方法的应用范围并不广泛。混合预测方法将数据驱动技术与物理模型相结合,既利用了物理模型预测的准确性,又兼具数据驱动方法的实用性,能够有效捕捉轴承退化过程中的不确定性[17,18]。然而,这类方法的模型复杂度通常较高,且可能受到物理模型要求的限制。随着大数据的发展与普及,基于数据驱动的方法逐渐成为RUL预测的主流。图神经网络(Graph convolutional network, GNNs)凭借其独特的关联性提取能力,在该领域受到越来越多的关注。图神经网络由顶点、边和图构成:顶点代表每个节点的特征,边代表节点之间的关系或相似性,图则是所有顶点和边的综合特征表示。捕捉特征之间的关联性能够有效从监测数据中提取退化信息,从而提高网络模型的鲁棒性和准确性。然而,现有文献常将多个传感器视为节点,将传感器之间的位置关系视为边。例如,Li等[19]建立了多传感器图神经网络用于轴承RUL预测,采用余弦相似度计算节点间的边权值。在单传感器领域,现有研究往往只考虑特征通道数据单维度的关联性。例如,Yang等[20]提出了一种基于单传感器的图神经网络,以时间序列作为节点连接判断的依据。仅考虑单维度关联性的图神经网络会丢失部分关联信息,导致预测精度下降。上述所有方法在轴承RUL预测方面均取得了一定成果,但它们都未关注轴承退化过程中的运动行为,且忽略了特征空间与轴承物理空间之间的实时交互。数字孪生(Digital twin, DT)为连接物理实体与状态监测数据提供了可行途径[21]。DT作为一种多尺度、多学科的仿真模型,能够实时模拟真实物理实体的运动,是连接物理空间与数字空间的桥梁[22]。同时,DT包含丰富的运行数据,可从中获取真实工况下难以得到的健康状态信息,这些信息能够为机械设备的制造、改进和维护提供指导[23]。利用DT技术可大幅降低实验成本,减少资源浪费[24]。目前,已有大量研究将DT应用于轴承全生命周期管理。Ma等[25]构建了一个融合领域自适应和注意力机制的增强元迁移学习模型,并将其与基于有限元的DT模型相结合,实现了基于少量标记目标域数据的轴承故障诊断。Qin等[26]针对轴承故障诊断中的样本不平衡问题,提出了一种基于DT的数据集生成方法。他们构建反向物理信息神经网络来调整模型参数,以优化孪生信号的匹配度,并设计边界损失辅助网络实现快速收敛。实验结果表明,该方法在不同工况和故障模式下均能提高轴承故障诊断的准确性。Li等[27]对轴承的故障演化模式进行了研究,将其分为裂纹、剥落和缺陷三类,提出了轴承全生命周期的多尺度DT模型,并通过实验验证了该模型具有良好的准确性。DT的发展时间相对较短,目前尚无公认的最优轴承数值模型。此外,许多技术尚未成熟,如高精度模型构建、虚实数据传输、数据预处理等。在轴承RUL预测领域,DT的应用也处于逐步完善阶段。Desai等[28]提出了一种基于摩擦学感知的DT模型,并将其与具有因果膨胀卷积的卷积神经网络相结合用于RUL预测,实现了无需磨损测量的自主维护。Liu等[29]基于振动现象构建了轴承DT模型,并采用领域对抗神经网络减小数字域与真实域之间的差异,该方法无需先验标记即可实现RUL预测。Zhang等[30]考虑到轴承RUL预测中未来数据缺失的问题,构建了基于敏感特征的DT框架,利用联合DT的集成学习Catboost方法对数据集进行补全,并通过实验验证了完整数据集的有效性。Zhao等[31]提出了一种通过DT模型生成样本数据的小样本RUL预测方法,采用多源回归对抗领域自适应方法对模拟数据进行领域转换。对现有文献的分析表明,目前用于轴承的DT更倾向于建立仿真模型来模拟轴承的运行过程。然而,上述仿真模型并未实现DT的核心目标——实时交互与数据反馈。这导致现有RUL预测研究无法获取轴承的实时运行状态,且忽略了物理空间与数字空间数据之间的关联性。同时,大多数现有DT模型未考虑DT与物理实体之间的实时差异,无法准确反映轴承的退化过程。为解决上述问题,本文提出一种基于DT模型两阶段更新的RUL预测方法。在孪生模型初始化后,通过多目标粒子群优化捕捉数字空间与物理空间之间的实时关联,更新孪生模型的动态响应,使其匹配最优的轴承全寿命缺陷尺寸。在第二阶段,通过校准缺陷尺寸进一步更新缺陷曲线。随后引入Bi-LSTM,将轴承的振动特征有效映射到孪生缺陷特征,以提高RUL预测的真实性。本文的主要贡献如下:(1)提出了两阶段更新DT模型,与传统动态建模不同。该模型通过多目标优化捕捉两类空间之间的实时关联,更新模型参数以实现孪生模型与真实轴承的交互,并在第二阶段利用高保真校准缺陷进一步更新缺陷曲线。(2)构建了基于Bi-LSTM的实时映射网络,并以DT模型两阶段更新得到的缺陷尺寸作为数据集对其进行训练。(3)提出了基于双关联的动态图神经网络,能够更好地提取物理空间与数字空间之间的特征关联性。 2 基础理论DT为轴承RUL预测提供了新的可能,其核心是动态建模。构建能够充分反映轴承真实运行状态的动态模型,有助于DT更好地发挥作用,从而更准确地指导物理空间的RUL预测。 2.1 数字孪生Grieves在产品生命周期管理课程中首次提出数DT概念,引入了镜像空间模型[32]。此后,DT受到全球广泛关注,并在产品故障预测与健康管理领域不断发展。DT模型是物理对象的虚拟表示,通过与物理实体的实时交互,使孪生模型不断接近物理实体的真实运行状态。当达到一定相似度阈值后,可通过多种方法从孪生模型中获取数据,进而对物理实体进行优化,指导维护决策[33]。DT具有提高可靠性、降低成本等优势,已在多个领域成功应用[34, 35]。基于DT的轴承全生命周期管理一般流程如图1所示。 图1 DT2.2 动态建模本文引入赫兹接触理论建立轴承动力学模型,该模型能更准确地反映轴承局部缺陷的扩展过程,所建立的动力学模型由微分方程推导得出: 其中,M为系统质量,C为阻尼系数,K为刚度,F为激励载荷。为方便研究轴承动力学特性,假设滚动体与滚道之间的接触变形为非线性弹簧-阻尼单元。当滚动体经过缺陷位置时,会产生时变位移激励,进而引发动力学响应。本文建立模型时做出如下必要假设:(1)轴承运行过程中温度恒定;(2)滚动体等距排列,质量可忽略不计,且相互之间无作用力;(3)仅考虑轴承径向方向的作用力,忽略轴向振动;(4)轴承经过缺陷时发生局部接触变形,但轴承整体尺寸不变。3 数字孪生模型的两阶段更新本节构建了具有参数更新机制的两阶段DT模型,整体RUL预测框架如图2所示。首先,根据轴承的物理参数模拟其全生命周期的动力学响应;通过两阶段更新与物理实体交互,实时更新轴承的缺陷尺寸,更准确地捕捉轴承全生命周期的缺陷状态;随后,为提高DT交互的实时性,采用Bi-LSTM建立轴承物理空间特征与孪生缺陷之间的实时映射;最后,将实时缺陷融入特征空间,以提高轴承RUL预测的准确性。 图2 基于DT的RUL预测框架3.1 孪生建模DT系统的动力学模型如图3所示。应用牛顿第二定律并结合式(1),可推导出考虑阻尼和恒定外载荷的滚动轴承二自由度动力学方程,其关系如式(2)所示: 其中, 为轴承的等效质量, 为轴承的等效阻尼, 、 分别为x、y方向的振动速度, 、 分别为x、y方向的振动加速度, 、 分别为外圈与滚动体在x、y方向的接触力分量, 、 分别为轴承的载荷分量。 图3 孪生模型将接触力视为非线性接触力,根据赫兹接触理论计算,可推导出式(3): 对于圆柱滚子轴承,n=10/9;对于球轴承,n=3/2。将其代入式(2),可得到滚动轴承孪生模型的最终缺陷扩展模型,如式(4)所示: 其中, 为轴承的总接触刚度, 为滚动体数量, 为滚动体 与外圈是否接触的判断因子,可由式(5)表示: 为滚道与滚动体i的接触变形,可由式(6)表示: 其中, 为时变位移激励, 为 时刻滚动体 的角位置,可通过式(7)-(9)计算:首先将轴的转速转换为弧度制,然后计算轴承保持架的转速,最后通过式(9)计算滚动体的位置。 其中, 为旋转系统中轴的转速, 为轴的角速度, 为滚动体直径, 为轴承的节圆直径, 为轴承保持架的转速, 为滚动体总数。 对于时变位移激励 ,为模拟真实轴承缺陷演化产生的位移激励,通常将轴承全生命周期分为两个阶段进行计算。为简化动力学模型,忽略缺陷边缘与滚动体之间的接触变形,将缺陷视为长度为 、深度为 的矩形。本文所考虑的轴承局部缺陷扩展过程如图4所示,据此建立两个阶段的位移激励函数表达式。 图4 缺陷扩展过程在初始缺陷生成阶段,由图4(a)可知,由于此时缺陷长度较小,滚动体无法完全接触到缺陷底部,其最大位移激励 始终小于缺陷深度 ,可由式(10)计算: 此时,时变位移激励函数可表示为式(11):其中, 为时刻 第 个滚动体的剩余角位置, , 为缺陷中心对应的角度, 为缺陷对应的跨度角。图4(b)为缺陷扩展阶段:随着缺陷尺寸增大,最大位移激励逐渐增加,直至等于缺陷深度 。此时滚动体将完全陷入缺陷中,这种现象通常在故障中后期出现。时变位移激励函数定义如式(12)所示:其中, 为滚动体接触缺陷底部时球心对应的跨度角。3.2 两阶段动态更新 基于3.1节的孪生建模,可调整各动态参数(如阻尼比、外载荷等)以匹配滚动轴承的真实动态响应。同时,为更准确地建模轴承全生命周期的缺陷尺寸,提出两阶段动态更新方法:采用多目标优化算法对孪生模型的缺陷参数进行持续迭代,得到帕累托最优前沿,使孪生模型生成的动态响应与真实响应高度匹配;在准确确定轴承全生命周期缺陷尺寸后,采用所提计算方法获取特定时刻的高保真缺陷尺寸,进而优化全生命周期缺陷曲线,最终得到精度更高的结果。 3.2.1 多目标参数优化 为使真实轴承与孪生轴承的动态响应差异最小化,首先获取初步的全生命周期缺陷尺寸。本文采用多目标优化对孪生模型参数进行迭代,优化目标同时考虑频域和时域相似度,以确保获得最匹配的缺陷参数。多目标优化的数学表达式如下: 其中, 为优化后的缺陷参数(包括缺陷长度 、缺陷深度 ), 、 分别为孪生轴承和真实轴承的动态响应, 表示快速傅里叶变换, 表示动态时间规整距离, 表示皮尔逊相关系数。 多目标粒子群优化算法由Carlos A. Coello Coello等人提出,是将传统粒子群算法扩展到多目标优化问题的算法。粒子群算法作为一种群智能进化算法,其核心原理是将优化问题的最优解类比为食物位置,将粒子的运动类比为鸟类的飞行方向和速度。在种群更新过程中,每只“鸟”(粒子)通过同时考虑自身对食物位置的记忆以及群体记忆的影响来调整飞行方向,通过迭代更新种群位置,引导种群向最优解收敛,最终获得全局最优解。其具体更新过程可表示为式(14): 其中, 为第 次迭代后粒子i的速度向量, 为第 次迭代后粒子 的位置向量, 为惯性系数, 、 为[0,1]范围内的随机数, 为个体学习因子, 为社会学习因子, 为第 次迭代中粒子 的最优位置, 为第 次迭代中种群的最优位置。计算得到第 次迭代的速度后,采用式(15)更新每个粒子的位置: 引入自适应网格算法和帕累托支配实现基于粒子群优化的多目标优化:多目标粒子群优化算法采用自适应网格算法和轮盘赌选择法,从每次迭代得到的一系列非支配关系粒子中选择历史最优解,在外部存档中存储分布更均匀的帕累托前沿。3.2.2 校准缺陷获取通过多目标优化求解后,可得到轴承全生命周期缺陷尺寸。为进一步减小其与真实轴承缺陷尺寸的差异,需采用尽可能接近真实的缺陷尺寸对3.2.1节得到的全生命周期缺陷曲线再次调整。然而,在轴承运行过程中拆解轴承测量缺陷尺寸既不合理又成本高昂。为解决这一问题,本文引入文献[36]中的方法,通过分析轴承时域振动信号确定特定时间段内更准确的缺陷尺寸。 滚动体经过局部缺陷时的物理过程如图5所示:当滚动体到达A点时,开始进入缺陷区域;此时由于接触面积减小,动态响应降低,直至到达最低局部点B(B点位置无需用于缺陷尺寸计算,故图中未标出);随后动态响应逐渐增大,并在C点达到峰值,此时滚动体即将脱离滚道;经过C点后,滚动体穿过缺陷到达D点,与缺陷边缘碰撞并产生高频响应。图中部分变量的几何关系如式(16)所示: 其中, 、 为A点、C点相对于缺陷入口E的角度, 为轴承节圆半径, 为保持架旋转频率, 为轴承从C点旋转到D点的时间, 为滚动体半径。由上式可知,从振动信号中提取各点位置后,可求得缺陷的跨度角 ,再通过式(17)得到精度更高的轴承缺陷长度: 获取部分时刻的校准缺陷尺寸后,采用式(18)对第一阶段生成的轴承全生命周期缺陷曲线进行修正,得到最终的两阶段更新缺陷尺寸: 其中, 为与第一个校准缺陷对应的第一阶段优化缺陷尺寸, 为轴承运行至失效的总时间, 为获取的校准缺陷数量, 为第 个时刻的校准缺陷尺寸。 图5 滚动体通过缺陷区域需说明的是,本文仅选择特定时刻计算校准缺陷,原因如下:1.上述校准缺陷计算过程基于轴承的双脉冲现象,而在轴承故障早期,该现象通常难以捕捉,因此该方法仅在缺陷扩展到一定尺寸后才具有较高精度;2.计算标定缺陷的成本较大,对轴承每一时刻计算标定缺陷是不切实际的,也是不合理的;3.计算每个轴承时刻的标定缺陷是不现实的,也是不合理的。3.3 基于双向长短期记忆网络的实时映射 为增强物理实体与孪生实体之间的交互性,加快信息交互速度,考虑到缺陷尺寸的增长是一个连续过程,且某一时刻的缺陷尺寸与其前后状态相关联,本文提出采用双向长短期记忆网络建立虚实空间之间的关联。该关联基于神经网络优异的学习能力,可接收轴承实时振动信号,通过训练后的神经网络输出孪生模型的实时缺陷尺寸,并反馈给真实轴承,为其RUL预测提供指导。 由于缺陷尺寸也可视为一维特征,为实现最优关联效果,需选择合适的特征进行映射。均方根值受噪声影响较小,且能有效描述动态响应的大小,因此本文选择均方根值作为缺陷映射的特征。具体步骤如下:(1)通过3.2节的两阶段模型更新,获取轴承全生命周期缺陷尺寸;(2)计算轴承全生命周期的均方根值;(3)以均方根值为输入、全生命周期缺陷尺寸为输出,训练双向长短期记忆网络;(4)将轴承实时均方根值直接输入模型,得到实时映射的缺陷尺寸。 4 动态图神经网络为将孪生模型的退化特征更好地融入真实轴承的RUL预测,考虑到图卷积网络(Graph Convolutional Networks, GCNs)能够捕捉特征间的关联关系,且聚合该关联关系可提高轴承RUL预测的准确性,本文提出一种考虑双关联的动态图卷积网络(Dual correlation dynamic graph convolutional network, DC-DGCN)。基于DGCN的轴承RUL整体流程如图6所示,该网络主要包括三部分:真实轴承特征提取与孪生轴承特征映射、动态空间关联提取、时间关联提取。首先,通过与真实轴承交互得到最优全生命周期孪生模型,并将真实轴承特征与孪生模型缺陷特征融合;然后,划分时间步数据,构建动态空间关联图以提取融合特征通道的动态空间关联,并将其输入带有门控循环单元(Gated Recurrent Unit, GRU)的DGCN模块,提取双关联特征;最后,通过全连接层输出轴承RUL。图6 DC-DGCN模型的框架4.1 GCNGCN可聚合具有关联信息的相邻节点,以更好地表示节点特征。图的结构可定义为 ,其中 表示节点的特征信息, 为节点数量(即特征数量), 为特征维度(即时间步长度), 表示节点之间的连接关系, 表示节点间关联的邻接矩阵。本文采用余弦相似度定义节点间的相似度矩阵,余弦相似度矩阵 中的元素 可通过式(19)计算,其中 为第 个轴承第 次采样数据第 行的特征, 为向量的二范数: 对余弦相似度矩阵 的元素应用式(20)定义的函数 ,可得到邻接矩阵 的元素 ,其中 为人工定义的阈值。 表示在时间关联图中两个时间节点无边线连接,即无时间关联性; 表示在时间关联图中两个时间节点有边线连接,即存在时间关联性。 计算空间关联邻接矩阵,并将其与输入特征矩阵结合。GCN模型将在傅里叶域构建图滤波器,该滤波器可作用于图节点,聚合一阶邻域特征,从而捕捉节点间的关联信息。归一化图拉普拉斯矩阵定义如式(21)所示: 其中, 为度矩阵, , 为单位矩阵。GCN模型的信息传递过程可表示为式(22): 其中, 为带有自环的邻接矩阵(即在原始邻接矩阵中加入自连接), 为第 层的可训练权重矩阵, 为ReLU激活函数, 为第 层的输入(当 时, , 为输入特征矩阵)4.2 DGCN由4.1节可知,GCN通过聚合相邻节点能够很好地捕捉特征间的空间关联,但仅依靠GCN无法获取特征间的时间依赖关系(即时间关联)。因此,本文设计DGCN模块,以同时获取融合特征通道的时空关联,并将其用于RUL预测。 图7展示了动态图卷积网络模块的结构,其中 为时刻 的输入, 为隐藏层状态, 、 、 分别为细胞状态、更新门和重置门。 图7 DGCN模块的构建 该模块的具体计算过程可表示为式(23),其中 为Sigmoid激活函数, 为图卷积网络处理过程, 和 分别为可训练权重矩阵和偏置: 综上,该模块在保留有效历史信息的同时,能够捕捉当前时空域的关联关系,因此其隐藏层同时包含融合特征通道的时间关联和空间关联信息。5 模型有效性验证为验证本文所提模型的有效性,本节采用公开数据集进行实验。所有实验均在搭载I7-11800H@2.30 GHz处理器和NVIDIA GeForce RTX 3090显卡的服务器上运行,RUL预测算法采用Pytorch框架实现。5.1 数据集描述采用XJTU-SY数据集的轴承退化数据验证所提两阶段动态更新DT模型的有效性,实验平台如图8所示。该数据集提供了15个轴承在三种不同工况下的全生命周期数据,表1列出了三组轴承的详细信息,采样间隔为1分钟,每个样本采样时长为1.28秒,采样频率为25.6kHz。 图8 XJTU-SY轴承实验台 表1 XJTU-SY数据集中轴承的工况 表2列出了实验轴承的实际参数,为最小化孪生模型与真实轴承的差异,将孪生模型的动力学参数设置为实际值。 表2 实验轴承的主要参数 XJTU-SY数据集每个样本包含32768个采样点,为便于观察和分析,每次仅使用总采样点中的10000个数据点优化孪生模型的动态参数。动态仿真参数如表3所示。采用上述动力学参数在Simulink中进行仿真,并在Matlab中使用ode45求解器执行后续多目标优化。 表3动态仿真的主要参数 5.2 孪生模型有效性验证 孪生模型的动态响应如图9所示,其与真实信号的包络分析对比如图10所示。可以看出,由于局部缺陷的存在,孪生模型的动态响应具有明显的周期性。由于外圈缺陷位置固定,产生的冲击信号间隔均匀,滚动体经过缺陷产生冲击的周期 ( 为外圈故障特征频率)。结合实验轴承的实际参数,通过式(24)可计算出其外圈故障特征频率为108Hz。由图10可知,孪生信号与真实信号的包络信号基本一致。由于真实轴承运行环境中存在噪声,其动态响应表现出不规则性,且振幅略大于孪生信号;相比之下,孪生信号更为规则。仿真数据的包络谱清晰地显示出轴承故障特征频率及其倍频,与真实轴承的包络谱差异极小。因此,可认为该孪生模型能够在一定程度上反映真实轴承的运行状态。 其中, 为滚动体数量, 为轴承旋转频率, 为滚动体直径, 为轴承节圆直径, 为轴承接触角。 图9 时域孪生信号 图10 实际信号与孪生信号的包络分析对比:(a)包络信号,(b)包络谱5.3 两阶段动态更新模型验证 DT的关键过程是与物理空间的实时交互。为使孪生模型更准确地反映轴承的实时健康状态,采用两阶段孪生缺陷尺寸更新来跟踪真实缺陷尺寸。 5.3.1 多目标优化求解 在验证孪生模型有效性后,利用真实轴承的动态响应对其进行两阶段动态更新,以获取最优全生命周期缺陷尺寸。本节选择XJTU-SY数据集的Bearing1_1和Bearing1_3作为测试对象,通过两阶段更新得到两个轴承的全生命周期缺陷曲线,用于后续实时映射。 多目标优化后得到的第一阶段轴承缺陷曲线如图11所示,每个时刻对应的不同缺陷尺寸为此时多目标优化求解得到的帕累托最优解。 图11 多目标优化结果:(a)Bearing1_1,(b)Bearing1_3 对每个时刻得到的缺陷尺寸取平均值,得到基于多目标优化的轴承第一阶段全生命周期缺陷尺寸曲线,如图12所示。 图12第一阶段的缺陷尺寸:(a)Bearing1_1,(b)Bearing1_3 5.3.2 校准缺陷尺寸计算 获取第一阶段轴承缺陷尺寸后,计算校准缺陷尺寸并进行第二阶段更新至关重要。文献研究表明,仅当轴承动态响应表现出明显的双脉冲现象时,该计算方法才具有较高精度。从第一阶段轴承缺陷尺寸曲线可以看出,Bearing1_1在78分钟时动态响应发生较大变化,可认为此时轴承缺陷尺寸已满足产生双脉冲现象的条件。因此,计算78分钟后的多个缺陷尺寸,对第一阶段轴承缺陷曲线进行更新;Bearing1_3采用类似方法进行推断和计算。表4列出了Bearing1_1的计算校准缺陷尺寸及其对应时刻的第一阶段缺陷尺寸。 表4 Bearing1_1的高精度校准缺陷 采用式(18)对第一阶段缺陷曲线进行修正,得到第二阶段更新缺陷尺寸,如图13所示。观察图13可知,第一阶段得到的轴承缺陷曲线能够大致跟踪整体趋势,但在轴承故障后期,多目标优化算法得到的缺陷尺寸曲线与两阶段更新后的曲线存在一定差异。原因是在缺陷较大的时间段内,轴承动态响应的不稳定性更强,导致缺陷匹配出现误差。两阶段校准缺陷可指导第一阶段缺陷曲线进行再次更新,从而得到高保真的轴承全生命周期缺陷曲线。 图13 二阶段更新过程:(a)Bearing1_1,(b)Bearing1_3 5.3.3 全生命周期缺陷尺寸验证 为进一步验证两阶段更新得到的全生命周期缺陷尺寸的有效性和准确性,将其与最新研究成果进行对比,包括Li等[27]提出的多尺度故障演化DT模型、Shi等[32]提出的新型DT模型以及Qin等[38]提出的基于CycleGAN的DT模型。需说明的是,为便于对比,对部分相关文献的缺陷尺寸曲线进行了处理,但保留了其主要趋势和特征。对比结果如图14所示,可以看出,两阶段更新后的全生命周期缺陷尺寸曲线与其他相关文献的曲线趋势基本一致,验证了本文所提DT模型的有效性。由于本文采用多目标优化拟合第一阶段曲线,缺陷尺寸曲线的性能更稳定,有利于后续RUL预测。 图14 缺陷尺寸的对比 5.4 缺陷尺寸实时映射 本节选择Bearing1_1数据的80%作为双向长短期记忆网络的训练集,剩余20%的Bearing1_1数据及Bearing1_3数据作为测试集,以验证缺陷曲线的准确性和模型将振动特征实时映射到缺陷尺寸的有效性。 本文设计的双向长短期记忆网络在输出时仅分别获取前向和后向部分的最后一步结果。通过调整隐藏层维度确定最优配置,实验表明隐藏层维度对预测结果的影响较小,因此将隐藏层维度设置为10,在保证预测性能的同时平衡参数数量。此外,采用Adam优化器对模型进行优化。 模型的映射效果如图15所示,可见映射曲线与两阶段更新得到的缺陷尺寸曲线差异极小,验证了映射模型的有效性,该模型能够很好地将真实轴承的动态响应映射到孪生模型的缺陷尺寸。这种实时映射能够以优异的实时性和准确性揭示轴承振动信号与运行缺陷尺寸之间的关系。随后,采用训练后的模型获取轴承的实时运行状态,并将该信息融入RUL预测。 图15 基于Bi-LSTM的缺陷尺寸映射:(a)Bearing1_1,(b)Bearing1_3 5.5 基于数字孪生的剩余寿命预测 上述小节从时域、包络谱等方面验证了DT模型的有效性,并通过两阶段更新校准了轴承的全生命周期缺陷尺寸,训练得到性能较优的映射模型。为实现整体DT框架的实时交互目标,本部分将模型映射得到的缺陷尺寸作为特征加入RUL预测,并通过与其他先进预测方法对比,验证所提方法的优越性。 5.5.1 超参数设置 在本节的RUL预测实验中,共提取8个时域特征、11个频域特征和8个时频域特征。其中,8个时域特征包括方差、峰度、熵、最大最小值、峰峰值、偏度、均方根和标准差;频域特征通过对原始信号进行快速傅里叶变换提取,包括中心频率、平均频率、最大振幅、最大功率谱密度、平均功率谱密度、功率谱密度方差、偏度、峰度、频率标准差、频率分布不对称系数和频率分布峰度;时频域特征通过采用Daubechies小波基函数进行三层小波包分解得到,8个特征分别对应不同子带的能量占比。研究表明,这些特征在轴承RUL预测中具有有效性[37]。 所提模型的超参数包括隐藏层维度和时间步长:时间步长设置过小时,门控模块难以有效捕捉时间信息;时间步长设置过大则会导致模型参数过多,延长训练过程,因此将时间步长推荐范围设置为20-35。隐藏层维度决定模型的信息记忆能力,设置范围为2-10。通过网格搜索法优化,综合考虑预测性能后,最终确定时间步长为30,隐藏层维度为6。 5.5.2 实验设计和结果 基于XJTU-SY数据集设计三组RUL预测任务,以验证所提方法在不同工况下的有效性,具体配置如表5所示。 表5 预测任务的具体设置 本文采用故障预测与健康管理领域广泛使用的均方根误差(Root mean square error, RMSE)和平均绝对误差(Mean square error, MAE)作为评价指标,衡量模型预测水平。这两个指标反映真实值与预测值之间的平均偏差,数值越小表示预测准确性越高。其中,均方根误差对异常值更敏感。此外,设计Score指标评价模型预测精度,该指标对预测值与真实值的差异高度敏感,且当真实值大于预测值时Score会显著增大,这一特性更符合实际需求。指标计算公式如下: 其中, 为测试样本数量, 为第 个样本的真实值, 为第 个样本的预测值。为验证本文获取的映射缺陷尺寸的有效性,将实验分为两种场景:S2表示仅提取上述特征;S1表示在提取上述特征的基础上加入全生命周期缺陷尺寸。 在对比模型选择方面:首先选择仅提取原始特征序列时间特征的时间卷积网络(Temporal Convolutional Network, TCN);其次,为验证图神经网络特征提取的优越性,选择两种具有空间提取能力的模型——卷积门控循环单元(Convolutional GRU, ConvGRU)和卷积长短期记忆网络(Convolutional LSTM, C-LSTM),这两种模型既能提取时间特征,又能利用卷积神经网络提取空间特征;最后,选择图卷积网络(GCN)进行对比,以验证所提模型在双关联特征提取方面的优越性。此外,为更好地体现所提模型的优越性,选择文献[20]中的ChebGCN-LSTM模型进行对比,该模型将特定时刻的特征序列作为节点特征,以时间顺序作为节点间连接的判断依据,并采用长短期记忆网络获取时间依赖关系。 训练过程采用Adam优化器,批大小设置为32,学习率设置为0.001,损失函数选择均方误差。 各模型在两种场景下的预测结果如表6和表7所示。场景S2的对比数据表明,所提方法的预测准确性总体优于其他模型:其平均均方根误差比表现最优的对比模型ConvGRU低0.011,这得益于图神经网络提取的关联关系能够更有效地揭示轴承退化过程,最终提高RUL预测准确性;此外,所提模型的均方根误差比标准图卷积网络和ChebGCN-LSTM分别降低0.026和0.013,表明双关联提取考虑了更广泛的特征信息,验证了所提模型的优越性。同时,同时提取时间和空间特征的模型比仅提取时间特征的模型表现出更优的预测性能。 综合场景S1来看,时间卷积网络在加入全周期缺陷尺寸作为特征后,预测性能未得到显著提升,表明仅提取时间特征的模型难以将实时缺陷尺寸很好地融入RUL预测;而ConvGRU、ChebGCN-LSTM和C-LSTM在加入该特征后,预测性能均有不同程度提升,总平均均方根误差分别降低0.11、0.10和0.12,验证了所提两阶段更新DT模型的有效性——通过映射得到的实时缺陷尺寸可提高模型的RUL预测能力。所提方法在S1场景下的平均均方根误差比S2场景降低0.020,降幅显著,表明与采用卷积神经网络进行空间特征提取相比,所提方法能更有效地提取实时缺陷特征与其他特征之间的关联关系。值得注意的是,所提模型的均方根误差降幅大于ChebGCN-LSTM,这得益于动态图的构建,使模型能够更有效地跟踪轴承退化趋势,获取适应性更强的关联信息。 表6 不同场景下各模型的RMSE值 表7 不同场景下各模型的MAE值 Score指标对比如图16和图17所示,可见所提模型的Score值最低,表明其预测精度最高,预测结果更有利于指导实际工作。尽管ConvGRU的均方根误差表现较好,但在Score指标上表现较差,说明其预测曲线难以很好地应用于实际场景。 图16 场景S2的Score值 图17 场景S1的Score值为进一步验证所提方法的有效性,图18和图19分别展示了部分轴承在场景S2和S1下的RUL预测结果曲线。可以看出,大多数模型在整体趋势上能够反映轴承退化过程,但时间卷积网络的预测精度未能达到理想效果;与仅提取时间关联的模型相比,同时提取时空关联的模型表现出更高的准确性;且在加入全寿命缺陷尺寸作为特征后,各模型的预测曲线更接近实际寿命曲线。在两种场景下,动态图卷积网络均能比其他模型更好地跟踪轴承退化趋势,具有更优的RUL预测能力。 两种场景的对比表明,动态图卷积网络在加入实时缺陷尺寸后,预测曲线的改善更为明显,说明所提方法通过融合缺陷尺寸特征,有效捕捉了轴承的整体退化特征,提高了轴承RUL预测的准确性,尤其在轴承寿命后期效果显著。这对RUL预测至关重要,因为轴承寿命前期的RUL通常无需过多关注,而准确的寿命后期RUL预测能够帮助提高设备可靠性,减少因突发故障造成的损耗。 此外,需注意的是,所提方法在部分轴承的预测中,加入缺陷尺寸特征后预测效果未得到显著提升,推测原因是这些轴承在运行过程中未出现明显的外圈缺陷,而本文构建的孪生模型仅描述了外圈的缺陷扩展过程。 为更清晰地说明所提方法的有效性和优越性,对比所提模型在两种场景下的预测结果,图20给出了部分轴承在两种场景下的预测曲线及误差大小。场景S1的模型预测精度更高,在预测后期的误差小于场景S2。这一优势源于动态图卷积网络能够有效利用全生命周期缺陷尺寸,且模型捕捉的关联关系显著提升了RUL预测性能。 图18 场景S2下各模型的预测曲线:(a)Bearing1-3,(b)Bearing1-4,(c)Bearing2-4,(d)Bearing3-3 图19 场景S1下各模型的预测曲线:(a)Bearing1-3,(b)Bearing1-4,(c)Bearing2-4,(d)Bearing3-3 图20 所提模型在两种场景下的对比6 总结针对当前轴承RUL预测未考虑运行实时健康状态的问题,本文提出一种DC-DGCN轴承RUL预测方法。首先,通过构建含局部缺陷的孪生动力学模型来模拟真实轴承的运行过程,并采用第一阶段多目标优化方法实时更新孪生模型参数,使孪生模型生成的信号与真实轴承的动态响应更加吻合。在获取轴承全生命周期缺陷尺寸后,通过第二阶段校准进一步优化缺陷尺寸,并引入Bi-LSTM建立实时映射关系。最终,结合从DT中获取的缺陷尺寸特征,利用所提出的双关联动态图卷积网络实现轴承RUL预测。实验结果表明,本文提出的动态孪生模型能够更准确地复现真实轴承的运行状态;在双关联动态图卷积网络的作用下,通过两阶段更新获取的缺陷特征显著提升了轴承RUL预测的准确性。此外,实验验证表明,本文所提方法的性能优于其他先进模型。该模型将实时健康状态监测与先进数据分析技术相融合。随着人工智能技术的不断发展,该模型可进一步融入智能决策系统,实现设备的自动化维护与故障预警,有望为工业制造等领域的智能化转型提供重要支撑。 编辑:陈宇航校核:李正平、陈凯歌、曹希铭、赵学功、白亮、任超、海洋、赵栓栓、陈莹洁、Tina、王金、赵诚、肖鑫鑫、张优该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除来源:故障诊断与python学习

    未登录
    还没有评论
    课程
    培训
    服务
    行家
    VIP会员 学习计划 福利任务
    下载APP
    联系我们
    帮助与反馈