论文题目:
Meta-knowledge random attention update network for few-shot and anti-noise remaining useful life prediction
论文期刊:Advanced Engineering Informatics
论文日期:2025年
论文链接:
https://doi.org/10.1016/j.aei.2025.103358
作者:Jing Yang (a), Xiaomin Wang (a*), Minglan Zhang (b), Lin Liu (c), Jiuyong Li (c)
机构:
a: School of Information Science and Technology, Southwest Jiaotong University, Chengdu, 610031, China;
b: School of Computing and Artificial Intelligence, Southwest Jiaotong University, Chengdu, 610031, China;
c: UniSA STEM, University of South Australia, Adelaide, SA, 5095, Australia
团队带头人简介:王小敏老师,现任西南交通大学教授、博士生导师,系“交通运输工程/交通信息工程及控制”国家一流学科中青年学术带头人及四川省杰出青年学科带头人。依托“交通信息工程及控制”国家重点学科及科研平台,长期从事轨道交通运行控制、智慧铁路、人工智能与大数据运维、数字铁路信息安全等方向的研究。王老师主持和参与了40余项国家自然科学基金、863计划、教育部、铁道部/铁路总公司/国铁集团、四川省及轨道交通行业企业等国家级和省部级科研项目,同时承担6项高等教育教学改革项目。已在IEEE TNNLS、IEEE TITS、Information Sciences、Reliability Engineering and System Safety、Energy等国内外知名期刊,以及《软件学报》《计算机学报》《自动化学报》等核心期刊发表学术论文160余篇。(来源: https://faculty.swjtu.edu.cn/wangxiaomin/zh_CN/index.htm)
1 摘要
2 引言
3 所提方法
3.1 随机注意力核网络
3.2 元知识更新网络
3.3 MeRAU的参数优化
4 实验与结果分析
4.1 数据集描述与预处理
4.2 噪声设置与评估指标选择
4.3 剩余寿命预测结果分析
4.4 消融实验分析
4.5 抗噪性能对比分析
4.6 小样本性能对比分析
4.7 与已有方法的对比分析
5 结论
在工业系统中,设备的剩余寿命(Remaining Useful Life,RUL)预测对于保障系统的安全运行至关重要。现有的RUL预测模型已取得显著进展,其核心多依赖于具有相似退化模式或近似分布的大量退化数据。然而,当标注的退化数据较为有限,且数据受到噪声干扰时,不同RUL数据之间的分布差异将进一步扩大,导致现有方法难以有效提取数据间的共享知识,从而难以实现令人满意的预测性能。针对这一问题,本文提出了一种用于小样本与抗噪声RUL预测的元知识随机注意力更新网络模型。首先,将学习得到的核特征视为随机潜变量,并采用蒙特卡洛采样方法进行建模;随后,在随机核中引入注意力机制,以控制局部退化信息,从而增强模型对特定知识的学习能力。此外,为降低冗余或噪声信息对元知识的干扰,在知识更新过程中融合共享知识与特定信息。本文在发动机与轴承退化相关数据集上开展了全面实验,结果验证了所提模型在预测性能方面的优越性。
关键词:工业系统,剩余寿命预测,抗噪声,小样本,元学习,元知识更新
随着工业物联网(Industrial Internet of Things, IoT)与先进传感技术的快速发展,以及现代工业系统的不断演化,如何有效降低系统的运维成本并保障其长期稳定运行显得尤为重要。作为确保系统与设备高效运行的重要手段,剩余寿命(Remaining Useful Life, RUL)预测受到了广泛关注。近年来,尽管循环神经网络、卷积神经网络、Transformer以及混合模型等深度学习方法已被广泛应用于RUL预测任务中,但这些方法在训练阶段通常依赖于大量退化数据以更新模型参数。然而,获取大规模退化数据往往成本高昂。当可用的退化数据较为有限时,这些深度学习方法的模型参数难以得到有效更新,进而导致预测性能大幅下降,缺乏竞争力。因此,如何在仅有少量退化数据的情况下实现准确的RUL预测,已成为当前研究的热点问题。
目前,从少量训练数据中学习并完成预测的过程通常被称为小样本学习(Few-Shot Learning, FSL)。在小样本学习问题中,元学习(meta-learning)因能够利用历史任务中的经验信息推广至新任务而展现出独特优势。元学习将有限的训练数据划分为多个包含少量样本的任务,并通过跨任务搜索无偏初始化参数,使模型的损失在全局范围内快速收敛,从而实现对新任务的快速适应。已有研究尝试将元学习与卷积神经网络相结合,应用于RUL预测任务中;也有研究通过引入注意力机制增强信号特征,以提升元学习模型的预测能力。然而,在面对复杂依赖关系与高维特征时,此类模型难以有效捕捉全局依赖与局部特征表示,导致退化特征提取过程不稳定的问题。
此外,在实际工业环境中,受限于传感器负载与外部环境的影响,大多数采集到的数据不可避免地包含不同程度的噪声干扰。这些噪声信号会扰乱原始序列数据中的特征模式与趋势,增加模型提取真实特征的难度,甚至可能引发过拟合问题。目前,常见的解决策略包括:设置多尺度卷积核以提取短时特征,从而增强对噪声信号的鲁棒性;设计专用的网络结构以自动识别与去除噪声;以及在某些场景下,通过加深网络层数提升模型的抗噪能力与复杂模式的学习能力。
尽管上述方法在抗噪性能方面取得了一定成果,但它们主要依赖于对数据中 特定特征的增强。这些方法普遍假设噪声与有效特征之间具有清晰的区分界限,然而现实场景中,噪声往往具备与退化特征相似的多尺度属性,使得在噪声与退化特征存在重叠的情况下,难以实现有效分离。在当前的RUL预测任务中,退化数据中的噪声干扰不仅会显著扭曲原始数据所包含的固有信息,而且噪声与退化特征重叠所带来的非平稳性问题,使得现有预测方法难以彻底消除噪声干扰。此外,噪声干扰与数据量大小密切相关:当样本量不足时,噪声数据所占比例相对较高,模型难以准确捕捉退化数据中的真实模式,导致训练阶段无法学习到足够的规律性,进而严重影响预测性能。因此,如何在强噪声干扰与小样本条件下构建高性能的RUL预测模型,成为当前亟需解决的重要挑战。
为应对这一问题,本文提出一种基于元知识随机注意力更新网络的RUL预测新模型MeRAU(Meta-knowledge Random Attention Update),专用于小样本与抗噪声情境下的退化寿命预测。该方法的核心思想是将随机核网络与模型无关元学习框架(model-agnostic meta-learning)相融合,通过数据驱动方式提取随机核特征,并引入注意力机制以捕捉不同任务间共享的退化特征信息。此外,本文设计了元知识更新网络,在抗噪推理过程中,借助精简高效的结构对历史任务中获取的先验信息与共享知识进行更新与记忆,从而提升模型在噪声干扰下的推理与预测能力。本文的主要贡献如下:
提出一种基于元学习框架的元知识随机注意力更新模型(MeRAU),用于应对小样本与强噪声条件下的剩余寿命预测任务。该方法引入元知识更新网络,通过对多个关联任务中的信息进行快速而精准的推理,获取通用的元知识,从而显著降低模型参数规模,并实现对新任务的快速适应与高精度预测。
在RUL预测中,将注意力机制引入到随机核网络中。该技术有效增强了变分后验在小样本与抗噪学习场景下的特征表征能力,提升了模型对关键退化信息的捕捉能力。通过大量实验验证,所提出的MeRAU模型在RUL预测任务中相较于多种先进方法表现出更优的性能,充分展示了其在应对复杂小样本与抗噪退化寿命预测任务中的巨大应用潜力。
在缺乏完整生命周期数据且对预测精度要求较高的场景下,小样本元学习为剩余寿命(RUL)预测提供了一种全新的策略。其中,模型无关元学习(Model-Agnostic Meta-Learning, MAML)是一种具有代表性的算法,因其能够从大量相似的元任务中学习先验知识,并有效地将该知识泛化到新任务中。本研究将随机核网络(Random Kernel Network)与MAML框架相结合,能够更有效地适应个体任务的复杂性与特征分布。
在RUL预测任务中,假设存在总计 个任务 ,每个任务由任务分布 中均匀采样得到。对于某一任务 ,其训练集为 ,验证集为 ,其中 。本文使用带有核技巧(kernel trick)的标准学习算法,通过公式 来学习预测器 的参数 ,其中训练集记作 ,验证集为 。在该公式中, 表示基础学习器(base learner), 表示输入数据经过随机核映射后的特征表示。
元学习器(meta-learner)主要用于学习不同退化任务之间的共性,并生成基础学习器的初始模型参数 。随后, 会基于 个基础学习器的参数进行计算,其过程可描述如下:
其中, 表示均方误差损失函数, 为特征映射函数。在本研究中,采用多层感知器(MLP)回归器作为小样本学习中的基础学习器 。Gram 矩阵中的核函数值 的计算方式为 ,其中 表示转置操作。单个任务的基础学习器 通过求解以下目标函数获得。
假设该多层感知器(MLP)具有 层,每一层 具有权重矩阵 、偏置向量 ,以及激活函数 。那么,对于任意输入为 、输出为 的第 层,其计算关系如公式所示:
其中, 表示输入层中的数据, 表示输出层中的预测值, 表示最顶层的权重,该权重是通过构建条件单层感知器作为生成器生成的:
随后,所学习到的回归器被应用于验证集 中的样本。
其中, , ,其每个元素表示训练集样本与验证集样本之间的核函数值 。通过引入元学习策略,元学习器通过学习所有参数以获取知识。
从概率角度来看,小样本RUL预测的目标是:在给定训练集 的条件下,估计验证集中退化数据 所对应标签 的后验预测分布,其表示形式如下:
该模型首先通过随机傅里叶特征核 提取训练样本 与验证样本 的随机特征:
其中, 表示与退化数据 对应的随机向量集 合。 。当随机向量的后验分布能够刻画训练过程时,即可通过 来预测验证集中退化样本的标签分布:
然而,直接求解随机向量的真实后验分布非常困难,通常采用变分推断方法进行处理。通过最小化目标分布 与一个更简单的分布 之间的Kullback–Leibler(KL)散度,实现对目标分布的近似。由此,后验预测分布可近似为以下分布:
其中,𝜙 是推断网络的参数,𝜃 是随机网络的参数。当退化数据中包含大量噪声且退化信息较为模糊时,从随机向量的后验分布中获取元知识的重要性会有所不同。基于此,模型进一步引入局部潜变量 ,用于表示与每个退化任务相关的注意力映射,其后验预测分布的对数似然函数表达如下:
其中,局部潜变量 的条件先验分布为 ,这是因为注意力向量应针对每个单独的验证集 进行建模。然而,直接求解这些问题非常困难。通过引入变分后验分布,并通过最小化其与真实后验的KL散度来进行逼近。对于随机向量 和注意力向量 ,分别采用变分分布 和 进行近似。
基于此,可以构建对数似然函数的下界,并通过最大化该下界来寻找最优解,其表达式如下:
该证据下界(ELBO)的第一项是基于推断出的随机向量 和注意力向量 ,对条件生成分布 对数似然的期望值。第二项是后验分布 与先验分布 之间的KL散度的估计值。通过最小化该项,模型被鼓励利用有限的退化信息捕获验证集中的共享知识。第三项KL散度的最小化则使模型生成的注意力向量更少受到噪声影响。随机注意力核网络的结构如图1所示。
图1 随机注意力核网络的结构框架
3.2 元知识更新网络
为了实现针对上下文RUL预测任务的抗噪声推理,本文设计了一种元知识更新网络(Meta-Knowledge Update Network, MKUN),以实现共享知识与特定信息的高效融合。其中,共享知识通过随机核特征提取,用于捕捉任务之间的全局模式;而特定信息则借助注意力机制获取,用以聚焦于局部特征。MKUN采用一种非参数结构的滤波函数,并结合带有时空信息传递控制机制的卷积长短期记忆网络(ConvLSTM),构建出一个简洁而高效的元知识更新网络架构。该网络结构如图2所示。
图 2 元知识更新网络结构示意图
对于当前预测任务 ,元知识更新网络(MKUN)的输入为元知识 ,由随机向量 与注意力向量 组成,即 。在提取上下文时空信息的过程中,采用基于双向 ConvLSTM 的推理网络,以缓解任务顺序对推理过程的影响。该网络旨在捕捉更丰富的上下文时空特征,并融合来自前序预测任务与后续任务的时空信息。MKUN 可表示为:
其中, 的输入包括元知识 、隐藏状态 以及记忆单元 。 为可学习参数。 表示通过抗噪声推理获得的元知识,即 。
其中, 表示更新后的隐藏状态, 、 和 分别为可学习的权重与偏置参数, 和 是激活函数, 和 $$ 分别表示按元素乘法操作符与卷积操作。 是滤波单元,用于度量元知识并剪除冗余信息,其计算公式为:
其中, 是用于过滤所选任务元知识的滤波函数,即 。 是衡量元知识间差异的距离函数。当两个元知识之间的差异大于阈值 时,说明未滤波的元知识 与滤波后的元知识 之间存在一定差异,此时可以在一定程度上保留不同任务的特定信息;当差异值小于阈值 时,仅考虑滤波后的元知识。该滤波单元能够对元知识进行非参数化过滤,选择性地保留任务特定的经验信息,从而实现元知识的混合式过滤,并有效缓解任务特定信息的灾难性遗忘问题。
3.3 MeRAU的参数优化
为了使 MeRAU 模型能够在含噪测试集上实现准确的RUL预测,要求推理网络 所对应的近似后验预测分布能够获得最优参数。为此,可通过最小化各任务的平均预测损失来实现,即通过最大化证据下界(ELBO)来寻找随机映射网络的最优参数 。这需要缩小近似后验分布与真实后验分布之间的差距,即最小化 和 两项散度。
对于一批任务 ,采用基于蒙特卡洛采样估计的随机优化方法可以获得目标函数的近似表达式,用于基于梯度的优化。共享参数 和 的训练目标如下所示:
其中,𝐿 和 𝑀 表示样本数量。蒙特卡洛采样分别在索引 𝑖 和 𝑗 上进行,𝑖 的取值范围为 1 到 𝐿,𝑗 的取值范围为 1 到 𝑀。考虑到不同任务可能具有不同的特征和数据分布,优化过程通过对各任务之间的损失进行平均,以寻求在不同场景下具有良好泛化能力的参数。同时,两项KL散度的引入也保证了模型训练过程的稳定性。
为了在训练过程中使用采样操作实现反向传播,采用了重参数化技术:
其中, 为参数化函数, 表示服从均值为零、单位协方差的正态分布的随机变量。 和 共同构成基学习器的顶层权重,记作 。元知识随机注意力更新网络的整体架构如图 3 所示。
图 3 元知识随机注意力更新网络架构
4.1 数据集描述与预处理
C-MAPSS数据集由NASA研究中心提供,是RUL预测领域中常用的基准数据集之一。该数据集是一组由分布在涡扇发动机不同位置的传感器采集的多维度退化数据,如图4所示。C-MAPSS数据集被划分为四个子集:FD001与FD003在单一工况下采集,FD002与FD004在控制变量随机调整且工况更复杂的条件下采集。具体而言,FD001和FD003均包含100个训练单元和100个测试单元,FD002包含260个训练单元和259个测试单元,FD004则包含248个训练单元和249个测试单元。
图 4 航空发动机示意图
考虑到设备在数据采集初期可能尚未出现明显的退化现象,本文采用分段线性方式对 RUL 进行表示。具体而言,数据集中每个发动机的退化周期均按照设定的 进行分段,当剩余寿命大于 时,统一设定为 。为与多数文献保持一致,本文将 设定为125。
4.1.2 智能维护系统数据集(IMS Dataset)
智能维护系统(Intelligent Maintenance Systems, IMS)数据集是用于轴承相关设备 RUL 预测研究的重要基准数据集之一。该数据集的测试平台与传感器安装位置如图 5 所示。平台上安装有四个 Rexnord ZA-2115 型双列轴承,旋转速度为2000 r/min,承载负荷为 6000 磅,采样频率为20 kHz。该数据集完整记录了轴承从正常运行逐步退化直至发生故障的全生命周期振动信号。
图 5 IMS 测试平台示意图
本文选取 IMS 数据集中的 Case2 和 Case3 进行实验。Case2 是从正常运行到失效的自然退化测试过程,而非加速退化实验,因此能够更真实地反映模型在实际工况下的 RUL 预测效果;而 Case3 表现出更复杂的退化模式,轴承在其生命周期中出现了两次“自愈”行为。考虑到 IMS 数据集的使用寿命较长,本文参考相对损伤指标(Relative Damage Indicators, RDI)来确定退化起始时间点,发现 Case2 和 Case3 分别在第 234 小时和第 1000 小时后开始出现退化现象。因此,本文分别截取两种工况从退化开始到停止运行之间的振动信号作为 Case2 和 Case3 的实验样本。由于相邻样本的 RDI 变化较小,进一步对数据进行划分:Case2 的退化数据被划分为两组共 162 个样本,Case3 被划分为两组共 140 个样本。同样采用分段线性形式对 RUL 进行标注,其中 Case2 和 Case3 的 分别设置为 140 与 125。
4.2 噪声设置与评估指标选择
4.2.1 噪声设定
在本研究中,所使用的 C-MAPSS 和IMS 数据集并非完全由纯净的全生命周期退化源数据构成,而是包含了一定程度的噪声。然而,与实际复杂应用场景相比,在受控实验环境中采集的退化数据具有相对较高的信噪比(SNR)。因此,为了增强对未知真实噪声的表示能力,并探讨其对 RUL 预测的影响,本文在 C-MAPSS 和IMS 数据集的全生命周期退化数据中引入了不同信噪比水平的白高斯噪声。信噪比(SNR)的定义如下:
其中, 和 分别表示所添加噪声信号的功率与原始退化源数据的功率。
4.2.2 评估指标
本文采用四种评估指标来量化 MeRAU 模型在 RUL 预测任务中的性能,包括:均方根误差(Root Mean Squared Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)、 以及评分函数(Score Function,SCORE)。其中,RMSE 可同时衡量剩余寿命早期与晚期预测值的离散程度;MAE 能够准确反映实际 RUL 预测误差的大小; 能够直观表示 RUL 预测模型的拟合精度;而 SCORE 指标则区别对待提前 预测与滞后预测结果,对滞后预测施加更大惩罚。
4.3 剩余寿命预测结果分析
为直观展示所提模型的抗噪声效果,本文选取了两个具有代表性的子集进行 RUL 预测结果分析,分别为C-MAPSS 数据集中的 FD001 和FD004 以及 IMS 数据集中的 Case2 和Case3。图 6(a)–(d) 展示了所提MeRAU 模型提取特征的概率密度函数(PDF),用于评估其在强噪声干扰下对真实退化信息的建模能力。
图 6 不同子集上的概率密度函数结果:(a)–(d)为 MeRAU 模型的结果,(e)–(h)为未引入抗噪机制的结果
作为对比,图 6(e)–(h) 给出了不含抗噪网络的模型无关元学习(MAML 或 “No Anti-noise Network”)的PDF 曲线,该方法仅使用 10% 的训练数据,在信噪比 SNR = −6 的情况下,直接对测试集进行 RUL 预测。从图中可观察到,MeRAU 模型在“无噪” 与 “抗噪”情况下的 PDF 曲线基本一致,明显优于未引入抗噪机制的 MAML,表明MeRAU 能够有效从强噪声退化数据中学习到真实信息,准确捕捉设备的退化趋势。
图 7 展示了在 FD001、FD004、Case2和 Case3 测试集上随机选取的退化单元的 RUL 预测结果。结果显示,相较于无抗噪能力的 MAML 方法,所提MeRAU 模型在小样本抗噪分析中表现出更优的预测效果。通过将随机特征与 MAML 框架融合,并引入随机注意力潜变量,MeRAU 模型显著提升了抗噪性能,在新颖的小样本抗噪场景下实现了出色的 RUL 预测性能。
图 7 不同子集上退化单元的RUL预测结果
4.4 消融实验分析
为了评估MeRAU模型中各组成成分对 RUL 预测的影响,本文在仅使用10%训练数据且信噪比(SNR)分别为−6和6的条件下,采用均方根误差(RMSE)和标准差作为评估指标,开展了消融实验。MeRAU包含四个变体,如表1所示。其中, 由随机核网络与元知识更新网络组成, 由随机核网络、元知识更新网络及滤波单元组成, 由随机注意力核网络与元知识更新网络组成,而 则为纯随机注意力核网络。
表 1 消融实验的详细设置
MeRAU 及其各变体在 FD001、FD002、Case2 和 Case3 子集上的 RMSE 结果如图 8 所示。MeRAU 模型在整体性能上优于 、 、 和 模型,验证了在小样本抗噪 RUL 预测中引入带滤波单元的随机注意力核网络与元知识更新网络的有效性。
图 8 MeRAU 及其变体方法在不同子集上的消融实验结果
为进一步验证选用 MLP 作为基学习器的合理性,本文开展了消融实验,分别将 MLP 替换为 CNN 和 SVR 回归模型。与主实验一致,消融实验同样仅使用训练数据的 10%,并选择信噪比分别为 和 的噪声条件,采用 RMSE 作为评估指标。
表 2 不同基学习器在 FD001 与Case2 数据集上的 RMSE 结果
表 2 的结果显示,选用 MLP 作为基学习器能够获得更优的 RUL 预测性能。相比之下,采用 SVR 作为基学习器时性能最差,这主要是由于在高维特征且受噪声干扰的条件下,SVR 更易产生过拟合问题。相比使用 CNN 作为基学习器,MLP的预测效果更加突出,其原因在于 MLP 模型结构相对简单,在有限数据条件下更易实现复杂的非线性映射。因此,以元知识更新网络和随机注意力核网络作为元学习器,结合 MLP 作为基学习器共同构建MeRAU 模型,能够有效实现小样本条件下的抗噪 RUL 预测。
4.5 抗噪性能对比分析
为研究不同噪声水平对 RUL预测性能的影响,选取 FD001、FD004、Case2 和 Case3 四个子集,在仅使用有限退化数据且不添加额外噪声的条件下进行模型训练,随后利用信噪比分别为 、 和 的不同噪声条件下的退化数据进行测试。评估指标采用 MAE(平均绝对误差)。表 3 对用于抗噪性能对比的 9 种方法进行了详细描述。
表 3 用于抗噪性能对比的方法说明
不同模型在不同噪声条件下的 RUL 预测效果如图 9 所示。显然,MeRAU 模型在各类噪声条件下对两个数据集均展现出显著优于其他九种预测方法的预测性能与泛化能力。相比于所提出的 MeRAU,随着 SNR 的降低,其余九种方法的 MAE 均显著上升。这是因为 SNR 的降低使退化数据中包含更多噪声,导致这些方法对健康状态的预测难度增加。
图 9 不同信噪比条件下各模型在不同子集上的 MAE 结果
具体而言,不具备抗噪能力的方法(A1-A3)难以从含噪退化数据中有效学习真实的特征知识;具备抗噪能力的浅层网络方法(A4-A6)虽借助信号处理相关手段进行处理,但其特征提取的质量和效率高度依赖于先验经验,难以有效应用于 RUL 预测任务;具备抗噪能力的深层网络方法(A7-A9)则通过加深网络结构或记忆不变特征提升模型抗噪能力,但在 SNR 降低时,这类方法的参数调整所需时间显著增加,导致预测结果出现较大偏差。
工业实际中退化数据的缺乏会显著影响 RUL 的预测准确性。为评估所提出的 MeRAU 模型在该问题下的鲁棒性,选取了 FD001、FD004、Case2 和 Case3 数据集,设定 ,在不同训练样本比例 条件下进行模型训练(其中 、 、 、 ),并采用 作为性能指标。表 4 对比了 9 种用于小样本学习情境下的预测方法及其实现细节。
表 4 用于小样本学习性能对比的方法说明
图 10 呈现了各模型在不同训练样本比例下的 RUL 预测效果。实验结果表明,MeRAU 模型在小样本条件下依旧表现出色,具有良好的鲁棒性与预测能力。与 MeRAU 相比,其他九种方法在训练样本比例下降时 明显降低,主要原因是样本不足加剧了模型训练的难度,同时训练数据中混杂噪声,也进一步削弱了模型对设备健康状态的准确预测能力。
图 10 各模型在不同训练样本比例与子集条件下的表现
不具备小样本学习能力的方法(B1–B3)无法从有限退化数据中提取稳定可靠的特征;浅层小样本方法(B4–B6)主要依赖专家经验建立先验知识,但该过程对人工依赖性高,缺乏普适性,不适于复杂的 RUL 预测任务;深层小样本学习方法(B7)虽然通过多层结构的自适应调整提升了表现,但仍不如基于元学习的方法(B8–B9)稳定。这是由于元学习方法能够借助预训练所学初始化参数,在面对新任务时快速适配,从而更好地应对小样本挑战。最终,MeRAU 模型通过融合随机注意力核网络与元知识更新网络,不仅在训练样本有限的情况下能为基础学习器提供更优的初始化参数,还能保持优异的 RUL 预测性能,显示出其在小样本学习场景下的强大优势。
4.7 与已有方法的对比分析
为验证所提出模型的有效性,本文与多个已有的先进方法进行了对比分析,包括 LSTM-RUL、CNN-RUL、Hetero-ConvLSTM、Attention GRU-CP、Kdnet-RUL、SD-TemCapsNet、MDER以及Siamese。参考上述方法的实验设置,将不同运行工况下的数据采用最大最小值归一化方式标准化至区间 [0,1]。该归一化过程有助于避免不同尺度的特征在建模过程中对结果产生不均衡影响。C-MAPSS 与 IMS 数据集的测试结果如图 11(a)–(b)所示。
图 11 MeRAU 与其他已有方法在不同数据集上的 结果
在 C-MAPSS 数据集上,KDnet-RUL 和 MDER 采用知识蒸馏方式压缩复杂模型,SD-TemCapsNet 结合 LSTM 与 CapsNet 机制以建模时序动态特征,Siamese 模型则通过孪生网络捕捉退化趋势。然而,这些模型在面对复杂退化模式与噪声干扰时,稳定性与精度仍存在一定局限。相较之下,MeRAU 通过引入蒙特卡洛采样提升对退化动态分布的建模能力,并借助注意力机制实现对局部退化特征的动态控制,从而在 C-MAPSS 数据集上获得更优预测性能。在该数据集上,MeRAU 在 RMSE、SCORE 和 指标上分别相较其他模型提高了 13.47%、9.1% 和 13.3%,展现出显著的综合优势。
在 IMS 数据集上,LSTM-RUL、CNN-RUL、Hetero-ConvLSTM 以及 Attention GRU-CP 等方法主要基于退化数据的相关性特征进行建模,但忽略了退化数据中存在的非平稳性与信息丢失问题,从而影响了模型的预测精度。相比之下,MeRAU 通过融合共享知识与特定知识,实现了对复杂退化动态的快速适应与对噪声的鲁棒性,因此在 IMS 数据集上获得了更优的预测结果。同样地,MeRAU 模型在 IMS 数据集上的 RMSE、SCORE 和 指标分别较其他模型提升了 16.41%、4.86% 和 9.61%。
进一步在 XJTU-SY 轴承数据集上进行了实验验证。该数据集通过多种加速疲劳实验,记录了 15 个滚动轴承从正常状态到故障的完整退化过程,涵盖三种工况:40 Hz/10 kN、37.5 Hz/11 kN 与 35 Hz/12 kN。轴承信号以每分钟采样一次的频率记录,采样率为 25600 Hz,每次采样共 32768 个数据点。实验中,每种工况下最后一个轴承数据作为测试集,其余数据用于模型训练。本研究将 MeRAU 模型与多个已有方法进行对比,包括 RVM、DSCN、TCN-RSA及 STD。性能评估指标包括 RMSE、SCORE、 和模型推理时间。图 11(c) 汇总了各方法在四项指标下的对比结果。
结果显示,MeRAU 模型在所有指标上均优于现有方法。具体来看,RVM、DSCN、TCN-RSA 与 STD 等方法结合特征提取与时序建模,并借助卷积结构与自注意力机制对退化特征进行建模,但面对退化过程中的非平稳性与噪声干扰,容易出现特征与信息损失,进而影响预测精度。相反,MeRAU 所引入的随机注意力核网络能够有效提升模型对动态退化过程的响应能力,并增强其对复杂退化模式的识别性能,从而在 XJTU-SY 数据集上取得更佳表现。对比结果表明,MeRAU 模型在 RMSE、SCORE 和 三项指标上的性能分别较现有最佳方法提升了 83%、74% 和 19%,同时具备更低的推理时间与更高的运算效率。上述实验结果进一步验证了 MeRAU 模型在 RUL 预测任务中的稳健泛化能力与卓越的预测性能。
本研究提出了一种基于元学习的 MeRAU 模型,用以应对剩余寿命(RUL)预测中的小样本抗噪挑战。该模型能够有效实现小样本条件下的抗噪预测,并在从退化数据中提取任务知识方面展现出较强的适应性与鲁棒性。通过引入蒙特卡洛采样,模型在潜在空间中获取共享知识,并利用注意力机制调控注意力核中的特定信息。随后,设计了元知识更新网络,将有效的先验共享知识与任务特定信息整合到当前任务中,通过元知识实现先验知识的更新与保留。接着,模型基于贝叶斯理论,结合变分后验分布与元知识,学习小样本抗噪任务的 RUL 预测。最后,在 C-MAPSS、IMS 与 XJTU-SY 等公开数据集上的实验验证了模型在小样本与抗噪 RUL 预测任务中的优越性能。
来源:故障诊断与python学习