首页/文章/ 详情

多视角故障诊断论文学习 | 基于自适应协同注意力融合网络的多视角旋转机械故障诊断

5小时前浏览2
          天蓝风不燥,祝各位读者假期快乐。本期分享西南交通大学团队的论文投稿:基于自适应协同注意力融合网络的多视角旋转机械故障诊断方法。智能故障诊断作为保障工业系统安全与高可靠性运行的关键技术,近年来引发了广泛关注,并在方法研究层面取得了显著进展。然而,当前主流方法普遍依赖于单一视角的振动信号,较少关注多视角信号之间的共识性特征与互补性信息,限制了诊断性能的进一步提升。针对上述问题,提出一种新颖的多视角故障诊断方法—COFU(Co-attention Fusion Network,该方法基于协同注意力机制构建融合框架,旨在有效整合多视角信号中的判别性特征,从而提升旋转机械故障识别的准确性与鲁棒性。通过三种结构差异化的编码器分别对多个视角的输入信号进行特征提取,构建其对应的高阶特征空间;引入自适应协同注意力融合网络,以动态建模不同视角特征之间的深层关系,并学习统一的融合表示。本研究为多视角融合在旋转机械故障诊断中的应用提供了一种鲁棒性的解决方案。

    论文链接:通过点击本文左下角阅读原文进行在线阅读及下载

    论文基本信息

    论文题目:

    Multi-view rotating machinery fault diagnosis with adaptive co-attention fusion network

    论文期刊:Engineering Applications of Artificial Intelligence

    论文日期:2023年5月

    论文链接:

    https://www.sciencedirect.com/science/article/abs/pii/S0952197623003226

    作者:Xiaorong Liu, Jie Wang, Sa Meng ∗, Xiwei Qiu, Guilin Zhao

    机构:

    School of Computing and Artificial Intelligence, Southwest Jiaotong University, Chengdu, China.

    目录

    1 摘要

    2 引言

    相关工作

    3.1 单视角故障诊断方法

    3.2 多视角故障诊断方法

    4 所提方法

    4.1 问题表述

    4.2 所提框架概述

    4.3 视角特定编码器

    4.4 自适应协同注意力融合

    4.5 故障诊断

    5 实验

    5.1 数据集

    5.2 基准模型

    5.3 结果讨论

    6 结论

    1 摘要

    智能故障诊断是保障工业生产安全与可靠性的重要研究方向,近年来受到了广泛关注,并在故障诊断方法的发展方面取得了显著进展。尽管如此,现有大多数方法主要依赖单一的振动信号视角,忽略了信号在不同视角之间的共识性与互补性。为此,本文提出了一种新颖的方法——COFU,即基于协同注意力融合网络的多视角学习模型,用于旋转机械的故障诊断,该模型旨在充分挖掘多视角之间的一致性与互补特征。具体而言,首先采用三种不同的编码器分别提取多视角信号的高阶特征表示;随后构建自适应协同注意力融合网络,以学习融合特征表示,在此过程中充分考虑各特征空间之间的关联性;最后,设计基于融合表示的故障检测器,实现对故障类型的准确识别。为验证所提方法的有效性,本文在三个数据集上进行了全面评估。实验结果表明,COFU方法在上述数据集上的故障识别准确率分别达到100%、99.95%和100%。结果进一步显示,所提方法在噪声干扰环境下同样具有优越的诊断性能,显著优于所有基准对比方法。该研究为多视角融合在旋转机械故障诊断中的应用提供了一种具有广阔前景的解决方案。

    关键词:多视角融合,协同注意力,故障诊断

    2 引言

    旋转机械作为复杂工业设备中的关键组成部分,在工业生产中正扮演着日益关键的角色(Shi 等, 2023)。由于其长期运行于恶劣工况环境之下,其核心部件(如齿轮、轴承等)极易发生损坏(Ge 等, 2022;Zheng 等, 2023)。因此,旋转机械故障诊断因与设备运行的安全性与可靠性密切相关,而成为现代工业应用中的研究热点(Zhao 等, 2020)。在过去数十年间,已有大量诊断方法被开发并成功应用于多个工业过程与系统的故障识别(Lu 等, 2021;Wang 等, 2021c,b,a)。

    早期的故障诊断方法主要采用信号处理技术以抑制噪声与谐波干扰、增强信号特征,如小波变换(Yan 等, 2014)、经验模态分解(Lei 等, 2013)与变分模态分解(Dragomiretskiy 和 Zosso, 2014)。随后,专家通过频谱分析,从处理后的信号中识别故障特征频率。然而,这些方法往往依赖大量领域知识,难以保证诊断结果的稳定性与可靠性,因此具有明显的耗时性与高人力成本(Peng 等, 2021)。

    在过去几十年中,机器学习技术被广泛应用于故障诊断。典型的分类模型,如支持向量机(SVM,Widodo 和 Yang, 2007)、极限学习机(ELM,Luo 等, 2016)与朴素贝叶斯分类器(NB,Cai 等, 2017),能够不依赖人工知识,自动建立特征与故障类别之间的映射,从而实现诊断智能化,显著降低人工干预。一般而言,机器学习方法需借助特征提取技术从原始信号中提取有效特征以建立映射关系。常用特征包括时域与频域的简单统计量以及非线性评估指标,如分形维数(Yang 等, 2007)。然而,这些特征往往较为浅层,所包含的判别性隐藏信息有限,可能导致映射函数存在偏差,进而影响分类模型的泛化性能,甚至导致其退化。

    近年来,深度学习技术被广泛关注,并逐渐成为弥补传统机器学习方法局限性的有效手段(Rubio, 2021;Rubio 等, 2021;Jiang 等, 2023)。其显著优势在于能自动提取深层特征并从数据中挖掘隐藏信息。随着相关技术的迅速发展,深度学习方法已被广泛应用于故障诊断中(Zhang 等, 2022;Liang 等, 2022;Zhao 等, 2023),并取得了良好效果,部分经典神经网络结构也被引入到该领域(Anon, 2023;Liang 等, 2023)。

    目前,基于深度学习的故障诊断方法大致可分为单视角方法与多视角方法。如图1(a)所示,单视角方法通常依赖于原始信号变换后所提取的某一类特征。然而,来自不同视角的信息之间存在紧密联系,若能有效利用这些联系,模型性能有望进一步提升(Wu 等, 2022b)。但该类方法未考虑多视角融合对故障诊断可能带来的益处,导致诊断过程中缺乏全面线索。

    如图1(b)所示,多视角方法则联合利用多个视角中提取的不同特征,尽管可以提供更多信息,但往往难以充分建模这些特征之间的复杂语义交互。然而,这些交互信息对于多视角学习至关重要,它有助于在不同视角之间建立更紧密的联系,从而提供更全面的诊断线索。传统的多视角特征融合方法通常采用简单拼接策略,可能会引入无关甚至噪声信息。为解决这一问题,近年来引入了注意力机制,用以选择性地从每个视角中提取最相关的信息。尽管取得了进展,目前多数方法仍仅在编码器末端引入单一注意力层,这限制了对多种对象间交互关系的深入建模(Wu 等, 2023;Zhang 等, 2023)。

    为缓解上述问题,本文提出了一种渐进式深度协同注意力融合网络,以提升旋转机械故障诊断的性能,该方法被称为COFU。受到人类对多视角信息理解过程(如图文结合的多媒体新闻)的启发(Wang 等, 2020),COFU模型设计了一种自适应协同注意力融合网络,用于捕捉时间视角、频率视角和小波视角之间的复杂语义交互关系。通过这些视角间的迭代交互,COFU利用时间引导的频率注意力、频率引导的时间注意力、小波引导的时频注意力,以及时频引导的小波注意力,生成最终的跨视角融合表示。

    从根本上看,与传统的单视角和多视角方法不同,COFU在设计中引入了多视角之间丰富关联的初始建模机制,如图1(c)所示。在技术实现方面,本文提出了一种基于协同注意力网络的渐进式跨视角融合技术,用以捕捉不同视角之间的深层交互,以提升故障类别的识别能力。具体而言,首先通过三个特定的神经网络,从原始振动信号中提取时间视角、频率视角和小波视角的高阶特征表示;随后,构建自适应协同注意力融合网络,将三种独立的多视角特征进行渐进融合,逐步学习其交互信息;最终,利用融合网络最后一层输出的表示进行故障类别的识别。

    1a)基于单视角方法;(b)采用拼接操作的多视角方法;(c)考虑语义交互的多视角方法。

    本研究的主要贡献如下:

    1) 所提出的COFU方法利用自适应协同注意力融合网络,捕捉多视角表示之间的复杂语义交互,能够有效学习时间视角、频率视角与小波视角之间的深度依赖关系,相较传统融合方法在多视角学习中表现更优。

    2) 所提COFU方法在CWRU轴承数据集、SEU轴承数据集与SEU齿轮数据集上进行了评估。结果显示,在各数据集上的诊断准确率分别达到100%、99.95%和100%。此外,在Precision和Recall指标上,COFU亦优于当前主流方法。值得一提的是,即使在噪声数据条件下(SNR=4dB),COFU在三个数据集上的平均准确率仍可保持在95%,展现出其显著的鲁棒性与有效性。


    3 相关工作

    3.1 单视角故障诊断方法

    单视角故障诊断方法主要集中于将原始振动信号在不同变换域(如时域、频域与时频域)中的形式作为输入引入深度学习模型。Teager-Kaiser能量算子(TKEO)因其可直接在时域内计算,已被广泛应用于包括齿轮箱与轴承在内的机械故障诊断中。然而,仅依赖时域信息在准确判定故障性质方面存在一定局限性。为弥补该缺陷,研究者引入频域技术,用于提取信号中与故障相关的谱分量,从而提升诊断精度。Li等(2021a)提出了一种归一化频域能量算子(FDEO),用于断条转子故障的诊断。此外,将一维原始信号转换为二维图像所获得的时频输入方式也各不相同。Zhang等(2020)指出,单一的时域或频域分析方法难以有效提取关键特征,因而提出了一种基于时频图像的故障诊断方法。Kang和Kim(2014)提出了一种基于Shannon小波的二维灰度图像表示,用于感应电机故障检测。Yu(2020)则提出了一种集中型时频分析工具,用于轴承故障诊断。尽管单视角故障诊断技术因其简单有效而获得了广泛应用,并推动了智能故障诊断技术的发展,但仅凭单一视角所获得的信息仍不足以实现对模型的全面理解。为克服此局限性,多视角方法的研究与发展逐渐成为趋势。

    3.2 多视角故障诊断方法

    在多视角任务中,来自不同视角的特征整合始终是一个关键问题(Wang 等, 2023)。Abdul和Al-Talabani(2022)将其获得的线性组合拼接成特征向量,并采用SVM进行故障分类。Lu和Yin(2021)提出了CFCNet模型,在特征融合阶段采用特征拼接策略。Peng等(2021)则提出了一种基于GP与集成学习的多视角特征构建方法,用于滚动轴承故障诊断。此外,典型相关分析(CCA)是一种广泛应用的经典方法,其通过将两个变量映射到公共子空间中,以捕捉其间相关性。Jiang等(2022a)从多视角学习的角度出发,提出了一种基于CCA的特征增强型故障诊断框架。该框架能够识别相关性最强的数据投影对,从而增强特征学习能力。Zhu等(2021)进一步提出了一种谐波多视角典型相关分析方法(HMCCA),构建了一个用于轴承故障诊断的谐波相关特征学习模型。尽管上述多视角故障诊断方法已取得一定成效,但在多视角信息融合方面仍存在一定局限性。具体而言,特征拼接方法无法刻画复杂语义交互关系,而CCA在提取多视角数据高阶关联方面存在性能瓶颈(Li 等, 2019)。从本质上看,这些方法未能充分考虑多视角数据之间的共识性与互补性。针对上述限制,本文提出一种新型的多视角旋转机械故障诊断方法,融合协同注意力机制。与现有方法相比,本文所提方法在融合过程中引入渐进式机制,能够有效捕捉不同视角之间的交互信息。

    4  所提方法

    4.1 问题表述

    如图2所示,模型的输入为一条信号,输出为故障类别。给定一维振动信号     ,我们对其进行若干信号变换操作,以获得多视角特征集     。具体而言,振动信号      直接作为时间视角特征      使用,无需任何预处理操作;为了获取频率视角特征,对      应用快速傅里叶变换(FFT),将其从时间域转换为频率域,得到频率视角特征     ;对于小波视角,则通过连续小波变换(CWT)作用于     ,得到小波视角特征     

    图2 COFU方法的流程图

    4.2 所提框架概述

    本文提出了一种新型的多视角旋转机械故障诊断架构COFU(Co-attention Fusion),该架构能够自适应地学习不同视角之间的共享语义。图3展示了所提方法的整体框架结构。如下所示,COFU架构由三个模块组成:

    视角特定编码器:如图3中部所示,在多视角特征提取过程中,时间域视角、频率域视角与小波域视角分别独立处理,其间的相互依赖关系未被建模。然而,这三者之间的内部关系对于全面理解信号所承载的信息具有关键作用。为此,本文设计了一个自适应协同注意力融合网络,以融合上述三个视角的特征表示。该方法有效增强了多视角特征的共识性与互补性。

    故障检测:如图3右侧所示,为实现对不同类型故障的识别,在完成第二模块中的多视角特征融合之后,提取出的深层特征向量被输入到一个包含两个线性层的故障分类器中,以完成最终的故障类型判别。

    图3 所提出的多视角协同注意力融合网络(COFU)示意图

    4.3 视角特定编码器

    给定振动信号    作为时间视角特征,分别采用快速傅里叶变换(FFT)与连续小波变换(CWT)获取其对应的频率视角特征与小波视角特征。随后,为获取由三类特征构成的多视角表示,本文根据各自特性设计了三个神经网络编码器。

    4.3.1 时间视角编码器

    对于时间视角,特征    直接来源于振动信号    ,无需额外的数据预处理。随后,采用长短期记忆网络(LSTM)作为编码器,用于表示时间特征    。LSTM是一种循环神经网络(RNN)变体,旨在解决长时依赖学习的问题。形式化地,在时间步     ,记忆单元      与隐藏状态      的更新过程如下所示。

       

       

       

    其中,     表示按元素相乘运算,     表示按元素作用的Sigmoid函数。         与      分别表示时间步      的输入门、遗忘门与输出门;     为时间步      的输入向量;     为仿射变换,依赖于网络的参数      和     。为同时捕捉时间域中来自过去与未来的信息,本文采用双向LSTM作为特征提取器。因此,在每一个时间步     ,由正向隐藏状态      与反向隐藏状态      拼接形成最终的时间特征表示。

       

    上述过程用BiLSTM(⋅)形式化表示。本文使用BiLSTM(⋅)来获得时间视角样本的更高级别表示。这个过程可以表示为:

       

    4.3.2 频率视角编码器

    对于频率视角,使用快速傅里叶变换(FFT)将每个样本样本从时间视图转换为频率视角。在此操作之后,本文也可以通过BiLSTM(.)获得频率视角的高级表示。对应的过程表示为

       

       

    4.3.3 小波视角编码器

    为了获得信号      的小波视角特征     ,本文采用连续小波变换(CWT)操作。此外,卷积神经网络(CNN)在图像特征提取方面因其优越性而被广泛应用与认可。在故障诊断领域,一些研究(Liang 等, 2022;Wen 等, 2018)也已利用 CNN 的优势对图像内容进行编码。在本研究中,小波视角特征      的变换形式被视作图像信息,采用CNN对其进行编码,以便在多个尺度上提取局部特征。假设卷积层包含多个滤波器,其第      个输出由以下过程定义。将该过程记为     ,具体如下所述。

       

    其中,     表示非线性激活函数,符号      表示卷积操作;     表示第      层中第      个样本对应的特征图;参数      与      分别表示第      层的卷积核权重与偏置项,是CNN模型需学习的参数;     表示CNN模型的层数。

    在本任务中,该过程可具体表示如下:

       

       

    4.4 自适应协同注意力融合

    如前文所述,不同视角之间的相互依赖关系应被充分考虑,以弥合其语义差异。为此,本文设计了多视角协同注意力融合模块,用于捕捉不同视角之间复杂的语义交互关系。在融合阶段,多个视角特征将被逐步融合,其过程如下所示:

    时间引导的频率注意力机制:通常而言,时域中的故障信号位置与特定频率点存在关联。因此,引入由时间信号引导的频率注意力模块,用以确定频域中应关注的区域。

    为了在频率视角上生成注意力分布,将上述两个表示输入一个单层神经网络,并接 softmax 函数处理。该过程可形式化表示为

       

       

    其中,         与      为模型参数,满足                  与      为偏置项。此外,记号      表示时间特征矩阵与频域特征向量的拼接操作。矩阵与向量之间的拼接是通过将向量拼接到矩阵的每一列上实现的。

    与      相关的新的频率向量可通过注意力分布获得,注意力分布为每个频率向量分配相应的权重。该过程可表示为:

       

    在前述过程中,本文通过时间视角引导的注意力机制获得了与时间序列      相关的新的频率表示。相应地,本文也需计算由频率引导的时间视角特征,其具体计算步骤如下所示。

       

       

       

    其中    ,              与      为偏置项。至此,已基于时间视角与频率视角完成了两轮交互式注意力计算。时间视角引导的注意力用于判断标签预测应关注的频率区域;而频率引导的注意力机制则可识别时间序列中与标签最相关的区段。

    然而,仍需进一步探索小波视角与时频融合表示之间的注意力分数关系。首先,通过时间视角与频率视角的互引导机制,得到一个新的表示     ,具体如公式所示。接下来,引入频率视角信息与     ,以进行协同注意力计算。

       

    其中,    ,其中      表示时频融合特征的维度,     表示每个融合特征的长度。

    在多数情况下,故障特征通常集中在小波图像的局部区域。因此,若直接利用整张图像的特征进行标签预测,可能会引入与故障无关的区域信息,从而导致结果次优。为避免该问题,本文引入时频融合引导的小波注意力模块,以判定应关注的小波图像区域。

       

       

       

    其中,         表示图像区域的数量;     和      为模型参数,满足                  与      为偏置项。

    时频融合引导的注意力机制能够判定小波视角中哪些图像区域应成为标签预测的关注重点,以及哪些区域更直观地反映故障特征。然而,仍需进一步确定时频融合序列中哪些片段与标签更为相关。因此,本文引入小波视角与时频融合表示之间的引导注意力机制整合,以此获得新的图像向量     

       

       

       

    其中, 和      为模型参数,满足             。与时间域引导的注意力操作类似,本文使用符号      表示时频融合矩阵与小波向量的拼接操作,即将小波向量拼接至矩阵的每一列。最终,基于能量函数与概率分布,得到全局注意力表示     

       

    4.5 故障诊断

    所提方法通过协同注意力网络获取多视角特征表示     。随后,故障检测器利用多层感知机(MLP)对每个特征向量进行分类。该过程可总结如下:

       

    本文使用交叉熵损失函数进行模型训练。概率的对数由以下表示:

       

    其中,     表示第      个样本的真实标签,     表示该样本属于第      个标签的概率分布。

    5 实验

    5.1 数据集

    为评估所提COFU方法的有效性,本文在三个公开数据集上进行了实验,包括CWRU、SEU_bearing和SEU_gear数据集。

    CWRU 轴承数据集:该数据集由凯斯西储大学轴承数据中心提供,其测试平台如图4所示。测试平台包括电动机、扭矩传感器、两个加速度计和测功机。两个加速度计分别安装于驱动端外壳和风扇端外壳上,用于采集振动信号。采样频率为12 kHz或48 kHz,振动信号在四种不同电机负载下进行记录。故障类型分为三类:轴承内圈故障、滚动体故障、外圈故障,故障直径分别为0.007、0.014和0.021英寸。本文采用驱动端在12 kHz采样频率下的数据。表1将健康状态、内圈故障、滚动体故障和外圈故障四种类型,按照故障程度划分为十类(包含一种健康状态与九种故障状态)。

    图4 CWRU轴承测试实验台

    表1 CWRU数据集

    SEU bearing数据集:该数据集来源于东南大学提供的齿轮箱数据集(SEU2)。如图5所示,模拟平台由电动机、制动器、控制模块和两个测试用变速箱构成。轴承数据集包含八路振动信号,本文选用第二路信号。加速度传感器分别安装于驱动电机、行星齿轮箱和平行齿轮箱上。实验设置包含两个工作状态,转速–负载(RS-LC)分别为20 Hz–0 V和30 Hz–2 V。每种工况下包含五类故障类型:裂纹内圈、裂纹滚柱、裂纹钢球、裂纹外圈以及健康状态,详细信息见表2。

    图5 SEU轴承测试实验台
    表2 SEU轴承故障数据集
    表3 SEU齿轮故障数据集
    5.2 基准模型

    CNN模型:一种同时包含一维(1D)与二维(2D)卷积通道的模型,能够学习周期信号中相邻与非相邻区间之间的局部相关性。LSTM:一种能够良好捕捉测量振动信号时间特性的模型。MCNN-LSTM:一种融合多尺度卷积神经网络与长短期记忆网络的模型,用于滚动轴承故障诊断。MHGAT:首个在轴承故障诊断领域引入多头图注意力网络的模型。

    多视角方法:通过与依赖多视角信息的技术进行对比,评估所提模型的性能表现。具体而言,Cat、Dot与Add为COFU方法的消融变体,其性能亦被纳入评估。

    MCCA(Jiang 等, 2022a):一种基于典型相关分析(CCA)的多视角学习方法,用于最大化振动信号与电流信号特征之间的相关性。为确保公平比较,我们将其多层特征提取部分替换为本文所提出的视角特定编码器。

    Concatenation:一种将不同视角的高阶表示直接拼接后,经过线性变换进行故障类型识别的多视角融合方法,其处理流程如图6(a)所示。

    Dot:一种将不同视角的高阶表示相乘后,进行线性变换并识别故障类型的多视角融合方法,处理流程如图6(b)所示。

    Add:一种将不同视角的高阶表示相加后,经线性变换完成故障类型识别的多视角融合方法,其处理流程如图6(c)所示。

    图6 “Concatenation + FC”、“Dot + FC” 和 “Add + FC” 的示意图
    5.3 结果讨论
    5.3.1 方法结果对比

    表4展示了本文提出的COFU方法与多个基线方法在性能上的对比评估。实验结果表明,在 CWRU、SEU_bearing和SEU_gear三个数据集上,COFU在准确率(ACC)、精确率(P)和召回率(R)三个指标上均优于其他方法。

    表4 不同模型诊断结果比较

    同时,基于表中结果可得出以下几点观察:

    (1) 在多种用于故障诊断的单视角方法中,MHGAT取得了最优的性能。这可归因于其采用了图神经网络与多头注意力机制等先进技术,能够在不同尺度上提取判别性特征,并构建增强的综合特征用于故障诊断。此外,将频率视角作为输入,在传统CNN和LSTM模型中也表现出更优的效果,说明频率视角特征在提取关键信息方面具有重要作用。尽管如此,诸如 MCNN-LSTM与MHGAT等结构设计合理的模型,在使用时间视角输入时同样能取得可比的性能表现。

    (2) 多视角方法的整体性能普遍优于单视角方法。观察发现,即便是简单的多视角融合技术,如Cat、Dot和Add,也在大多数情况下优于单视角方法。上述结果验证了多视角信息集成有助于显著提升故障检测性能的假设。然而,仍需注意,部分单视角模型(如 MHGAT)在性能上甚至超过了最基础的多视角融合方法。这可能是由于简单拼接融合方式可能引入一定噪声,反而削弱了多视角方法的效果。

    (3) 本文提出的COFU方法在所有基线方法中表现最为优越。尽管MCCA采用了典型相关分析以学习多视角间复杂的语义相关性,其融合策略相对复杂,但在三个数据集上,COFU 的整体性能仍优于MCCA。具体而言,COFU在三个数据集上均获得了最高的ACC、P与R。在CWRU与SEU_gear数据集上,所提出模型的准确率、精确率与召回率均为100%;在SEU_bearing数据集上,COFU模型的准确率、精确率与召回率分别为99.95%、99.95%与99.95%。

    该优越性能归因于协同注意力融合网络能够有效利用不同视角间的共识信息与互补特征,从而显著提升旋转机械故障诊断的准确性与鲁棒性。

    5.3.2 COFU诊断表现

    为更有针对性地分析各类故障类别的诊断效果,本文绘制了混淆矩阵以验证实验结果。如图7所示,混淆矩阵全面记录了不同数据集上的诊断与分类结果,包含正确分类信息与误分类信息。混淆矩阵的纵轴表示真实标签,横轴表示预测标签,因此对角线上的元素表示各数据集的诊断准确率。从图中可以看出,本文所提出的方法在三个数据集上对10类故障状态样本均实现了有效识别,模型在各数据集上的准确率分别为100%、99%与100%。对于SEU_bearing数据集,存在两个分类错误的样本,这两个样本均为工况“20_2”下的ball故障,被错误预测为“30_2 ball”。本文认为,该现象部分原因可能是这两个故障类别本身同属于ball故障类,二者在特征表现上具有一定相似性,从而导致了误分类的出现。

    图7 COFU在各数据集上的混淆矩阵图示
    5.3.3 抗噪性能表现
    本文通过在信噪比(SNR)范围从-4dB到4dB的条件下对信号数据进行实验,分析了所提出方法的抗噪性能。详细结果如图8所示。在SNR = -4dB条件下,COFU方法的诊断准确率明显高于其他对比方法。随着SNR的增加,各方法的诊断准确率整体提升;在SNR = 4dB时,COFU的诊断准确率接近95%。该结果表明,COFU在工业噪声环境下具有更优越的抗干扰能力。
    图8 模型在不同噪声环境下的性能
    5.3.4 特征可视化
    为验证COFU中协同注意力网络的有效性,本文在CWRU数据集上对COFU所学习的三视角融合表示进行t-SNE可视化,结果如图9所示。为了揭示多视角方法所提取的特征,本文采用t-SNE降维算法对特征进行可视化处理。从图9可以看出,在经过三种简单多视角方法提取特征后,不同故障类别之间存在重叠,表明其无法有效区分不同故障。而COFU提取的特征在类别间表现出更高的可分性。在COFU的自适应协同注意力融合网络作用下,主要特征得到有效增强,从而有助于不同故障类别之间的分离。
    图9 CWRU 数据集上提取特征的 t-SNE 可视化结果
    经过多轮协同注意力融合后,各类故障在空间分布上表现出明显差异;同一类故障的样本聚集在一起,表明COFU能够有效区分不同类型的故障。综上所示,相较于其他方法,本文提出的COFU能够更好地学习多视角下的故障交互特征,从而更有助于故障类别的判别与分离。

    6 结论

    本文提出了一种用于旋转机械故障诊断的多视角方法,称为多视角自适应协同注意力融合网络(COFU)。与传统单视角输入方法不同,COFU通过利用特定的神经网络编码器,对三种视角的特征表示进行融合,从而获取更为全面的故障特征信息。此外,本文还提出了一种新型的融合方法,以有效利用多视角数据的共识性与互补性。

    最终,COFU 被应用于CWRU、SEU_bearing和SEU_gear三个数据集,以实验方式验证其相较于基线方法的学习性能,分别在三者上取得了100%、99.95%和100%的准确率。实验结果表明,所提出的COFU方法是一种有效且便捷的解决方案,具有较强的适应性,能够理想地识别故障信息,并成功实现滚动轴承的自动化故障诊断。

    考虑到CWRU与SEU数据集本身的局限性,如数据干净、样本构造简单、故障类型数量有限以及难以模拟真实工业环境等因素,所训练模型在实际部署中的性能可能受到一定影响。因此,未来工作将致力于结合多视角学习方法,引入小样本学习与领域自适应技术,以增强模型在更贴近实际工业环境中的泛化能力。


    编辑:Jin
    校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、Tina、陈宇航、陈莹洁、赵诚、肖鑫鑫
    该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除

    来源:故障诊断与python学习
    振动非线性旋转机械航空python海洋声学裂纹电机多尺度DAP
    著作权归作者所有,欢迎分享,未经许可,不得转载
    首次发布时间:2025-05-17
    最近编辑:5小时前
    故障诊断与python学习
    硕士 签名征集中
    获赞 77粉丝 107文章 194课程 0
    点赞
    收藏
    作者推荐

    “数字孪生/故障诊断”专题 | 基于数字孪生和领域泛化的未知工况自适应故障诊断(上)

    本期给大家分享一篇小编近期阅读的数字孪生技术相关文章。如果有故障诊断相关方向研究人员希望宣传自己研究成果,欢迎大家在公众 号后台与小编联系投稿,大家一起交流学习。数字孪生是当前故障诊断领域的研究热点。本期推荐的这篇是林奈大学博士研究生迈赫迪·萨曼·阿扎里的文章,这篇文章中提出了一种结合多个范式的自适应故障诊断系统,即基于共享知识的监控-分析-规划-执行(MAPE-K)循环,领域泛化网络(DGNMs)模型和数字孪生(DT)。MAPE-K循环能够实时适应,DT生成补充数据解决标记数据不足问题,DGNM通过对抗学习和领域差异度量增强特征泛化。实验证明,该系统在相关工作操作和跨机器任务中表现优于现有技术。由于文章篇幅过长,小编将分两次为大家翻译介绍这篇综述,本节推文是这篇文章的上半部分,希望对大家的学习有所帮助,文章质量很高同时希望大家可以多多引用,特别是对所提方法的借鉴。论文链接:通过点击最左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目: Self-adaptive fault diagnosis for unseen working conditions based on digital twins and domain generalization论文期刊:Reliability Engineering and System SafetyDoi:https://doi.org/10.1016/j.ress.2024.110560作者: Mehdi Saman Azari(a), Stefania Santini(b), Farid Edrisi(a), Francesco Flammini(c) 论文时间: 2024年 机构: a Department of Computer Science and Media Technology, Linnaeus University, Växjo, Sweden b Department of Electrical Engineering and Information Technology, University of Naples Federico II, Naples, Italy c School of Innovation, Design and Engineering, Mälardalen University, Sweden 作者简介:迈赫迪·萨曼·阿扎里,于2010年在伊朗德黑兰的塔比阿特莫达雷斯大学获得电气工程硕士学位;随后,他于2014年加入瑞典林奈大学,攻读计算机科学与媒体技术博士学位。在林奈大学期间,他作为Cyber-Physical Systems研究组的一员,专注于弹性网络物理系统的研究。2018年至2020年,他在林奈大学担任研究助理,参与多个与物联网相关的研究项目,并在该领域取得显著成果。(来源:ResearchGate) 摘要近年来,基于领域自适应的智能故障诊断技术被用于解决网络物理系统中的领域迁移问题;然而,对于获取目标数据的需求限制了其适用于未知工况的范围。为了克服这些限制,引入了领域泛化技术来增强故障诊断模型在未知工况下的操作能力。然而,现有方法假设可以访问来自各个源域的大量标记训练数据,在真实世界的工程场景中由于资源限制而面临挑战。此外,缺乏随时间更新诊断模型的机制,需要探索能够对新的未知工况自主重新配置的自适应泛化诊断模型。在这样的背景下,本文提出了一种结合多个范式的自适应故障诊断系统,即基于共享知识的监控-分析-规划-执行(MAPE-K:Monitor-Analyze-Plan-Execute over a shared Knowledge)循环,领域泛化网络模型(DGNMs:Domain Generalization Network Models)和数字孪生(DT:Digital Twins)。MAPE-K循环使系统能够在动态工业环境中进行实时适应,无需干预。为解决标记训练数据不足的问题,使用数字孪生生成补充数据并不断调优参数,以反映新的未知工况的动态性。DGNM整合了对抗学习和基于领域差异度的度量标准,来增强特征多样性和泛化能力。多域数据增强的引入提高了特征多样性,并有利于学习多个领域之间的相关性,最终提高了特征表示的泛化性。所提出的故障诊断系统在三个公开可用的旋转机械数据集上进行了评估,证明相较于其他最先进方法,该系统在相关工作操作和跨机器任务中表现更出色。 关键词:故障诊断系统;MAPE-K;领域泛化; 数据增强;旋转机械;数字孪生;未知工况 目录1 引言2 相关工作 2.1 传统机器学习和深度学习 2.2 领域自适应 2.3 领域泛化 2.4 数字孪生体 2.5 MAPE-K3 预备工作 3.1 构建诊断数字孪生 3.2 领域泛化问题设置 3.3 混合4 自适应故障诊断系统设计 4.1 监视器 4.2 分析仪 4.3 规划者指标 4.4 执行者 4.5 知识5 旋转机械案例研究6 实验验证与性能分析 6.1 数据集 6.2 对比方法 6.3 实施细则 6.4 诊断结果与分析7 结论注:小编能力有限,如有翻译不恰之处,请多多指正~ 若想进一步拜读完整版,请下载原论文进行细读。 1 引言工业传感技术和计算能力的发展极大地推动了数据驱动的方法在信息物理框架内的机械设备故障诊断[ 1 ]。在此,尽管深度学习( DL :Deep Learning )方法在从大型数据集中提取隐含的故障相关特征方面优于传统机器学习( ML:Machine Learning )方法,但它们仍然依赖于跨训练和测试阶段数据分布一致的假设。由于机械设备的高度动态性,导致工况和数据分布不断变化,这种严格的假设在实际应用中几乎不成立。由于DL模型是在特定的工况下训练的,因此上述差异(通常称为域偏移)构成了一个关键的挑战[ 2 ]。在试图克服领域迁移问题时,深度学习方法需要收集大量与新工况相关的数据,并从头开始对模型进行训练。然而,这个过程是资源密集型的,可能并不总是实用的,因此确定了在不同的工况下增强模型适应性的替代策略的必要性[ 3 ]。为了解决领域迁移问题,领域自适应( DA:Domain Adaptation )技术应运而生,以增强DL模型的弹性和适应性[ 2 ]。DA策略寻求最小化训练(源)和测试(目标)数据之间的差异。尽管基于DA的故障诊断方法是有效的,但其实用性取决于适应过程中目标域数据的可用性。在真实情况下,特别是当机械设备在新的工况下运行时,只有代表正常运行状态的数据可用于训练,而有缺陷的数据则无法获取。这些条件,通常被称为不可见的工况,普遍存在于高动态机械设备和不断变化的环境中,例如旋转机械[ 4 ],因此,大多数DA方法的适用性仅限于离线跨域故障诊断任务。为了应对未知工况带来的开放性挑战,研究人员越来越关注智能故障诊断系统领域的领域泛化( DG:Domain Generalization )技术。这些技术旨在将源域中的诊断知识的适用性推广到未知的工作环境中[ 5 ]。尽管在推广性方面取得了可喜的成果,但现有的基于DG的未知工况处理方法面临以下挑战。首先,许多DG方法旨在通过将所有领域整合到单个潜在空间来学习领域不变的表示,通常忽略了对精确诊断至关重要的特定领域特征[ 6 ]。这种监督不仅限制了特征的多样性,而且增加了源域特征过拟合的风险,所以该模型可能难以有效地推广到新的、看不见的工况。由此迫切需要改进基于DG的故障诊断系统,以便更好地整合和利用特定领域的信息,从而提高其在不同工业工况下的泛化能力。其次,为了开发具有足够泛化能力的模型,这些方法依赖于从具有不同数据分布的不同源域获得大量标记训练数据的假设。然而,在实际工程场景中,从不同工况下的相同机器或从不同但相似的机器收集如此广泛的训练数据集是一个挑战。这些挑战源于与数据收集相关的高成本,包括设备设置、维护和操作停机时间。此外,现实工业环境中固有的多样性和多变性往往导致数据集稀疏或不完整,特别是涉及罕见的故障事件或特定的操作场景。这种数据的稀缺性会严重限制仅在有限且同质的数据集上训练的诊断模型的泛化能力。因此,探索一种可靠的补充源来提供训练数据集变得至关重要。第三,工业机械运行在动态和不断变化的环境中,需要能够适应和更新其评估的诊断模型,以应对新的数据和不断变化的工况。传统的方法往往缺乏持续的模型更新机制,而依赖于可能很快过时的静态数据集。因此,迫切需要探索能够自主监测运行工况变化并据此调整诊断策略的自适应广义诊断模型。这样的模型不仅可以随着时间的推移增强可靠性,而且可以确保诊断系统在不断变化的工业环境中保持有效和准确。针对上述开放性问题,本文提出了一种将MAPE - K、领域泛化网络模型和数字孪生技术高度集成的自适应故障诊断系统。在这里,DGNM被用于处理由于特征多样性有限而导致的丢弃特定领域特征和过拟合的问题。为此,需要结合多种技术,包括多领域数据增强、对抗学习和基于领域的差异度量。更具体地说,多域增强采用基于狄利克雷分布的混合技术,生成融合了来自不同域特征的增强数据。然后将这些丰富的数据用于对抗学习和基于领域的差异度量,以提取更多样化的特征,提高网络的泛化性。DT被嵌入到所提出的平台中,作为可靠的数据供应商,从而解决了从实际机器中获取足够训练数据集的问题。事实上,DT模型是不断调整的,可以反映新的看不见的工况的运行动态,并提供了丰富的诊断知识来源。最后,为了应对工业机械环境的动态性,将MAPE - K自适应回路引入到所开发的故障诊断系统中。该循环有利于实时适应新的不可见的工况,从而减少了直接人为干预的需要,增强了系统的自主性。因此,这项工作的关键新贡献可以概括如下:采用MAPE - K循环用于自适应故障诊断系统。集成数字孪生和适当的更新策略,以提供可靠的补充源域数据。利用多域数据增强,以提高故障诊断系统对分布外数据的泛化能力。将域判别器和基于域的差异度量模块嵌入到基于DL的泛化网络DGNM中,以学习来自多个源域的域不变和判别特征。使用三个公开的用于交叉作业操作和跨机器任务的数据集,在旋转机械案例研究中对该方法进行了实验评估。本文的结构如下:第2节简要回顾相关研究,随后是第3节的基础知识和背景信息。在第4节,提供了对所提出的自适应故障诊断系统的全面描述。第5节阐明了将该系统应用于旋转机器作为案例研究。此外,第6节提供了实验结果及其分析。最后,在第7节中,总结论文并讨论未来研究的潜在方向。2 相关工作本节回顾了与本文相关的最新概念。为了增强条理性,每个概念,即传统机器学习和深度学习、领域自适应、领域泛化、数字孪生和MAPE-K,将分别进行讨论。2.1 传统机器学习和深度学习 在预测性维护领域,传统的ML和DL由于其在故障检测和隔离方面的能力,已被证明在开发故障诊断系统方面是有效的。例如,Rajabi等[ 7 ]提出了一种将传统ML算法与信号处理技术相结合的故障诊断系统,在数据不平衡和计算资源占用方面实现了更好的平衡。类似地,Moradi等[ 8 ]提出了一种集成贝叶斯网络( BN:Bayesian Networks )和深度学习( DL:Deep Learning )的新的数学架构,用于复杂工程系统( CES:Complex Engineering Systems )的状态和操作风险监测。此外,Zhao等[ 9 ]开发了一种模型驱动的深度展开方法,为故障诊断系统设计抗噪声攻击的可解释性DL模型,以实现事前可解释性。然而,由于机械设备运行在高度动态的环境中,这种领域迁移对现有的基于传统ML和DL的数据驱动故障诊断系统提出了重大挑战。 2.2 领域泛化 领域自适应方法的最新进展显著地解决了领域迁移带来的挑战。这些方法一般分为基于统计的方法和基于领域对抗的方法。基于统计的方法,如相关对齐[ 10 ]和最大均值差异( MMD:Maximum Mean Discrepancy )[ 11 ],将差异度量集成到它们的目标函数中以最小化领域分布差异。另一方面,基于领域对抗的方法利用对抗框架来识别跨领域的可迁移特征[ 12 ]。在这一领域的显著场景包括相同机器的迁移( TIM:Transfer from Different related Machines ) [ 13 ]和不同相关机器的迁移( TDM:Transfer from Different related Machines ) [ 14 ],其中重大的挑战是由于来自真实机器( RM:Real Machines )的故障数据稀缺,因为机器故障是不频繁的,有时是罕见的。一种流行的替代方案是将诊断知识从实验室迁移到真实世界机器( TLRM :Transfer from Virtual to Real Machine) [ 15 ],但由于需要在实验室机器中诱发各种故障,往往耗时且成本较高。例如,Li等人[ 16 ]证明了在物理过程中使用模拟数据进行异常检测的潜力。然而,基于DA的故障诊断方法严重依赖于目标领域数据的可用性。 2.3 领域自适应 为了应对未知目标领域的挑战,研究正在探索领域泛化方法,这些方法可以分为数据增强、正则化和领域不变表示学习。数据增强技术,如Fan等人[ 17 ]探索的数据增强技术,集成领域差异和领域判别器来诊断故障,旨在通过多样化源数据来增强泛化能力。然而,Fan等人使用的传统混合技术具有局限性,因为它们只在两个域之间生成样本,而忽略了对其他域的考虑。Shi等人[ 18 ]开发了多源增强结合对抗训练来增强特征多样性,学习多个域之间的相关性,从而增强特征表示的泛化性。正则化方法,如Yang等人[ 19 ]的方法,通过应用正则化技术,优化中心损失和softmax损失来防止过拟合,以改善未知条件下的故障诊断。域不变表示学习方法,如Chen等人提出的对抗域不变泛化( ADIG:Adversarial Domain-Invariant Generalization )方法[ 20 ],通过使用特征归一化来提取不同源域的一致表示,以提高诊断精度。Wang等人[ 21 ]设计了多个特定领域的辅助分类器来显式地学习不同源域之间的特定领域特征,然后使用卷积自编码器模块通过预测不确定性和重构损失去除学习到的特定领域特征。尽管DG方法是有效的,但它们往往忽略了在看不见的工况下对故障诊断至关重要的特定私有特征,并且通常需要来自不同源域的大量、多样、有标签的训练数据,这在实际工程环境中可能具有挑战性和成本高昂的收集。 在源域可用训练数据集有限的场景下,Jun等人[ 22 ]提出了一种单域泛化模型,称为多尺度风格生成对抗对比网络( MSG-ACN:Multi-scale Style Generative and Adversarial Contrastive Networks ),从单一工况中学习诊断知识,并将其泛化到新工况中。然而,单域泛化方法在实际应用中往往由于对新的未见域的有限泛化而陷入困境,导致性能下降、过拟合和对域偏移的敏感性。 2.4 数字孪生体 为了应对这些挑战并提供一种实用的替代方案,数字孪生被引入来模拟故障条件以生成训练数据[ 23 ]。总的来说,它提供了一种更有针对性的方法来生成与目标机器状态的具体特征和操作条件紧密匹配的数据,从而提高故障诊断系统的性能和可靠性。例如,Ma等人[ 24 ]利用有限元方法,结合模拟和真实世界数据,开发了一个用于DA的DT模型。类似地,Don等[ 25 ]创建了一个动态轴承模型来生成大量的合成数据,证明了其在DA中对真实旋转机械的适用性。Jia等人[ 26 ]开发了DG的DT模型,结合了模拟和真实世界数据的各种组合,以增强诊断能力。然而,需要一种策略来更新DT模型,以反映真实世界的变化,并保持与实际系统保持一致的准确性。在这种观点下,Xia等人[ 27 ]提出了一种使用DT模型和深度迁移学习的智能故障诊断框架,其中DT模型根据来自物理资产的实时数据进行更新。然而,由于机器的工况是动态变化的,并且随着时间而变化,因此开发自适应诊断模型至关重要,它可以自动更新诊断模型和DT模型,以适应新的、未知的工况。最近的方法,如Mishra等人[ 28 ]和霍等人[ 29 ],解决了这一需求,尽管为新的未知工况量身定制的模型仍然是必不可少的。 2.5 MAPE-K MAPE - K循环是实现软件密集型系统自适应的广泛认可的参考模型[ 30 ],代表了对共享知识库的监视、分析、计划和执行。它起源于计算系统需要在没有人工干预的情况下自动处理复杂的管理任务[ 31 ]。通过提供一种结构化的方法来分离各种功能和相互作用,MAPE - K循环持续运行,以确保系统能够自主地适应变化并维持其目标[ 32 ]。 MAPE - K的许多后续应用已经在不同的领域中实现,显示了它的通用性。例如,在机器人学中,MAPE - K回路被用来增强机器人系统的自主性和效率,使其能够适应动态环境,并以最小的人类监督来执行复杂的任务[ 33 ]。在智能工厂中,它被用于优化生产流程,并通过适应变化的制造条件和检测异常来确保不间断运行[ 34 ]。同样,在物联网( IoT:Internet of Things )应用中,MAPE - K支持对连接设备的动态管理,以确保它们能够有效地响应不断变化的上下文和用户需求[ 35 ]。然而,据作者所知,目前还没有研究专门针对新的和不可见的工况而设计的结构化自适应故障诊断系统。 最后,为了解决和解决上述所有公开问题,并填补当前文献中的空白,本文介绍了一种新的自适应故障诊断框架,该框架以完全集成的方式结合了多种技术。为了清晰地勾勒出本文的贡献,表1给出了一个比较性的总结,以揭示所提出的方法相对于现有方法的改进之处。 表1 相关工作总结和我们提出的方法3 预备工作3.1 构建诊断数字孪生开发DTs是一项具有挑战性的任务,因为它需要在足够可接受的模拟性能和真实机器的复杂性之间找到平衡。换句话说,必须选择建设性地确定抽象层次,以涵盖所有相关细节。对于诊断目标,有必要定义最关键组件的详细模型,而不是整个机器的详细表示。接下来,为了方便和提供一个标准的框架,将设计过程分解为以下4个高级步骤:选择关键零部件。首先,需要确定哪些组件必须进行状态监测,这可以与其关键程度有关,即对机器安全和性能的影响以及故障易感性。推导出观测下系统的动力学行为。这一步的重点是开发上一步确定的关键组件的动态模型。我们指出,只需要模拟关键机器部件的动态行为即可。关键组件的建模应遵循白盒方法,即使用确切的组件工作机制,并具有真机的任何规则和限制。对故障进行定义和建模。该步骤解决了将适当的故障机制集成到上一步开发的动态模型中,以便注入和模拟可能导致机器故障的故障。一般而言,为了影响机械的动态行为并提供故障数据集,必须集成故障机理。指定虚拟传感器。该步骤是通过虚拟传感器的方式来定义和指定通过DT仿真需要采集的数据。虚拟传感器,如果有必要,它们的动态,应该集成到机器的DT中。这使得用户能够收集在整个DT模型仿真过程中产生的数据。一旦建立并初步校准了预测某些目标变量值的数字模型,其预测能力将根据工况数据和测量值进行不断更新和调整。3.2 领域泛化问题设置 领域泛化的目标是在多个已知标注的源领域 上训练模型 ,从而使它能够有效地在未见的目标领域 上运行。在这种表示法中, 和 分别指代源领域和目标领域。每个源领域 , 由索引 确定,包括一组数据点 及其对应的标签 ,这些数据点从不同的分布 中抽取。领域标签 范围在 内, 表示每个领域中的样本数量。每个源领域中每个类别的标签空间定义为 ,其中 代表总类别数。 目标域表示为 ,与源域共享相同的类别标签空间,即在本研究中没有考虑类别迁移 。目标域的分布为 ,不同于源域 的分布。 挑战在于使用来自这K个源域的数据训练模型,并辅以增强数据,以确保其获得足够的泛化能力。这将使模型能够在未知的目标域Dt上有效地执行诊断任务,尽管源域和目标域之间的数据分布存在差异。3.3 混合 增强训练数据的多样性和数量是公认的提高智能诊断模型泛化性能的方法。数据增强是实现这一目标的一种广泛使用的策略,特别是在面对有限的训练数据时。 一种特别有效的数据增强方法是混合。该技术通过两个训练样本及其关联标签的数学组合创建增广样本来生成多样化的数据,记为( , )和( , ),由公式定义: 这里, 表示凸组合函数,而 是从Beta分布 ( α, α) 中随机选择的混合因子,其中 α > 0。混合操作具有价值,因为它能够捕获不同领域和类别样本之间的关系,强调训练样本之间的线性相关性。此外,它可以补偿不同领域样本之间的遗漏信息,比如领域特定特征,使模型能够学习多样化特征并探索更丰富、领域不变的表征。 4 自适应故障诊断系统设计工业传感技术和计算能力的发展极大地推动了数据驱动的方法在信息物理框架内的机械设备故障诊断[ 1 ]。故障诊断系统( FDS:The fault diagnosis system )用于检测潜在缺陷,将其隔离,并识别出具体的故障类型。在实际的应用中,真实的机器性能受到各种工作操作和环境条件的影响。在这些条件下,真实机器数据的分布通常会随着新的工况而变化。传统的基于DL和领域自适应技术的FDS在训练阶段需要同时访问新工况下的健康和故障数据,以保持其功能或适应其行为;然而,在模型训练过程中,只有健康状态是正常可用的,而故障数据往往是无法访问的。为了克服这个问题,需要消除依赖关系,并使诊断模型能够泛化到新的工况。为此,我们引入了自适应,其主要目的是使FDS能够在无法访问其故障数据的情况下对新的未知工况进行自主重构。在信息物理系统的新兴技术和计算范式的背景下,所提出的自适应FDS的参考框架如图1所示。它包括被管理和管理元素层,而管理元素层负责实现自适应。MAPE - K循环是专门为设计、开发和实现FDS自适应而定制的,如图2所示。 图1 自适应故障诊断参考架构 图2 利用MAPE - K进行自适应故障诊断MAPE - K环由以下四个重要的功能组件( FC:Functional Components )组成: FC1:监视器。该组件从被管元素和环境中获取数据,通过探针对其进行处理,以更新知识库。·FC2:分析器。利用更新的知识,分析器确定是否需要适配,并分析适配的潜在场景。FC3:规划器。如果认为适应是必要的,规划器执行最合适的适应场景,每个场景包含两个或多个适应动作。FC4:执行者。执行者通过效应器执行开发的FDS,根据设计的计划调整被管理元素。 管理元素使用这些组件之间的共享知识来协同实现自适应。在接下来的章节中,我们将详细介绍MAPE - K的各个组成部分。4.1 监视器监测是该循环的初始阶段,有责任为后续阶段提供必要的数据。在监测阶段,定期从FDS中的传感单元收集数据。Monitor组件处理来自传感器的数据,进行均匀化和噪声去除,使其适用于分析阶段和规划阶段。然后将处理后的信息存储在共享知识中。4.2 分析仪更新了通过监视器与机器最新操作数据共享的知识后,分析仪利用这些数据来检测机器工况的任何变化。为了衡量机器工况的变化,我们需要引入一些指标。首先,我们定义指标WCC(WCCWork Condition Change)如下:其中 和 分别表示当前时刻和前一个采样时刻的工作状态。 为设计参数,由系统设计者定义,是在变化非常小的情况下防止误报的阈值。换句话说, = 意味着检测到了工况的变化,因此需要进行适应性调整。为了衡量新工况下DT的响应( )与真机的响应( )之间的差异,定义了以下指标:其中 表示响应信号之间的计算误差, θ 是确定响应信号之间可接受误差的调整阈值, 表示DT的响应与真实机器之间的较大差异, 表示较小且可接受的差异。这些指标的计算结果由知识中的分析器保存,以备将来参考。4.3 规划者指标分析器计算并存储在知识中的指标作为触发器,供规划者指导该功能组件。事实上, 的价值激活或失活了Planner。而 的价值驱动对系统变化做出适当的反应。具体来说,当检测到显著差异 (例如, 时, 表明当前DT模型已经过时,需要进行更新,因此规划者指标选择了三个适应任务,例如,更新策略、数据生成和领域泛化,分别为 , , ,更新策略详见第4.3.1节,在 中执行,而 提供来自多个域的带标签训练数据,并提供所需的数据分布,以启用后续的域泛化网络模型(见第4.3.2节)。最后,在第4.3.3节中介绍了 ,其责从多个源域中泛化已有的诊断知识。相反,在有限偏差(例如, 的情况下,即当DT不需要调整就能有效运行时,只有 和 被执行。4.3.1 : 更新Dt模型在所提出的自适应故障诊断系统中,DT模型的更新是一个关键的过程,该过程被视为一个优化问题。主要目标是最小化DT模型与真实机器演化条件之间的差异,确保DT与真实世界的变化保持同步。如图3所示,引入基于参数灵敏度分析的模型更新策略,使DT模型与目标真机状态对齐。该模型更新策略被定义为一个优化问题,其目标函数是最小化这些差异。 图3 DT更新策略 为了实现DT更新概念,选择合适的响应信号来衡量真实目标机器状态的实际行为与DT模型预测的行为之间的相似性是至关重要的。基于所选择的响应信号,所开发的更新策略的优化函数可以定义为Eq.( 3 ) 。更新策略的成功取决于选择合适的度量标准来衡量真实系统行为和DT模型预测行为之间的相似性。例如,振动数据是监测工业系统健康状态的最具信息量的信号之一。然而,直接在时域中比较振动数据可能会具有挑战性,需要一种专门的度量标准来评估从模拟和真实场景中得出的频谱之间的相似性。根据响应信号和定义的指标计算真实响应和模拟响应之间的相似度后,选择和调整更新参数,以减少RM与其DT之间的差异。一旦误差的平方范数落在可接受的范围内,表明DT的响应与机器新的、不可见的操作条件保持一致,则认为更新策略是成功的。4.3.2 : 提供训练数据从具有不同数据分布的多个领域中获取大量有标签的训练数据是使DG模型能够有效泛化的必要条件。作为对这种必要性的回应, 侧重于提供来自多个源域的训练数据集。该活动是 后续阶段的基础,分为两个步骤:-多源域的定义的范围是定义一个来自多个源域的训练数据集。第一步,执行真实机器的DT模型,构建源域数据集。因此,DT适用于不同健康状态下的仿真,包括不同的故障尺寸。为了补充这个主要数据集,我们探索了从目标机械的先前工作操作中收集的历史数据,并将其存储在知识库中。然而,在不同工作操作下从同一测试轴承中获取训练数据集的实际挑战使得该任务在某些情况下不可行。在这种情况下,可以从其他轴承中获得另一个可靠的训练数据集,其中丰富的诊断知识可在云存储库中获得,因为存在不同工业工厂、公司和数字平台的同类机器。这允许创建一个多样化的训练数据集,它作为 中领域泛化过程的基础。-数据增强其目的是通过使用来自不同领域的样本来生成新的样本(域间样本),从而探索领域相关性表示。因此,该模块在增加数据多样性的同时,在一定程度上保留了领域特异性,从而增强了学习到的特征的泛化性。此外,它确保了域间数据分布的平滑,促进了域不变表示的学习。为了实现这一目标,我们从混搭概念(参见第3.3节)中获得了灵感。然而,传统的混合技术仅限于在两个域之间生成样本,忽略了对其他域的考虑。认识到这些在多源场景下的局限性,我们引入了多域混合,如图4所示。为了有效地利用来自多个领域的信息,我们采用狄利克雷分布代替贝塔分布对混合因子进行采样。 图4 传统混频与多域混频的比较 选择Dirichlet分布比Beta分布具有显著的优势,特别是在多类和复杂场景中。狄利克雷分布通过生成和为1的混合权重来自然地处理多个类,简化了实现并保证了一致性。它对样品之间的重量分布提供了更大的控制,从而增强了混合的灵活性。相比之下,Beta分布主要适用于二分类场景,当扩展到多分类问题时效率较低。因此,狄利克雷自然地管理多类数据的能力,再加上它的简单性和灵活性,使其成为混合技术的首选。 这种调整使得我们的多领域混合方法能够生成具有丰富信息和多样性的样本,使模型能够有效地提取全面和泛化的诊断见解。多源增强样本记为 ,是从不同源域的样本 中使用以下方程得到的: 这里, 表示从Dirichlet分布 中随机取样的混合因子的集 合,其中 是一个m元序组数组,它的所有元素的值在本文中设置为相同.此外,为了促进域不变表示和最小化域差异,生成与增强样本相对应的软域标签用于对抗训练,如下面的方程所描述:总之,通过强调样本级别的增强和引入软领域标签进行对抗训练,我们为领域泛化网络赋权,以更有效地提取领域不变表示。4.3.3 :领域泛化网络模型领域泛化网络模型在更广泛的自适应故障诊断系统中的一致性集成强调了系统将其诊断能力泛化到目标机器的未知工况的能力。更具体地说,DGNM旨在解决与多个分布偏移和无法获得新的工况数据(故障数据)有关的挑战。如图5所示,通过利用早期阶段 获得的训练数据,DGNM专注于学习领域不变的特征表示,可以有效地泛化以识别未知工况中的故障。 图5 方案A2、A3的总体架构为了保证FDS的泛化性和自适应性,我们采用了多种技术,包括对抗学习和基于领域的差异度量。DGNM由特征提取器 和分类器 组成,可以有效地处理跨域故障诊断任务。此外,基于对抗学习的判别器 有助于训练网络平等对待所有源域,从而促进跨不同运行条件的有效故障诊断所需的域不变表示的学习。此外,基于领域的差异度量 在最小化多个领域之间的分布差异方面起着至关重要的作用,从而增强了系统有效概括诊断知识的能力。最后,通过对原始数据和增广数据中的数据进行探索,对所开发的DGNM进行优化,以提取领域通用特征。当模型训练完成后,DGNM保证了学习到的特征具有鲁棒性,从而增强了系统在目标机未见工况下的故障识别性能。这项活动的执行分为以下基本步骤: -特征提取器和故障分类器模块与 更广泛的框架一致,特征提取器和故障分类器模块在DGNM中充当不可或缺的组件。利用基于CNN模型的广泛有效性,我们的方法使用 作为源标签分类器和特征提取器。这种选择是由 在处理工业机械中常见的信号,特别是振动信号的有效性所驱动的[36]。特征提取过程涉及三个卷积层的序列,其次是平坦层和全连接层。该序列生成的高级表示记为 。我们使用LeakyReLU作为非线性激活层,并结合批量归一化来加速训练过程。这些表示作为后续故障诊断分类器模块的基础,其目的是创建依赖于域不变特征表示的判别分类器。该分类器模块以 为输入,包含两个全连接层,有效地将特征提取器的高维特征表示降为一个 维向量,表示为 。对于来自多个源域的原始样本和多域混合算法的增广数据,分类损失 可以写为:其中 是增广样本的个数。-域判别器模块在所提框架的背景下,域判别器模块基于生成对抗网络的原理,由生成器和判别器组成,通常被描述为一个两人游戏[ 37 ]。为了培养网络公正对待所有数据源的能力,我们设计了一个使用对抗学习的多域判别器。这种方法有助于从多样化的源域获取领域不变的特征表示,最终加强了故障分类器在不同领域中的泛化性能。领域判别器模块采用类似于分类器模块的结构来产生与特征表示Xg相关的概率。与领域对抗训练方案一致,我们采用交叉熵函数作为领域分类损失,定义为:基于领域的差异度量模块在我们提出的DG网络模型的背景下,我们观察到监督学习和对抗训练可以将来自不同领域具有相同机器条件标签的数据样本投影到学习子空间中的相同区域。但是存在潜在的过拟合风险,不同类别的聚类效果无法得到保证。这种脆弱性在应用于新领域时可能会导致泛化性能降低。为了缓解这一挑战,我们在DGNM框架中引入了基于领域的差异度量模块。该模块的主要目标是最小化来自不同源域的数据分布之间的距离,以增强它们之间的凝聚力。从本质上讲,这使得来自不同领域的数据在一个共同的分布空间中对齐,同时保持来自同一领域的数据之间的合理距离。为了实现这一点,该模块通过对其输出施加正则化,将两个全连接层连接到特征提取器的输出,从而最大化域内距离,同时最小化域间距离。类内距离( Lintra )衡量聚类紧密度,确保同一类内的数据紧密聚类。这可以定义为: 其中 表示在我们的训练数据集中与第l台机器健康状态相关的样本集 合,它包括原始数据和增广数据。在 和 表示第j个个体样本。 表示 内的总样本数。此外, 是指由 产生的输出向量的维数, 是由 导出的均值。类似地,类间距离 量化了可分性,可定义为: 其中 表示 在不同类中的平均值。综上所述,通过整合聚类紧致性 和可分性 的概念,我们将距离度量学习的优化目标表述如下: 优化目标: DGNM的优化涉及3个主要目标,重点关注特征提取器参数 、故障诊断分类器参数 、领域判别器参数 和基于领域的差异度量参数 。一个合适的优化目标有三个:最小化 和 的损失,同时最大化 的损失。这样,综合目标函数L可以表示为:其中超参数 和 用于对三个分量进行加权。一旦建立整体损失函数L,对模型进行优化,使得:在每个训练批次内使用随机梯度下降( SGD )算法迭代更新网络参数。SGD是机器学习中的一种基本优化技术,它利用训练数据的子集(批)计算损失函数关于网络参数的梯度,从而促进参数的有效更新。该方法使网络能够不断地优化其参数以最小化损失函数,从而增强了网络在故障诊断中跨不同领域的泛化能力。通过基于每个批次计算的梯度迭代调整参数,SGD确保网络渐进地学习到对现实场景中遇到的不同操作条件具有鲁棒性和适应性的表示。 4.4 执行者 Planner ( 即 )中的最后一个活动生成一个经过训练的模型,该模型存储在Knowledge中,必须由被管元素中的FDS单元执行。因此,执行器负责将开发的诊断模型加载并传递给FDS。4.5 知识 知识在提供所有MAPE元素协同工作和协作实现自适应的机制方面发挥着重要作用。知识包括不同的信息,如: 通过Monitor采集目标机的运行时数据,包括运行数据的相关值。“ WCC ”和“ ”指标由分析器评估。数据来源于DT,包括机械的虚拟模型及其相关的几何参数,以及故障尺寸。活动模型( 、 、 ),计划者需要在每个场景中执行。设计参数(即阈值T , , , )。历史数据,包括目标机器的先前工况,以及来自不同工业工厂、公司和数字平台的同类机器的数据。 编辑:赵栓栓校核:李正平、陈凯歌、曹希铭、赵学功、白亮、任超、海洋、陈宇航、陈莹洁、Tina、王金、赵诚、肖鑫鑫该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除来源:故障诊断与python学习

    未登录
    还没有评论
    课程
    培训
    服务
    行家
    VIP会员 学习计划 福利任务
    下载APP
    联系我们
    帮助与反馈