首页/文章/ 详情

TIM论文学习 | UDDGN:一种用于通用域泛化诊断的领域无关紧凑边界学习方法

4小时前浏览1
 本期给大家推荐一篇TIM论文UDDGN:一种用于通用域泛化诊断的领域无关紧凑边界学习方法该方法设计了通用诊断域泛化网络(Universal Diagnosis Domain Generation Network, UDDGN),通过流形混合的监督对比损失模块和基于类对抗训练的紧凑边界模块,为源域各故障模式建立领域无关的紧凑边界决策域当目标域出现新故障模式时,分类器依据预设边界进行判别,不满足任何边界条件的样本将被归类为“未知”。

论文链接:通过点击本文左下角阅读原文进行在线阅读及下载

论文基本信息

论文题目:

UDDGN: Domain-Independent Compact Boundary Learning Method for Universal Diagnosis Domain Generation  

论文期刊:
IEEE TRANSACTIONS ON INSTRUMENTATION AND MEASUREMENT
 

论文日期:2025年

论文链接:https://doi.org/10.1109/TIM.2025.3554906

作者:Yuhan Huang (a), Wentao Huang (a), Xiaoxi Hu (b), Zhengjie Liu (a), Jide Huo (a) 

机构:

a: the School of Mechatronics Engineering, Harbin Institute of Technology, 92 West Dazhi St., Harbin, China.  

b: the State Key Laboratory of Advanced Rail Autonomous Operation, Beijing Jiaotong University, Beijing 100044, China

作者简介

黄宇涵,哈尔滨工业大学机电工程学院2023级硕士研究生,研究方向为基于迁移学习的旋转机械故障诊断。  

黄文涛,哈尔滨工业大学机电工程学院博导,研究方向为机械设备智能故障诊断理论与方法、不确定性信息处理技术。  

胡小溪,北京交通大学先进轨道交通自主运行全国重点实验室博士研究生,研究方向为机电故障诊断。

目录

1 摘要
2 引言
方法
3.1 问题描述
3.2 UDDGN总体流程
3.3 UDDGN总体目标函数
4 实验验证
5 结论

1 摘要

基于领域泛化(Domain Generalization, DG)的智能故障诊断(Intelligent Fault Diagnosis, IFD)方法在应对未知目标域的领域偏移挑战方面已取得显著成效,然而现有DG方法均假设源域与目标域具有完全相同的故障模式,这一假设在复杂工程实际中往往难以成立。针对目标域故障模式不可预测、源目标域标签空间关系未知这一现实难题,本文创新性地提出了通用诊断域泛化(Universal Diagnosis Domain Generation, UDDG)新范式,该范式要求模型既能准确识别共有标签空间内的目标样本,又能有效拒绝未知故障模式。为解决这一更具挑战性的实际问题,我们设计了通用诊断域泛化网络(Universal Diagnosis Domain Generation Network, UDDGN),通过流形混合的监督对比损失模块和基于类对抗训练的紧凑边界模块,为源域各故障模式建立领域无关的紧凑边界决策域。当目标域出现新故障模式时,分类器依据预设边界进行判别,不满足任何边界条件的样本将被归类为“未知”。在两个测试平台上的大量实验验证了所提算法的有效性和优越性。  

关键词:故障诊断,通用领域泛化,任意类别偏移,迁移学习  

2 引言

虽然基于领域泛化的智能故障诊断方法在解决跨工况领域偏移问题上已取得显著成效,但现有方法在应对工业现场复杂多变的实际情况时面临严峻挑战。工业设备运行具有三个典型特征:首先,工况相关性导致特定故障模式仅在特定工况下显现(如高速工况下易出现轴承疲劳裂纹),这使得目标域可能出现完全未知的故障模式(开集)、部分已知模式(部分集)或仅已知模式(闭集)三种情况;其次,监测局限性使得难以预知设备可能发生的所有故障类型,导致训练数据无法覆盖所有潜在故障模式;第三,数据稀缺性使得难以获取充足的多源域故障样本。  

这些特征导致现有方法存在两个主要局限:1现有闭集域泛化方法仅考虑数据分布偏移而完全忽略类别偏移问题;2开集域泛化方法open set domain generalization-based fault diagnosis ,OSDGFD虽然同时考虑了数据分布偏移和类别偏移,但仅针对目标域必然包含新故障的开集场景设计,无法适应实际可能出现的闭集或部分集场景。此外,这两类方法大多依赖多源域数据进行训练,难以满足工业现场数据获取的现实条件。  

究其根本,现有方法的局限性在于:1未能建立统一的框架来处理目标域可能出现的任意类别偏移情况(闭集/部分集/开集);2缺乏对单源域场景的有效支持3无法自适应地应对数据分布偏移和类别偏移的复合影响。  

为此,我们提出了通用诊断域生成网络(Universal Diagnosis Domain Generation Network, UDDGN),通过以下创新解决上述问题:1)采用流形混合的监督对比学习,仅需单源域数据即可学习域不变特征;2)基于CVAE生成伪分布外样本,通过类对抗训练建立自适应紧凑边界,统一处理闭集、部分集和开集三种场景。本文的主要贡献包括:

  1. 提出通用领域泛化(Universal Diagnosis Domain  Generation, UDDG)新范式,首次统一处理工业诊断中可能出现的三种标签空间关系    
  2. 开发单源域泛化框架,通过流形混合和监督对比学习实现域不变特征提取    
  3. 设计基于条件变分自编码器(Conditional Variational  Auto-Encoder, CVAE)的紧凑边界学习机制,无需显式建模未知空间即可识别新故障

3 方法

3.1 问题描述

在UDDG场景中,训练时提供一个由    个样本组成的源域 ,其中    是原始输入数据,    表示采样长度,    代表轴承健康状态的标签,    代表轴承健康状态的类别数量,以同样的方式定义目标域    ,其中         ,     表示目标域数据的健康状态,由于源域与目标域数据是在不同工况下采集的,因此两者数据的分布是不同的    ,并且两者之间的标签空间的关系是未知的,我们分别使用        表示两者的标签空间,采取commonness指标定义两标签空间的Jaccard distance:    ,     越小,说明两z域之间的类别差异越大,总体的任务目标是设计一个训练阶段无法访问    且不知道    但依然工作良好的诊断模型。

 UDDG的总体目标是找到一个可以最小化期望风险    的可测量函数    

     


其中,      是一个正则化参数,      表示源域与目标域之间的公共类别,      表示目标域中可能出现的未知类别,      表示在公共类别上的经验风险,       是开放空间风险,用于衡量未知样本被标记为已知或未知类别的不确定性,其具体形式如式所示:

     

属于未知类别的目标域样本被识别为源域已知类别的次数越多,开放集的风险越大。

3.2 UDDGN总体流程

如图1所示,所提方法的总体流程可分为训练和测试两个阶段。在训练阶段:1)首先通过小波包分解和预处理获得源域数据;2)采用流形混合技术增强数据,并通过监督对比学习模块和分类器实现域不变特征学习,以此解决UDDG场景下的领域偏移问题;3)利用条件变分自编码器生成伪类外分布样本,通过类对抗训练建立紧凑边界,无需为潜在的未知故障类别进行额外建模,即可解决UDDG场景下的类别偏移问题。在测试阶段:目标域样本依次与各故障类别的决策边界进行匹配,若不符合任何边界则判定为未知故障。从图中可以看出,整体的UDDGN框架分为基于流行混合的监督对比损失模块和基于类内对抗学习的紧凑边界模块,接下来,我们详细介绍这两个模块。  

UDDGN总体流程

3.2.1 基于流行混合的监督对比损失模块

基于流形混合的监督对比损失模块通过流形混合技术增强数据多样性,并采用监督对比学习实现域不变特征提取。该模块在特征空间对同类样本进行线性插值,构建具有域不变特性的增强样本,同时通过对比损失函数拉近同类样本距离、推远异类样本距离,有效解决了UDDG场景下的领域偏移问题。

3.2.2 基于类内对抗学习的紧凑边界模块

基于类内对抗学习的紧凑边界模块利用条件变分自编码器生成伪类外分布样本,通过类对抗训练建立自适应紧凑边界。该模块通过对抗学习动态调整各类别的球形决策边界,既保证对已知类别的覆盖,又能有效拒绝未知样本,无需显式建模未知空间即可解决UDDG场景下的类别偏移问题。两个模块协同工作,分别针对领域偏移和类别偏移这两个关键挑战提供了解决方案。

3.3 UDDGN总体目标函数

整体训练过程分为四个阶段:    

  • 对原始信号进行小波包分解,相比传统小波变换降低了计算负载,同时丰富了信号表征;    

  • 使用源域已知类别样本训练条件变分自编码器(CVAE)    

  • 在分类损失指导下通过特征提取器获取类别原型;    

  • 通过流形混合技术扩展已知类别样本,结合监督对比学习实现单源域泛化,并利用CVAE生成的OOD数据与已知数据进行对抗训练以获取紧凑边界。    

整体的目标函数为:

   

其中        是用于平衡三项损失的正则系数,利用    优化器端到端更新网络参数,并设置学习率调度函数:    
每个训练历程的优化过程表示为:

     

     

     


     表示第      轮更新。

之后经过验证集上的calibration strategy得到边界调整系数     ,测试阶段,我们使用第二阶段得到的类别原型和经过调整系数改进的边界半径     ,首先判断样本在闭集分类器上所属的类别,使用对应类别的类别原型和边界半径进行判断,若处于边界半径外,则判断为位置类样本,若处于边界半径外,根据模型输出最大值对应的索引判断所属类别。

4 实验验证

本研究采用Paderborn轴承数据集和自建SFB试验台数据集进行验证。Paderborn数据集包含8类故障模式,采集于不同转速(900/1500rpm)、载荷(400/1000N)和扭矩(0.1/0.7Nm)工况,划分为PA/PB/PC三个域,采样频率64kHz,每类1000个样本。SFB数据集包含7类健康状态,采集于600/900/1200rpm三种转速,划分为MA/MB/MC三个域,采样频率51.2kHz。实验设计了16个跨域诊断任务,覆盖闭集(目标域仅含源域已知故障)、部分集(目标域含源域部分故障)和开集(目标域含新故障模式)三类场景,采用ACC、AUROCk、H-score和OSCR四项指标评估性能,并与ERM、PROSER等传统方法以及AOSDGN、M-ADA等域泛化方法进行对比。

 

验证算法所用的实验台    

实验结果表明,在闭集任务中本方法ACC88.45%-92.13%,较次优方法平均提升12.6%监督对比学习使特征类内方差降低37.2%在开集任务中H-score83.92%-86.71%,显著优于传统开集方法,紧凑边界模块使未知类F1-score89.7%误报率降低23.4%相比多源域方法AOSDGN,单源条件下ACC提升19.8%较域适应方法UAN在无目标域数据情况下性能差距<5%可视化分析显示,t-SNE特征分布形成明确类簇结构,未知类与已知类分离度达2.3σ球形边界能自适应调整半径。本方法在工业适用性方面表现突出,仅需1个源域即可达到多源方法92%性能,满足诊断需求。    

 

部分实验可视化结果    

通过流形混合增强和对抗边界学习的协同作用,本方法在单源条件下同时解决了领域偏移(平均ACC提升14.2%)和类别偏移(H-score提升32.4%)的双重挑战,验证了其在复杂工业场景中的优越性和实用性。

5 结论

本文提出了一种新型通用诊断域生成场景,并开发了基于类决策的UDDGN方法,仅利用单源域数据即可同时解决领域偏移和类别偏移问题。本研究的核心创新点在于:(1)通过流形混合的监督对比损失模块实现域不变特征学习(2)基于类对抗训练的紧凑边界模块实现未知类识别。在两个测试平台上的大量实验表明,该方法在UDDG场景中表现出色,不仅超越了现有域泛化方法的性能,在特定条件下甚至接近域适应方法的水平。尽管取得了这些积极成果,仍有若干方面值得深入研究首先,当前验证主要针对振动信号,该方法在其他工业诊断数据类型(如声学信号和图像数据)上的适用性有待验证;其次,虽然在跨转速和跨负载场景中表现优异,但在更具挑战性的跨设备场景(存在更大领域差异)下的验证将进一步提升方法的实用性;第三,当前框架中基于特征空间线性插值的流形混合增强方法和球形紧凑边界设计可能需要进一步优化以适应更复杂的实际分布模式。针对这些挑战,未来工作将重点关注:(1)通过研究声学和图像数据的适用性扩展多模态故障诊断框架;(2)在更大领域差异的跨设备场景下验证和改进方法性能;(3)开发基于物理机理的数据增强策略,设计自适应紧凑边界以更好地适应实际复杂分布模式。这些改进将使本方法更适用于具有多样化工况和故障模式的工业现场诊断任务。  

编辑:李正平

校核:陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、陈宇航、Tina、陈莹洁、王金、赵诚、肖鑫鑫

该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除



来源:故障诊断与python学习
ACT振动疲劳旋转机械通用航空轨道交通ANSApythonUM声学裂纹理论电机试验
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-05-05
最近编辑:4小时前
故障诊断与python学习
硕士 签名征集中
获赞 77粉丝 106文章 190课程 0
点赞
收藏
作者推荐

3min创新点Get!| 基于注意力嵌入二阶神经网络的高效可解释轴承故障诊断方法(附开源代码)

欢迎关注我们的专题文章——“3min创新点Get!”。本专题我们将按照“问题来源——解决途径——创新点”的结构帮助读者了解文章结构并快速捕捉创新点。(投稿方式点击这)本期关键词:注意力机制,可解释性,二阶卷积神经网络如因网络及权限问题无法获取原文及代码,通过点击本文左下角的阅读原文进行在线阅读及下载论文基本信息论文题目:Attention-Embedded Quadratic Network (Qttention) for Effective and Interpretable Bearing Fault Diagnosis论文期刊:IEEE TRANSACTIONS ON INSTRUMENTATION AND MEASUREMENT论文日期:2023年论文链接: 10.1109/TIM.2023.3259031开源代码:https://github.com/asdvfghg/QCNN_for_bearing_diagnosis作者:Jing-Xiao Liao, Hang-Cheng Dong, Zhi-Qi Sun, Jinwei Sun, Shiping Zhang and Feng-Lei Fan机构:(a) School of Instrumentation Science and Engineering, HarbinInstitute of Technology, Harbin 150001, China(b) Weill Cornell Medicine, Cornell University, Ithaca, NY 14850 USA作者简介:廖敬骁, 现为哈尔滨工业大学和香港理工大学双学位博士生。曾获香港理工大学研究生奖学金,哈尔滨工业大学特殊奖学金等荣誉。研究方向为机械故障诊断,非平稳信号处理,非线性神经网络等,在IEEE TII,MSSP,IEEE TIM,IEEE TAI,IEEE JBHI等期刊等国际著名学术期刊发表研究论文10余篇(ESI高被引论文1篇),公开授权国家发明专利1项。摘要 轴承故障诊断对于降低旋转机械的损坏风险从而提高经济效益具有重要意义。近年来,以深度学习为代表的机器学习在轴承故障诊断方面取得了很大进展。然而,将深度学习应用于此类任务仍面临着有效性和可解释性等重大挑战:1)当轴承信号受到噪声的严重破坏时,深度学习模型的性能会大幅下降; 2)深度学习是黑箱模型,即很难知道一个模型是如何对正常信号和故障信号进行分类。为了解决这些问题,首先,我们使用二阶神经元来建立卷积网络的原型。由于二阶神经元具有较强的特征表示能力,该网络能够有效地滤除含噪轴承数据。此外,我们通过将学习到的二阶函数分解成与注意力类似的形式,独立推导出了二阶神经元的注意机制,称为qttention,从而使得由二阶神经元构成的模型具有内在的可解释性。实验结果表明,本文提出的神经网络能够有效地进行轴承故障诊断。关键词:轴承故障诊断,深度学习,二阶卷积神经网络(Quadratic Convolutional Neural Network, QCNN),二阶神经元诱导注意力模块(Attention-Embedded Quadratic Network, qttention)1 问题来源 基于信号处理的方法通常利用傅里叶变换、短时傅里叶变换、希尔伯特-黄变换等将信号序列变换到频域或时频域。然后,进行频谱分析以捕获故障轴承的功能。尽管这些方法在理论上是合理的,但它们存在以下缺点:1)由于轴承总是安装在复杂的机械系统中,因此测量信号中充满了来自其他机械部件的干扰和来自测量设备的背景噪声。这要求从业者仔细地设计复杂的去噪模型以从复杂的噪声环境中提取各种故障特征;2)因为不同的轴承结构和直径导致故障的不同特征频率,所以在执行基于信号处理的方法时需要手动确定的参数以最大化它们的诊断性能,由于工业领域的复杂性,其既不智能也不可扩展。2 解决途径 2.1 研究现状为了克服上述弱点,在过去的几年里已经开发了各种深度学习模型。Wen等人将一维时域信号折叠成二维图像,然后使用LeNet-5作为骨干对这些图像进行分类。同时,很多研究直接使用1D-CNN模型对1D时域信号进行研究。例如,WDCNN(Deep Convolutional Neural Networks with Wide first-layer kernels)在第一层中采用宽卷积核作为一维信号的信号提取器,并在几个轴承故障上取得了令人满意的结果。此外,注意力机制有助于网络关注故障特征并进一步增强特征提取能力,因此广泛研究在轴承故障诊断中引入了注意力模块。这样不仅提高了网络的分类精度,而且使网络具有可解释性。2.2 当前研究局限性尽管深度学习模型在轴承故障检测方面取得了很大的进步,但仍然存在需要解决的挑战:1)有效性:目前,深度学习模型可以表现出色,即,当信号干净或经过调试后,准确率超过90%。然而,当信号被噪声严重破坏时,深度学习该模型的性能会大幅下降。如果想要在工业领域中实现深度学习模型,则应该解决该问题; 2)可解释性:深度学习等一系列非线性或递归操作,是黑盒模型。由于模型缺乏可解释性,因此很难知道模型提取故障信号的物理原理。3 创新点 3.1 二阶卷积神经网络图1 所提出的QCNN框架受生物神经系统中神经元多样性的启发,提出了一种称为二阶神经元的新型神经元,以促进深度学习中的神经元多样性。二阶神经元是对输入信号计算两个线性卷积的乘积再加上输入信号平方的卷积。根据神经元的多样性,我们将所提出网络分为两个部分:神经元设计和结构设计。图1展示了提出的二阶卷积神经网络(Quadratic Convolutional Neural Network, QCNN)。在神经元设计中,我们采用二阶神经元,希望借由其强大的特征表示能力用于轴承诊断。具体地说,QCNN在卷积层中用二阶卷积运算代替传统的卷积。在结构设计上,QCNN继承了WDCNN的结构作为所提出模型的结构。因为,WDCNN是一个成熟的模型,其设计已被许多后续研究所考虑。这种结构堆叠了六个CNN块和一个全连接层。二阶神经元在表示能力方面在本质上有所提高,这种提高并非来源于所增加的参数量而是由于所涉及的非线性计算。首先,传统神经元的非线性映射仅由激活函数提供,而二阶神经元从二阶聚集函数获得额外的非线性映射。因此,单个二阶神经元可以实现传统神经元无法实现的异或逻辑。其次,二阶神经元不等同于三个传统神经元的组合或总和。假设激活函数是ReLU,常规神经元的组合只能是分段线性函数,但二阶神经元是分段多项式函数。多项式函数比线性函数更适合于逼近复杂函数。3.2 二阶神经元诱导注意力模块图2 在卷积运算的框架中为整个信号建立qttention映射的工作流程注意力模块最初是为自然语言处理等序列任务而衍生的。如缩放点积注意力机制等在Transformer模型中被广泛采用。同时,通道和空间注意力模块被用来增强CNN。然而,注意力机制的关键在于引入了一个关于输入重要性的映射,即(𝑾𝒙) · 𝒙,从而促使网络有区别地利用输入信息。 基于上述观察,我们发现二阶神经元也包含一个注意机制,称为qttention,通过分解学习的二阶函数模拟注意力。在卷积层中,qttention与卷积运算紧密耦合。图2展示了为整个信号建立qttention图的工作流程。每个卷积核被认为是单个神经元,卷积运算是以恒定步长在输入上移动核。在每个感受野,卷积核的计算并生成一个qttention图。通过连接局部感受野处的所有qttention图来导出整个信号的最终qttention图。当步幅小于感受野的长度时,两个相邻的感受野重叠。然后,我们对重叠位置的注意力得分求平均值。与传统的全局注意力模块相比,该注意力模块是局部的。qttention的局部性更适用于轴承故障诊断。通常,在将信号划分为若干个小块之后应用注意力模块。然后,将注意力得分分配给每个小块,并且注意力图针对整个信号。相反,注意力与卷积有关,卷积出现在每个局部感受野。由于故障信号在时域中会表现为周期性的瞬态脉冲,因此qttention的局部性更适合于提取故障特征。编辑:曹希铭校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、Tina、陈宇航、海洋、陈莹洁、王金、赵诚、肖鑫鑫该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除点击左下角阅读原文,即可在线阅读论文。来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈