论文链接:通过点击本文左下角的阅读原文进行在线阅读及下载。
论文题目:
UDDGN: Domain-Independent Compact Boundary Learning Method for Universal Diagnosis Domain Generation
论文期刊:
IEEE TRANSACTIONS ON INSTRUMENTATION AND MEASUREMENT
论文日期:2025年
论文链接:https://doi.org/10.1109/TIM.2025.3554906
作者:Yuhan Huang (a), Wentao Huang (a), Xiaoxi Hu (b), Zhengjie Liu (a), Jide Huo (a)
机构:
a: the School of Mechatronics Engineering, Harbin Institute of Technology, 92 West Dazhi St., Harbin, China.
b: the State Key Laboratory of Advanced Rail Autonomous Operation, Beijing Jiaotong University, Beijing 100044, China
黄宇涵,哈尔滨工业大学机电工程学院2023级硕士研究生,研究方向为基于迁移学习的旋转机械故障诊断。
黄文涛,哈尔滨工业大学机电工程学院博导,研究方向为机械设备智能故障诊断理论与方法、不确定性信息处理技术。
胡小溪,北京交通大学先进轨道交通自主运行全国重点实验室博士研究生,研究方向为机电故障诊断。
关键词:故障诊断,通用领域泛化,任意类别偏移,迁移学习
虽然基于领域泛化的智能故障诊断方法在解决跨工况领域偏移问题上已取得显著成效,但现有方法在应对工业现场复杂多变的实际情况时面临严峻挑战。工业设备运行具有三个典型特征:首先,工况相关性导致特定故障模式仅在特定工况下显现(如高速工况下易出现轴承疲劳裂纹),这使得目标域可能出现完全未知的故障模式(开集)、部分已知模式(部分集)或仅已知模式(闭集)三种情况;其次,监测局限性使得难以预知设备可能发生的所有故障类型,导致训练数据无法覆盖所有潜在故障模式;第三,数据稀缺性使得难以获取充足的多源域故障样本。
这些特征导致现有方法存在两个主要局限:1)现有闭集域泛化方法仅考虑数据分布偏移而完全忽略类别偏移问题;2)开集域泛化方法(open set domain generalization-based fault diagnosis ,OSDGFD)虽然同时考虑了数据分布偏移和类别偏移,但仅针对目标域必然包含新故障的开集场景设计,无法适应实际可能出现的闭集或部分集场景。此外,这两类方法大多依赖多源域数据进行训练,难以满足工业现场数据获取的现实条件。
究其根本,现有方法的局限性在于:1)未能建立统一的框架来处理目标域可能出现的任意类别偏移情况(闭集/部分集/开集);2)缺乏对单源域场景的有效支持;3)无法自适应地应对数据分布偏移和类别偏移的复合影响。
为此,我们提出了通用诊断域生成网络(Universal Diagnosis Domain Generation Network, UDDGN),通过以下创新解决上述问题:1)采用流形混合的监督对比学习,仅需单源域数据即可学习域不变特征;2)基于CVAE生成伪分布外样本,通过类对抗训练建立自适应紧凑边界,统一处理闭集、部分集和开集三种场景。本文的主要贡献包括:
在UDDG场景中,训练时提供一个由 个样本组成的源域 ,其中 是原始输入数据, 表示采样长度, 代表轴承健康状态的标签, 代表轴承健康状态的类别数量,以同样的方式定义目标域 ,其中 , , 表示目标域数据的健康状态,由于源域与目标域数据是在不同工况下采集的,因此两者数据的分布是不同的 ,并且两者之间的标签空间的关系是未知的,我们分别使用 与 表示两者的标签空间,采取commonness指标定义两标签空间的Jaccard distance: ,
UDDG的总体目标是找到一个可以最小化期望风险
其中,
属于未知类别的目标域样本被识别为源域已知类别的次数越多,开放集的风险越大。
3.2 UDDGN总体流程如图1所示,所提方法的总体流程可分为训练和测试两个阶段。在训练阶段:1)首先通过小波包分解和预处理获得源域数据;2)采用流形混合技术增强数据,并通过监督对比学习模块和分类器实现域不变特征学习,以此解决UDDG场景下的领域偏移问题;3)利用条件变分自编码器生成伪类外分布样本,通过类对抗训练建立紧凑边界,无需为潜在的未知故障类别进行额外建模,即可解决UDDG场景下的类别偏移问题。在测试阶段:目标域样本依次与各故障类别的决策边界进行匹配,若不符合任何边界则判定为未知故障。从图中可以看出,整体的UDDGN框架分为基于流行混合的监督对比损失模块和基于类内对抗学习的紧凑边界模块,接下来,我们详细介绍这两个模块。
图1 UDDGN总体流程
3.2.1 基于流行混合的监督对比损失模块
基于流形混合的监督对比损失模块通过流形混合技术增强数据多样性,并采用监督对比学习实现域不变特征提取。该模块在特征空间对同类样本进行线性插值,构建具有域不变特性的增强样本,同时通过对比损失函数拉近同类样本距离、推远异类样本距离,有效解决了UDDG场景下的领域偏移问题。
3.2.2 基于类内对抗学习的紧凑边界模块
基于类内对抗学习的紧凑边界模块利用条件变分自编码器生成伪类外分布样本,通过类对抗训练建立自适应紧凑边界。该模块通过对抗学习动态调整各类别的球形决策边界,既保证对已知类别的覆盖,又能有效拒绝未知样本,无需显式建模未知空间即可解决UDDG场景下的类别偏移问题。两个模块协同工作,分别针对领域偏移和类别偏移这两个关键挑战提供了解决方案。
整体训练过程分为四个阶段:
对原始信号进行小波包分解,相比传统小波变换降低了计算负载,同时丰富了信号表征;
使用源域已知类别样本训练条件变分自编码器(CVAE);
在分类损失指导下通过特征提取器获取类别原型;
通过流形混合技术扩展已知类别样本,结合监督对比学习实现单源域泛化,并利用CVAE生成的OOD数据与已知数据进行对抗训练以获取紧凑边界。
整体的目标函数为:
其中
每个训练历程的优化过程表示为:
之后经过验证集上的calibration strategy得到边界调整系数
图2 验证算法所用的实验台
实验结果表明,在闭集任务中本方法ACC达88.45%-92.13%,较次优方法平均提升12.6%,监督对比学习使特征类内方差降低37.2%;在开集任务中H-score达83.92%-86.71%,显著优于传统开集方法,紧凑边界模块使未知类F1-score达89.7%,误报率降低23.4%。相比多源域方法AOSDGN,单源条件下ACC提升19.8%;较域适应方法UAN,在无目标域数据情况下性能差距<5%。可视化分析显示,t-SNE特征分布形成明确类簇结构,未知类与已知类分离度达2.3σ,球形边界能自适应调整半径。本方法在工业适用性方面表现突出,仅需1个源域即可达到多源方法92%性能,满足诊断需求。
图3 部分实验可视化结果
通过流形混合增强和对抗边界学习的协同作用,本方法在单源条件下同时解决了领域偏移(平均ACC提升14.2%)和类别偏移(H-score提升32.4%)的双重挑战,验证了其在复杂工业场景中的优越性和实用性。
本文提出了一种新型通用诊断域生成场景,并开发了基于类决策的UDDGN方法,仅利用单源域数据即可同时解决领域偏移和类别偏移问题。本研究的核心创新点在于:(1)通过流形混合的监督对比损失模块实现域不变特征学习;(2)基于类对抗训练的紧凑边界模块实现未知类识别。在两个测试平台上的大量实验表明,该方法在UDDG场景中表现出色,不仅超越了现有域泛化方法的性能,在特定条件下甚至接近域适应方法的水平。尽管取得了这些积极成果,仍有若干方面值得深入研究:首先,当前验证主要针对振动信号,该方法在其他工业诊断数据类型(如声学信号和图像数据)上的适用性有待验证;其次,虽然在跨转速和跨负载场景中表现优异,但在更具挑战性的跨设备场景(存在更大领域差异)下的验证将进一步提升方法的实用性;第三,当前框架中基于特征空间线性插值的流形混合增强方法和球形紧凑边界设计,可能需要进一步优化以适应更复杂的实际分布模式。针对这些挑战,未来工作将重点关注:(1)通过研究声学和图像数据的适用性扩展多模态故障诊断框架;(2)在更大领域差异的跨设备场景下验证和改进方法性能;(3)开发基于物理机理的数据增强策略,设计自适应紧凑边界以更好地适应实际复杂分布模式。这些改进将使本方法更适用于具有多样化工况和故障模式的工业现场诊断任务。
编辑:李正平
校核:陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、陈宇航、Tina、陈莹洁、王金、赵诚、肖鑫鑫
该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除