这篇论文是针对旋转机械跨域故障诊断时出现新型未知故障而开展的研究。针对开放集故障诊断场景,提出一种融合自监督机制的开放集跨域故障诊断方法。适合于机器学习、增量学习、开集故障诊断研究领域学习者,特别是对使用增量学习进行建模故障诊断思路的感兴趣学者。
论文链接:通过点击最左下角的阅读原文进行在线阅读及下载。
论文题目:Self-Supervised-Enabled Open-Set Cross-Domain Fault Diagnosis Method for Rotating Machinery
School of Mechanical Science and Engineering, Huazhong University of Science and Technology, Wuhan 430074, PR China.
在旋转机械故障诊断中,跨工况是一种常见情形,可通过跨域迁移学习加以解决。然而,现有的故障诊断方法通常未考虑可能出现的新型未知故障,即开放集故障诊断场景,从而导致诊断性能下降。为应对该问题,本文提出了一种融合自监督机制的开放集跨域故障诊断方法(Self-supervised-enabled Open-set Cross-domain, SEOC),以实现旋转机械在多种工况下的高鲁棒性故障识别。具体而言,方法引入开放集风险最小化策略与自监督对比学习机制,以增强特征区分性与模型稳定性;设计伪标签一致性自训练机制以减小域间分布差异;同时,构建基于压缩置信规则的开放集识别策略,实现对未知故障与已知故障类别的有效区分。在三相电机与轴承故障数据集上的实验结果表明,所提出的SEOC方法在故障识别准确性与效率方面均优于现有方法。相比基线方法,SEOC框架的整体分类准确率提升至少9%,在未知故障识别方面的平均准确率超过97.68%,验证了其在电机与轴承故障诊断中的优越性能。
旋转机械的广泛应用极大地推动着工业发展 [1], [2]。然而,由于其通常运行于极端工况条件下,一些关键部件极易发生故障,从而可能引发重大财产损失甚至人员伤亡 [3], [4], [5]。基于振动信号的故障诊断方法在保障现代工业设备安全与稳定运行中具有重要意义 [6]。
近年来,深度学习凭借其强大的特征提取能力,在故障特征提取与智能故障诊断领域引起了广泛关注 [7]–[10]。然而,大多数基于深度学习的故障诊断方法普遍依赖于两个前提假设:其一,存在充足的标注数据;其二,训练数据与测试数据具有相同的分布。在实际工业场景中,由于旋转机械运行工况的变化,信号数据分布往往存在差异 [11], [12],从而导致模型泛化能力下降,诊断性能不稳定。
为应对上述问题,基于迁移学习的故障诊断方法被提出 [13],旨在利用不同领域的知识迁移能力缓解数据分布差异。其中,作为一种有效的迁移学习技术,域适应(Domain Adaptation, DA)被广泛用于跨域故障诊断任务。现有DA方法主要分为两类:基于距离度量的故障诊断方法与基于对抗学习的故障诊断方法。前者利用最大均值差异(Maximum Mean Discrepancy, MMD)[14]、MMD变体 [15]、相关对齐(Correlation Alignment, CORAL)[16]及其扩展方法 [17]等度量指标,缓解源域与目标域之间的分布偏移;后者则以生成对抗网络为基础 [18], [19],通过对抗训练学习域不变特征,降低域间差异。此外,为应对跨域过程中异常类别导致的负迁移问题,部分域自适应方法也被提出,如部分对抗自适应方法 [20] 及加权对抗网络方法 [21]。
尽管上述DA方法能够有效应对典型的跨工况(即跨域)故障诊断问题,但对于开放集故障诊断场景仍缺乏有效应对能力 [22]。在开放集场景中,目标域可能包含源域中未出现的未知故障类别,这将导致传统方法对异常类别的负迁移。尽管已有部分研究尝试引入极值理论、实例级加权机制 [23] 或双对抗神经网络结构 [24] 等方法解决开放集问题,但这些方法大多仅关注源域的故障样本信息,忽视了目标域中的故障数据分布差异,容易导致对目标域故障识别的偏倚,表现为对已知类和未知类的低可靠性识别与不稳定预测,最终影响整体诊断性能。
为解决上述挑战,本文提出一种融合自监督机制的开放集跨域故障诊断方法(Self-supervised-enabled Open-set Cross-domain, SEOC)。该方法旨在实现多工况下旋转机械的高鲁棒性智能故障识别。具体而言,为提取结构化的判别性故障特征,本文在领域自适应框架中引入了对比学习机制;为缓解工况变化引起的域间分布差异,设计了一种基于伪标签一致性的自训练机制,通过高置信度伪标签辅助模型学习,从而提升跨域适应能力;此外,为有效识别未知与已知故障类别,本文提出一种基于压缩置信规则的开放集类别识别策略,显著提升了识别准确率。为进一步减少误判,还引入开放集风险最小化机制,以增强模型的可判别性与稳定性。
本文的主要贡献包括:
1、为克服故障特征重叠问题并获得可区分的故障特征分布,SEOC方法引入自监督对比学习机制,从而提取鲁棒的结构化判别特征。
2、为缓解未知类故障引起的性能退化,本文提出基于压缩置信规则的故障类别识别方法,实现未知类与已知类故障的有效检测;同时引入开放集风险最小化策略,以提升识别的区分性与稳定性。
3、为克服工况变化导致的数据分布差异,设计伪标签一致性自训练机制,并将高可靠性的目标域未知故障样本引入训练过程,作为有效监督信息以提升分类性能。
带有标签的源域 个数据样本,其中 是带标注的信号片段, 是对应的故障模式标签, 是故障类别的数量。未标记的目标域 , 表示目标域中的 个未标记的数据样本,故障类别被定义为 , 代表未知的故障模式。开放集跨域故障诊断的目标是学习一个能够准确识别已知故障并识别未标记目标域上未知故障的故障诊断模型。
5.1 SEOC框架
所提出的 SEOC 方法的框架如图1所示。该框架由样本增强模块、判别特征提取模块和开放集学习模块组成。
样本增强模块用于增加样本的多样性,提高泛化性能,包含强样本增强和弱样本增强。强样本增强包括归一化、随机添加高斯噪声、缩放、拉伸和裁剪,可用于随机生成严重失真的样本。弱样本增强包括对振动信号进行归一化和随机裁剪。在源域中采用弱增强策略获取弱增强信号样本。在目标域中利用弱增强和强增强策略获取混合增强信号样本。混合增强样本用于在对比学习中构建目标域信号的两个不同视角。后续的特征提取模块可以利用混合增强样本的互信息来挖掘鲁棒特征。
判别特征提取模块用于提取不同工况下鲁棒的故障特征表示。具体而言,在源域中,利用监督学习获取跨类故障判别信息;同时,为了克服故障特征重叠,经验分类风险用于对同类故障特征进行聚类并分离不同类故障特征。此外,利用自监督对比学习挖掘结构信息,通过混合增强样本两个视角的互信息最大化获得鲁棒的判别特征。同时,为避免未知类故障的影响,利用开集空间风险用于识别已知类故障和未知类故障。
开集学习模块由开集识别和伪标签一致性学习组成。开集识别模块依靠构建的置信规则来检测未知类故障和已知类故障。采用伪标签一致性策略降低领域差异,并使用选定的可靠样本的伪标签作为监督信息进行自训练,以获得令人满意的结果。
5.2 判别特征提取
源域和目标域之间存在特征差异,正确识别源域并不能保证模型在目标域的诊断准确性。目标域的一些潜在特征信息有助于识别未知类别。因此,提出基于自监督对比学习的特征学习方法,以获取鲁棒的故障特征和结构信息。同时,提出开放集风险最小化方法,以提高可区分性和稳定性。
5.2.1 源域监督学习
利用监督学习策略挖掘源域中的故障特征。利用交叉熵计算预测概率与真实标签之间的差异。
其中 为源域振动信号 的真实概率分布, 表示弱增强样本的预测概率分布。
为了进一步减小经验分类风险,引入倒数点[25],它与已知类的原型[25]相反。假定第 个倒数点为 , 表示未知类别的样本。开放集空间的样本应该比闭合集的样本距离倒数点更近。
其中 表示两集 合样本之间的距离。通过公式(2),可以通过倒数点与对应已知类的距离差来识别样本。给定一个样本 和倒数点 , 将被计算:
其中 表示学习的判别特征, 表示欧式距离, 表示内积。该方法利用相似性度量计算所有已知类故障的嵌入特征与倒数样本特征之间的差异来确定类类别。分类概率输出可以表示为:
为调整相似概率的超参数。训练通过最小化倒数样本的分类误差来进行:
通过最小化经验分类风险损失,将每个已知类样本推送到已知类特征空间,同时远离未知类空间。
5.2.2 目标域无监督学习
针对目标域,提出了一种基于自监督对比学习的特征学习方法。该方法利用正负样本之间的差异来指导缺陷特征的获取。如图1所示,判别性特征学习模块包含一个特征编码器和对比估计损失函数。缺陷特征编码器用于获取不同视角的混合增强样本的缺陷特征表示。利用余弦相似度度量来计算构建的样本对之间的差异。给定弱增强样本和强增强样本的特征 和 ,相似性度量可以表示为:
基于该相似性度量,修改后的对比损失函数 可以表示为:
为了降低开集空间风险,有效地分离已知特征和未知特征,应增大未知类与倒数样本之间的最大距离,使其小于预先定义的间隔参数R。因此,间隔约束[25]可以表示为:
由于开集空间与闭集空间互补,约束开集空间可以转化为限制已知样本与互反样本之间的距离小于 ,可写为:
通过最小化经验分类风险损失,每个未知类被推到未知类特征空间,并远离已知类空间。 特征学习模块最大化目标域混合增强信号的互信息,以学习故障判别特征。该模块采用自监督学习策略,挖掘潜在的类别结构信息。同时,该模块可以将类别结构信息从标记源域迁移到未标记目标域。为了保证对未知类和已知类的准确识别,特征学习模块在开放集识别模块之前进行训练,以避免出现不稳定的情况。
5.3 开放集识别
5.3.1 未知故障识别
为了识别未知故障,根据未知故障预测概率和目标域内整个故障预测概率的分布,构建了置信规则。 由于弱增强样本 与原始信号相似,弱增强样本的分类器输出概率被用作故障预测概率。当对未知故障信号的预测概率 大于或等于预设阈值,则该故障信号视为候选未知故障类。因此,置信度规则的下界可以定义为:
其中, 是候选的未知故障样本, 是预设的阈值。由于未知故障样本并不在源域中,阈值的数值将会很小。遵循这一规则,特征提取模块将把小的概率数值分配给未知类,将大的概率数值分配给已知故障的样本。 置信规则的上界是根据整个故障类别预测概率构建的。如果在未标记的目标域中为每个故障类别分配相似的概率值,则故障样本类别的确定将变得困难。为了有效地区分未知类故障样本和已知类故障样本,应限制概率的最大值,以使它们更容易区分。当故障概率的最大值小于或等于特定边界时,候选信号将被判定为未知故障类别。反之,该样本将被丢弃。置信规则的上界可以设计为:
5.3.2 已知故障识别
同类信号样本会倾向于同一个聚类中心,因此选取聚类中心样本生成高置信度伪标签。当弱增强故障样本中各类概率最大值超过或等于预设边界 ,则判断信号为已知故障;否则,判断样本为未知故障。因此,伪标签可以写成:
表示伪标签,指示已知类故障。 表示已知类故障样本的故障类别概率最大值。 为给定阈值。在协同训练过程中,源域中的已知类故障对目标域中的已知类故障具有一定的引导作用,阈值 应该设置得大一些。给定高置信度伪标签后,相应的样本将在接下来的训练轮次中被视为新的训练样本。
5.3.3 伪标签一致性学习
不同工况下存在差异,决策边界无法有效捕捉目标域中未知类故障的判别信息和类间故障特征。提出的方法利用高置信度伪标签作为目标域训练的监督信息,以提高识别精度。通过伪标签一致性学习,提出的SEOC方法可以自适应地将决策边界调整到未标记故障信号的稀疏分布区域。伪标签一致性学习损失可以定义为:
是强增强样本中选取的已知故障的故障预测概率, 表示在强增强样本中的未知故障的故障预测概率, 为一个训练周期内的振动信号样本个数。通过伪标签一致性训练,模型可以尽可能地利用目标域中未标记数据的信息,降低对真实标记样本的依赖,克服目标域中标记缺失的问题。经过伪标签一致性训练后,模型可以在目标域信号上反向传播并优化伪标签,以减小不同工况下的分布差异,从而缓解域漂移问题。该策略可以有效地利用目标域中未标记数据的信息,提高模型的泛化能力。
如上所述,所提出的方法利用了交叉熵函数、对比学习损失、伪标签一致性损失和开放集风险最小化损失;总损失可以写成:
和 是权衡参数。在训练阶段,通过优化源域的对比损失和交叉熵损失,并在目标域中进行伪标签一致性训练来进行域对齐。
6.1 实验数据集描述
6.1.1 三相电机故障数据集
三相电机故障的原始振动信号采集于如图2所示的实验台上。实验台包含三相电机、电机控制器、转轴、轴承模块和变速箱。采用DYTRAN 3093压电加速度计和CMSONE-DAQ数据采集器采集振动信号,采样频率为25.6 kHz。实验台在两种不同转速工况(20Hz和25 Hz)下设计了六种故障类型,包括健康状态、内置转子弯曲、内置转子断条、内置轴承故障、内置转子不对中、电压不平衡和单相故障(复合故障),对应的故障标签分别为0、1、2、3、4、5、6。本文针对每种故障类型采集了400个原始故障样本(400×2048个点)。
6.1.2 轴承数据集
轴承故障振动信号由实验台测量得到,如图3所示。采用DYTRAN 3093压电加速度计和CMSONE-DAQ数据采集器采集振动信号,采样频率为25.6 kHz。故障轴承包含2种类型的滚珠故障(0.5 mm和1 mm)、健康状态故障、2种类型的内圈故障(0.5 mm和1 mm)、2种类型的内外圈复合故障(0.5 mm和1 mm),对应的故障标签设为0、1、2、3、4、5、6、7。每种故障类型采集400个原始故障样本(400×2048点)。
6.1.3 直齿轮数据集
如图4所示,直齿轮故障的振动信号由试验台测量。试验台包含一根轴、一台电机和一个齿轮箱。PCB333B2加速度计用于测量振动信号,采样频率为10 kHz。如图4所示,在15 Hz和20 Hz下设置了四种不同程度的裂纹类型,相应的故障标签分别为0、1、2、3和4。本文针对每种故障类型收集了400个原始故障样本(400×2048个点)。
6.2 故障诊断任务
为了评估所提出的 SEOC 框架在各种开放集任务中的有效性,我们随机选择不同的类别来构建标签集。表1列出了电机数据集、轴承数据集和正齿轮数据集的迁移任务(T1~T7、B1~B10 和 D1~D7) 。
6.3 实验结果与分析
为了证明所提出的 SEOC 方法的稳健性和有效性,我们使用了四个评估指标:AL、AL* 和 UK,其中 AL、AL* 和 UK 分别表示全类准确率、共享类准确率和未知类准确率。所有实验结果均取五次试验的平均值,以减轻随机性的影响。
6.3.1 结果分析
开展七个三相电机故障诊断任务来验证所提出的方法。三相电机数据集的诊断结果如表2所示。与对比方法相比,所提出的SEOC方法表现出最佳性能。所提出的SEOC方法的平均AL、AL和UK分别为98.63%、98.66%和97.68%,而平均诊断准确率最高的对比方法的AL、AL和UK分别为89.78%、89.84%和55.22%。这表明同时考虑未知类和已知类样本识别,并进一步降低经验分类风险和开放空间风险是有效的。所提出方法在所有诊断任务上的AL都超过90%,并且超过了所有对比方法。所提出的SEOC方法的AL*超过95%,表明大多数已知故障类别可以被正确识别。此外,所提出的 SEOC 方法的平均 UK 为 97.68%,表明 97.68% 的未知类故障能够被有效识别。实验结果表明,所提出的 SEOC 方法在已知类识别和未知类检测任务上均优于对比方法。如图5所示,所提出的方法在所有任务上均表现出优异的性能。
6.3.2 特征可视化
利用t分布随机邻域嵌入对分类器softmax层之前的特征表示进行可视化。如图6所示,C0- C5代表故障类型0-5,Unk代表电机未知故障,所提出的SEOC方法仍然表现出优越的性能。由于存在未知故障,CNN和DANN表现较差,两种故障类型(如任务T1中的C2和Unk)表现出部分重叠。OSBP中的故障类型之间存在明显的混合部分(如任务T1中的C0、C2、C4、C5和Unk),四种故障类型混合在一起,无法区分。UDA方法可以有效地对共享类进行分类,但未知故障识别失败。此外,所提出的方法可以正确地获得已知故障分类和未知故障识别,表现出可分离的结果。
6.3.3 消融实验
进行消融实验以评估所提出的 SEOC 方法每项创新的有效性。No-risk、No-con 和 No-pcl 分别代表消除开放集风险最小化损失、收缩学习损失和伪标签一致性学习损失。电机的消融实验结果分别如表3所示。所提的SEOC方法表现出更优异的性能,表明所提方法在已知类故障和未知类故障之间建立了明确的界限,并且可以通过所提策略有效地识别未知故障。所提出的SEOC方法的精度优于消融实验的精度,其中所提出方法的每个部分对于开集跨域故障诊断都是有效的。
本文提出了一种新的 SEOC 模型用于开集跨域故障诊断。为了学习鲁棒的判别性故障特征,最小化开集风险,减少领域偏移,同时提高已知类和未知类故障的识别能力,该方法将自监督对比学习、开集风险最小化、伪标签一致性自训练和开集类别识别结合到一个框架中。为了分离重叠的故障特征并获得可区分的故障特征分布,提出了自监督对比学习框架来挖掘结构信息并获得鲁棒的判别性故障特征。开集风险最小化被公式化以提高可区分性和稳定性。一致性训练旨在减少领域偏移。此外,还开发了一种新的开集识别模块,该模块具有设计的挤压置信度规则,用于未知类和已知类故障检测。在电机、轴承和正齿轮故障诊断中,对所提方法进行了全面的研究和理论分析。与现有方法的比较结果表明,所提方法不仅达到了较高的分类准确率,而且对未知类和已知类故障的识别也表现出优异的性能。未来,我们将重点探索复杂机械设备中不同部件故障的开集诊断方法,并重点解决数据不平衡和小样本等问题。
编辑:任超
校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、曹希铭、冯珽婷、陈宇航、陈莹洁、王金、赵诚、肖鑫鑫
该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除。