论文题目:Towards dual-perspective alignment: A novel hierarchical selective adversarial network for transfer fault diagnosis
论文期刊:Advanced Engineering Informatics
论文日期:2025年
作者:
Yansong Zhang, Xianfeng Yuan, Xilin Yang, Xinxin Yao, Jianjie Liu, Fengyu Zhou, Peng Duan
School of Mechanical, Electrical & Information Engineering, Shandong University, Weihai 264209, China
张焱淞,山东大学机电与信息工程学院。智能故障诊断、迁移学习、变工况下的旋转机械健康监测。联系方式:202337618@mail.sdu.edu.cn
无监督域自适应已广泛应用于旋转机械迁移故障诊断中,旨在解决标记数据缺失和分布偏移问题。然而,现有的方法仍然面临着一些挑战。首先,这些方法通常认为无论源域故障样本是否应该迁移,所有样本在域自适应中的贡献是相等的,这会导致负迁移。其次,所有的网络参数都被认为具有相同的可迁移性,忽略了一些参数仅适用某个领域或并不适合故障特征分布对齐的情况。为了解决这些问题,本文提出了一种新型层次化选择性对抗网络(Hierarchical Selective Adversarial Network, HSAN),该网络通过实例级和参数级的细粒度自适应来提高诊断性能。具体来说,为了抑制由于故障样本被视为同等易迁移水平而导致的负迁移,本文设计了一种实例选择机制,自适应地确定具有高适应性贡献的可迁移故障样本。在参数级对齐方面,通过所提出的识别准则将可学习参数分为领域无关参数和领域特定参数,其中前者在域适应过程中是可迁移的,后者不可迁移并被惩罚以削弱对于适应过程的干扰。本文在两个公共数据集和一个实际的故障诊断测试台上进行了大量诊断实验,实验结果充分表明HSAN具有优越的诊断性能,优于其他先进的跨域诊断方法。
旋转机械在工业场景中占有核心地位,滚动轴承作为其关键部件尤为重要,其健康状态直接影响工业系统的性能。在实际制造生产中,滚动轴承的故障可能导致严重的经济损失甚至人员伤亡。因此,滚动轴承故障诊断具有重要意义,受到了广泛的研究关注。
随着传感技术和工业物联网的进步,海量工业数据为故障诊断提供了新的机会。基于深度学习的故障诊断(Deep Learning-based Fault Diagnosis, DLFD)得益于其出色的特征提取能力,以其良好的性能成为机器健康状态监测领域数据驱动的新范式。然而,大多数DLFD方法都遵循训练和测试故障样本集具有相同分布的基本假设,这在实际工业场景中是不现实的。在特定工况下训练的诊断模型在部署到新的工况时,性能会下降。此外,在新的工况下标记故障样本是一项费时费力的工作。因此,在直接将一个分布上训练的DLFD迁移到其他分布时可能会面临挑战。为了在目标域获得满意的诊断效果,迁移学习思想被应用在故障诊断中,在不同工况下的跨领域任务中发挥着关键作用。
无监督域自适应(Unsupervised Domain Adaptation, UDA)属于迁移学习的一个研究范畴,旨在通过学习领域共享知识来建立不同领域之间的联系。目前主流的UDA故障诊断方法大致分为两类。第一类基于度量。例如,Zhang等人对相关对齐(Correlation Alignment, CORAL)损失进行了优化,以减小分布差异,增强模型诊断能力。从空间映射的角度来看,Qian等人提出了一种新的振动特征引导的差异度量来增强故障分布表示能力。另一类是基于对抗的方法。Ganin等人首先提出了一种域对抗神经网络(Domain Adversarial Neural Network, DANN),其中提取器和判别器通过对抗训练获得具有梯度反转层的域不变特征。Xiao等人利用联合最大平均差异(Joint Maximum Mean Discrepancy, JMMD)对DANN进行了改进,实现了边缘分布和条件分布对齐,获得了更好的诊断结果。此外,Jiao等人构造了一种对抗熵最小-最大操作,通过更新分类器使熵最大化来学习不变的域原型,然后更新后的提取器使熵最小化以获得高类区分度的故障特征。因此,UDA技术在故障诊断中越来越普遍。
尽管UDA轴承故障诊断取得了令人瞩目的成就,但现有方法仍然存在影响诊断能力的问题。首先,现有方法将所有故障样本在知识迁移中视为具有同等的可迁移性,因此在自适应过程中,这些样本在源域内始终具有同等的权值。然而,由于数据分布的偏移,不同的样本具有不同等的可迁移性,因此当前这种同等加权方式对于挖掘域不变故障特征是低效的。其次,如图1左侧所示,现有的跨域故障诊断方法在优化过程中假设诊断网络的所有参数拥有同等地位。然而,根据彩 票假设,只有部分参数对诊断模型的性能至关重要。相应地,如果所有参数都被同等迁移,则可能对学习域不变故障特征造成负面影响。
图1 所提出的域无关参数DAPs学习和现有方法的对比
为了解决现有方法的上述缺陷,提高不同工况下的迁移诊断结果,设计了一种新的层次化选择性对抗网络(Hierarchical Selective Adversarial Network, HSAN),用于实例级和参数级双视角故障特征分布对齐。在训练过程中,首先提取源域和目标域故障数据对应的故障特征。然后,通过实例选择机制自适应地识别源域样本并根据其重要性分配权重,从而有利于实例级的域自适应。此外,通过评估参数对目标函数的影响,为参数划分设计了参数识别准则。如图1右侧所示,选取的域无关参数(Domain-Agnostic Parameters, DAPs)在参数级上改善故障特征分布对齐,从而提高迁移诊断精度。下面详细介绍了所提出方法的创新方面和关键贡献。
(1)提出了一种新型的层次化选择性对抗网络HSAN用于迁移故障诊断,该诊断模型在实例级别和参数级别上实现了细粒度的对齐。为了避免由于源域故障样本假定适应性同等贡献而导致的负迁移,设计了一种实例选择机制,旨在根据样本重要性来确定可迁移的源域故障样本,从而在实例级别提高诊断性能。
(2)开发了一种参数识别标准,以将诊断模型参数分为域不变的部分和域特定的部分。分别针对域不变和域特定的参数实施正、负更新规则,这可以增强参数级别的故障知识迁移。实例和参数的层次化选择有助于域适应过程,并取得了良好的诊断结果。
(3)在两个广泛使用的公共数据集和一个实际故障诊断测试台上进行的实验结果表明HSAN的表现优于其他先进的跨域诊断方法。
本文的后续部分如下所述。第2节阐述了本文的理论背景。第3节对本文提出的方法进行了全面的说明。第4节给出了实验的结果及其分析。最后,第5节对论文进行总结。
本文针对于不同工况下的无监督跨域故障诊断任务,其中源域和目标域分别表示为 和 。 和 分别表示标记的源故障样本个数和未标记的目标故障样本;一个带有相应标签 的故障样本 。 和 遵循不同的分布。假设两个域具有相同的标记空间,即 ,这意味着具有相同的轴承健康状态类别。HSAN的目标是从源域 中学习域不变的故障特征,在目标域 上获得满意的诊断结果。
图2 DANN模型架构
如图2所示,DANN由特征提取器 、判别器 和分类器 组成。具体来说,通过优化 ,它学习不变和判别故障特征表示,而 负责预测故障样本类别。 识别特征来自源域或目标域。 接收来自 的反向梯度,这增强了提取域不变故障特征的能力。DANN优化目标包括分类损失 和域判别损失 ,可表示为:
其中, 为平衡因子。 分别为 、 、 的参数。 和 分别为健康状态数量和指示函数。 表示结果矩阵中的第v个分量。在模型训练过程中, 的最小化将更新 ,并提高模型的分类能力。对于 ,更新 加强了模型判别能力, 获得提取域不变特征的能力。
MMD通常被用作非参数距离估计量来测量域间分布的差距。与关注全局分布的MMD不同,LMMD是一种能够测量局部分布差异的核方法。利用基于平方核的均值嵌入距离计算源域分布 和目标分布 间的分布差距 :
其中,
为了解决由于对故障实例和诊断模型参数的重要性考虑有限而导致的严重负迁移和诊断准确性降低的问题,我们提出了HSAN用于实例级和参数级双视角对齐。首先,实例级提出了一种实例选择机制(Instance Selection Mechanism, ISM),根据源域故障样本的重要度自适应地分配权重,有效地促进了域不变故障信息的挖掘。此外,通过评估DAPs对目标函数的影响来动态识别域无关参数。通过利用这些选定的DAPs,故障诊断能力和总体诊断性能将得到显著提高。双视角对齐策略确保了鲁棒的跨域诊断性能,并取得良好的诊断结果。
本节将详细介绍HSAN,分为实例选择机制、域无关参数学习和总体优化目标三部分。HSAN训练中涉及的关键步骤如图3所示。
图3 HSAN模型训练及故障诊断流程
现有的无监督迁移诊断方法通常假设所有源域故障样本在域自适应过程中具有相同的重要度,从而对每个故障样本赋予相同的权重进行知识迁移。然而,由于数据的多样性,一些源域故障样本可能与目标域数据具有较大的域差异。统一加权策略会导致诊断模型在迁移到目标域时诊断性能下降。
考虑到不同故障样本之间的差异性,提出了一种基于故障样本重要度的实例选择机制,以应对负迁移问题,并精确度量不同域样本之间的相似性,如图4所示。这一过程的核心是训练判别器,其目的是区分故障特征的域来源。通过识别难以分类为源域或目标域的故障特征,判别器可以精确定位与目标域特征空间更接近的故障样本。具体来说,判别器损失表明每个源域故障样本与目标域的相似度。较大的
图4 实例选择机制ISM示意图
此外,分类损失
这种基于判别器置信度的实例选择策略允许诊断模型优先考虑相关度高的故障样本,有效降低可能导致负迁移的异常值的影响。在纳入损失函数之前,这些权重通过min-max尺度进行归一化,以保持稳定性并防止极值扭曲适应过程。在获得所有源故障样本的权值后,通过min-max尺度将每个权值
其中,
通过强调领域不变的故障样本,ISM不仅使模型更加关注易于迁移的故障特征,而且提高了模型在不同工况下的整体自适应性能。因此,实例选择机制是减少负迁移和实现鲁棒跨域故障诊断的关键组成部分。
常用的UDA诊断方法在域不变故障特征学习中往往忽略了特定于域的故障信息,降低了模型的诊断精度和泛化能力。因此,本节旨在在参数级别减轻特定领域故障信息对迁移诊断模型的不利影响。
直观地说,可训练参数对域不变信息学习的影响可以反映在域自适应过程中的损失函数中。利用有无某一参数时计算的损失函数的差值来衡量其可迁移性,可表示为:
其中,
其中,
DAPs比率在不同的数据分布中有所不同。域差异程度越高,表明域不变信息越少,域无关参数越少,因此采用代理
其中,
其中,
因此,特征提取器、分类器和域判别器的DAPs数可以定义为:
HSAN的总体优化目标包括
其中,
其中,
其中,
图5 JNU和HUST诊断平台图
图6 真实诊断平台诊断平台图
如图7所示,随机选取迁移诊断任务J1→J0作为典例,利用t-SNE技术在二维空间中投影故障特征。可以清楚地看到,两个域的每个轴承健康状态类别提取的故障特征在HSAN中聚类效果较好,图7(a)-(f)的重叠区域多于(g)和(h)。然而,这些类别的故障特征仍然被图7(h)混淆。在HSAN的可视化结果中,不同域的故障特征得到了最好的对齐,不同类型的故障之间有明显的区分。总体而言,可视化结果表明HSAN比其他方法实现了最佳特征边缘和条件分布对齐。
图7 JNU数据集特征分类结果可视化
为了进一步验证HSAN的诊断性能,J1→J0任务的所有方法的混淆矩阵如图8所示。值得注意的是,尽管TPC在TB类别中略显优势,但HSAN在其余故障类别中表现出无与伦比的性能,从而实现了其在故障诊断精度方面的整体优势。HSAN的优越性能可归功于其双视角对齐,通过丰富模型在不同工况下的泛化能力来增强故障识别能力。
图8 JNU数据集混淆矩阵结果可视化
本小节旨在从信号的角度验证所设计的ISM的有效性。在JNU数据集上随机选择不同的故障类型,即任务J1→J0中的IF和OF,任务J0→J2中的IF和BF,其中ISM计算的故障样本权值及其对应的原始振动信号如图9所示。以第一行的5个时域图为例,权重较高的0.97和0.92的故障样本与锚定目标样本极为相似。这对故障知识迁移会有帮助。相比之下,只有0.73低权重的故障样本与目标样本不同,它只有两个突出的波峰。因此,所提出的ISM能够识别具有高可迁移性的源故障样本,并根据其显著性分配权重。同样,其余三行的图表也显示了上述结果,验证了ISM的优越性。
图9 JNU数据集不同权重样本时域图
表1说明了在HUST数据集上验证的详细诊断结果。可见,HSAN的诊断准确率最高,为97.12%。除此之外,TPC在五个任务上实现了最佳性能,但其平均准确率比HSAN低5%。同时,可以发现HSAN不仅具有较强的故障诊断能力,而且稳定性最强,其平均标准差在1.8%以下,而其他方法的平均值在3.24% ~ 7.09%之间。同时,由于领域特定信息的负面影响,比较方法的相对较高的标准差和较差的性能突出了它们在不同工作条件下的适应和泛化能力的潜在差距。
表1 HUST数据集诊断结果
HUST数据集上的三维t-SNE可视化结果如图10所示。由图10(a)-(e),与(f)、(g)和(h)相比可以看出,这五种方法显示出更高的特征重叠程度。结果表明,HSAN不仅确保了更好的特征对齐,而且在不同故障类别之间实现了最优的类判别性。表明实例级和参数级对齐策略的有效性。
图10 HUST数据集不同权重样本时域图
为了验证我们设计的DAPs比值确定方法的有效性,我们随机选取四个迁移诊断任务作为示例。如图11所示,在所有情况下,我们设计的方法比任何其他预定义的固定比率获得更好的诊断准确性。在自动计算DAPs比值的情况下,我们的HSAN可以更好地利用域不变故障信息,减轻域特定故障信息的负面影响,从而达到最佳的诊断性能。由于当比率是预定义值时,模型通过使用一些未删除的特定于领域的参数来进行领域适应,导致严重的负迁移。因此,DAPs比值的自适应测定是必要和有效的。
图11 HUST数据集不同DAPs比值结果
比较诊断结果,包括我们的HSAN和7种比较方法在PT500实际故障诊断试验台上显示在表2中。HSAN在最高的诊断准确性方面表现出卓越的性能。此外,TPC和MMSD分别在5个任务和1个任务中表现最佳,但它们的平均准确率比HSAN落后6%以上。HSAN的平均标准差仅为1.32%,其余对比方法均达到2%以上,反映了HSAN性能稳定。
表2 实际诊断平台诊断结果
为了进一步验证HSAN中每个组成部分的作用,在图12中对三个数据集进行了消融研究。首先,从HSAN中去除DAPs学习用于模型训练,记为DA-ISM。与HSAN相比,DA-ISM的分类准确率在3个数据集中分别下降到93.15%、89.49%和84.94%,说明DAPs的不可或缺。此外,DA-DAPs是通过将ISM从HSAN中分离出来而构建的,其精度分别降低到93.79%、89.27%和85.98%。此外,同时去除实例级和参数级机制后,平均准确率分别降至91.72%、87.11%和78.00%。因此,ISM和DAPs对于提高HSAN的精度和稳定性至关重要。以上分析表明,本文提出的双视角对齐在域自适应过程中发挥了重要的作用,极大地提升了迁移诊断性能。
图12 三个数据集上的消融实验
本章节分别研究了DAPs在提取器、分类器和判别器三个模块中的作用。表3给出了不同DAPs范围下HSAN在四个随机选择的迁移任务上的诊断性能。与没有任何DAPs的HSAN相比,在三种情况下,DAPs学习只应用于三个模块其中一种,分别提高了18%、14%和11%的准确率。此外,从HSAN中分别去除三个模块上的DAPs的性能下降幅度很大,下降范围从4%到6%,这表明在HSAN的三个模块中考虑所有领域无关参数的重要性。
表3 实际诊断平台不同DAPs范围影响
具体来说,以P4→P0任务为例,在不考虑任何模块的DAPs的情况下,平均准确率只有33.38%。极低的准确率结果表明,诊断模型几乎无法提取出任何域不变的故障特征。在这种情况下,一旦将DAPs学习应用于,那么DAPs将大大提高的域不变特征提取能力,这体现在准确率的显著提高上。然而,当DAPs应用于和时,领域不变特征提取得到了改善,但仍然有限,导致特定于领域的特征被高置信度错误分类,降低了准确性。同样,通过对抗训练将DAPs应用于和提升特征可判别性,但的提取能力较弱,会放大错误的判别结果,在没有应用DAPs的时候进一步降低分类的准确性。而对于应用于所有三个模块的DAPs,它们的协同作用增强了域不变特征提取,提高了故障分类的准确性,并改进了特征的可迁移性和可判别性。这种协作平衡了特征提取、分类和自适应,从而提高了诊断性能。
本文提出了一种新型层次化选择性对抗网络HSAN,该网络通过实例级和参数级的双视角对齐来提高迁移诊断性能。在HSAN中,设计了实例选择机制,根据源故障样本的重要性自适应识别可迁移的源故障样本,有效抑制负迁移影响。此外,我们开发了一个参数识别准则来区分域无关参数和域特定参数,并利用不同的参数更新规则来减轻领域特定故障信息的不利影响。在两个公共故障诊断数据集和一个实际轴承故障诊断试验台上进行了全面的迁移诊断实验分析,充分验证了HSAN的优越性。通过双视角对齐机制,可以清楚地得出HSAN比其他先进的方法具有更令人满意的诊断性能和稳定性。
编辑:曹希铭
校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、Tina、陈宇航、海洋、陈莹洁、王金、赵诚、肖鑫鑫
该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除