首页/文章/ 详情

论文分享| 基于双重视角层次性选择的对抗迁移诊断网络

1天前浏览2
本期给大家推荐的文章是《基于双重视角层次性选择的对抗迁移诊断网络》。本文以当前无监督域自适应诊断方法中出现的参数可迁移性和重要性被忽视的问题为切入点,提出了一种新型层次化选择性对抗迁移网络。这种方法通过实例选择机制和参数级对齐的细粒度自适应来提高诊断性能。
 

论文基本信息

论文题目:Towards dual-perspective alignment: A novel hierarchical selective adversarial network for transfer fault diagnosis

论文期刊:Advanced Engineering Informatics

论文日期:2025年

作者:

Yansong Zhang, Xianfeng Yuan, Xilin Yang, Xinxin Yao, Jianjie Liu, Fengyu Zhou, Peng Duan

机构:

School of Mechanical, Electrical & Information Engineering, Shandong University, Weihai 264209, China

第一作者简介:

张焱淞,山东大学机电与信息工程学院。智能故障诊断、迁移学习、变工况下的旋转机械健康监测。联系方式:202337618@mail.sdu.edu.cn 

目录

摘要
1 引言
2 理论背景  
2.1 无监督跨域故障诊断的定义  
2.2 域对抗神经网络DANN  
2.3 局部最大均值差异LMMD  
3 所提出方法  
3.1 实例选择机制ISM  
3.2 域无关参数学习DAPs  
3.3 总体优化目标  
4 实验结果分析
4.1 数据集描述
4.2 JNU数据集结果分析
4.3 HUST数据集结果分析
4.4 真实诊断平台结果分析
5 结论

摘要

无监督域自适应已广泛应用于旋转机械迁移故障诊断中,旨在解决标记数据缺失和分布偏移问题。然而,现有的方法仍然面临着一些挑战。首先,这些方法通常认为无论源域故障样本是否应该迁移,所有样本在域自适应中的贡献是相等的,这会导致负迁移。其次,所有的网络参数都被认为具有相同的可迁移性,忽略了一些参数仅适用某个领域或并不适合故障特征分布对齐的情况。为了解决这些问题,本文提出了一种新型层次化选择性对抗网络(Hierarchical Selective Adversarial Network, HSAN),该网络通过实例级和参数级的细粒度自适应来提高诊断性能。具体来说,为了抑制由于故障样本被视为同等易迁移水平而导致的负迁移,本文设计了一种实例选择机制,自适应地确定具有高适应性贡献的可迁移故障样本。在参数级对齐方面,通过所提出的识别准则将可学习参数分为领域无关参数和领域特定参数,其中前者在域适应过程中是可迁移的,后者不可迁移并被惩罚以削弱对于适应过程的干扰。本文在两个公共数据集和一个实际的故障诊断测试台上进行了大量诊断实验,实验结果充分表明HSAN具有优越的诊断性能,优于其他先进的跨域诊断方法。

1 引言

旋转机械在工业场景中占有核心地位,滚动轴承作为其关键部件尤为重要,其健康状态直接影响工业系统的性能。在实际制造生产中,滚动轴承的故障可能导致严重的经济损失甚至人员伤亡。因此,滚动轴承故障诊断具有重要意义,受到了广泛的研究关注。

随着传感技术和工业物联网的进步,海量工业数据为故障诊断提供了新的机会。基于深度学习的故障诊断(Deep Learning-based Fault Diagnosis, DLFD)得益于其出色的特征提取能力,以其良好的性能成为机器健康状态监测领域数据驱动的新范式。然而,大多数DLFD方法都遵循训练和测试故障样本集具有相同分布的基本假设,这在实际工业场景中是不现实的。在特定工况下训练的诊断模型在部署到新的工况时,性能会下降。此外,在新的工况下标记故障样本是一项费时费力的工作。因此,在直接将一个分布上训练的DLFD迁移到其他分布时可能会面临挑战。为了在目标域获得满意的诊断效果,迁移学习思想被应用在故障诊断中,在不同工况下的跨领域任务中发挥着关键作用。

无监督域自适应(Unsupervised Domain Adaptation, UDA)属于迁移学习的一个研究范畴,旨在通过学习领域共享知识来建立不同领域之间的联系。目前主流的UDA故障诊断方法大致分为两类。第一类基于度量。例如,Zhang等人对相关对齐(Correlation Alignment, CORAL)损失进行了优化,以减小分布差异,增强模型诊断能力。从空间映射的角度来看,Qian等人提出了一种新的振动特征引导的差异度量来增强故障分布表示能力。另一类是基于对抗的方法。Ganin等人首先提出了一种域对抗神经网络(Domain Adversarial Neural Network, DANN),其中提取器和判别器通过对抗训练获得具有梯度反转层的域不变特征。Xiao等人利用联合最大平均差异(Joint Maximum Mean Discrepancy, JMMD)对DANN进行了改进,实现了边缘分布和条件分布对齐,获得了更好的诊断结果。此外,Jiao等人构造了一种对抗熵最小-最大操作,通过更新分类器使熵最大化来学习不变的域原型,然后更新后的提取器使熵最小化以获得高类区分度的故障特征。因此,UDA技术在故障诊断中越来越普遍。

尽管UDA轴承故障诊断取得了令人瞩目的成就,但现有方法仍然存在影响诊断能力的问题。首先,现有方法将所有故障样本在知识迁移中视为具有同等的可迁移性,因此在自适应过程中,这些样本在源域内始终具有同等的权值。然而,由于数据分布的偏移,不同的样本具有不同等的可迁移性,因此当前这种同等加权方式对于挖掘域不变故障特征是低效的。其次,如图1左侧所示,现有的跨域故障诊断方法在优化过程中假设诊断网络的所有参数拥有同等地位。然而,根据彩 票假设,只有部分参数对诊断模型的性能至关重要。相应地,如果所有参数都被同等迁移,则可能对学习域不变故障特征造成负面影响。

图1 所提出的域无关参数DAPs学习和现有方法的对比

为了解决现有方法的上述缺陷,提高不同工况下的迁移诊断结果,设计了一种新的层次化选择性对抗网络(Hierarchical Selective Adversarial Network, HSAN),用于实例级和参数级双视角故障特征分布对齐。在训练过程中,首先提取源域和目标域故障数据对应的故障特征。然后,通过实例选择机制自适应地识别源域样本并根据其重要性分配权重,从而有利于实例级的域自适应。此外,通过评估参数对目标函数的影响,为参数划分设计了参数识别准则。如图1右侧所示,选取的域无关参数(Domain-Agnostic Parameters, DAPs)在参数级上改善故障特征分布对齐,从而提高迁移诊断精度。下面详细介绍了所提出方法的创新方面和关键贡献。

(1)提出了一种新型的层次化选择性对抗网络HSAN用于迁移故障诊断,该诊断模型在实例级别和参数级别上实现了细粒度的对齐。为了避免由于源域故障样本假定适应性同等贡献而导致的负迁移,设计了一种实例选择机制,旨在根据样本重要性来确定可迁移的源域故障样本,从而在实例级别提高诊断性能。

(2)开发了一种参数识别标准,以将诊断模型参数分为域不变的部分和域特定的部分。分别针对域不变和域特定的参数实施正、负更新规则,这可以增强参数级别的故障知识迁移。实例和参数的层次化选择有助于域适应过程,并取得了良好的诊断结果。

(3)在两个广泛使用的公共数据集和一个实际故障诊断测试台上进行的实验结果表明HSAN的表现优于其他先进的跨域诊断方法。

本文的后续部分如下所述。第2节阐述了本文的理论背景。第3节对本文提出的方法进行了全面的说明。第4节给出了实验的结果及其分析。最后,第5节对论文进行总结。

2 理论背景

2.1 无监督跨域故障诊断的定义

本文针对于不同工况下的无监督跨域故障诊断任务,其中源域和目标域分别表示为      和      。      和      分别表示标记的源故障样本个数和未标记的目标故障样本;一个带有相应标签      的故障样本      。      和      遵循不同的分布。假设两个域具有相同的标记空间,即      ,这意味着具有相同的轴承健康状态类别。HSAN的目标是从源域      中学习域不变的故障特征,在目标域      上获得满意的诊断结果。

2.2 域对抗神经网络DANN

图2 DANN模型架构

如图2所示,DANN由特征提取器      、判别器      和分类器      组成。具体来说,通过优化      ,它学习不变和判别故障特征表示,而      负责预测故障样本类别。      识别特征来自源域或目标域。      接收来自      的反向梯度,这增强了提取域不变故障特征的能力。DANN优化目标包括分类损失      和域判别损失      ,可表示为:

   
   
   
 

其中,      为平衡因子。      分别为      、      、      的参数。      和      分别为健康状态数量和指示函数。      表示结果矩阵中的第v个分量。在模型训练过程中,      的最小化将更新      ,并提高模型的分类能力。对于      ,更新      加强了模型判别能力,      获得提取域不变特征的能力。

2.3 局部最大均值差异LMMD

MMD通常被用作非参数距离估计量来测量域间分布的差距。与关注全局分布的MMD不同,LMMD是一种能够测量局部分布差异的核方法。利用基于平方核的均值嵌入距离计算源域分布      和目标分布      间的分布差距      :

     
   

其中,      是核为      的再生核希尔伯特空间(Reproducing Kernel Hilbert Space, RKHS)。      表示原始样本到RKHS的映射。      表示      ,其中是向量的内积。因为      涉及到一个无限维的特征空间,它不能直接计算。因此,引入核技巧可以得到上式。      是类别总数。      和      分别表示样本      和      的权值。

3 所提出方法

为了解决由于对故障实例和诊断模型参数的重要性考虑有限而导致的严重负迁移和诊断准确性降低的问题,我们提出了HSAN用于实例级参数级双视角对齐。首先,实例级提出了一种实例选择机制(Instance Selection Mechanism, ISM),根据源域故障样本的重要度自适应地分配权重,有效地促进了域不变故障信息的挖掘。此外,通过评估DAPs对目标函数的影响来动态识别域无关参数。通过利用这些选定的DAPs,故障诊断能力和总体诊断性能将得到显著提高。双视角对齐策略确保了鲁棒的跨域诊断性能,并取得良好的诊断结果。

本节将详细介绍HSAN,分为实例选择机制、域无关参数学习和总体优化目标三部分。HSAN训练中涉及的关键步骤如图3所示。

图3 HSAN模型训练及故障诊断流程

3.1 实例选择机制ISM

现有的无监督迁移诊断方法通常假设所有源域故障样本在域自适应过程中具有相同的重要度,从而对每个故障样本赋予相同的权重进行知识迁移。然而,由于数据的多样性,一些源域故障样本可能与目标域数据具有较大的域差异。统一加权策略会导致诊断模型在迁移到目标域时诊断性能下降。

考虑到不同故障样本之间的差异性,提出了一种基于故障样本重要度的实例选择机制,以应对负迁移问题,并精确度量不同域样本之间的相似性,如图4所示。这一过程的核心是训练判别器,其目的是区分故障特征的域来源。通过识别难以分类为源域或目标域的故障特征,判别器可以精确定位与目标域特征空间更接近的故障样本。具体来说,判别器损失表明每个源域故障样本与目标域的相似度。较大的      损失值表明对应的故障样本更难区分,反映了与目标域故障样本在特征表示上的相似性更强。因此,这样的故障样本被认为更适合域自适应,在适应过程中被赋予更大的重要性。

图4 实例选择机制ISM示意图

此外,分类损失      用于进一步衡量每个源样本与目标域的匹配性。ISM通过结合      和      计算每个源故障样本的自适应权值,保证最能代表目标特征的样本在学习过程中发挥突出作用。将第    个源域故障样本的权值设置为:

   
 

这种基于判别器置信度的实例选择策略允许诊断模型优先考虑相关度高的故障样本,有效降低可能导致负迁移的异常值的影响。在纳入损失函数之前,这些权重通过min-max尺度进行归一化,以保持稳定性并防止极值扭曲适应过程。在获得所有源故障样本的权值后,通过min-max尺度将每个权值      归一化,以保持稳定性并防止适应过程中的极值扭曲影响:

   
 

其中,      ,      。易迁移的故障样本在自适应过程中会产生更显著的影响,而具有较大分布差异故障样本的知识负迁移得到缓解,修正后的判别器损失      计算为:

   
 

通过强调领域不变的故障样本,ISM不仅使模型更加关注易于迁移的故障特征,而且提高了模型在不同工况下的整体自适应性能。因此,实例选择机制是减少负迁移和实现鲁棒跨域故障诊断的关键组成部分。

3.2 域无关参数学习DAPs

常用的UDA诊断方法在域不变故障特征学习中往往忽略了特定于域的故障信息,降低了模型的诊断精度和泛化能力。因此,本节旨在在参数级别减轻特定领域故障信息对迁移诊断模型的不利影响。

直观地说,可训练参数对域不变信息学习的影响可以反映在域自适应过程中的损失函数中。利用有无某一参数时计算的损失函数的差值来衡量其可迁移性,可表示为:

   
 

其中,      是除第      个值为1之外的全零向量,⊙表示Hadamard积。然而,计算每个      并确定其每个参数的可迁移性的成本过高。鉴于参数的现有陈述在我们的假设中只能是可迁移的或不可迁移的,      用于表示一个参数      是领域无关的      还是特定于领域的      ,因此,可以从      相对于      的导数中推断出      的近似,并且可以将识别准则修改为

   
 

其中,      将结果乘以一个权重向量      ,并且,      表示接收      作为输入的神经元的初始激活,即      。      是某一参数对应的梯度。识别出的      值较高的参数被视为与领域无关的参数,其余的      值较低的参数被视为与领域相关的参数。

DAPs比率在不同的数据分布中有所不同。域差异程度越高,表明域不变信息越少,域无关参数越少,因此采用代理      -distance来确定DAPs比值。给定两个经验分布      和      ,二值分类器      的代理      -distance可以表示为:

   
 

其中,      为      区分故障样本是来自源域还是目标域的任务误差。相应地,整个HSAN中域无关参数的比例计算公式为:

   
 

其中,      的值从0到1,这是      的下限边界。较大      的意味着较少的域不变故障信息,即较小的      ,反之亦然。

因此,特征提取器、分类器和域判别器的DAPs数可以定义为:

             

3.3 总体优化目标

HSAN的总体优化目标包括      和一个利用可迁移样本改进的。此外,利用实现条件分布对齐,辅助实例级自适应。优化HSAN的最终目标如下:

   
 

其中,    和    为平衡系数,并且    。    是当前训练轮次。    和    分别为系数上限和变化率。 采用不同更新规则的SGD算法对HSAN进行优化。对不同模块的域无关参数执行正更新规则:

   
   
   
 

其中,    为学习率。对于可迁移性较低的特定领域参数实施负更新规则,定义为:

   
 

其中,    表示模块的领域特定参数。

4 实验结果分析

4.1 数据集描述

JNU数据集:JNU数据集在电机转速分别为600、800和1000 r/min的情况下采集。JNU诊断平台如图5所示。轴承的四种不同健康状态分别是正常(NA)、内圈故障(IF)、外圈故障(OF)和滚珠故障(BF)。通过三个域(J0、J1和J2)以相应的速度构造6个不同的迁移故障诊断任务。
HUST数据集:如图5所示,HUST数据集具有正常(N)、严重内故障(SIF)、严重外故障(SOF)、严重滚珠故障(SBF)和严重复合故障(SCF)五种轴承健康状态。选取3900、4200、4500、4800 r/min 4个转速条件作为不同的域(H0、H1、H2、H3),构建12个迁移诊断任务。
 

图5 JNU和HUST诊断平台图

图6 真实诊断平台诊断平台图

真实诊断平台:使用真实故障诊断试验台构建真实的诊断实验。图6描绘了实验平台和四种类型的故障轴承,包括内部故障、外部故障、滚珠故障和内外套圈故障组合的复合故障。根据800、1200、1600、2000、2400 r/min 5个转速,我们分别定义了5个域,分别为:P0、P1、P2、P3、P4。因此,构建了20个验证HSAN性能的迁移任务。

4.2 JNU数据集结果分析

4.2.1 特征可视化

如图7所示,随机选取迁移诊断任务J1→J0作为典例,利用t-SNE技术在二维空间中投影故障特征。可以清楚地看到,两个域的每个轴承健康状态类别提取的故障特征在HSAN中聚类效果较好,图7(a)-(f)的重叠区域多于(g)和(h)。然而,这些类别的故障特征仍然被图7(h)混淆。在HSAN的可视化结果中,不同域的故障特征得到了最好的对齐,不同类型的故障之间有明显的区分。总体而言,可视化结果表明HSAN比其他方法实现了最佳特征边缘和条件分布对齐。

图7 JNU数据集特征分类结果可视化

4.2.2 混淆矩阵结果评估

为了进一步验证HSAN的诊断性能,J1→J0任务的所有方法的混淆矩阵如图8所示。值得注意的是,尽管TPC在TB类别中略显优势,但HSAN在其余故障类别中表现出无与伦比的性能,从而实现了其在故障诊断精度方面的整体优势。HSAN的优越性能可归功于其双视角对齐,通过丰富模型在不同工况下的泛化能力来增强故障识别能力。

图8 JNU数据集混淆矩阵结果可视化

4.2.3 可迁移故障样本可视化分析

本小节旨在从信号的角度验证所设计的ISM的有效性。在JNU数据集上随机选择不同的故障类型,即任务J1→J0中的IF和OF,任务J0→J2中的IF和BF,其中ISM计算的故障样本权值及其对应的原始振动信号如图9所示。以第一行的5个时域图为例,权重较高的0.97和0.92的故障样本与锚定目标样本极为相似。这对故障知识迁移会有帮助。相比之下,只有0.73低权重的故障样本与目标样本不同,它只有两个突出的波峰。因此,所提出的ISM能够识别具有高可迁移性的源故障样本,并根据其显著性分配权重。同样,其余三行的图表也显示了上述结果,验证了ISM的优越性。

图9 JNU数据集不同权重样本时域图

4.3 HUST数据集结果分析

4.3.1 诊断结果评估

表1说明了在HUST数据集上验证的详细诊断结果。可见,HSAN的诊断准确率最高,为97.12%。除此之外,TPC在五个任务上实现了最佳性能,但其平均准确率比HSAN低5%。同时,可以发现HSAN不仅具有较强的故障诊断能力,而且稳定性最强,其平均标准差在1.8%以下,而其他方法的平均值在3.24% ~ 7.09%之间。同时,由于领域特定信息的负面影响,比较方法的相对较高的标准差和较差的性能突出了它们在不同工作条件下的适应和泛化能力的潜在差距。

表1 HUST数据集诊断结果

4.3.2 特征可视化

HUST数据集上的三维t-SNE可视化结果如图10所示。由图10(a)-(e),与(f)、(g)和(h)相比可以看出,这五种方法显示出更高的特征重叠程度。结果表明,HSAN不仅确保了更好的特征对齐,而且在不同故障类别之间实现了最优的类判别性。表明实例级和参数级对齐策略的有效性。

图10 HUST数据集不同权重样本时域图

4.3.3 域无关参数比值影响分析

为了验证我们设计的DAPs比值确定方法的有效性,我们随机选取四个迁移诊断任务作为示例。如图11所示,在所有情况下,我们设计的方法比任何其他预定义的固定比率获得更好的诊断准确性。在自动计算DAPs比值的情况下,我们的HSAN可以更好地利用域不变故障信息,减轻域特定故障信息的负面影响,从而达到最佳的诊断性能。由于当比率是预定义值时,模型通过使用一些未删除的特定于领域的参数来进行领域适应,导致严重的负迁移。因此,DAPs比值的自适应测定是必要和有效的。

图11 HUST数据集不同DAPs比值结果

4.4 消融实验和实际诊断平台结果分析

4.4.1 诊断结果评估

比较诊断结果,包括我们的HSAN和7种比较方法在PT500实际故障诊断试验台上显示在表2中。HSAN在最高的诊断准确性方面表现出卓越的性能。此外,TPC和MMSD分别在5个任务和1个任务中表现最佳,但它们的平均准确率比HSAN落后6%以上。HSAN的平均标准差仅为1.32%,其余对比方法均达到2%以上,反映了HSAN性能稳定。

表2 实际诊断平台诊断结果

4.4.2 消融实验

为了进一步验证HSAN中每个组成部分的作用,在图12中对三个数据集进行了消融研究。首先,从HSAN中去除DAPs学习用于模型训练,记为DA-ISM。与HSAN相比,DA-ISM的分类准确率在3个数据集中分别下降到93.15%、89.49%和84.94%,说明DAPs的不可或缺。此外,DA-DAPs是通过将ISM从HSAN中分离出来而构建的,其精度分别降低到93.79%、89.27%和85.98%。此外,同时去除实例级和参数级机制后,平均准确率分别降至91.72%、87.11%和78.00%。因此,ISM和DAPs对于提高HSAN的精度和稳定性至关重要。以上分析表明,本文提出的双视角对齐在域自适应过程中发挥了重要的作用,极大地提升了迁移诊断性能。

图12 三个数据集上的消融实验

4.4.3 域无关参数范围影响分析

本章节分别研究了DAPs在提取器、分类器和判别器三个模块中的作用。表3给出了不同DAPs范围下HSAN在四个随机选择的迁移任务上的诊断性能。与没有任何DAPs的HSAN相比,在三种情况下,DAPs学习只应用于三个模块其中一种,分别提高了18%、14%和11%的准确率。此外,从HSAN中分别去除三个模块上的DAPs的性能下降幅度很大,下降范围从4%到6%,这表明在HSAN的三个模块中考虑所有领域无关参数的重要性。

表3 实际诊断平台不同DAPs范围影响

具体来说,以P4→P0任务为例,在不考虑任何模块的DAPs的情况下,平均准确率只有33.38%。极低的准确率结果表明,诊断模型几乎无法提取出任何域不变的故障特征。在这种情况下,一旦将DAPs学习应用于,那么DAPs将大大提高的域不变特征提取能力,这体现在准确率的显著提高上。然而,当DAPs应用于和时,领域不变特征提取得到了改善,但仍然有限,导致特定于领域的特征被高置信度错误分类,降低了准确性。同样,通过对抗训练将DAPs应用于和提升特征可判别性,但的提取能力较弱,会放大错误的判别结果,在没有应用DAPs的时候进一步降低分类的准确性。而对于应用于所有三个模块的DAPs,它们的协同作用增强了域不变特征提取,提高了故障分类的准确性,并改进了特征的可迁移性和可判别性。这种协作平衡了特征提取、分类和自适应,从而提高了诊断性能。

5 结论

本文提出了一种新型层次化选择性对抗网络HSAN,该网络通过实例级和参数级的双视角对齐来提高迁移诊断性能。在HSAN中,设计了实例选择机制,根据源故障样本的重要性自适应识别可迁移的源故障样本,有效抑制负迁移影响。此外,我们开发了一个参数识别准则来区分域无关参数和域特定参数,并利用不同的参数更新规则来减轻领域特定故障信息的不利影响。在两个公共故障诊断数据集和一个实际轴承故障诊断试验台上进行了全面的迁移诊断实验分析,充分验证了HSAN的优越性。通过双视角对齐机制,可以清楚地得出HSAN比其他先进的方法具有更令人满意的诊断性能和稳定性。



编辑:曹希铭

校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、Tina、陈宇航、海洋、陈莹洁、王金、赵诚、肖鑫鑫

该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除



来源:故障诊断与python学习
Mechanical振动旋转机械航空海洋UM理论电机Electric数字孪生试验DAP
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-07-10
最近编辑:1天前
故障诊断与python学习
硕士 签名征集中
获赞 81粉丝 119文章 219课程 0
点赞
收藏
作者推荐

双重注意引导的树状决策网络 | DATGN:一种适应强噪声与不平衡数据的故障诊断模型

本期聚焦于复杂环境下轴承故障诊断的智能方法研究:在工业现场强噪声与数据极度不平衡的条件下,传统诊断模型在多类别、分层次的故障识别中面临识别率低、泛化能力弱等诸多挑战。为此,本文提出了一种融合双重注意力机制的树状等级决策网络(Dual attention-guided tree-inspired grade decision network, DATGDN),构建了一个具备全局与局部感知能力的多层级智能诊断框架。该方法创新性地设计了三元注意力机制与多头卷积注意力模块,有效增强特征提取的鲁棒性,并通过树状结构的决策网络,实现对故障位置与严重程度的层次化判别。在多个信噪比场景与不平衡数据集上的实验证明,DATGDN不仅显著提升了识别精度,还增强了对复杂故障结构的解析能力,为智能制造中的精细化设备运维提供了可靠的新思路。论文链接:通过点击本文左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目:Double attention-guided tree-inspired grade decision network: A method for bearing fault diagnosis of unbalanced samples under strong noise conditions论文期刊:Advanced Engineering Informatics论文日期:2025年论文链接:https://www.sciencedirect.com/science/article/pii/S1474034624006554?via%3Dihub作者:Zhilin Dong (a,b), Yonghua Jiang (b), Weidong Jiao (a,b), Feibin Zhang (c), Zhenya Wang (c), Jinfeng Huang (c), Xin Wang (d), Kun Zhang (e)机构:a: School of Engineering, Zhejiang Normal University, Jinhua 321004, China;b: Xingzhi College, Zhejiang Normal University, Lanxi 321100, China;c: Department of Mechanical Engineering, Tsinghua University, Beijing 100084, China;d: School of Aeronautics, Northwestern Polytechnical University, Xi’an 710072, China;e: Beijing University of Technology, Beijing 100124, China第一作者简介:董治麟老师,浙江师范大学工学院研究生导师,现为浙江师范大学装备状态监测与智能维护技术研究所核心成员。董老师是中国计算机学会(CCF)会员、中国振动工程学会会员、中国自动化学会制造自动化专业委员会委员,以及英国皇家物理学会(Institute of Physics, IOP)标准会员。现担任Robot Learning期刊青年编委。近年来,董老师在本领域权威期刊发表Top论文4篇,ESI高被引论文3篇,热点论文2篇,总引用次数超过300次。作为活跃的学术审稿人,他为20余种国内外期刊担任审稿工作,获IOP出版社授予“IOP Trusted Reviewer”荣誉。研究方向包括:机械结构设计与运动学仿真、动力学机理建模、信号处理(信号分解与时频分析),特征指标构建(熵值复杂性理论),度量学习,机器学习(浅层与深度学习)、设备状态监测与故障诊断、寿命预测等。(来源: https://mypage.zjnu.edu.cn/20245567/zh_CN/index/343963/list/index.htm)目录1 摘要2 引言3 双重注意力引导的树状等级决策网络3.1 三元注意力机制3.2 多头卷积自注意力机制3.3 树状等级决策层3.4 双重注意力引导的树状等级决策网络4 基于所提方法的故障诊断4.1 故障诊断流程图4.2 实验数据集概述4.3 参数选择5 实验验证5.1 实验结果5.2 消融实验6 结论1 摘要在强噪声条件下实现对不平衡轴承数据集的层次化多分类故障诊断是一项具有挑战性的任务。为此,本文提出了一种层次化多分类故障诊断模型,称为双重注意力引导的树状等级决策网络(DATGDN)。首先,设计了一种先进的三元注意力机制(Triplet attention, TA)和一种新颖的多头卷积注意力机制(Multi-head convolutional attention, MHCA),用于提取轴承故障特征。此外,这些机制可以集成到标准卷积神经网络中,构建形成双重注意力引导的主干网络。最后,通过结合一种创新的树状结构决策网络,DATGDN 实现了对轴承故障位置与严重程度的层次化决策。该模型在两组具有不同信噪比和多个不平衡比例的轴承数据上进行了测试。实验结果表明,与多种先进算法相比,所提出的方法不仅在各类任务中实现了更高的识别率,还能够对轴承故障的位置与程度进行分级决策。关键词:三元注意力机制,多头卷积注意力机制,树状决策结构,故障诊断2 引言滚动轴承作为机械系统的核心部件,在机械制造与轨道交通等领域中发挥着关键作用。轴承的运行状态与性能直接影响整个系统的可靠性、稳定性、安全性及使用寿命。一方面,不同类型的轴承故障数据分布不均,使得模型的训练与测试过程更加复杂;另一方面,强噪声的存在进一步干扰了对轴承信号的特征提取与故障诊断过程。因此,在不平衡数据与强噪声干扰下实现轴承故障诊断仍是一项极具挑战性的任务。在轴承故障诊断领域,时域分析、频域分析、时频分析、信号分解与浅层机器学习方法不断发展与演进。然而,面对复杂且高维的数据,传统方法因处理能力有限,常常变得难以奏效。卷积神经网络(CNN)和循环神经网络(RNN)等深度学习方法 凭借强大的特征学习与表示能力,能够从原始数据中提取更复杂的特征,逐步走向研究前沿。CNN 之所以被广泛应用,主要得益于其稀疏连接、参数共享与等变表示三大优势。特别是,一维卷积神经网络(1D-CNN)因其输入数据形状能够与原始采集的轴承振动信号形状精确匹配,持续应用于轴承故障诊断。尽管 1D-CNN 在多个任务中取得了良好表现,但其在复杂任务中的性能仍有进一步提升的空间。注意力机制(Attention Mechanism,AM)是一种机器学习技术,可使模型在处理输入数据时有选择地关注或突出其中的特定部分。将不同类型的 AM 嵌入 CNN 或 RNN 中进一步提升了模型性能,在故障诊断领域广受关注。尽管融合注意力机制的 CNN 展现出强大的特征提取能力,并在复杂环境下的故障诊断任务中表现出良好效果,但仍存在两大显著缺陷:(1)仅关注输入信号与输出结果,忽视中间过程的实际推理,降低了诊断结果的可信度;(2)其在故障位置与程度的判定方式与人类思维方式不符。针对上述问题,已有研究指出,将决策树结构与卷积神经网络(CNN)结合,可显著提升识别准确率。关于树状结构深度学习的研究,主要聚焦于利用层次结构对复杂数据进行高效分类,同时优化学习过程 。Roy 等人提出了 Tree-CNN 模型,使网络在引入新类别时能够自适应地扩展其层次结构。该模型支持网络以树状方式不断扩展,以适应新的数据类别,同时保留对已学习类别的辨识能力。Ren 等人针对单一分类问题,提出了一种树状结构的循环神经网络(Tree-RNN),其层次结构可将大型分类任务划分为更小、可管理的子类,每个子类配备一个特定分类器。在故障诊断领域,Wang 等人提出了一种新型网络,称为基于深度卷积的树状网络(DCTN),该网络旨在有效区分轴承健康状态下的七种不同工况。该研究为层次化决策过程提供了坚实的理论基础。然而,该研究在决策机制方面仍存在一定不足,且在应对不同噪声干扰条件下对不平衡多类轴承数据的诊断能力仍有待提高。为进一步探索树状等级决策网络并应对上述挑战,本文针对强噪声环境下的不平衡轴承数据集,构建了一种层次化多分类故障诊断模型,称为双重注意力引导的树状等级决策网络(DATGDN)。该模型通过层次化诊断有效降低了诊断任务的复杂度,并提升了故障识别的准确率。结合故障诊断领域的最新技术进展,所提出模型在以下几个方面展现出独特优势:集成先进的三元注意力机制与创新的多头卷积自注意力机制于标准 CNN 架构中,用以从轴承故障信号中提取相关信息并剔除无关干扰特征;设计了一种新颖的两层决策树结构,包括种子节点与叶节点,实现了轴承故障位置的精确定位与故障严重程度的分级诊断。该多层次决策机制可系统性评估故障的位置与强度,更加契合工程运维的实际需求;在结构集成方面,通过将树状网络中种子节点的权重值继承自主干网络全连接层的概率分布,实现了无缝融合,有效增强了决策过程的鲁棒性并取得良好的识别效果。3 相关研究内容3.1 双重注意力引导的树状等级决策网络 三元注意力机制(Triplet Attention, TA)在同时建模通道注意力与空间注意力的同时,简化了参数数量。所提出的 TA 结构如图 1 所示。为了更全面地解释 TA 机制,首先需阐明“跨维交互(Cross-Dimension Interaction)”的概念,其次介绍 Z-pooling: 图1 三元注意力机制的整体框架(a) 跨维交互:由于传统的通道注意力方法在信号处理中通常采用单一权重来衡量各通道的重要性,因此被认为缺乏通道与空间维度之间的交互能力。CBAM 模块通过在通道注意力的基础上引入空间注意力作为附加组件,提升了整体性能。为捕捉输入数据在通道与空间维度之间的依赖关系,TA 中引入了一种基于空间注意力的“跨维交互机制(Cross-Dimension Interaction)”。对于一个以 (通道、高度与宽度)表示的三维信号,其核心思想是联合建模以下三组维度对之间的交互关系: 、 与 。这种机制使注意力模块能够更有效地捕捉输入特征在不同维度间的复杂依赖关系,并增强其对关键特征的敏感性。TA 框架通过构建三个独立分支实现跨维交互,各分支分别独立地捕捉输入张量在通道与空间维度之间的依赖性,重点建模 、 与 的两两关系。(b) Z-pool:Z-pool 是一种用于将张量的第一个维度压缩为两个通道的操作层,其核心操作结合了全局最大池化(Global Max Pooling, GMP)与全局平均池化(Global Average Pooling, GAP)。通过将高维通道信息压缩为两个具有代表性的特征图,模型可以更容易地捕捉通道维与高度/宽度维之间的相关性,从而增强不同维度之间的交互能力。其数学表达形式如下所示的公式: 其中,0d表示张量形状为 时所对应的通道维。如果 C 表示该通道维的大小,则在经过 Z-pool 处理后,其值将被转换为 2。(c) 三元注意力机制(Triplet Attention):在计算过程中,TA 模块首先将输入张量 分别传递至其内部的三个分支进行处理。在第一个分支中,建立了 维与 维之间的交互关系。具体操作如下:输入张量 ,原始形状为 ,通过沿 轴的旋转转换为张量 ,其形状为 。为保持原始张量的内在结构特性并简化计算流程,采用 Z-pool 操作将张量的第 维降至 ,得到张量 ,其维度为 。随后, 经标准卷积与归一化处理,产生中间输出,其维度为 。该中间输出再通过 sigmoid 函数进行归一化,使其值限制在 区间,从而生成注意力权重,并将该权重应用于 。最终,为获得与原始输入一致的张量结构,对张量再次沿 轴进行旋转。第二个分支也需经过相似的处理步骤,包括张量旋转、通过 Z-pooling 进行降维、卷积与归一化处理,并通过 sigmoid 激活生成注意力权重不同于前两个分支,第三个分支无需进行两次旋转操作,因为该分支旨在表征空间注意力。为了便于后续表述,第二分支在 Z-pooling 后的张量记作 ,而 经卷积与归一化处理后的张量记作 ,其形状为 。第三分支中,输入张量直接经过 Z-pooling 后得到 ,其形状为 。最后,通过直接求平均的方式,将上述三个分支生成的张量融合,得到最终的加权注意力输出张量 。该张量的维度与原始输入张量一致。该过程如下式所示: 其中, ( )用于表示第 个标准卷积操作, 表示 sigmoid 函数操作,公式表示如下: 其中, 表示第 个跨维注意力机制。公式中的符号“–”表示旋转操作,用于保持初始输入张量的维度形状不变。综上所述,通过对张量的通道维与其宽度、高度维之间的交互关系以及张量的空间注意力进行直接平均计算所得到的结果,被称为三元注意力(Triplet Attention, TA)。3.2 多头卷积自注意力机制 传统的多头自注意力机制(Multi-head Self-Attention, MSA)存在以下两个缺点:计算量随着输入 token 数量的增加呈非线性增长,在训练与推理过程中带来显著的计算开销;MSA 中每个注意力头仅负责部分嵌入维度,当每个注意力头对应的嵌入维度较小时,可能会导致网络性能下降。为应对上述问题,本文提出了一种多头卷积自注意力机制(Multi-head Convolutional Self-Attention, MCSA),其单头卷积自注意力(CSA)操作如图 2 所示。 图 2 单头卷积注意力机制的整体框架图该注意力机制的工作流程如下:首先,将一维原始信号 通过嵌入编码方法转换为二维输入张量 ,其中 表示空间维度, 表示通道维度。类似于 MSA,MCSA 中通过一系列投影矩阵获得查询向量(Query, )。同时,将二维输入 token 沿空间维度转换为三维张量 ,以压缩内存占用。将三维张量 输入深度卷积核,卷积核大小为 ,步长为 ,填充设为 ,以实现张量高度与宽度的下采样。此处参数 根据特征图尺寸或网络阶段数自适应设定。随后,对该三维张量进行层归一化处理。空间下采样后的新张量 被重塑为二维张量,即 ,其中 。然后将 输入两组投影层,分别获取键向量(Key, )与值向量(Value, )。最后,基于以下公式计算 、 、 之间的注意力函数: 其中,采用标准的 卷积操作 来模拟不同注意力头之间的交互作用。 表示缩放维度。该配置使每个注意力头的注意力函数都能够依赖于全部的键(Key)与查询(Query)。然而,这种结构可能削弱 MSA 处理位于不同位置的多样表示子集信息的能力。为了恢复这种多样性表达能力,本文在注意力计算中引入了实例归一化(Instance Normalization,IN),其中 表示经过 Softmax 之后的点积矩阵。来自各个注意力头的输出结果随后被拼接并送入一个线性投影层,以生成最终的输出结果: 其中, 表示由线性变换所生成的权重矩阵。3.3 树状等级决策层 在该模型的决策框架中,需准确表达故障类型与故障严重程度之间的逻辑关联。受决策树(Decision Tree, DT)的启发,本文设计了一种新颖的层次化诊断逻辑层,称为树状等级决策层(Tree-Inspired Grade Decision Layer, TGDL),以支持对故障严重程度的多层次分析。与传统神经网络不同,TGDL 中叶节点与根节点之间的输入–输出关系并非线性对应。 如图 3 所示,该结构主要包含两个诊断层级:故障类型与故障严重程度。在第一层中,通过输入样本识别故障类型,并据此确定其对应的上层类别属性;随后在第二层评估故障严重程度,以进一步确定其下层子类属性。该结构采用第一层节点识别故障类型,第二层节点判断故障等级,构成了所谓的树状结构决策层。其中,第一层节点对应不同类型的故障,第二层节点对应故障的不同严重程度。 图 3 树状结构决策层的权重传递机制第二层节点的权重通过继承先前训练好的全连接层的参数进行定义。这一配置确保了故障严重程度判别性能与预训练主干网络保持一致。第 个叶节点权重的获取方式如下式所示: 值得注意的是,在前向传播过程中,子类的特征表示将从其上层类别特征中继承并更新;因此,在反向传播阶段,与上层类别对应的叶节点权重及与子类对应的种子节点权重也将同步更新。3.4 双重注意力引导的树状等级决策网络DATGDN 被设计用于处理具有不同信噪比(SNR)的不平衡轴承数据,其目标是在优化故障诊断准确率的同时,为决策过程中的推理机制提供可解释的理论依据。所构建 DATGDN 的结构示意图如图 4 所示。 图4 DATGDN的结构示意图(a) 主干网络的构建:如图 4 所示,所构建的三元注意力机制(TA)与多头卷积自注意力机制(MCSA)被集成至一个深度为 的标准卷积神经网络的第三层中,形成一个新型网络,称为双重注意力引导卷积神经网络(DACNN)。在构建的 DACNN 中,两种注意力机制分别独立作用于 CNN,用以增强其特征提取能力,确保两者所引导的特征之间不存在相互干扰。最终,分别由两种注意力机制增强的特征将被加权相加。此操作不仅保留了每个注意力机制增强后的特征所具有的独立语义,还保证了特征之间的互补性和增强效果,而非相互削弱。(b) 主干网络与树状等级决策层之间的连接:通过利用 DACNN 最终全连接层(FCL)中的权重,建立了一个结构化的层次体系,并系统地定义了嵌入特征的决策规则。这种方式有助于更全面地理解特征的分布情况。在预训练的 DACNN 中,FCL 提取出属于 个类别的种子节点的权重。 随后,这些权重通过 Softmax 分类器转换为预测概率,其过程如下式所示: 其中, 表示全连接层(FCL)中第 列所对应的权重向量; 表示树状结构决策层的输入特征向量,同时也是最终卷积层的输出结果; 表示对第 类别的预测概率,其满足: 种子节点的权重直接继承自预训练的全连接层。该方法确保了子类的识别能力与预训练的 DACNN 模型保持一致。(c) 基于决策损失的微调:本研究中设计的 DATGDN 模型对 DACNN 与 TGDL 的权重进行了联合微调。若需计算每个决策节点的决策概率,可通过 Softmax 函数进行求解。以图 4 所示结构为例,微调后满足如下关系: 其中, 表示微调后第 个树状等级决策层的权重向量。上层类别(superclass)的分类结果为子类的微调与识别提供了先验知识。在每个节点上,基于路径概率应用 Softmax 分类,用以确定最终的故障诊断决策。种子节点的正确预测概率记作 ,而叶节点的正确预测概率记作 。因此,下式用于表示 TARTDN 模型的整体预测准确率概率: 其中, 表示 TGDL 中路径的概率。最终的类别预测通过索引 中概率最高的值获得,如下式所示: 完整的损失函数表示为 ,其通过公式中的交叉熵函数进行计算: 在该框架中,预训练 DACNN 的真实标签记作 ,预测概率记作 ;而 DACNN 的准确标签记作 。为确保保留原始训练模型的性能,右侧公式的第一项同样采用预训练网络中的交叉熵函数。第二项则引入了一个新的损失项,该项与树状决策路径中所有预测概率相关。4 基于所提方法的故障诊断4.1 故障诊断流程图前文已系统阐述了 DATGDN 的基本原理。本节将该方法应用于滚动轴承故障识别任务。图 5 展示了基于 DATGDN 模型构建的故障诊断流程: 图5 基于DATGDN的轴承故障诊断流程图振动信号采集:在故障测试平台上通过专用传感器采集滚动轴承在不同工况下所产生的不平衡振动信号。故障特征提取:利用新提出的 DATGDN 模型,从在不平衡条件下、具有不同噪声分布的轴承故障信号中提取关键特征。智能故障诊断:将具有已知状态的训练样本输入配置好的 DATGDN 进行训练;随后将状态未知的测试样本输入到已训练完成的 DATGDN 中,以判定其健康状态。4.2 实验数据集概述本研究选用两个数据集对所提出的 DATGDN 模型的测试效果进行验证。图 6 展示了两个实验平台,以下分别简要介绍各数据集的具体情况: 图6 数据集A和B的实验设备(a) 数据集 A:该数据集由印度某研究团队提供 [40],实验平台如图 6(a) 所示。所用轴承为圆柱滚子轴承,故障由电火花加工技术人为制造为矩形凹槽。加速度传感器安装在轴承座顶部,用于采集振动信号。实验条件为:转速 2050 rpm,垂直载荷 200 N,采样频率 70 kHz。该数据集包含 10 类信号类型:内圈故障:1.01 mm、1.56 mm、2.03 mm(共 3 类);外圈故障:0.86 mm、1.55 mm、1.97 mm(共 3 类);滚动体故障:1.16 mm、1.73 mm、2.12 mm(共 3 类);正常轴承信号:1 类。(b) 数据集 B:该数据集来自湖南大学 [41],实验平台结构如图 6(b) 所示。实验条件为:转速 900 rpm,垂直载荷 6 N,采样频率 8192 Hz。平台采集了 9 组斜齿轮减速器的故障数据,包含:内圈、外圈与保持架故障(故障尺寸为 2 mm、4 mm 和 6 mm)。此外,采集 1 组正常轴承数据,用以提升分类任务的准确性。在实验框架中,将两个数据集 合并为 10 个类别,每类代表一种不同的健康状态。表 1 列出了各类别对应的标签说明。表1 不同试验台的数据标签 为在不同失衡比(Unbalance Ratio, UR)与噪声干扰条件下进行轴承故障识别实验,根据公式向每种健康状态下长度为 2048 点的轴承信号中加入噪声。 其中, 与 分别表示原始信号功率与所添加噪声的功率。此外,实验中包含了在噪声环境下具有不同失衡比的样本,如表 2 所示。其中,“300 + 150×9” 表示将 300 个样本分配给正常类别,其余 9 个故障类别各分配 150 个样本。表2 在噪声环境下具有不同失衡比的实验样本 4.3 参数选择 实验结果受批处理大小(batch size)与交叉熵参数 的显著影响。为优化这两个关键参数,本文在数据集 B 上进行了实验,其中失衡比(UR)设为 2:1,信噪比(SNR)设为 8。不同 值与批处理大小下的优化实验结果如图 7 所示。 图 7 不同 值与批处理大小下的实验结果从图 7 可以看出,一旦 被设定,当批处理大小超过 16 时,整体识别率显著下降。当批处理大小设置为 8 或 16 时,识别率表现较好。在这些配置中,批处理大小为 16 时,性能最优。相比于批处理大小参数, 参数对实验结果的影响相对较小,但同样具有重要作用。实验结果表明,在确定批处理大小后,将 设置为 0.2 时,能够达到最优的整体识别率 98.73%。图 8 展示了在 和批处理大小为 16 条件下,所提出 DATGDN 模型的三维混淆矩阵。从图 8 中可以观察到,只有少量的滚动体故障(尺寸为 1.1)被误分类为尺寸为 2.03 的滚动体故障,且少量内圈故障(尺寸为 1.01)被误分类为正常样本。基于上述实验结果,后续实验中选定批处理大小为 16,并将交叉熵参数设置为 0.2。 图 8 DATGDN 模型在 且批处理大小为 16 条件下的混淆矩阵5 实验验证5.1 实验结果 所提出的方法在两个实验方案中进行了验证,每个方案包含三组不平衡数据。每组不平衡数据均进行了四组不同噪声条件(信噪比 SNR 范围为 10 至 4)下的实验,以及一组无噪声实验。图 9 展示了在两个不同数据集上进行五次试验后,所提出 DATGDN 模型的分类性能。 图 9 DATGDN 在两组数据集上五次运行的平均分类准确率从图 9 可以观察到,在两组实验数据中,随着失衡比(UR)的增加,DATGDN 的故障识别率逐渐下降;同时,随着 SNR 的升高,其识别率稳定上升。这一趋势符合客观规律,也与预期一致。在不同条件下,所提出的 DATGDN 的识别率范围在 92.21% 至 99.45% 之间,表明该模型能够在多种干扰环境与分布特性下,提取出有效特征,基本满足实际工程应用需求。此外,DATGDN 不仅具备较高的识别准确率,还展现出较强的推理能力与可解释性。以数据集 B 中的一个内圈样本与一个外圈样本为例,在无噪声、UR = 10 的条件下,所提出 DATGDN 的推理与决策过程如图 10 所示。 图 10 所提出 DATGDN 的推理与决策过程示意图从图 10 (a) 可见,当输入一个故障样本时,第一层定位初步判断为外圈故障,其概率为 96.82%;随后,在进一步判别故障尺寸时,该样本被识别为 4 mm 外圈故障,概率为 95.26%。同样地,从图 10 (b) 可观察到,当输入新的故障样本时,模型在第一层分类中以 98.65% 的概率将其识别为内圈故障;随后进一步识别其故障尺寸,判定其为 4 mm 内圈故障,概率为 96.77%。结果表明,实验结果与输入数据的真实标签高度一致,验证了所提出模型在推理与分级诊断过程中的准确性与鲁棒性。5.2 消融实验 5.2.1 对比方法概述 为验证 DATGDN 的优势,本文设计了多种对比算法,具体如下:(1)决策树(DT):一种基本的浅层机器学习算法。本文选用CART 算法作为分类器。(2)CNN:标准的一维卷积神经网络(1D-CNN),包含三层卷积层,用于从轴承信号中提取故障特征,最终通过 Softmax 层进行故障类别判别。(3)CNN-DT:由上述 (a) 与 (b) 组合构成的复合模型。(4)CBAM 辅助 CNN(CBAM-CNN):包含三层卷积结构,使用 CBAM 模块替代三元注意力与 MCSA,并移除树状等级决策层(TGDL)。(5)三元注意力辅助 CNN(TA-CNN):仅保留三层卷积与一个三元注意力机制。(6)多头卷积自注意力增强 CNN(MCSA-CNN):仅包含三层卷积与一个 MCSA 模块。 (7)DCTN:以 1D-CNN 为主干网络,去除三元注意力与 MCSA,保留TGDL作为决策层。(8)三元注意力引导的树状网络(TATN):去除MCSA,区别于树状等级决策层的仅为主干网络部分,采用 TA-CNN 替代原有CNN 结构。(9)多头卷积自注意力增强 CNN 与TGDL(MCSATN):去除三元注意力,结构由三层卷积、一个 MCSA 与TGDL组成。 5.2.2 与其他方法的对比分析 图 11 展示了在两组数据集、不同失衡比(UR)与信噪比(SNR)条件下,不同方法的故障识别准确率对比。 图11 不同方法在两组数据集及不同失衡比(UR)与信噪比(SNR)条件下的诊断识别率对比 由图 11 可得知实验结果如下: 所提出的 DATGDN 模型在不同UR 与 SNR 条件下的诊断结果始终优于其他方法,突显其在轴承故障诊断中的显著优势。如图 11(c) 与图11(f) 所示,即使在 UR = 10:1、SNR = 4 dB 的极端条件下,DATGDN 依然保持较高准确率,明显优于其他模型,具体表现为在数据集 A 上达到92.21%,在数据集B 上达到93.68%。 在图 11 的每一个子图中,DT 曲线始终被CNN 曲线包围。例如,在图 11(c) 中,SNR = 4 dB 条件下,DT 的准确率仅为17%,而CNN 可达76.84%。整体上,DT 准确率普遍低于60%,CNN 高于 60%,体现了深度学习方法相较于浅层机器学习方法的优势。 CNN-DT 的诊断结果始终介于 CNN 与 DT 之间,准确率范围为59% 到 76.36%,说明将卷积层用于特征提取并结合 Softmax 分类,优于单纯的浅层机器学习方法。DCTN 的诊断结果相较于 CNN 显著提升。例如,在数据集 A、UR = 10:1 条件下,DCTN 在不同 SNR 条件下准确率提高6.31% 到 19.47%,其中SNR = 4 dB 时提升最大,达到19.47%,说明TGDL层次结构在深度网络支持下大幅增强了 CNN 的决策能力。DCTN 相较于 CNN-DT 的对比表明,TGDL的引入显著提升了决策能力。例如,在数据集 A 中UR = 2:1 且 SNR = 10 dB 条件下,准确率从74.55%提高至95.45%,进一步验证了 TGDL 的优势。 TATN 相较于 DCTN 引入了TA 机制,进一步提升了特征提取能力和诊断性能。如在数据集 A、UR = 10:1 条件下,TATN 准确率为96.65%,而DCTN 为89.47%,说明三元注意力机制在提升模型性能方面具有显著效果。在数据集 B、UR = 5:1 且SNR = 4 dB 条件下,DATGDN 的准确率为94.64%,而 MCSATN 在相同条件下仅为80.72%。这一差异体现了 DATGDN 在TATN 基础上进一步引入 TA 与 MCSA 的并行融合机制,在噪声环境下的不平衡轴承数据中展现出更强的诊断能力。6 结论本文提出了一种兼具诊断性能与可解释性的 DATGDN 模型,用于在噪声环境下对不平衡轴承数据集进行故障诊断。 (a)在 DATGDN 框架中,DACNN网络作为主干结构,结合三元注意力机制和多头卷积注意力机制,能够在噪声环境下有效提取与故障相关的特征; (b) DATGDN 引入了 TGDL 架构,实现层次化决策。该结构首先进行故障分类,随后进行严重程度评估,模拟人类在系统性评估中的认知过程; (c)在多个测试任务中,涵盖不同的数据不平衡和噪声条件,并基于两组实验数据集进行测试,所提出的 DATGDN 在识别率方面始终优于多种现有先进算法,从而验证了该模型的有效性与优越性。编辑:Jin校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、Tina、陈宇航、陈莹洁、赵诚该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈