首页/文章/ 详情

强化学习故障诊断 | 一种基于数据增强的旋转机械故障诊断新型强化学习智能体

1天前浏览9

旋转机械的故障诊断对于保障工业生产的可靠性和安全性至关重要。然而,数据不平衡和样本有限等问题给故障诊断带来了挑战。本期给大家推荐一篇结合了强化学习的故障诊断论文:一种基于数据增强的旋转机械故障诊断新型强化学习智能体。论文提出了一种基于强化学习和数据增强的旋转机械故障诊断方法,有效地解决了数据不足的问题,并取得了优异的诊断效果。该方法结合了变分自编码器(VAE)和Wasserstein生成对抗网络(WGAN-GP)的优势,能够生成高质量的故障样本,丰富数据集。同时,采用均衡深度Q网络(Equilibrium-DQN)作为强化学习智能体,通过多目标网络提升了训练的稳定性和准确性。实验结果表明,该方法在轴承故障诊断中具有良好的性能,为旋转机械故障诊断提供了新的思路。

论文链接:通过点击本文左下角阅读原文进行在线阅读及下载

论文基本信息

论文题目 

A novel reinforcement learning agent for rotating machinery fault diagnosis 
with data augmentation

论文期刊Reliability Engineering and System Safety

论文时间2025年

论文链接:

https://doi.org/10.1016/j.ress.2024.110570

作者

Zhenning Li , Hongkai Jiang *, Xin Wang

机构

School of Civil Aviation, Northwestern Polytechnical University, 710072 Xi’an, PR China

作者介绍  

姜洪开,男,1972年生,博士,西北工业大学教授/博导。西安交通大学仪器科学与技术专业博士学位。2006年5月进入西北工业大学航空宇航科学与技术博士后流动站从事博士后研究工作,并留校任教。主持航天科技创新基金、中国博士后科学基金等国家和省部级基金项目4项。参加国家973子课题项目1项、国家自然科学基金重点项目1项、国家自然科学基金面上项目2项、国家863高技术研究发展计划项目1项。百度百科  

通讯作者邮箱:
jianghk@nwpu.edu.cn (H. Jiang)

目录

摘要  

1.介绍  

2.理论背景  

2.1.带有梯度惩罚的Wasserstein生成对抗网络  

2.2.变分自编码器  

3.所提方法  

3.1.  基于Wasserstein GAN和梯度惩罚的变分自编码器  

    3.1.1.模型组件  

    3.1.2.损失函数  

    3.1.3.培训战略  

3.2.均衡深度Q网络  

    3.2.1.目标网络更新  

    3.2.2.均衡目标值  

    3.2.3.优点和计算成本  

4.实验验证  

4.1.实验一  

    4.1.1.数据集描述  

    4.1.2.数据增强  

    4.1.3.数据分析  

    4.1.4.故障诊断结果

4.2.实验二  

    4.2.1.数据集描述  

    4.2.2.数据增强  

    4.2.3.数据分析  

    4.2.4.故障诊断结果  

5.结论

摘要

        数据失衡与样本有限的问题,给工业故障诊断领域带来严峻挑战,尤其在旋转机械故障诊断中,采样和标注的限制更为突出。强化学习虽以自动优化学习能力著称,但其数据收集的质量和数量严重制约了应用效果。本文将基于均衡深度Q网络(Equilibrium-DQN)的智能体与变分自编码器结合Wasserstein生成对抗网络梯度惩罚(VAEWGAN-GP)应用于旋转机械故障诊断。均衡DQN通过多目标网络协同工作,显著提升了训练稳定性和准确性。VAEWGAN-GP在解决故障诊断中的数据稀缺问题上表现优异,特别是在保留原始数据特征的同时,能有效扩充典型样本以丰富标注数据。本文提出了一种创新框架,将数据增强技术与强化学习智能体相结合用于故障诊断。该框架不仅弥补了样本不足的缺陷,更展现了其在复杂工业场景中的应用潜力。实验结果表明,无论是测试台数据集还是真实机车数据集,所提框架均展现出显著优势。

关键词:均衡深度Q网络,强化学习智能体,故障诊断数据增强

1. 介绍

旋转机械广泛应用于航空航天、铁路运输、石油化工等众多领域[1,2]。这类设备的稳定运行直接关系到行业的耐用性、效率和产能。然而,旋转机械常在振动应力、腐蚀性环境及高强度运转等严苛条件下工作。一旦关键部件发生灾难性故障,不仅可能引发安全事故,还会造成重大经济损失[3]。因此,对旋转机械实施状态监测与故障诊断,对于提升设备可靠性和安全性至关重要[4]。

深度学习技术在旋转机械故障诊断领域取得了重大突破,为传统方法提供了强大而高效的替代方案[5]。该技术通过分层特征变换和反向传播训练,自动从原始数据中提取有效特征,展现出卓越的特征提取能力。这种特性使得深度学习模型无需人工特征工程即可捕捉复杂故障模式[6]。此外,其分布适应性使其能够在多种环境中同时应用[7,8]。因此,近些年许多深度学习技术在故障诊断领域都展现出创新潜力。特别是Liu等人[9]提出了一种多源对抗差异匹配自适应网络,用于跨域故障诊断。Yan等人[10]则利用数字孪生技术构建了框架,在数据失衡条件下检测齿轮箱故障。

尽管深度学习在故障诊断领域已展现出显著效果,但其应用仍面临诸多挑战。究其根源,主要是故障样本的稀缺性——由于机器在多数情况下都能正常运行,导致训练数据严重不足。这种数据匮乏往往会导致深度学习模型性能大幅下降[11]。更棘手的是,深度学习模型的学习过程往往缺乏可解释性和自主性,使得人们难以理解其决策逻辑[12]。因此,优化学习算法以提升效率和智能化水平至关重要,这样才能获得更精准、更可靠的诊断结果。

生成对抗网络(GANs)[13]凭借其强大的数据生成能力,已广泛应用于图像合成、文本转图像等多种场景。在故障诊断领域,GANs常被用于生成多样化且逼真的样本[14,15]。Wang等人[16]提出了一种通过自适应特征提取增强滚动轴承数据故障诊断性能的GAN架构。Wang等人[17]提出了一种用于核电站故障诊断的卷积条件生成对抗网络。Sun等人[18]在逆变器故障诊断中,采用基于Wasserstein距离和辅助分类的生成对抗网络(GAN)结构。Wang等人[19]提出了一种多尺度对比生成对抗网络(GAN)用于单领域机械故障诊断的数据增强方法。Li等人[20]构建了一个用于航空发动机预测的数据增强框架,该框架采用时间序列生成对抗网络(GAN)和基于Transformer的多任务模型。尽管GAN在故障诊断领域已取得显著进展,但训练过程中仍存在模式坍塌、梯度消失等挑战。此外,GAN缺乏学习样本表征的能力,导致生成样本特征不可靠,无法完全逼近真实数据。

强化学习(RL)以其自主和自适应学习特性而闻名,在大规模模型的训练和优化以及目标导向决策问题的解决中发挥了重要作用[21,22]。深度Q网络(DQN)[23]由DeepMind于2017年提出,该技术采用深度网络替代传统Q函数,专门用于解决高维状态空间中的复杂问题。通过仅利用系统输入输出数据即可生成高效策略,强化学习方法已在故障诊断领域得到广泛应用[24]。Wang等人[25]提出了一种基于深度特征增强的强化学习方法,用于滚动轴承的可靠且鲁棒的故障识别。Yan等人[26]采用基于数据的架构,通过约束强化学习实现嵌入式动态故障诊断与控制。Yu等人[27]提出了一种基于图的方法,利用有偏强化学习在有限且含噪的数据条件下提升旋转机械故障诊断的准确性。Li等人[28]将强化学习应用于旋转机械故障诊断,实现了图神经网络结构搜索过程的自动化。Zhu等人[29]通过结合确定性学习与强化学习,针对非线性系统中的鲁棒故障识别问题,有效应对了不确定性因素和环境变化带来的挑战。但强化学习存在明显局限:其训练过程具有随机性特征,且对训练样本提出了严苛要求。因此,开发可靠有效的RL技术势在必行。

在数据失衡或有限的情况下,故障诊断面临巨大挑战。为解决这一难题,本研究提出了一种独特的智能体方案,通过深度强化学习结合生成对抗网络的数据增强技术来提升性能。该智能体采用主动诊断策略,通过与环境的持续交互不断丰富训练样本。此外,引入GAN架构的设计确保了即使在数据极度匮乏的场景下也能保持稳健性能。

本文的主要创新点如下:

1)本文提出了一种新型的故障数据生成方法,该方法结合了变分自编码器(VAE)[30]和带有梯度惩罚的Wasserstein生成对抗网络(WGAN-GP)[31]的优点。这种方法不仅确保了潜在表示的有效性,还显著提升了生成样本的质量水平。

2)本文提出了一种新的强化学习智能体训练方法,将集成学习的概念引入强化学习中。该方法通过整合多个智能体的估计结果来训练单个智能体。这可以促进智能体的决策能力,从而提高策略优化的有效性。

3)我们提供了一个集成框架,其中包含数据增强模块,用于丰富诊断模块的数据集。该框架将高质量生成数据与高效的训练策略相结合,以提升强化学习智能体的性能。

第二节将是一个简略的概念概要,第三节将提供对方法的深入描述,第四节将列出对该方法的经验验证,第五节将讨论主要发现并描述其影响。

2. 理论背景

2.1.带有梯度惩罚的Wasserstein生成对抗网络

WGAN-GP是生成对抗网络的一个广泛应用变体,相比基础GAN框架有显著改进。虽然仍以生成新数据为最终目标,但WGAN-GP更侧重于解决GAN训练过程中的稳定性问题和模式坍缩问题。

在传统的GAN和WGAN-GP框架中,生成器提供合成样本,而判别器(通常在WGAN-GP中被称为“评论家”)的工作是辨别由生成器创建的数据和真实数据。

WGAN-GP中的生成器与标准GAN类似,其目标是生成与真实数据分布模式基本一致的数据。生成器损失函数的定义如下:

   
 

然而,WGAN-GP中的判别器与传统GAN中的判别器存在本质区别。它不输出数据真实与否的概率值,而是直接输出一个无 界数值。其核心目标是为真实数据赋予更高评分,而对生成数据则给予更低评分。判别器的损失函数定义如下:

   
 

为确保训练稳定性,我们在WGAN-GP中引入梯度惩罚项,该惩罚项可保证评估器在所有数据上的梯度范数接近于1。梯度惩罚损失函数如下所示:

   
 

其中,表示真实数据与生成数据之间的插值。

总体而言,WGAN-GP中评论家的总损失函数为:

   
 

其中    是梯度惩罚的权重系数。

尽管存在这些改进,WGAN-GP可能仍无法完全实现最优的生成性能和特征表示。WGAN-GP的一个显著局限在于其缺乏捕捉并保留原始数据内在特性和特征的能力。

2.2.变分自编码器

VAE是一种将自编码器架构与概率推理相结合的生成模型。它在编码过程中将数据压缩到低维潜在空间,然后利用这种表示在解码过程中重建数据。

VAE使用概率编码将输入映射到一个分布,而不是直接映射到潜在空间中的固定点:

   
 

对于每个输入    ,其在潜在空间中的表示    是从由    和    参数化的高斯分布中采样得到的。这种概率方法使得潜在空间更加密集且连续,这对生成任务非常有利。

VAE还采用KL散度作为正则化工具,以确保潜在空间分布    与先验分布    保持一致:

   
 

其中,    通常采用标准高斯分布    。KL散度不仅能提高潜在空间的可解释性,还能有效防止模型过拟合。

在重建过程中,VAE通过从编码分布中随机采样来实现随机解码。这种随机性增强了模型的变异性并提升了生成能力。

虽然VAE在结构化潜在空间表征方面表现优异,但在生成高质量、逼真的样本时常常力不从心,这限制了其实际应用效果。因此,需要将VAE的优势与先进的生成技术相结合,才能突破这些局限并提升性能表现。

2.3.DeepQ网络

在强化学习中,Q函数表示当遵循最优策略时,在给定状态下某个动作的预期累积奖励。DQN是一种先进的算法,它利用深度神经网络来近似这个Q函数。这种近似对于处理具有大状态空间的环境至关重要,因为在这些环境中,传统的基于表格的Q学习方法是不切实际的。

Q值指导智能体的决策过程,表示每个动作的潜在奖励。训练过程的目标是通过损失函数捕捉预测Q值与目标Q值之间的差距:

   
 

其中,    和    分别表示在线网络和目标网络的参数,而    则代表在下一个状态s中可能采取的每个动作a的最大Q值。

在训练过程中,深度Q网络(DQN)采用    贪婪策略来平衡探索与利用。这意味着最佳估计动作将以    的概率被选中,而其他动作则以    的概率随机选择。智能体通过与环境交互获取状态s,并根据策略选择动作a。随后获得奖励r和下一个状态    ,整个交互过程如图1所示。经验元组    会被存储在经验回放缓冲区,使在线网络能够从随机采样的批次中进行更新。同时,目标网络权重会定期更新。

 

图1 DQN智能体-环境交互图解

原始的DQN算法需要大量的数据集进行训练,这可能是一个很大的限制。此外,其固有的随机性和非线性可能导致不稳定和次优策略。因此,迫切需要为DQN开发一个更稳定和可靠的训练框架,以促进更一致的学习过程。

3. 所提方法

3.1.基于WassersteinGAN和梯度惩罚的变分自编码器

本文提出了一种集成式VAE-WGAN-GP模型,旨在结合VAE的结构化潜在空间和GAN的多样化样本生成能力,并通过改进WGAN-GP的两个特性来增强GAN组件的稳定性。该模型被设计为一种数据导向的数据增强算法。该方法专注于在有限的样本量下捕获用于故障诊断任务的内在数据特征。

3.1.1.模型组件

本方法采用的编码器承担着与VAE结构中编码器相同的核心功能——在潜在空间中学习数据表征。其核心任务是掌握数据分布的统计规律,并将原始输入数据映射到潜在空间。这种编码机制至关重要,因为它既能保留数据的关键特征,又能有效降低原始数据的维度。

该模块具有双重功能,既是VAE的解码器,又是GAN的生成器。作为解码器时,它能将压缩数据还原为原始形态;同时作为生成器,它还能创建合成样本以欺骗评估机制。这种设计使VAE与GAN之间形成了桥梁,显著提升了整体运行效率。

该批评机制继承了WGAN-GP的架构,用于评估样本的真实性。它不仅能引导生成器产出更高质量的输出结果,还能确保训练过程稳定可靠。具体实现方式是通过测量生成数据与真实数据之间的分布差异,从而促进更逼真样本的生成。其复杂结构如图2所示。

 

图2 VAE-WGAN-GP集成架构

3.1.2.损失函数

所提出的方法允许平衡和组合以下损失函数,这使得模型能够在训练的不同阶段调整每个损失的贡献,以优化模型性能。重建损失(    )衡量初始数据与潜在空间中重建数据之间的差异,确保模型准确地捕获和复 制输入数据:

   
 

KL散度损失(    )确保学习到的潜在分布保持在标准高斯先验分布附近,从而促进有意义的潜在空间表征:

   
 

Wasserstein损失(    )旨在减少实际数据分布与生成数据分布之间的距离,确保生成高质量的样本:

   
 

梯度惩罚损失(    )对梯度偏离1的评论器进行惩罚,从而促进更平滑和更稳定的训练动态:

   
 

综合上述损失函数,总损失函数可表示为:

   
 

其中    、    、    和    是用于平衡损失函数的超参数。通过根据模型性能调整各损失项的相对重要性,从而实现最佳功能。

3.1.3.培训战略

为了保证VAE和WGAN-GP组件之间的协调交互和稳定收敛,我们提出了两种训练策略:交替训练策略和正则化技术

由于模型具有集成特性,VAE和GAN组件采用交替训练模式。编码器和解码器通过VAE损失进行更新,而生成器和判别器则使用WGAN-GP损失进行优化。在更新任一组件时,另一组件保持固定状态。这种设计有效降低了两个组件之间的相互干扰。

梯度裁剪作为一种正则化技术,其主要优势在于确保训练过程的稳定性,尤其对于对抗性训练中的判别器而言。它能有效防止权重过度增长,从而平衡训练动态并避免梯度爆炸现象。因此,该技术不仅使训练过程更加平滑,还能显著提升模型性能。

通过采用本文提出的训练策略,VAE-WGAN-GP结构将VAE的可理解潜在空间与WGAN-GP生成高保真样本的能力有机结合。该方法确保了在故障诊断任务中生成的样本既具有真实性又易于理解。

3.2.均衡深度Q网络

为解决深度Q网络(DQN)中存在的价值高估和训练随机性问题,我们提出了一种均衡深度Q网络(Equilibrium-DQN)用于故障诊断。该模型通过多目标网络预测目标Q值,旨在最小化这些预测误差并提升故障诊断智能体的训练稳定性。为满足均衡深度Q网络对样本量的要求,我们采用变分自编码器-变分自编码器-生成对抗网络(VAE-WGAN-GP)作为数据增强模块。

3.2.1.目标网络更新

为了增强DQN的稳定性,我们改进了Equilibrium-DQN中目标网络的维护和更新过程。不再像传统方法那样固定间隔将权重从在线网络复 制到目标网络,而是同时维护N个目标网络的历史记录。通过这种方式,更新过程能够更加动态且稳定。

更新通过丢弃最旧的网络并添加最新的网络来执行。同时,目标网络权重也会通过以下公式被修改:

   
 

其中,     是第    个目标网络权重。

3.2.2.均衡目标值

在均衡深度Q网络(Equilibrium-DQN)中,目标Q值会根据目标网络的历史数据动态调整。这种设计与传统DQN截然不同——后者仅依赖当前目标网络的状态。对于特定状态-动作对    ,其目标Q值是通过平均最近    个目标网络的Q值计算得出的:

   
 

在此公式中,    表示使用权重    计算第    个目标网络。对于每个样本,使用平均目标Q值计算时间差(TD)目标    

   
 

其中,    是奖励,    表示状态    中的可能动作,    是折扣因子。

总损失是根据计算出的TD目标和在线网络的预测结果来计算的,然后使用反向传播算法用这个损失来更新在线网络的权重。图3显示了详细的结构。

 

图3 均衡-DQN架构概览

3.2.3.优点和计算成本

均衡深度神经网络(Equilibrium-DQN)通过跨多个网络平均估计值来增强学习稳定性,这一特性在模型训练初期尤为显著。该方法有效降低了单网络预测中固有的波动性,从而提升模型性能。不过,由于需要维护多个目标网络并在更新过程中执行更多前向传播,计算成本会相应增加——但考虑到由此带来的性能提升,这种额外开销通常是可以接受的。此外,将均衡深度神经网络与变分自编码器-变分自编码器-生成对抗网络-生成过程(VAE-WGAN-GP)方法结合使用,可以进一步放大这些优势,有望在更广泛的环境和场景下提升模型的鲁棒性和有效性。

3.3.方法框架

图4所示,本研究提出的框架将均衡深度神经网络(Equilibrium-DQN)与变分自编码器-变分生成对抗网络-高斯过程(VAE-WGAN-GP)相结合。在完成原始数据的采集并划分训练集和测试集后,通过VAE-WGAN-GP对训练集进行样本扩充以增加数据量。最终将包含原始训练集和生成样本的扩充数据集作为均衡深度神经网络(Equilibrium-DQN)的训练数据集。

 
图4 所提方法示意图  

通过VAE-WGAN-GP增强故障诊断数据:该方法首先利用VAE编码器将真实数据样本编码到潜在空间,捕捉复杂的数据分布特征。随后,VAE解码器从潜在空间重建新样本,并将其输入WGAN-GP判别器。通过学习潜在空间表征,VAE能够捕捉故障诊断数据的核心特征,确保生成样本继承这些丰富特征。WGAN-GP判别器则负责验证样本真实性,从而保证生成的高质量样本符合预期标准。该过程包括计算VAE的重构损失和KL散度损失,以及WGAN-GP的Wasserstein损失和梯度惩罚。

优化故障诊断的均衡深度Q网络(Equilibrium-DQN):训练均衡深度Q网络时,首先需要为主网络和多个目标网络设置初始参数。算法通过迭代状态观测数据,利用目标网络计算每个动作对应的平均Q值。该平均Q值随后用于在ϵ-贪婪策略下确定动作选择。当执行动作后,环境会返回奖励和后续状态,这些经验将被存储。主网络通过从存储的经验中采样,并基于目标网络的平均Q值最小化损失来更新。目标网络权重则定期通过从主网络转移权重并重新计算其平均值进行调整。这种设计使均衡深度Q网络能够有效降低Q值估计的方差、稳定学习过程并提升准确度,从而增强模型在故障诊断中的鲁棒性和性能表现。

4. 实验验证

4.1.实验一

4.1.1.数据集描述

意大利都灵理工大学机械与航空航天工程系为本研究提供了由动态与识别研究组(DIRG)[32]提供的完整数据集。该装置包含高速主轴和一组用于加速度数据采集的传感器,如图5所示。测试在不同速度、载荷及损伤程度下进行,实验数据包含七个子集:分别记录三种尺寸(150、250和450微米)压痕引发的故障情况,这些压痕出现在单个滚动体或内圈表面,另有一个无缺陷数据集。所有数据均在约1.4 kN的载荷下采集,采样频率为51.2 kHz,转速为12k rpm,取自受损轴承座。如表1所示,共提取540个样本,每个样本包含1024个数据点。

 
图5 轴承数据采集测试台  

表1 航空轴承数据集的详细说明

 


4.1.2.数据增强

VAE-WGAN-GP方法对现有数据集进行增强,增加了每个类别设置80个样本。超参数α、β和λ的设定为1,以平衡重建损失、KL散度损失和Wasserstein损失,同时根据原始WGAN-GP设计将γ设置为10以保证稳定性及样本多样性。图6展示了原始信号与增强信号在频域和时域表示中的对比。蓝色部分为原始信号,红色部分为VAE-WGAN-GP生成的信号。

 

图6 原始数据与VAE-WGAN-GP增强数据的并排视图

对比结果显示,VAE-WGAN-GP方法能有效保留原始数据特征。增强后的数据在时域振幅、位置和频域分布方面与真实信号高度吻合,这种相似性凸显了该方法在保持时域特征方面的优势。VAE-WGAN-GP框架中的VAE组件对保留原始信号的时域和频域特征至关重要。然而,生成对抗网络(GAN)可能在频域引入平滑效应,并在样本生成过程中产生随机变化,导致频域分布出现差异。尽管存在这些变化,VAE-WGAN-GP方法仍基本保留了时域特征及频域分布的关键特性

4.1.3.数据分析

为评估VAE-WGAN-GP方法生成的数据对故障诊断流程及结果的影响,我们通过增强数据集对训练数据进行优化。针对7个数据集,每个数据集选取20个样本用于训练,剩余原始数据作为测试集。本研究将提出的改进方法与原始WGAN-GP和VAE-GAN方法进行对比,扩展数据集详情见表2。最终基于该扩展数据集完成了故障诊断模型的训练工作。

表2 使用上述方法构建的数据集

 

针对每个数据集,我们采用卷积神经网络(CNN)作为基准模型进行故障诊断,诊断准确率越高表明数据质量越好。考虑到网络结构对故障诊断的影响,为提高基准测试的可信度,我们使用了四种具有不同结构参数的卷积神经网络(CNN)。表3列出了每种CNN结构的具体参数。

表3 用于比较分析的详细CNN架构

   

诊断结果如图7所示。观察发现,仅使用原始故障数据集的模型表现最差。值得注意的是,通过各类基于生成对抗网络(GAN)的方法生成的增强数据集,故障诊断的有效性得到了显著提升。这证实了使用GAN网络增强数据集的有效性。特别地,在所有参数设置下,VAE-WGAN-GP方法均取得了最佳诊断效果,相较于两种基准方法,其生成的数据质量尤为突出,尤其在该数据集上表现最为优异。

 

图7 不同结构下的诊断结果

4.1.4.故障诊断结果

在原始数据集上,均衡DQN(Equilibrium-DQN)与传统DQN及双DQN(Double DQN,简称DDQN)[33]进行了对比实验。两组模型共享参数设置为:学习率0.8、折扣因子0.99、更新迭代次数128次、回放缓冲区大小64。奖励函数设计旨在提升诊断准确性,正确诊断可获得累计奖励增加10分,错误诊断则会减少1分。将探索率设定为0.1,并在训练过程中逐步降低以平衡探索与收敛。采用前一章展示过最佳效果的结构-3网络架构。均衡DQN配置了10个独立的目标网络,每个模型均进行了10轮训练,并记录了各训练周期在测试集上的准确率。最终性能趋势如图8所示。

 

图8 独立运行的智能体训练准确性和平均性能

在训练初期,Equilibrium-DQN和DQN的收敛速度相近,而DDQN则展现出显著更快的收敛效率。这种更快的收敛性可归因于DDQN决策过程的改进。随着训练的推进,Equilibrium-DQN的平均准确率开始超越DQN和DDQN。这一提升主要得益于Equilibrium-DQN中强化的网络更新机制。此外,如先前分析所示,Equilibrium-DQN在训练过程中表现出更小的准确率波动,表明其稳定性更强且诊断效果更优。

为评估所提出的方法,将VAE-WGAN-GP生成的数据与Equilibrium-DQN结合,并与其他多种方法和数据配对进行比较,如图9所示。同时,我们进行了性能对比分析,将WGAN-GP方法与原始DQN方法及本文提出的方法进行比较。该对比包括通过t-SNE分析进行评估,并使用混淆矩阵检查诊断结果,如图10所示。

 

图9 不同方法和数据配对的准确度结果

 

图10 诊断结果和特征可视化

在最终诊断结果中观察到有趣的规律。值得注意的是,虽然原始DQN模型在使用原始数据集时表现与CNN相当,但偶尔会因训练不稳定而表现欠佳。然而,当DQN与任何基于GAN的方法结合时(即便是相对基础的VAE-GAN方法),我们看到了显著提升。这种改进表明,相较于CNN,DQN可能更依赖于数据集的丰富性,这凸显了利用GAN为强化学习智能体增强数据的重要研究价值。这种数据增强似乎产生了协同效应——两种方法相互促进,从而获得更优的诊断结果。

最重要的是,与所有其他测试方法相比,所提出的方法——将VAEWGAN-GP与Equilibrium-DQN集成——在故障诊断中实现了最高的准确率。结果不仅验证了所提出方法的有效性,还突显了其在提升故障诊断流程中的优越性。研究结果表明,通过战略性地结合先进的数据生成技术和强化学习技术,可以显著提升诊断模型的性能和可靠性。

4.2.实验二

4.2.1.数据集描述

在实验2中,研究人员从一台承受9800牛顿[34]载荷的机车轴承单元采集数据。安装在552732QT轴承顶部的100 mV/g加速度计记录了32秒的振动数据(如图11所示)。实验共监测了8种不同工况,包含7种故障状态和1种正常状态。数据采样频率为12.8 kHz,转速调整至约500 rpm。故障类型涵盖内圈缺陷、外圈缺陷、滚珠缺陷及其组合形式。最终收集到610个样本(如表4所示),其中训练集160个,测试集450个,每个样本包含1024个数据点。

 

图11 电力机车轴承试验设备

表4 机车轴承数据集的详细说明

 

4.2.2.数据增强

在实验2中,我们同样采用VAE-WGAN-GP方法对现有数据集进行扩充,为每个类别生成了额外的80个样本。图12展示了8个类别中增强后的信号(红色)与原始信号(蓝色)在时域和频域中的对比效果。

 

图12 原始数据与VAE-WGAN-GP增强数据的并排视图

实验结果充分证明了VAE-WGAN-GP方法在保留原始数据特征方面的卓越性能。生成的数据在频域分布、幅值以及时域位置等方面均与原始数据高度吻合。这种一致性不仅验证了振动信号数据特征的有效保留,更凸显了该方法在提升旋转机械信号数据质量方面的巨大潜力。

4.2.3.数据分析

本节采用与第4.1.3节类似的方法,使用VAE-WGAN-GP方法进行数据增强,并将其与由WGAN-GP和VAE-GAN方法生成的数据集进行比较。对于每个类别,训练集都增加了从原始数据集中抽取的20个样本。训练集和测试集的配置详见表5

表5 使用上述方法构建的数据集

 

与前一节相同,我们采用四种不同参数设置的CNN结构作为故障诊断基准模型,各CNN结构的详细参数如表6所示,各模型的诊断结果如图13所示。

表6 用于比较分析的详细CNN架构

 
 

图13 不同结构下的诊断结果

与第4.1.3节的研究结果一致,测试结果呈现出相似的规律。WGAN-GP方法的表现优于VAE-GAN,这表明梯度惩罚和Wasserstein距离对模型增强效果贡献更大。尤为重要的是,VAE-WGAN-GP方法在所有参数设置下始终保持着最佳诊断效果。这一结论进一步印证:在扩展旋转机械数据集等任务中,所提出的VAE-WGAN-GP方法有望取得更优的成果。

4.2.4.故障诊断结果

使用原始数据集,将Equilibrium-DQN方法的有效性与传统的DQN和DDQN方法进行了对比。相同的超参数设置如第4.1.4节所述。三个模型均采用了相同的参数设置,包括学习率、折扣因子、回放窗口大小、网络更新频率、奖励函数和探索率。所有智能体均采用前一章表现最佳的结构1方案。Equilibrium-DQN通常使用单个目标网络,而DDQN则采用双网络架构以缓解高估偏差问题。每个诊断模型均进行了十次独立训练。

图14所示,与数据集1相比,平衡DQN、传统DQN和DDQN在工程数据集2上的表现均出现下滑。这种下降趋势可归因于两个数据集诊断复杂度的差异。值得注意的是,DQN和DDQN在后期阶段偶尔会出现准确率下降,这可能是因为训练样本数量有限导致的过拟合现象。相比之下,均衡DQN保持了稳定的准确率提升且波动较小,展现出更优的性能。尽管DDQN在早期收敛性方面表现更佳,但即使在训练样本有限的情况下,均衡DQN仍始终保持着优于其他两种方法的优势。

 

图14 独立运行的智能体训练准确性和平均性能

最后,对各种诊断模型和数据配对进行了全面的性能比较,如图15所示。研究还进一步对比了WGAN-GP与原始DQN结合的故障诊断能力,并与本文提出的方法进行了比较。该对比包括t-SNE评估和使用混淆矩阵的诊断结果,如图16所示。

 

图15 不同方法和数据配对的准确度结果

 

图16 诊断结果和特征可视化

对比实验结果表明,生成对抗网络(GAN)能显著提升深度强化学习智能体的性能,这说明数据增强对深度强化学习具有积极影响。本研究提出的结合变分自编码器-变分自编码器-生成对抗网络(VAE-WGAN-GP)与均衡深度Q网络(Equilibrium-DQN)的方法,在性能上较单纯的WGAN-GP与原始DQN组合方案展现出显著提升。这一点在t-SNE分析中很明显,诊断智能体具有更好的特征提取和更高的诊断准确性,结果进一步验证了所提出方法的效率和优越性。

5. 结论

本研究探索了VAEWGAN-GP与Equilibrium-DQN方法在旋转机械故障诊断中的应用价值及其协同优势,实验结果证实这两种方法在实验室环境电力机车场景中均展现出显著效能。通过整合多个目标网络,Equilibrium-DQN方法显著提升了诊断智能体的稳定性和准确性。与此同时,VAEWGAN-GP方法为故障诊断提供了高质量且具有实际意义的数据表征。这些方法的协同效应充分展现了强化学习与数据增强技术在复杂工业场景中的应用潜力。

然而,VAE-WGAN-GP和Equilibrium-DQN算法在当前实现中仍存在一些局限性。VAEWGAN-GP由于其网络结构的限制,在收敛性方面面临挑战,这可以通过优化梯度惩罚项或采用渐进式训练策略来解决。Equilibrium-DQN在早期阶段表现出较差的训练效率,这可以通过优化经验回放机制或采用预训练技术来缓解。因此,未来研究将聚焦于通过整合更复杂的深度学习模型和强化学习策略来进一步开发这些算法,旨在实现更高的故障诊断准确率,并提升复杂工业环境中的实时性能表现。


编辑:陈莹洁

校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、Tina、王金、赵诚、陈宇航、肖鑫鑫

该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除


来源:故障诊断与python学习
System振动非线性化学旋转机械航空航天电力UGpython海洋UM声学理论电机数字孪生
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-08-15
最近编辑:1天前
故障诊断与python学习
硕士 签名征集中
获赞 87粉丝 125文章 228课程 0
点赞
收藏
作者推荐

论文分享| 基于双重视角层次性选择的对抗迁移诊断网络

本期给大家推荐的文章是《基于双重视角层次性选择的对抗迁移诊断网络》。本文以当前无监督域自适应诊断方法中出现的参数可迁移性和重要性被忽视的问题为切入点,提出了一种新型层次化选择性对抗迁移网络。这种方法通过实例选择机制和参数级对齐的细粒度自适应来提高诊断性能。 论文基本信息论文题目:Towards dual-perspective alignment: A novel hierarchical selective adversarial network for transfer fault diagnosis论文期刊:Advanced Engineering Informatics论文日期:2025年作者:Yansong Zhang, Xianfeng Yuan, Xilin Yang, Xinxin Yao, Jianjie Liu, Fengyu Zhou, Peng Duan机构: School of Mechanical, Electrical & Information Engineering, Shandong University, Weihai 264209, China第一作者简介: 张焱淞,山东大学机电与信息工程学院。智能故障诊断、迁移学习、变工况下的旋转机械健康监测。联系方式:202337618@mail.sdu.edu.cn 目录摘要 1 引言 2 理论背景 2.1 无监督跨域故障诊断的定义 2.2 域对抗神经网络DANN 2.3 局部最大均值差异LMMD 3 所提出方法 3.1 实例选择机制ISM 3.2 域无关参数学习DAPs 3.3 总体优化目标 4 实验结果分析 4.1 数据集描述 4.2 JNU数据集结果分析 4.3 HUST数据集结果分析 4.4 真实诊断平台结果分析 5 结论 摘要无监督域自适应已广泛应用于旋转机械迁移故障诊断中,旨在解决标记数据缺失和分布偏移问题。然而,现有的方法仍然面临着一些挑战。首先,这些方法通常认为无论源域故障样本是否应该迁移,所有样本在域自适应中的贡献是相等的,这会导致负迁移。其次,所有的网络参数都被认为具有相同的可迁移性,忽略了一些参数仅适用某个领域或并不适合故障特征分布对齐的情况。为了解决这些问题,本文提出了一种新型层次化选择性对抗网络(Hierarchical Selective Adversarial Network, HSAN),该网络通过实例级和参数级的细粒度自适应来提高诊断性能。具体来说,为了抑制由于故障样本被视为同等易迁移水平而导致的负迁移,本文设计了一种实例选择机制,自适应地确定具有高适应性贡献的可迁移故障样本。在参数级对齐方面,通过所提出的识别准则将可学习参数分为领域无关参数和领域特定参数,其中前者在域适应过程中是可迁移的,后者不可迁移并被惩罚以削弱对于适应过程的干扰。本文在两个公共数据集和一个实际的故障诊断测试台上进行了大量诊断实验,实验结果充分表明HSAN具有优越的诊断性能,优于其他先进的跨域诊断方法。1 引言旋转机械在工业场景中占有核心地位,滚动轴承作为其关键部件尤为重要,其健康状态直接影响工业系统的性能。在实际制造生产中,滚动轴承的故障可能导致严重的经济损失甚至人员伤亡。因此,滚动轴承故障诊断具有重要意义,受到了广泛的研究关注。随着传感技术和工业物联网的进步,海量工业数据为故障诊断提供了新的机会。基于深度学习的故障诊断(Deep Learning-based Fault Diagnosis, DLFD)得益于其出色的特征提取能力,以其良好的性能成为机器健康状态监测领域数据驱动的新范式。然而,大多数DLFD方法都遵循训练和测试故障样本集具有相同分布的基本假设,这在实际工业场景中是不现实的。在特定工况下训练的诊断模型在部署到新的工况时,性能会下降。此外,在新的工况下标记故障样本是一项费时费力的工作。因此,在直接将一个分布上训练的DLFD迁移到其他分布时可能会面临挑战。为了在目标域获得满意的诊断效果,迁移学习思想被应用在故障诊断中,在不同工况下的跨领域任务中发挥着关键作用。无监督域自适应(Unsupervised Domain Adaptation, UDA)属于迁移学习的一个研究范畴,旨在通过学习领域共享知识来建立不同领域之间的联系。目前主流的UDA故障诊断方法大致分为两类。第一类基于度量。例如,Zhang等人对相关对齐(Correlation Alignment, CORAL)损失进行了优化,以减小分布差异,增强模型诊断能力。从空间映射的角度来看,Qian等人提出了一种新的振动特征引导的差异度量来增强故障分布表示能力。另一类是基于对抗的方法。Ganin等人首先提出了一种域对抗神经网络(Domain Adversarial Neural Network, DANN),其中提取器和判别器通过对抗训练获得具有梯度反转层的域不变特征。Xiao等人利用联合最大平均差异(Joint Maximum Mean Discrepancy, JMMD)对DANN进行了改进,实现了边缘分布和条件分布对齐,获得了更好的诊断结果。此外,Jiao等人构造了一种对抗熵最小-最大操作,通过更新分类器使熵最大化来学习不变的域原型,然后更新后的提取器使熵最小化以获得高类区分度的故障特征。因此,UDA技术在故障诊断中越来越普遍。尽管UDA轴承故障诊断取得了令人瞩目的成就,但现有方法仍然存在影响诊断能力的问题。首先,现有方法将所有故障样本在知识迁移中视为具有同等的可迁移性,因此在自适应过程中,这些样本在源域内始终具有同等的权值。然而,由于数据分布的偏移,不同的样本具有不同等的可迁移性,因此当前这种同等加权方式对于挖掘域不变故障特征是低效的。其次,如图1左侧所示,现有的跨域故障诊断方法在优化过程中假设诊断网络的所有参数拥有同等地位。然而,根据彩 票假设,只有部分参数对诊断模型的性能至关重要。相应地,如果所有参数都被同等迁移,则可能对学习域不变故障特征造成负面影响。图1 所提出的域无关参数DAPs学习和现有方法的对比为了解决现有方法的上述缺陷,提高不同工况下的迁移诊断结果,设计了一种新的层次化选择性对抗网络(Hierarchical Selective Adversarial Network, HSAN),用于实例级和参数级双视角故障特征分布对齐。在训练过程中,首先提取源域和目标域故障数据对应的故障特征。然后,通过实例选择机制自适应地识别源域样本并根据其重要性分配权重,从而有利于实例级的域自适应。此外,通过评估参数对目标函数的影响,为参数划分设计了参数识别准则。如图1右侧所示,选取的域无关参数(Domain-Agnostic Parameters, DAPs)在参数级上改善故障特征分布对齐,从而提高迁移诊断精度。下面详细介绍了所提出方法的创新方面和关键贡献。(1)提出了一种新型的层次化选择性对抗网络HSAN用于迁移故障诊断,该诊断模型在实例级别和参数级别上实现了细粒度的对齐。为了避免由于源域故障样本假定适应性同等贡献而导致的负迁移,设计了一种实例选择机制,旨在根据样本重要性来确定可迁移的源域故障样本,从而在实例级别提高诊断性能。(2)开发了一种参数识别标准,以将诊断模型参数分为域不变的部分和域特定的部分。分别针对域不变和域特定的参数实施正、负更新规则,这可以增强参数级别的故障知识迁移。实例和参数的层次化选择有助于域适应过程,并取得了良好的诊断结果。(3)在两个广泛使用的公共数据集和一个实际故障诊断测试台上进行的实验结果表明HSAN的表现优于其他先进的跨域诊断方法。本文的后续部分如下所述。第2节阐述了本文的理论背景。第3节对本文提出的方法进行了全面的说明。第4节给出了实验的结果及其分析。最后,第5节对论文进行总结。2 理论背景2.1 无监督跨域故障诊断的定义本文针对于不同工况下的无监督跨域故障诊断任务,其中源域和目标域分别表示为 和 。 和 分别表示标记的源故障样本个数和未标记的目标故障样本;一个带有相应标签 的故障样本 。 和 遵循不同的分布。假设两个域具有相同的标记空间,即 ,这意味着具有相同的轴承健康状态类别。HSAN的目标是从源域 中学习域不变的故障特征,在目标域 上获得满意的诊断结果。2.2 域对抗神经网络DANN图2 DANN模型架构如图2所示,DANN由特征提取器 、判别器 和分类器 组成。具体来说,通过优化 ,它学习不变和判别故障特征表示,而 负责预测故障样本类别。 识别特征来自源域或目标域。 接收来自 的反向梯度,这增强了提取域不变故障特征的能力。DANN优化目标包括分类损失 和域判别损失 ,可表示为: 其中, 为平衡因子。 分别为 、 、 的参数。 和 分别为健康状态数量和指示函数。 表示结果矩阵中的第v个分量。在模型训练过程中, 的最小化将更新 ,并提高模型的分类能力。对于 ,更新 加强了模型判别能力, 获得提取域不变特征的能力。2.3 局部最大均值差异LMMDMMD通常被用作非参数距离估计量来测量域间分布的差距。与关注全局分布的MMD不同,LMMD是一种能够测量局部分布差异的核方法。利用基于平方核的均值嵌入距离计算源域分布 和目标分布 间的分布差距 : 其中, 是核为 的再生核希尔伯特空间(Reproducing Kernel Hilbert Space, RKHS)。 表示原始样本到RKHS的映射。 表示 ,其中是向量的内积。因为 涉及到一个无限维的特征空间,它不能直接计算。因此,引入核技巧可以得到上式。 是类别总数。 和 分别表示样本 和 的权值。3 所提出方法为了解决由于对故障实例和诊断模型参数的重要性考虑有限而导致的严重负迁移和诊断准确性降低的问题,我们提出了HSAN用于实例级和参数级双视角对齐。首先,实例级提出了一种实例选择机制(Instance Selection Mechanism, ISM),根据源域故障样本的重要度自适应地分配权重,有效地促进了域不变故障信息的挖掘。此外,通过评估DAPs对目标函数的影响来动态识别域无关参数。通过利用这些选定的DAPs,故障诊断能力和总体诊断性能将得到显著提高。双视角对齐策略确保了鲁棒的跨域诊断性能,并取得良好的诊断结果。本节将详细介绍HSAN,分为实例选择机制、域无关参数学习和总体优化目标三部分。HSAN训练中涉及的关键步骤如图3所示。图3 HSAN模型训练及故障诊断流程3.1 实例选择机制ISM现有的无监督迁移诊断方法通常假设所有源域故障样本在域自适应过程中具有相同的重要度,从而对每个故障样本赋予相同的权重进行知识迁移。然而,由于数据的多样性,一些源域故障样本可能与目标域数据具有较大的域差异。统一加权策略会导致诊断模型在迁移到目标域时诊断性能下降。考虑到不同故障样本之间的差异性,提出了一种基于故障样本重要度的实例选择机制,以应对负迁移问题,并精确度量不同域样本之间的相似性,如图4所示。这一过程的核心是训练判别器,其目的是区分故障特征的域来源。通过识别难以分类为源域或目标域的故障特征,判别器可以精确定位与目标域特征空间更接近的故障样本。具体来说,判别器损失表明每个源域故障样本与目标域的相似度。较大的 损失值表明对应的故障样本更难区分,反映了与目标域故障样本在特征表示上的相似性更强。因此,这样的故障样本被认为更适合域自适应,在适应过程中被赋予更大的重要性。图4 实例选择机制ISM示意图此外,分类损失 用于进一步衡量每个源样本与目标域的匹配性。ISM通过结合 和 计算每个源故障样本的自适应权值,保证最能代表目标特征的样本在学习过程中发挥突出作用。将第 个源域故障样本的权值设置为: 这种基于判别器置信度的实例选择策略允许诊断模型优先考虑相关度高的故障样本,有效降低可能导致负迁移的异常值的影响。在纳入损失函数之前,这些权重通过min-max尺度进行归一化,以保持稳定性并防止极值扭曲适应过程。在获得所有源故障样本的权值后,通过min-max尺度将每个权值 归一化,以保持稳定性并防止适应过程中的极值扭曲影响: 其中, , 。易迁移的故障样本在自适应过程中会产生更显著的影响,而具有较大分布差异故障样本的知识负迁移得到缓解,修正后的判别器损失 计算为: 通过强调领域不变的故障样本,ISM不仅使模型更加关注易于迁移的故障特征,而且提高了模型在不同工况下的整体自适应性能。因此,实例选择机制是减少负迁移和实现鲁棒跨域故障诊断的关键组成部分。3.2 域无关参数学习DAPs常用的UDA诊断方法在域不变故障特征学习中往往忽略了特定于域的故障信息,降低了模型的诊断精度和泛化能力。因此,本节旨在在参数级别减轻特定领域故障信息对迁移诊断模型的不利影响。直观地说,可训练参数对域不变信息学习的影响可以反映在域自适应过程中的损失函数中。利用有无某一参数时计算的损失函数的差值来衡量其可迁移性,可表示为: 其中, 是除第 个值为1之外的全零向量,⊙表示Hadamard积。然而,计算每个 并确定其每个参数的可迁移性的成本过高。鉴于参数的现有陈述在我们的假设中只能是可迁移的或不可迁移的, 用于表示一个参数 是领域无关的 还是特定于领域的 ,因此,可以从 相对于 的导数中推断出 的近似,并且可以将识别准则修改为 其中, 将结果乘以一个权重向量 ,并且, 表示接收 作为输入的神经元的初始激活,即 。 是某一参数对应的梯度。识别出的 值较高的参数被视为与领域无关的参数,其余的 值较低的参数被视为与领域相关的参数。DAPs比率在不同的数据分布中有所不同。域差异程度越高,表明域不变信息越少,域无关参数越少,因此采用代理 -distance来确定DAPs比值。给定两个经验分布 和 ,二值分类器 的代理 -distance可以表示为: 其中, 为 区分故障样本是来自源域还是目标域的任务误差。相应地,整个HSAN中域无关参数的比例计算公式为: 其中, 的值从0到1,这是 的下限边界。较大 的意味着较少的域不变故障信息,即较小的 ,反之亦然。因此,特征提取器、分类器和域判别器的DAPs数可以定义为: 3.3 总体优化目标HSAN的总体优化目标包括 和一个利用可迁移样本改进的。此外,利用实现条件分布对齐,辅助实例级自适应。优化HSAN的最终目标如下: 其中, 和 为平衡系数,并且 。 是当前训练轮次。 和 分别为系数上限和变化率。 采用不同更新规则的SGD算法对HSAN进行优化。对不同模块的域无关参数执行正更新规则: 其中, 为学习率。对于可迁移性较低的特定领域参数实施负更新规则,定义为: 其中, 表示模块的领域特定参数。4 实验结果分析4.1 数据集描述JNU数据集:JNU数据集在电机转速分别为600、800和1000 r/min的情况下采集。JNU诊断平台如图5所示。轴承的四种不同健康状态分别是正常(NA)、内圈故障(IF)、外圈故障(OF)和滚珠故障(BF)。通过三个域(J0、J1和J2)以相应的速度构造6个不同的迁移故障诊断任务。HUST数据集:如图5所示,HUST数据集具有正常(N)、严重内故障(SIF)、严重外故障(SOF)、严重滚珠故障(SBF)和严重复合故障(SCF)五种轴承健康状态。选取3900、4200、4500、4800 r/min 4个转速条件作为不同的域(H0、H1、H2、H3),构建12个迁移诊断任务。 图5 JNU和HUST诊断平台图图6 真实诊断平台诊断平台图真实诊断平台:使用真实故障诊断试验台构建真实的诊断实验。图6描绘了实验平台和四种类型的故障轴承,包括内部故障、外部故障、滚珠故障和内外套圈故障组合的复合故障。根据800、1200、1600、2000、2400 r/min 5个转速,我们分别定义了5个域,分别为:P0、P1、P2、P3、P4。因此,构建了20个验证HSAN性能的迁移任务。4.2 JNU数据集结果分析4.2.1 特征可视化如图7所示,随机选取迁移诊断任务J1→J0作为典例,利用t-SNE技术在二维空间中投影故障特征。可以清楚地看到,两个域的每个轴承健康状态类别提取的故障特征在HSAN中聚类效果较好,图7(a)-(f)的重叠区域多于(g)和(h)。然而,这些类别的故障特征仍然被图7(h)混淆。在HSAN的可视化结果中,不同域的故障特征得到了最好的对齐,不同类型的故障之间有明显的区分。总体而言,可视化结果表明HSAN比其他方法实现了最佳特征边缘和条件分布对齐。图7 JNU数据集特征分类结果可视化4.2.2 混淆矩阵结果评估为了进一步验证HSAN的诊断性能,J1→J0任务的所有方法的混淆矩阵如图8所示。值得注意的是,尽管TPC在TB类别中略显优势,但HSAN在其余故障类别中表现出无与伦比的性能,从而实现了其在故障诊断精度方面的整体优势。HSAN的优越性能可归功于其双视角对齐,通过丰富模型在不同工况下的泛化能力来增强故障识别能力。图8 JNU数据集混淆矩阵结果可视化4.2.3 可迁移故障样本可视化分析本小节旨在从信号的角度验证所设计的ISM的有效性。在JNU数据集上随机选择不同的故障类型,即任务J1→J0中的IF和OF,任务J0→J2中的IF和BF,其中ISM计算的故障样本权值及其对应的原始振动信号如图9所示。以第一行的5个时域图为例,权重较高的0.97和0.92的故障样本与锚定目标样本极为相似。这对故障知识迁移会有帮助。相比之下,只有0.73低权重的故障样本与目标样本不同,它只有两个突出的波峰。因此,所提出的ISM能够识别具有高可迁移性的源故障样本,并根据其显著性分配权重。同样,其余三行的图表也显示了上述结果,验证了ISM的优越性。图9 JNU数据集不同权重样本时域图4.3 HUST数据集结果分析4.3.1 诊断结果评估表1说明了在HUST数据集上验证的详细诊断结果。可见,HSAN的诊断准确率最高,为97.12%。除此之外,TPC在五个任务上实现了最佳性能,但其平均准确率比HSAN低5%。同时,可以发现HSAN不仅具有较强的故障诊断能力,而且稳定性最强,其平均标准差在1.8%以下,而其他方法的平均值在3.24% ~ 7.09%之间。同时,由于领域特定信息的负面影响,比较方法的相对较高的标准差和较差的性能突出了它们在不同工作条件下的适应和泛化能力的潜在差距。表1 HUST数据集诊断结果4.3.2 特征可视化HUST数据集上的三维t-SNE可视化结果如图10所示。由图10(a)-(e),与(f)、(g)和(h)相比可以看出,这五种方法显示出更高的特征重叠程度。结果表明,HSAN不仅确保了更好的特征对齐,而且在不同故障类别之间实现了最优的类判别性。表明实例级和参数级对齐策略的有效性。图10 HUST数据集不同权重样本时域图4.3.3 域无关参数比值影响分析为了验证我们设计的DAPs比值确定方法的有效性,我们随机选取四个迁移诊断任务作为示例。如图11所示,在所有情况下,我们设计的方法比任何其他预定义的固定比率获得更好的诊断准确性。在自动计算DAPs比值的情况下,我们的HSAN可以更好地利用域不变故障信息,减轻域特定故障信息的负面影响,从而达到最佳的诊断性能。由于当比率是预定义值时,模型通过使用一些未删除的特定于领域的参数来进行领域适应,导致严重的负迁移。因此,DAPs比值的自适应测定是必要和有效的。图11 HUST数据集不同DAPs比值结果4.4 消融实验和实际诊断平台结果分析4.4.1 诊断结果评估比较诊断结果,包括我们的HSAN和7种比较方法在PT500实际故障诊断试验台上显示在表2中。HSAN在最高的诊断准确性方面表现出卓越的性能。此外,TPC和MMSD分别在5个任务和1个任务中表现最佳,但它们的平均准确率比HSAN落后6%以上。HSAN的平均标准差仅为1.32%,其余对比方法均达到2%以上,反映了HSAN性能稳定。表2 实际诊断平台诊断结果4.4.2 消融实验为了进一步验证HSAN中每个组成部分的作用,在图12中对三个数据集进行了消融研究。首先,从HSAN中去除DAPs学习用于模型训练,记为DA-ISM。与HSAN相比,DA-ISM的分类准确率在3个数据集中分别下降到93.15%、89.49%和84.94%,说明DAPs的不可或缺。此外,DA-DAPs是通过将ISM从HSAN中分离出来而构建的,其精度分别降低到93.79%、89.27%和85.98%。此外,同时去除实例级和参数级机制后,平均准确率分别降至91.72%、87.11%和78.00%。因此,ISM和DAPs对于提高HSAN的精度和稳定性至关重要。以上分析表明,本文提出的双视角对齐在域自适应过程中发挥了重要的作用,极大地提升了迁移诊断性能。图12 三个数据集上的消融实验4.4.3 域无关参数范围影响分析本章节分别研究了DAPs在提取器、分类器和判别器三个模块中的作用。表3给出了不同DAPs范围下HSAN在四个随机选择的迁移任务上的诊断性能。与没有任何DAPs的HSAN相比,在三种情况下,DAPs学习只应用于三个模块其中一种,分别提高了18%、14%和11%的准确率。此外,从HSAN中分别去除三个模块上的DAPs的性能下降幅度很大,下降范围从4%到6%,这表明在HSAN的三个模块中考虑所有领域无关参数的重要性。表3 实际诊断平台不同DAPs范围影响具体来说,以P4→P0任务为例,在不考虑任何模块的DAPs的情况下,平均准确率只有33.38%。极低的准确率结果表明,诊断模型几乎无法提取出任何域不变的故障特征。在这种情况下,一旦将DAPs学习应用于,那么DAPs将大大提高的域不变特征提取能力,这体现在准确率的显著提高上。然而,当DAPs应用于和时,领域不变特征提取得到了改善,但仍然有限,导致特定于领域的特征被高置信度错误分类,降低了准确性。同样,通过对抗训练将DAPs应用于和提升特征可判别性,但的提取能力较弱,会放大错误的判别结果,在没有应用DAPs的时候进一步降低分类的准确性。而对于应用于所有三个模块的DAPs,它们的协同作用增强了域不变特征提取,提高了故障分类的准确性,并改进了特征的可迁移性和可判别性。这种协作平衡了特征提取、分类和自适应,从而提高了诊断性能。5 结论本文提出了一种新型层次化选择性对抗网络HSAN,该网络通过实例级和参数级的双视角对齐来提高迁移诊断性能。在HSAN中,设计了实例选择机制,根据源故障样本的重要性自适应识别可迁移的源故障样本,有效抑制负迁移影响。此外,我们开发了一个参数识别准则来区分域无关参数和域特定参数,并利用不同的参数更新规则来减轻领域特定故障信息的不利影响。在两个公共故障诊断数据集和一个实际轴承故障诊断试验台上进行了全面的迁移诊断实验分析,充分验证了HSAN的优越性。通过双视角对齐机制,可以清楚地得出HSAN比其他先进的方法具有更令人满意的诊断性能和稳定性。 编辑:曹希铭校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、Tina、陈宇航、海洋、陈莹洁、王金、赵诚、肖鑫鑫该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈