近年来,机器学习(ML)方法,如卷积神经网络(CNN)[2]、多层感知器[3]和支持向量机(SVM)[4],已被用于故障诊断,依赖于安装在旋转机械上的传感器收集的大量数据。然而,在仅有正常状态数据的少数故障诊断案例中,由于缺乏故障样本和待测旋转机械的个体差异,上述方法受到影响,导致难以构建机械的个体模型,导致诊断精度较低。领域自适应(domain adaptation,DA)[5]被认为是解决少样本问题的有效方法。对于机械故障诊断,待测机器的正常样本和未知状态样本的 集 合构成目标域。另一台机器的各种状态的样本集构成了源域。Sand等人[6]使用了迁移分量分析和适应决策边界的支持向量机进行冷却机故障诊断,通过非线性转换最小化了源域和目标域之间的特征差异。Singh和Verma [7]通过将最小冗余性最大相关性(MRMR)和迁移学习与深度学习模型相结合,减少了模型训练对目标域故障数据的依赖性,以实现不同数据集之间的诊断迁移。Wan等人[8]提出了一种基于深度卷积多对抗DA方法的轴承诊断模型,该模型使用多域鉴别器来调整源域和目标域的边缘分布和条件分布,以实现轴承的故障诊断。然而,现有的故障诊断方法在实际应用中需要目标域故障数据来实现诊断模型的构建,并且在仅有正常状态数据的少样本情况下,由于缺乏目标域故障样本,诊断精度往往较低。
样本生成被认为是目标域缺失故障样本的可行解决方案。Chandra和Sekhar [9]采用有限元分析方法对转子轴承系统启动阶段的故障样本进行了模拟,并通过模拟试验完成了样本生成模型中的关键参数。Song等人[10]基于有限元方法建立了机械故障仿真模型,并利用仿真数据进行了诊断模型训练。上述数据生成模型是基于大量真实故障数据或在简化条件下建立的,而不考虑机器的实际运行状态和包含其自身特征的个体特征。因此,工程应用中的诊断准确性需要提高。为了解决机器个体特征提取的问题,Bo等人[11]提出了一种基于机理特征生成模型(MCGM)的诊断方法,该模型结合了故障机理和机器个体特征来生成个性化的虚拟故障样本,然而,在MCGM中反映机器故障状态的公共参数是基于经验设定的,容易受到人为因素的影响。Yu等人[12]提出了基于MCGM方法的领域自适应故障诊断(DA-MCGM),并使用Dirichlet过程高斯混合模型(DPGMM)来估计MCGM分布中公共参数的分布。然而,参数分布方法缺乏理论基础,也没有经过其他分布模型的验证。此外,各种类型故障的公共参数的代表性还需要进一步验证。
GAN由Goodfellow [13]于2014年提出。由于其拟合真实数据分布的出色能力,GANs在数据扩充和辅助解释方面极具应用前景。Tran等人[14]使用GAN来学习图像数据的原始分布,以实现自然图像和医学图像的样本增强。左等人[15]通过GAN拟合高维和低维数据空间中的数据特征分布,实现了图像样本的生成。郭等人[16]提出了多标签一维生成对抗网络来实现真实损伤数据的生成,解决了由于缺乏真实标签故障数据而导致诊断模型难以构建的问题。
这篇文章基于文献[12],通过对旋转机械设备的故障机理对共同特征进行改进,提升了共同特征的代表性。同时,提出了共同特征分布模型,并将降噪处理应用于测量信号中,以提高对微弱故障的诊断效果。本文提出的基于CNN的旋转机械故障智能诊断方法,该方法集成了基于GAN的MCGM生成的虚拟样本(MCGM-CNN)。目标域的故障样本是通过将公共参数与源域故障数据的GAN学到的分布模式以及基于MCGM的目标域正常数据相结合生成的。最后,利用正常状态样本和CNN生成的虚拟故障样本构建故障诊断模型。这篇文章的贡献可以总结如下。
1)旋转机械的领域自适应:领域自适应(domain adaptation,DA)是一种迁移学习方法,从源域学习知识,并将其应用于不同但相关的目标域,以实现跨域分类任务[5]。对于旋转机械的故障诊断,本文将每个状态都有足够数据的样本空间视为源域,将待测设备的正常状态和未知状态数据组成的样本集设置为目标域。
2)MCGM原理:对于以信号为基础的机械设备状态描述系统,机械的故障状态具有个体特征和共同特征。例如,初始不平衡、初始错位和背景噪声都是旋转机械的个体特征,由机器故障引起的信号特征是旋转机械的共同特征,并体现在故障部件的故障特征频率上。
3)生成对抗网络:GAN模型基于博弈论的思想,由生成器和鉴别器组成。生成器学习真实数据的分布模式以生成新的样本。鉴别器识别输入是真实样本还是生成样本,生成器和鉴别器通过对抗学习不断改进,当鉴别器无法识别输入样本的真实性或虚假性时,可以认为生成器学习了真实数据的分布规律。生成器 G 和判别器 D 的层数设置较少,以实现快速学习特征分布,同时避免过度拟合。的层数,以实现快速学习特征分布,同时避免过度拟合。GAN 网络的结构参数见表1。
表1 GAN的网络结构参数
4)样本生成:当轴承、齿轮和轴等机械的旋转部件发生故障时,通常会产生激励源,从而在机器旋转过程中产生周期性的激励信号。它在频谱中表现为一个特定的频率分量,即故障频率。以滚动轴承内圈故障为例,在无噪声干扰的理想情况下,在分析故障机理及其理论频域分布的基础上,讨论了所提出的方法,如图1所示。其中存在内圈缺陷频率,伴随着左侧和右侧的边带。上述三个频率及其谐波是轴承内圈故障频域的组成部分。基于以上三个与故障类别相关的频率分量,提出了两个公共参数来重新反映不同故障对应的频率分布。轴承内圈失效MCGM中的两个公共参数简述如下:1)主频率与基准频率的幅值比如图1的α所示。2)主旁频率幅值比如图1中的
图1 轴承内圈故障频率图
GAN通过生成器G针对鉴别器D获得鉴别器D无法区分为真或假的新样本。通过使用GAN训练鉴别器,可以基于源域公共参数获得公共参数分布模型,以实现公共参数的扩展。在MCGM的指导下,结合源域生成目标域中的大量虚拟故障样本,以实现在少数故障诊断案例中构建旋转机械诊断模型。故障虚拟样本生成的流程图如图2所示。
1)公共参数提取:RSSD[20]用于对信号进行去噪,并进行包络频谱分析,得到信号包络频谱波形。根据故障机理确定了反映整体特征的
2)公共参数的分布模型:公共参数
3)样本生成:利用旋转机械的故障机理和相应部件的结构尺寸信息,获得不同故障的理论故障频率,并根据故障类型依次训练每种类型,生成个性化样本。
图2 样本生成流程图
1)卷积神经网络:CNN通过计算新数据与每个类别的已知数据之间的相似概率来确定新数据的类别。典型的CNN由卷积层(Conv)、池层(Pool)、全连接层(FC)和SoftMax(SM)分类器组成。CNN中的第l层是卷积层,第l-1层的输出与卷积核进行卷积,结果输入到激活函数中进行处理,得到第l层的特征图。
2)故障诊断模型构建:基于虚拟样本和CNN的故障诊断模型的构建流程如图3所示。
图3 模型构建和故障诊断的流程图
基于目标域正常数据集和源域故障信号,使用上述方法生成目标域故障虚拟样本。由于CNN具有强大的特征提取和分类能力,因此使用故障虚拟样本和正常状态样本来训练CNN,以获得目标域故障诊断模型。考虑到每个故障的样本长度和特征频率值,为了确保快速准确地提取故障特征,基于CNN的故障诊断模型的参数设置如表2所示,训练期间训练集与测试集的比例为7:3。
注:原论文在有具体公式细节,如有需要可下载原论文查看。
轴承故障模拟试验台数据集、离心泵试验台数据、机车空载运行试验台数据和公共数据集用于验证所提出的MCGM-CNN对轴承故障的性能。实验采用Python3.7语言和PyTorch1.6ML框架,计算机操作系统安装在Windows10上。
1)故障模拟试验台数据集A:数据集A是从论文作者课题组的旋转机械故障模拟试验台中收集的。结构如图4所示,由电机、减速箱和轴承组成。故障轴承处的E048211振动传感器用于收集每组实验的振动信号。通过线切割在不同轴承的内圈和外圈的接触表面上加工出多个凹槽。处理缺陷如图5所示。
图4 旋转机械故障模拟试验台
图5 用于数据集A的故障轴承(a)外圈故障(b)内圈故障
为了保证高频信息的保留和避免频率混叠,根据采样定理,采样频率设置为25.6 kHz,采样点数量设置为16384,以确保频率分辨率并提高计算效率[27]。
2)离心泵数据B和C:数据集B和C收集自离心泵试验台,试验台主要由电机、离心泵、管道和水箱组成,其结构如图6所示
图6 离心泵试验台
离心泵来自SULZER,型号为APP11-32,与所用工业领域相同。传感器型号和采样设置与数据集A中的相同。通过线切割工艺获得的缺陷轴承如图7所示。
图7 用于数据集B和C的故障轴承 (a)外圈故障 (b)内圈故障
3)机车空载运行试验台数据集D:数据集D是从机车维修厂的空载运行试验台中收集的。空载运行试验是指机车车轮在装载前空转,以确定其是否满足装载要求。运行测试期间的采样频率和采样点数量设置与故障模拟测试相同。测试台和传感器布置如图8所示。
图8空载运行试验台的基本结构和测点布置
4)公共承载数据集E:MFPT公共数据集的数据是一段连续数据。因此,使用重叠采样方法对数据进行分割,以获得多组数据。采样频率和采样点设置为48.828 kHz,所有N、ORF和IRF状态的样本组数量设置为2016 [12]。
所提出方法的应用前提是目标域的状态标签是源域状态标签的子集。基于这一前提,由A、B、C和E数据集作为源域数据组成,以验证MCGM-CNN方法。在每个诊断任务中,用于训练诊断模型的故障数据是基于源域故障状态数据和目标域正常状态数据生成的个性化故障虚拟样本,测试样本是目标域的真实故障数据。对于每个诊断任务,目标域中80%的正常状态数据用于模型训练,并且每个故障的虚拟故障样本数量设置为与正常状态数据相同,以避免样本不平衡。
以数据集A为例,计算了内圈和外圈故障的真实公共参数
图9 数据集A 的公共参数分布
从图9所示公共参数分布的比较可以看出,不同故障之间的公共参数分布存在显著差异,每个典型的数学分布也存在差异。通过GAN训练获得的公共参数分布与真实参数分布相似。以诊断任务A→B为例,基于数据集B的常用参数和正常状态数据,生成的数据集B虚拟故障样本和真实故障样本如图10所示。
图10 故障真实样本和生成样本 a)内圈故障 b)外圈故障
比较图10所示的结果可以发现,生成的样本的频率分布与真实样本相似,并且生成的样本在有效保留旋转频率等个体特征的同时,在故障频率方面更加突出。
以诊断任务A→B为例,CNN生成的故障虚拟样本和真实故障样本特征的t-SNE图如图11所示。从t-SNE图中可以看出,生成的样本和真实样本的特征聚类结果相似,这进一步证明了所提出的样本生成模型的有效性。采用五次交叉验证来测试MCGM CNN方法,表3中给出了16个诊断任务的准确性。
图11 通过任务A→B中的t-SNE实现特征可视化
表3 五次交叉实验的诊断准确率(%)表4 具有不同公共参数分布的模型的准确性(%)
表3中的结果表明,MCGM-CNN方法可以准确识别每个故障,平均准确率达到93.38%。与其他诊断任务相比,诊断任务B、C和C的准确性更高,因为B和C的数据来自同一设备,并且源域和目标域之间的相似性更高。MCGM-CNN方法在不同数据集作为源域数据的情况下实现了高准确率,这也表明MCGM-CNN可以实现对不同转速和不同缺陷尺寸的故障进行准确识别。下面将根据共同参数分布的影响以及在不同样本数量和比较方法下是否使用RSSD进行实验结果分析。
1) 公共参数分布模型的比较分析:为了进一步验证MCGM-CNN方法生成公共参数的准确性,分别使用DPGMM、T分布、x2-分布和F-分布模型来拟合16个诊断任务的公共参数分布。将上述各分布模型的诊断精度与MCGM-CNN方法中使用GAN拟合的计算结果进行比较。诊断结果如表4所示。
从表4中给出的结果可以看出,不同的公共参数分布模型对诊断精度的影响存在明显差异,这进一步说明了公共参数的分布是实现故障DA-MCGM的关键之一。与使用单个数学模型的参数估计方法相比,GAN在不依赖先验经验的情况下自动拟合数据分布,提高了参数拟合的准确性。因此,在每个诊断任务中,基于GAN的公共参数分布模型的平均精度高于其他模型。
2) 不同样本数下有无RSSD的比较分析:为了研究缺陷样本数对诊断模型的影响,使用不同数量的样本来训练诊断模型。此外,为了分析RSSD对非周期性噪声的降噪效果,比较了使用和不使用RSSD训练的MCGM CNN方法的识别精度。以诊断任务A→B和C→B为例,不同样本数的平均识别精度如图12所示。从图12所示的结果可以看出,当样本数量太少时,每个诊断任务的准确性都很低。随着样本数量的增加,诊断准确率呈上升趋势。对于所提出的方法,当样本量达到250组时,精度趋于稳定。从图12中还可以发现,添加RSSD后的诊断精度总体上高于不添加RSSD时的诊断精度,当样本数量较低时,基于RSSD的诊断精度提高尤其明显。随着样本数量的增加,准确率的差异变得更小。可以证明,RSSD可以减少噪声信号对诊断结果的影响,也保证了微弱故障的识别。同时,比较结果表明,RSSD可以降低建立诊断模型对训练样本数量的要求。
3)比较分析:为了进一步验证MCGM-CNN的有效性,将分析结果与其他五种基于DA的诊断方法进行了比较,包括DA-MCGM [12]、测地线流核GFK [28]、域自适应神经网络(DaNN)[29]、深度感知对抗域自适应(DPADA)[30]和故障属性条件生成对抗网络(FACGAN)[31]。为了进一步验证所提出的公共参数的有效性,使用GAN来估计DA-MCGM中描述的公共参数,该模型被定义为GAN-DA-MCGM。使用与MCGM-CNN相同的网络结构参数的CNN模型的诊断准确率作为比较基准,以验证基于迁移学习的所提方法的有效性。同时,为了验证所提方法中诊断网络结构的可靠性,将MCGM-CNN中的CNN替换为深度神经网络(DNN)[32]。每种方法的描述和十六项诊断任务的结果显示在表和图13中。
图13 试验结果准确性比较
MCGM-CNN基于故障机理确定机器故障发生的频率分量,并通过学习频率公共参数的分布以及将其与包含个体特征的正常状态数据相结合来生成个性化的故障样本。与其他在不考虑故障机理的情况下针对少镜头诊断问题的迁移诊断方法相比,MCGM-CNN提高了迁移学习的效率,实现了潜在信息的充分利用。此外,MCGM-CNN根据设备结构和故障机理确定不同速度下的故障频率,从而在可变工作条件下具有良好的迁移能力。RSSD通过减少非周期性信号对故障信号的干扰,使故障特征频率更加突出,进一步提高了准确性,保证了早期故障识别的诊断准确性。
图14 数据集D的外圈故障数据的包络谱
以数据集D为例,分析了所提出的方法对工业场景的诊断有效性,如图14所示。
外圈故障的大部分数据包络谱如图16(a)所示,具有显著的外圈故障频率和谐波频率。如图16(b)和(c)所示,也有相当一部分信号具有复杂的信号频率分量和电感特性频率。可以看出,在存在转速波动的情况下,使用数据集A、B、C和E作为源域,数据集D作为目标域,MCGM-CNN仍然可以实现92.58%的平均诊断准确率。所提出的方法通过学习每个故障频率的分布模式来实现诊断模型的构建,而不是只关注频率值。因此,当频率存在偏差时,它仍然可以在工业应用中表现良好。MCGM-CNN通过在理论缺陷频率附近设置随机采样点并添加公共参数,减少了速度波动对诊断结果的影响。上述结果表明,MCGM-CNN可以在少量应用情况下实现旋转机械的智能诊断。