论文学习 | 第13篇-SCI一区-基于新型 MCGM 的 CNN 旋转机械少样本故障诊断方法

13天前浏览2052

本篇论文是针对在实际工程中存在的故障数据不足而开展的研究，因为机械设备通常在正常工作条件下运行，由于只有正常数据可用，诊断模型的构建通常难以实现，这实际上是一种少样本故障诊断问题。因此提出了一种少样本旋转机械新的智能故障诊断方法。适合于深度学习、迁移学习、故障诊断、生成对抗网络研究领域者学习者。

1 论文基本信息

论文题目：Few-Shot Fault Diagnosis Method of Rotating Machinery Using Novel MCGM Based CNN
论文期刊：Transactions on Industrial Informatics
DOI：10.1109/TII.2023.3242813
论文时间：2023年
作者：Gongye Yu(1); Peng Wu(1); Zhe Lv(2); Jijie Hou(1); Bo Ma(1); Yongming Han(3)
机构:
1 Beijing Univ Chem Technol, Coll Mech & Elect Engn, Beijing 100029, Peoples R China
2 714 Res Inst CSSC, Beijing 100101,Peoples R Chinaarrow_drop_down
3 Beijing Univ Chem Technol, Coll Informat Sci & Technol, Beijing 100029, Peoples R China

2 摘要

现有的故障诊断方法在各种状态的故障数据可用时能取得良好的结果。然而，在实际应用中，由于只有正常数据可用，诊断模型的构建通常难以实现，这实际上是一种少样本故障诊断问题。因此，提出了一种基于卷积神经网络（CNN）的少样本旋转机械新的智能故障诊断方法，该方法利用由机理特征生成模型（ Mechanism character generative model，MCGM）生成的虚拟样本与生成对抗性网络（GAN）相结合。利用GAN和源域故障数据学习反映故障类别的共同参数的分布模式。然后，将目标域的正常状态数据与学习到的共同参数分布结合起来，基于MCGM在目标域生成虚拟样本。此外，基于CNN使用虚拟样本训练故障诊断模型。最后，分别利用实验室轴承数据、工业数据和旋转机械的公共数据验证了所提出的故障诊断方法。结果表明，所提出的方法在诊断任务中实现了93.38%的平均准确率，比其他对比方法至少提高了4.56%的性能。

关键词：领域自适应；故障诊断；故障机理；生成对抗网络；旋转机械；虚拟样本

3 目录

1 论文基本信息

2 摘要

3 目录

4 引言

5 所提出MCGM-CNN方法

5.1 基于MCGM的虚拟样本生成

5.2 基于CNN的故障诊断模型训练

6 实验验证与分析

6.1 数据集描述

6.2 实验验证

6.3 实验分析

7 结论

注：小编能力有限，如有翻译不恰之处，请多多指正~

若想进一步拜读，请下载原论文进行细读。

4 引言

旋转机械在现代工业系统中起着至关重要的作用，旋转机械的健康状况直接影响整个机械系统[1]的可靠性。旋转部件发生故障会威胁到生产安全，因此对旋转机械进行故障诊断对于保证机械的稳定运行和人员安全具有重要意义。随着工业4.0的到来，传统工业正在向自动化、数字化和智能化转型，这使得对旋转机械智能故障诊断的需求更加迫切。

近年来，机器学习（ML）方法，如卷积神经网络（CNN）[2]、多层感知器[3]和支持向量机（SVM）[4]，已被用于故障诊断，依赖于安装在旋转机械上的传感器收集的大量数据。然而，在仅有正常状态数据的少数故障诊断案例中，由于缺乏故障样本和待测旋转机械的个体差异，上述方法受到影响，导致难以构建机械的个体模型，导致诊断精度较低。领域自适应（domain adaptation，DA）[5]被认为是解决少样本问题的有效方法。对于机械故障诊断，待测机器的正常样本和未知状态样本的集合构成目标域。另一台机器的各种状态的样本集构成了源域。Sand等人[6]使用了迁移分量分析和适应决策边界的支持向量机进行冷却机故障诊断，通过非线性转换最小化了源域和目标域之间的特征差异。Singh和Verma [7]通过将最小冗余性最大相关性（MRMR）和迁移学习与深度学习模型相结合，减少了模型训练对目标域故障数据的依赖性，以实现不同数据集之间的诊断迁移。Wan等人[8]提出了一种基于深度卷积多对抗DA方法的轴承诊断模型，该模型使用多域鉴别器来调整源域和目标域的边缘分布和条件分布，以实现轴承的故障诊断。然而，现有的故障诊断方法在实际应用中需要目标域故障数据来实现诊断模型的构建，并且在仅有正常状态数据的少样本情况下，由于缺乏目标域故障样本，诊断精度往往较低。

样本生成被认为是目标域缺失故障样本的可行解决方案。Chandra和Sekhar [9]采用有限元分析方法对转子轴承系统启动阶段的故障样本进行了模拟，并通过模拟试验完成了样本生成模型中的关键参数。Song等人[10]基于有限元方法建立了机械故障仿真模型，并利用仿真数据进行了诊断模型训练。上述数据生成模型是基于大量真实故障数据或在简化条件下建立的，而不考虑机器的实际运行状态和包含其自身特征的个体特征。因此，工程应用中的诊断准确性需要提高。为了解决机器个体特征提取的问题，Bo等人[11]提出了一种基于机理特征生成模型（MCGM）的诊断方法，该模型结合了故障机理和机器个体特征来生成个性化的虚拟故障样本，然而，在MCGM中反映机器故障状态的公共参数是基于经验设定的，容易受到人为因素的影响。Yu等人[12]提出了基于MCGM方法的领域自适应故障诊断（DA-MCGM），并使用Dirichlet过程高斯混合模型（DPGMM）来估计MCGM分布中公共参数的分布。然而，参数分布方法缺乏理论基础，也没有经过其他分布模型的验证。此外，各种类型故障的公共参数的代表性还需要进一步验证。

GAN由Goodfellow [13]于2014年提出。由于其拟合真实数据分布的出色能力，GANs在数据扩充和辅助解释方面极具应用前景。Tran等人[14]使用GAN来学习图像数据的原始分布，以实现自然图像和医学图像的样本增强。左等人[15]通过GAN拟合高维和低维数据空间中的数据特征分布，实现了图像样本的生成。郭等人[16]提出了多标签一维生成对抗网络来实现真实损伤数据的生成，解决了由于缺乏真实标签故障数据而导致诊断模型难以构建的问题。

这篇文章基于文献[12]，通过对旋转机械设备的故障机理对共同特征进行改进，提升了共同特征的代表性。同时，提出了共同特征分布模型，并将降噪处理应用于测量信号中，以提高对微弱故障的诊断效果。本文提出的基于CNN的旋转机械故障智能诊断方法，该方法集成了基于GAN的MCGM生成的虚拟样本(MCGM-CNN)。目标域的故障样本是通过将公共参数与源域故障数据的GAN学到的分布模式以及基于MCGM的目标域正常数据相结合生成的。最后，利用正常状态样本和CNN生成的虚拟故障样本构建故障诊断模型。这篇文章的贡献可以总结如下。

1）提出了可以反映故障类别的公共参数。使用GAN构建公共参数的分布模型，以提高生成样本的可靠性。
2）在目标域仅有正常状态数据的少样本情况下，提出了基于GAN的MCGM的虚拟样本生成方法。
3）通过实验室数据、工业数据和旋转机械的公共数据验证了MCGM-CNN方法的诊断效果。

5 所提出MCGM-CNN方法

5.1 基于MCGM的虚拟样本生成

1）旋转机械的领域自适应：领域自适应（domain adaptation，DA）是一种迁移学习方法，从源域学习知识，并将其应用于不同但相关的目标域，以实现跨域分类任务[5]。对于旋转机械的故障诊断，本文将每个状态都有足够数据的样本空间视为源域，将待测设备的正常状态和未知状态数据组成的样本集设置为目标域。

2）MCGM原理：对于以信号为基础的机械设备状态描述系统，机械的故障状态具有个体特征和共同特征。例如，初始不平衡、初始错位和背景噪声都是旋转机械的个体特征，由机器故障引起的信号特征是旋转机械的共同特征，并体现在故障部件的故障特征频率上。

3）生成对抗网络：GAN模型基于博弈论的思想，由生成器和鉴别器组成。生成器学习真实数据的分布模式以生成新的样本。鉴别器识别输入是真实样本还是生成样本，生成器和鉴别器通过对抗学习不断改进，当鉴别器无法识别输入样本的真实性或虚假性时，可以认为生成器学习了真实数据的分布规律。生成器 G 和判别器 D 的层数设置较少，以实现快速学习特征分布，同时避免过度拟合。的层数，以实现快速学习特征分布，同时避免过度拟合。GAN 网络的结构参数见表1。

表1 GAN的网络结构参数

4）样本生成：当轴承、齿轮和轴等机械的旋转部件发生故障时，通常会产生激励源，从而在机器旋转过程中产生周期性的激励信号。它在频谱中表现为一个特定的频率分量，即故障频率。以滚动轴承内圈故障为例，在无噪声干扰的理想情况下，在分析故障机理及其理论频域分布的基础上，讨论了所提出的方法，如图1所示。其中存在内圈缺陷频率，伴随着左侧和右侧的边带。上述三个频率及其谐波是轴承内圈故障频域的组成部分。基于以上三个与故障类别相关的频率分量，提出了两个公共参数来重新反映不同故障对应的频率分布。轴承内圈失效MCGM中的两个公共参数简述如下：1）主频率与基准频率的幅值比如图1的α所示。2）主旁频率幅值比如图1中的和所示。

图1 轴承内圈故障频率图

GAN通过生成器G针对鉴别器D获得鉴别器D无法区分为真或假的新样本。通过使用GAN训练鉴别器，可以基于源域公共参数获得公共参数分布模型，以实现公共参数的扩展。在MCGM的指导下，结合源域生成目标域中的大量虚拟故障样本，以实现在少数故障诊断案例中构建旋转机械诊断模型。故障虚拟样本生成的流程图如图2所示。

1）公共参数提取：RSSD[20]用于对信号进行去噪，并进行包络频谱分析，得到信号包络频谱波形。根据故障机理确定了反映整体特征的，以及反映局部特征的和，它们被确定为公共参数。

2）公共参数的分布模型：公共参数，和用作GAN的输入数据，并训练公共参数分布模型。为了避免GAN中存在的梯度消失和梯度爆炸问题，训练过程分解了参数学习任务，并在训练中使用相同的参数训练样本。考虑到特征样本的长短，将生成器G和鉴别器D中的层数设置得较小以实现特征分布的快速学习同时避免过拟合。GAN网络的结构参数如表1所示。

3）样本生成：利用旋转机械的故障机理和相应部件的结构尺寸信息，获得不同故障的理论故障频率，并根据故障类型依次训练每种类型，生成个性化样本。

图2 样本生成流程图

5.2 基于CNN的故障诊断模型训练

1）卷积神经网络：CNN通过计算新数据与每个类别的已知数据之间的相似概率来确定新数据的类别。典型的CNN由卷积层（Conv）、池层（Pool）、全连接层（FC）和SoftMax（SM）分类器组成。CNN中的第l层是卷积层，第l-1层的输出与卷积核进行卷积，结果输入到激活函数中进行处理，得到第l层的特征图。

2）故障诊断模型构建：基于虚拟样本和CNN的故障诊断模型的构建流程如图3所示。

图3 模型构建和故障诊断的流程图

基于目标域正常数据集和源域故障信号，使用上述方法生成目标域故障虚拟样本。由于CNN具有强大的特征提取和分类能力，因此使用故障虚拟样本和正常状态样本来训练CNN，以获得目标域故障诊断模型。考虑到每个故障的样本长度和特征频率值，为了确保快速准确地提取故障特征，基于CNN的故障诊断模型的参数设置如表2所示，训练期间训练集与测试集的比例为7:3。

表2 基于CNN的故障诊断模型的参数设置

注：原论文在有具体公式细节，如有需要可下载原论文查看。

6 实验验证与分析

轴承故障模拟试验台数据集、离心泵试验台数据、机车空载运行试验台数据和公共数据集用于验证所提出的MCGM-CNN对轴承故障的性能。实验采用Python3.7语言和PyTorch1.6ML框架，计算机操作系统安装在Windows10上。

6.1数据集描述

1）故障模拟试验台数据集A：数据集A是从论文作者课题组的旋转机械故障模拟试验台中收集的。结构如图4所示，由电机、减速箱和轴承组成。故障轴承处的E048211振动传感器用于收集每组实验的振动信号。通过线切割在不同轴承的内圈和外圈的接触表面上加工出多个凹槽。处理缺陷如图5所示。

图4 旋转机械故障模拟试验台

图5 用于数据集A的故障轴承（a）外圈故障（b）内圈故障

为了保证高频信息的保留和避免频率混叠，根据采样定理，采样频率设置为25.6 kHz，采样点数量设置为16384，以确保频率分辨率并提高计算效率[27]。

2）离心泵数据B和C：数据集B和C收集自离心泵试验台，试验台主要由电机、离心泵、管道和水箱组成，其结构如图6所示

图6 离心泵试验台

离心泵来自SULZER，型号为APP11-32，与所用工业领域相同。传感器型号和采样设置与数据集A中的相同。通过线切割工艺获得的缺陷轴承如图7所示。

图7 用于数据集B和C的故障轴承（a）外圈故障（b）内圈故障

3）机车空载运行试验台数据集D：数据集D是从机车维修厂的空载运行试验台中收集的。空载运行试验是指机车车轮在装载前空转，以确定其是否满足装载要求。运行测试期间的采样频率和采样点数量设置与故障模拟测试相同。测试台和传感器布置如图8所示。

图8空载运行试验台的基本结构和测点布置

4）公共承载数据集E：MFPT公共数据集的数据是一段连续数据。因此，使用重叠采样方法对数据进行分割，以获得多组数据。采样频率和采样点设置为48.828 kHz，所有N、ORF和IRF状态的样本组数量设置为2016 [12]。

6.2 方法验证

所提出方法的应用前提是目标域的状态标签是源域状态标签的子集。基于这一前提，由A、B、C和E数据集作为源域数据组成，以验证MCGM-CNN方法。在每个诊断任务中，用于训练诊断模型的故障数据是基于源域故障状态数据和目标域正常状态数据生成的个性化故障虚拟样本，测试样本是目标域的真实故障数据。对于每个诊断任务，目标域中80%的正常状态数据用于模型训练，并且每个故障的虚拟故障样本数量设置为与正常状态数据相同，以避免样本不平衡。

以数据集A为例，计算了内圈和外圈故障的真实公共参数和，并基于GAN生成了它们的公共参数。提取的真实公共特征参数和生成的虚拟参数的比较如图9所示。

图9 数据集A 的公共参数分布

从图9所示公共参数分布的比较可以看出，不同故障之间的公共参数分布存在显著差异，每个典型的数学分布也存在差异。通过GAN训练获得的公共参数分布与真实参数分布相似。以诊断任务A→B为例，基于数据集B的常用参数和正常状态数据，生成的数据集B虚拟故障样本和真实故障样本如图10所示。

图10 故障真实样本和生成样本 a）内圈故障 b）外圈故障

比较图10所示的结果可以发现，生成的样本的频率分布与真实样本相似，并且生成的样本在有效保留旋转频率等个体特征的同时，在故障频率方面更加突出。

6.3 结果分析

以诊断任务A→B为例，CNN生成的故障虚拟样本和真实故障样本特征的t-SNE图如图11所示。从t-SNE图中可以看出，生成的样本和真实样本的特征聚类结果相似，这进一步证明了所提出的样本生成模型的有效性。采用五次交叉验证来测试MCGM CNN方法，表3中给出了16个诊断任务的准确性。

图11 通过任务A→B中的t-SNE实现特征可视化

表3 五次交叉实验的诊断准确率（%）表4 具有不同公共参数分布的模型的准确性（%）

表3中的结果表明，MCGM-CNN方法可以准确识别每个故障，平均准确率达到93.38%。与其他诊断任务相比，诊断任务B、C和C的准确性更高，因为B和C的数据来自同一设备，并且源域和目标域之间的相似性更高。MCGM-CNN方法在不同数据集作为源域数据的情况下实现了高准确率，这也表明MCGM-CNN可以实现对不同转速和不同缺陷尺寸的故障进行准确识别。下面将根据共同参数分布的影响以及在不同样本数量和比较方法下是否使用RSSD进行实验结果分析。

1）公共参数分布模型的比较分析：为了进一步验证MCGM-CNN方法生成公共参数的准确性，分别使用DPGMM、T分布、x2-分布和F-分布模型来拟合16个诊断任务的公共参数分布。将上述各分布模型的诊断精度与MCGM-CNN方法中使用GAN拟合的计算结果进行比较。诊断结果如表4所示。

从表4中给出的结果可以看出，不同的公共参数分布模型对诊断精度的影响存在明显差异，这进一步说明了公共参数的分布是实现故障DA-MCGM的关键之一。与使用单个数学模型的参数估计方法相比，GAN在不依赖先验经验的情况下自动拟合数据分布，提高了参数拟合的准确性。因此，在每个诊断任务中，基于GAN的公共参数分布模型的平均精度高于其他模型。

2）不同样本数下有无RSSD的比较分析：为了研究缺陷样本数对诊断模型的影响，使用不同数量的样本来训练诊断模型。此外，为了分析RSSD对非周期性噪声的降噪效果，比较了使用和不使用RSSD训练的MCGM CNN方法的识别精度。以诊断任务A→B和C→B为例，不同样本数的平均识别精度如图12所示。从图12所示的结果可以看出，当样本数量太少时，每个诊断任务的准确性都很低。随着样本数量的增加，诊断准确率呈上升趋势。对于所提出的方法，当样本量达到250组时，精度趋于稳定。从图12中还可以发现，添加RSSD后的诊断精度总体上高于不添加RSSD时的诊断精度，当样本数量较低时，基于RSSD的诊断精度提高尤其明显。随着样本数量的增加，准确率的差异变得更小。可以证明，RSSD可以减少噪声信号对诊断结果的影响，也保证了微弱故障的识别。同时，比较结果表明，RSSD可以降低建立诊断模型对训练样本数量的要求。

图12 不同数量的平均识别精度。

3）比较分析：为了进一步验证MCGM-CNN的有效性，将分析结果与其他五种基于DA的诊断方法进行了比较，包括DA-MCGM [12]、测地线流核GFK [28]、域自适应神经网络（DaNN）[29]、深度感知对抗域自适应（DPADA）[30]和故障属性条件生成对抗网络（FACGAN）[31]。为了进一步验证所提出的公共参数的有效性，使用GAN来估计DA-MCGM中描述的公共参数，该模型被定义为GAN-DA-MCGM。使用与MCGM-CNN相同的网络结构参数的CNN模型的诊断准确率作为比较基准，以验证基于迁移学习的所提方法的有效性。同时，为了验证所提方法中诊断网络结构的可靠性，将MCGM-CNN中的CNN替换为深度神经网络（DNN）[32]。每种方法的描述和十六项诊断任务的结果显示在表和图13中。

图13 试验结果准确性比较

从图13所示的结果中可以看出，MCGM-CNN获得了最高的平均准确率，与DA-MCGM相比，准确率提高了4.56%，后者在所有比较方法中诊断效果最好，也高于其他比较方法。与DA-MCGM相比，MCGM-CNN方法采用了更可靠的通用参数估计方法。与DAMCGM相比，GAN-DA-MCGM的精度提高了2.56%，进一步证明了通用参数能够更好地反映故障特征。此外，RSSD的引入进一步减少了噪声信号对故障信号的干扰，这导致了更高的诊断精度。与仅依靠数据驱动的域自适应方法的DPADA、FACGAN、GFK和DANN相比，MCGM-CNN集成了故障机理和每个状态的数据，更好地实现了潜在信息的利用。此外，目标域的正常状态数据和公共特征在MCGM-CNN中被组合以生成故障样本，随着生成的样本更接近真实样本，从而产生更好的诊断结果。使用与MCGM-CNN相同的训练样本来训练基于DNN的诊断模型，结果表明，与DNN相比，所提出的方法的准确率提高了5.84%，这证明了所提出的CNN的有效性。此外，每种比较方法的诊断准确性都高于CNN，表明了迁移诊断的有效性。

MCGM-CNN基于故障机理确定机器故障发生的频率分量，并通过学习频率公共参数的分布以及将其与包含个体特征的正常状态数据相结合来生成个性化的故障样本。与其他在不考虑故障机理的情况下针对少镜头诊断问题的迁移诊断方法相比，MCGM-CNN提高了迁移学习的效率，实现了潜在信息的充分利用。此外，MCGM-CNN根据设备结构和故障机理确定不同速度下的故障频率，从而在可变工作条件下具有良好的迁移能力。RSSD通过减少非周期性信号对故障信号的干扰，使故障特征频率更加突出，进一步提高了准确性，保证了早期故障识别的诊断准确性。

图14 数据集D的外圈故障数据的包络谱

以数据集D为例，分析了所提出的方法对工业场景的诊断有效性，如图14所示。

外圈故障的大部分数据包络谱如图16（a）所示，具有显著的外圈故障频率和谐波频率。如图16（b）和（c）所示，也有相当一部分信号具有复杂的信号频率分量和电感特性频率。可以看出，在存在转速波动的情况下，使用数据集A、B、C和E作为源域，数据集D作为目标域，MCGM-CNN仍然可以实现92.58%的平均诊断准确率。所提出的方法通过学习每个故障频率的分布模式来实现诊断模型的构建，而不是只关注频率值。因此，当频率存在偏差时，它仍然可以在工业应用中表现良好。MCGM-CNN通过在理论缺陷频率附近设置随机采样点并添加公共参数，减少了速度波动对诊断结果的影响。上述结果表明，MCGM-CNN可以在少量应用情况下实现旋转机械的智能诊断。

7 结论

针对旋转机械故障诊断模型在只有正常状态数据的情况下难以建立的问题，提出了MCGM-CNN方法来生成适用于待测设备的虚拟故障样本，并基于虚拟样本实现了诊断模型的构建。通过实验室数据、工业数据和公共数据验证了MCGM-CNN方法的有效性。每个诊断任务的诊断准确率达到93.38%，比现有的其他方法高4.56%。实验结果表明，所提出的公共参数可以重新拟合故障类别，并且通过GAN拟合公共参数的分布模型来确保生成样本的准确性。由于能够基于目标域的正常状态数据生成虚拟样本，所提出的结合公共参数和个体特征的样本生成方法对解决其他领域的少炮问题具有启示意义。同时，进一步证明了基于合理方法生成的虚拟样本可以取代真实样本，并为其他基于生成样本的分类问题解决提供指导。MCGM-CNN假设相同的故障发生在其他设备中，并且通过迁移生成模型来获取虚拟故障样本。因此，如何识别故障机理不明确的未知故障并更新诊断模型将是我们进一步工作的重点。

来源：故障诊断与python学习