故障诊断是当前工业设备领域的研究热点。本期推荐的这篇是迪肯大学博士研究生迪拉杰・纽帕内的文章,这篇文章聚焦数据驱动的机械故障诊断
,系统梳理了传统机器学习、深度学习、强化学习、迁移学习等方法的应用,分析了多个机械故障数据集的特征与应用,探讨了数据稀缺、模型泛化性等挑战,并提出了数据集优化、算法改进等未来研究方向。其核心价值在于弥补现有研究在 RL (Reinforcement Learning:强化学习)应用、多源数据融合等方面的空白,促进该领域的进一步发展。
由于文章篇幅过长,小编将分三次为大家翻译介绍这篇论文,第一篇推文阐述 MFD(Machinery Fault Diagnosis:机器故障诊断) 重要性,指传统方法不足,数据驱动方案兴起;介绍故障诊断类别与维护策略,点明现有综述缺陷;说明本综述方法、分类体系;探讨机械故障数据,包含类型、增强技术、数据集三个方面;最后阐述传统数据驱动方法及各自优缺点。
本篇推文将聚焦先进数据驱动方法,详解 DL(CNN、RNN 等)、RL、TL 在 MFD 的应用,DL 各模型处理不同数据与任务,RL 用于分类和架构搜索,TL 缓解数据与域差异问题,还提及异常检测等其他助力 MFD 的方法。
希望对大家的学习有所帮助,文章质量很高同时希望大家可以多多引用。
论文题目: Data-driven machinery fault diagnosis: A comprehensive review
论文期刊:Neurocomputing
Doi:https://doi.org/10.1016/j.neucom.2025.129588
a School of IT, Deakin University, WaurnPonds, Geelong, Victoria 3216, Australia
1 引言
1.1 研究背景
1.2 研究动机
1.3 文章结构
2 实施的方法论与开发的分类法论
3 机械设备故障数据(与分析)
3.1 数据类型与分析
3.2 数据增强
4 数据驱动方法
4.1 传统数据驱动方法
4.2 基于深度学习的数据驱动方法
4.3 基于强化学习的故障诊断
4.4 基于迁移学习的故障诊断
4.5 其他方法
5 挑战
5.1 数据相关挑战
5.2 旋转机械面临的挑战
6.3 现有方法面临的挑战
5.4 应用机器学习/深度学习算法面临的挑战
5.5 其他挑战
6 对未来研究者的建议
6.1 机械设备与数据集增强
6.2 算法开发
6.3 其他建议
7 未来展望
8 结论
尽管基于传统机器学习的技术在机械设备故障诊断中展现出潜力,但在复杂工业环境下的早期故障检测方面仍存在不足。工业过程的动态性、非线性和多模态特性,使得数据分析变得复杂。传统机器学习方法需要人工进行特征提取和选择,这在处理大型数据集时颇具挑战性,且会导致特征挖掘与决策过程分离,进而造成效率低下 [250]。随着机器复杂度和数据维度的增加,这些局限性制约了经典模型的有效性。此外,依赖人工经验的传统故障检测方法耗时、易出错,难以满足现代工业系统的需求 [27]。噪声的存在以及机械设备信号的非平稳性,进一步增加了故障检测的难度。因此,深度学习在改进故障检测与诊断方面引起了广泛关注。深度学习于 21 世纪 10 年代中期兴起 [251],凭借直接从原始数据中学习有用表征、无需人工特征工程的能力,为机械设备故障诊断带来了变革。结合传感器和物联网的发展,深度学习能够处理海量数据,从而提高故障检测与诊断的准确性和效率 [29,252]。
4.2.1 与最新先进模型的对比
卷积神经网络被广泛用于机器故障分类。事实上,机械设备故障诊断是基于卷积神经网络的故障诊断(CNNFD:CNN-based FD)中最早且探索最广泛的领域之一,其直接受图像分类原理的启发 [30]。在这种情况下,二维和一维卷积神经网络都有应用。一维卷积神经网络专注于时间序列数据,而二维卷积神经网络处理具有空间 / 时间相关性的多维数据。卷积神经网络的不同变体,如残差网络、密集连接网络、视觉几何组网络、胶囊网络(CapsNet:Capsule Network)、扩张卷积神经网络、基于区域的卷积神经网络等,也已被改编并应用于机械设备故障诊断中,以改进制造和工业流程。为了使综述更有条理,我们根据卷积网络的结构特征,将基于卷积神经网络的故障诊断研究细分为两个方面:使用一维卷积神经网络的故障诊断和使用二维卷积神经网络的故障诊断。
一维卷积神经网络故障诊断:将一维卷积神经网络用于故障诊断是一种直接的策略,其中原始一维数据可直接作为卷积神经网络模型的输入。如前所述,振动数据是该策略中常用的数据类型。研究 [111] 采用了一个一维卷积神经网络(包含 3 个卷积层和 2 个多层感知器层)对 IMS 数据集进行轴承故障分类。原始振动数据经过几个关键的预处理步骤:通过 8 倍抽取来降低复杂度,提供 12.5 kHz 的带宽;采用低通滤波去除高频成分;对数据进行归一化处理以保证尺度一致性。该研究的准确率达到了 97.1%。同样,Zhang 等人在研究 [76] 中,利用 CWRU 轴承数据集,在噪声干扰和工作环境多变的情况下,采用一维卷积神经网络进行轴承故障诊断。这项研究的独特之处在于使用了 dropout(丢弃)和小批量训练技术,且避免了复杂的预处理。通过重叠切片技术对训练样本进行处理,将其作为一种数据增强方法。研究取得了 99.77% 的出色分类准确率,尤其是在信噪比为 10 的情况下。此外,还采用 t-SNE 方法对分类结果进行可视化和理解。另外,研究 [77] 中实现了一种基于语义空间嵌入的零样本故障诊断方法。该方法使用一个带有两个卷积层和一个全连接层的一维卷积神经网络,从 CWRU 和 TEP 数据集的原始数据中提取故障特征。为实现零样本学习,构建了人工定义的故障标签嵌入作为故障属性矩阵,其中每个轴承故障都具有 7 个细粒度的故障属性。通过余弦距离将特征嵌入与故障属性进行匹配。还有,研究 [112] 利用 IMS 轴承振动数据集,通过一个多通道一维卷积神经网络分类器处理时域振动数据,以增强电动机轴承故障检测效果。对数据进行了 Z-score 标准化和线性缩放预处理。该双通道分类器通过同时使用 x 轴和 y 轴数据,准确率达到 100%;而一个双通道 / 两级分类器能够区分早期和晚期故障程度,平均准确率为 84.64%。同样,在研究 [82] 中,宽核卷积神经网络(WK-CNN:Wide-Kernel CNN)被用于处理三个工业机械故障数据集的原始时间序列数据,这三个数据集分别是 CWRU 轴承数据集、齿轮箱故障诊断数据集和帕德博恩轴承数据集。该方法通过 38880 次模型迭代,重点研究了不同的架构超参数(如核大小、步长和滤波器),分析它们对模型性能的影响。数据预处理包括数据分段、批处理以及划分为训练集和测试集。主要通过准确率分数衡量的结果显示,不同数据集和超参数配置下的性能差异显著,部分模型达到了接近完美的准确率。此外,还采用机器学习 / 深度学习算法进一步理解特定超参数与宽核卷积神经网络性能之间的非线性关系,强调了可训练参数数量对不同数据集的细微影响。
除振动数据外,其他机械故障信号(如声发射、电流、温度等)也被用作一维卷积神经网络故障诊断的输入。研究 [253] 中,作者提出了一种离心风机叶片损伤识别方法。他们采用了一种多层融合算法,将振动声学信号(在不同风机转速和噪声水平下从声压传感器和加速度计收集)与一维卷积神经网络相结合。首先通过自适应加权融合在数据层面融合声学和振动信号,然后使用一维卷积神经网络进行特征提取,提取的特征随后通过全连接层进行组合。同样,研究 [141] 专注于通过将 ReliefF 特征提取与一维卷积神经网络堆叠双向门控循环单元模型相结合,预测风力发电机叶片结冰故障。该研究使用了中国 2017 年工业大数据竞赛的 SCADA 数据,初始数据预处理包括:利用 ReliefF 将特征维度从 20 维降至 15 维,并通过滑动时间窗口重构数据。采用加权准确率指标解决数据不平衡问题,并使用 5 折交叉验证。结果显示,与传统模型相比,加权准确率显著提高了 43.08%。研究 [254] 旨在通过分析定子电流信号诊断永磁同步电机的故障。收集了不同故障场景和转速下的定子电流数据,形成一个包含 2000 个数据点的数据集,经归一化后分为 1000 个训练样本和 1000 个测试样本。采用了一维卷积神经网络和小波包变换两种关键方法进行特征提取,其中一维卷积神经网络的诊断准确率达到 98.8%,性能优于其他方法。
随着可解释人工智能(XAI:Explainable Artificial Intelligence)概念的日益普及,在复杂机械系统中对透明且可理解的模型的需求变得前所未有的迫切。为解决这一问题,研究 [101] 利用多小波核(MWK:Multi-Wavelet Kernel)卷积神经网络对齿轮箱的一维振动信号进行了分析。该研究采用了中国东南大学提供的 DDS 数据集和风力发电机齿轮箱数据集。通过将连续小波变换与传统卷积神经网络相结合,这项研究引入了多小波核卷积层和核权重重校准模块,并采用热图对学习到的特征图进行可视化,从而提高了齿轮箱故障诊断中脉冲检测的可解释性。数据预处理包括使用大小为 1024 的滑动窗口对信号进行切割,以及采用标准归一化技术。在不同条件下的齿轮箱故障诊断中,多小波核卷积神经网络的分类准确率均超过 98%。
二维卷积神经网络故障诊断:最初,应用于机械设备故障诊断的卷积神经网络架构模仿了图像处理中使用的二维结构。由于机械信号主要是一维时间序列,因此主要方法是将这些一维信号转换为二维形式。为此,研究人员采用了多种信号处理方法,下文将对其进行简要说明。
许多研究人员通过数据矩阵变换将一维时间序列数据转换为二维图像格式,这种格式被称为 “振动图像”[42]。在此过程中,原始一维数据被转换为二维矩阵(图像结构)。例如,若有一个一维信号
并希望将其转换为 维度的二维矩阵(其中 ),则可应用如下变换:对于 且 ,有 。过程有效地将时间序列数据重构为类似图像的格式,从而能够应用图像处理技术来分析信号模式。除 “振动图像” 外,热成像图 [255] 也被用作卷积神经网络(CNNs)的输入。在机械设备故障诊断(MFD)中,热成像技术是识别指示故障的温度异常的关键手段,可实现非侵入式、连续的监测与诊断,常与振动分析等其他技术结合使用,以预防机器出现重大问题。此外,峭度图[256]、尺度图[45] 和频谱图[42] 是机械故障诊断中重要的信号处理技术,用于分析机器信号与噪声。峭度图通过评估跨频段的信号峭度来检测瞬态故障,突出信号的突然变化。由连续小波变换(CWT:Continuous Wavelet Transform)生成的尺度图提供信号的时频视图,可有效突出随时间变化的频率特征。通过短时傅里叶变换(STFT:Short-Time Fourier Transform)生成的频谱图则提供时频分析,非常适合跟踪机器行为的变化。这些技术通过数学算法处理原始振动或声学数据,将信号转换为视觉形式,从而助力机械故障及潜在缺陷的检测。二维卷积神经网络所使用的数据类型列于表 5 中。
作为数据矩阵变换方法的一项应用,Neupane 等人 [42] 利用该技术将原始数据转换为二维矩阵,随后采用一个简单的二维卷积神经网络模型对凯斯西储大学数据集进行轴承故障检测。同样,在一项创新性研究中,Jiao 等人 [302] 提出了一种深度耦合密集卷积网络(CDCN:deep coupled dense convolutional network)用于机械故障诊断。该网络采用一维卷积结构和密集连接,能有效从原始的非平稳机械信号中提取特征。与传统的数据拼接技术不同,该模型将多传感器数据作为并行输入进行整合。这些传感器同时捕捉横向和扭转振动,通过双层信息融合方法实现更精准的故障识别。深度耦合密集卷积网络模型的准确率达到 99.39%,相较于传统卷积神经网络、单传感器数据方法以及基于数据拼接的融合技术,在识别准确率、收敛速度和分类精度方面均表现更优。所有实验均在英特尔酷睿 i7 处理器和英伟达 GTX 1060 显卡上重复进行 10 次,以减少随机性。作者在试验台上模拟并测试了行星齿轮箱的 9 种健康状态,实验在 20Hz 驱动转速、2N・m 负载条件下进行,数据采样频率为 5kHz,最终针对 9 种状态形成包含 5400 个样本的数据集;他们还添加了高斯白噪声,以模拟真实恶劣的工业环境。尽管该模型可能会增加计算成本,并导致训练与测试数据分布之间出现差异,但其良好的实验结果及计划中的改进表明,该方法为智能故障诊断领域的发展做出了重要贡献。
另一种转换方法是将来自时域或频域的统计数据作为卷积网络的输入。在研究 [303] 中,研究人员使用带有加速度计和高速相机的齿轮试验台,以振动信号的快速傅里叶变换(FFT)频谱生成的二维灰度图像为输入,训练了一个卷积神经网络(VGG16 ConvNet)。该数据集包含 600 张图像,来自塑料齿轮耐久性测试,其中 500 张用于训练,100 张用于测试。研究采用迁移学习的方法,将最初在 ImageNet 上训练的 VGG16 网络用这些振动数据图像重新训练。在预处理步骤中,通过 FFT 频谱峰值提取方法将振动信号转换为图像。该方法包括以锯齿模式在 0Hz 至 1600Hz 的频率范围内每隔 16.67Hz 选取振幅峰值,生成 12×16 像素的灰度图像。每张代表频率振幅和相位的图像,根据高速相机的观测结果被标记为 “有裂纹” 或 “无裂纹”,为卷积神经网络训练提供带标签的数据。值得注意的是,这项研究的训练准确率达到 99%,测试准确率达到 100%,其主要目的是检测塑料齿轮的裂纹,重点重新训练了模型的最后两层。此外,研究 [83] 介绍了一种滚动轴承故障诊断方法,该方法将深度卷积神经网络(DCNN:Deep Convolutional Neural Network)与免疫算法相结合。这种技术使用从轴承故障信号的时域和频域转换而来的二维图像作为深度卷积神经网络的输入。利用凯斯西储大学数据中心的数据,该方法结合深度卷积神经网络进行特征提取,并利用免疫算法自适应学习新故障。预处理包括将振动信号转换为二维图像。该方法的故障识别准确率超过 98%,有效减少了误报和漏报,通过先进的机器学习技术展示了其在自适应学习和故障诊断准确性方面的优势。研究 [256] 则专注于利用卷积神经网络(具体是改进的 LeNet-5 架构)进行滚动轴承的故障诊断。它独特地将一维声发射信号转换为二维峭度图图像,以适应卷积神经网络的输入要求。该数据集包括来自不同故障状态和正常状态轴承的声发射信号。预处理包括使用 1/3 二叉树方法将一维信号转换为二维峭度图。快速峭度图算法中的 1/3 二叉树方法是一种扩展,它使用三个额外的带通滤波器对信号序列进行进一步分解,在几乎不增加计算成本的情况下实现了更精细的频率和分辨率采样。通过这种方法,不同转速下各种轴承状态的分类准确率超过 95%,其中部分状态在 500RPM 时的准确率达到 100%。研究 [81] 还介绍了 AntisymNet,这是一种用于旋转机械故障诊断的轻量级卷积神经网络,它将一维振动信号转换为二维图像进行处理。利用 MiniImageNet、CWRU 轴承、渥太华轴承和 Hob 等数据集,该模型取得了较高的准确率(在 CWRU 数据集上高达 99.70%)。AntisymNet 的创新架构结合了正向和反向分支,用于高效的特征提取和融合,在降低复杂度的同时,在不同数据比例下都表现出良好的性能,凸显了其在工业故障诊断中的实际应用价值。另外,在研究 [304] 中,研究人员对一台连接到 SpectraQuest MFS 的 0.5 马力感应电机进行了分析,使用了两个加速度计。该研究采用多头一维卷积神经网络,通过分析一维振动信号来诊断电机故障,包括轴弯曲和轴承问题。数据被划分为 256 个样本的窗口,来自四次实验运行。配备 Leaky ReLU 和早停功能的卷积神经网络,其故障识别准确率达到 99.92%。
除上述所用的图像类型外,一些研究人员还将热成像图用作卷积神经网络的输入。Li 等人 [255] 开发了一种基于卷积神经网络的红外热成像(IRT:Infrared Thermal)图像故障诊断方法,这些图像是通过红外热成像技术从机械设备上捕捉到的。从 SpectraQuest 机械故障模拟器获取的红外热成像图像是从热视频中选取的,用于构建数据样本,并将其输入到卷积神经网络模型中进行故障检测。所用的故障类别数量为 10 类,且使用 SoftMax 作为分类器。同样,在他们关于机器故障诊断的研究 [165] 中,研究人员采用了一个坚固的轴承试验台,该试验台配备有一台 220 伏、2 马力的直流电机,用于模拟各种轴承故障,如内圈故障、外圈故障、滚珠故障和润滑问题。通过单轴加速度计收集振动数据,并通过热成像相机获取红外热成像数据。他们采用二维卷积神经网络,通过连续小波变换将一维振动数据处理为二维尺度图图像,并通过红外热成像技术提取热成像图像。为提高计算效率,这些数据被转换为灰度图,这使得卷积神经网络在恒速条件下的故障诊断准确率达到 100%,而在转速变化时准确率略有下降。
采用结合可解释人工智能原理的二维卷积神经网络,研究 [101] 提出了一种用于机械设备故障诊断的多层小波注意力卷积神经网络(MWA-CNN:Multilayer Wavelet Attention CNN),该网络将卷积神经网络与小波变换技术相结合。它采用离散小波变换层和频率注意力机制,以增强抗噪声能力和可解释性。该方法在离散小波变换层和卷积层之间交替进行,实现信号分解和特征学习。研究所用数据来自高速航空轴承和电机轴承(DIRG 轴承数据集和 PU 轴承数据集),预处理阶段采用 Z-score 标准化,通过滑动分割进行数据增强。值得注意的是,多层小波注意力卷积神经网络取得了较高的诊断准确率(在 4 分贝信噪比下为 98.75%,在 - 4 分贝信噪比下为 87.61%)。这种方法通过使网络聚焦于相关特征信息,提高了可解释性,符合可解释人工智能原理,从而增强了决策的透明度。其他一些应用卷积神经网络的研究成果汇总于表6中。
4.2.2 基于循环神经网络(RNN)的故障诊断(FD)
循环神经网络旨在通过顺序处理输入并利用反馈环路记忆过去的状态来处理时间序列数据,这使其非常适合分析振动、温度等机械信号的时间特性。这种能力使其能够有效地进行故障检测和剩余使用寿命预测。然而,循环神经网络常常受到梯度消失和梯度爆炸问题的困扰,这限制了它们从长序列中学习的能力 [1]。这促使了诸如长短期记忆(LSTM:Long Short-Term Memory)单元和门控循环单元(GRUs:Gated Recurrent Units)等高级版本的发展,这些网络融入了门控机制,以改善对长期依赖关系的学习 —— 这一点对于机械设备的可靠故障诊断至关重要。
长短期记忆网络和门控循环单元:长短期记忆网络旨在解决循环神经网络的梯度消失问题。它们采用更复杂的单元结构,包含一个记忆单元、输入门、输出门和遗忘门,能够学习并保留输入序列中的长期依赖关系。门控循环单元(GRUs:Gated Recurrent Units)的架构比长短期记忆网络更简单,将输入门和遗忘门合并为一个单一的更新门,并将细胞状态与隐藏状态合并。这使得门控循环单元在计算上更高效,同时保持与长短期记忆网络相近的性能 [307]。
双向循环神经网络:双向循环神经网络(BiRNN:Bidirectional RNN)结合了两个信息流向相反的循环神经网络(RNN:Recurrent Neural Network)层,增强了对时间序列的敏感性。它同时考虑过去和未来的数据,这使其在动态机械故障诊断中极具价值 —— 在这类诊断中,捕捉跨时间的信息对于识别故障类型和严重程度至关重要。这种方法显著提高了故障识别效果 [40]。
混合方法:此外,混合方法如循环神经网络编解码器(可处理变长序列,将输入编码为嵌入向量并解码为不同长度的输出)[37, 38, 104, 308]、卷积循环神经网络(CRNN:Convolution RNN)模型(卷积神经网络提取空间特征,循环神经网络分析时间依赖关系)[132, 309–311]、隐马尔可夫模型 - 循环神经网络[307] 等,也被应用于机械设备故障诊断(MFD:Machinery Fault Diagnosis)中。
在针对往复式压缩机故障诊断的研究 [314] 中,研究人员通过贝叶斯优化对长短期记忆网络模型进行了优化。该方法包括对单个传感器的振动信号数据进行预处理,在保留时间细节的同时降低维度。这一过程结合人工数据增强,提升了长短期记忆网络检测 17 种不同故障状态的能力,其性能优于传统及先进的深度学习技术。研究通过混淆矩阵评估模型的诊断精度,重点关注准确率、精确率、召回率和 F 值等指标。表现最佳的长短期记忆网络模型取得了 93% 的显著平均准确率。同样,研究 [39] 开发了一种基于深度长短期记忆网络(DLSTM:deep LSTM)的方法,用于预测美国国家航空航天局涡扇发动机的剩余使用寿命,该方法利用了 CMAPSS 平台的 FD001 和 FD003 数据集。深度长短期记忆网络模型采用多传感器数据融合、网格搜索优化和 Adam 优化算法,并通过丢弃方法防止过拟合。预处理步骤包括通过指数平滑降噪,以及基于信号相关性和单调性的特征选择,这使得模型在多个性能指标上表现优异,如最低分数、R 值和剩余使用寿命误差范围。此外,研究 [307] 提出了一种基于改进门控循环单元网络的回转支承寿命预测模型,该网络通过飞蛾火焰优化算法进行优化,并与隐马尔可夫模型结合用于早期退化检测。该方法包括使用基于鲁棒局部均值分解的希尔伯特变换进行信号预处理,以及在时域和频域进行特征提取。通过与标准机器学习方法对比验证,该模型在挖掘机回转支承的趋势预测和剩余寿命预测中表现出更高的准确性和鲁棒性,其平均准确率达到 92%。研究 [40] 还采用了一种基于多时间窗口的卷积神经网络 - 双向长短期记忆网络,以解决工业中状态监测数据长度不一致的问题,并利用美国国家航空航天局 C-MAPSS 数据集预测涡扇发动机的剩余使用寿命。该方法的预处理包括特征选择、归一化,以及通过分段线性函数进行标签修正。研究使用不同的时间窗口大小来捕捉多样的时间依赖关系,相比固定窗口方法提升了模型性能。同时,采用加权平均法聚合多个基础模型的结果,优化集成框架的性能。在研究 [315] 中,研究人员开发了一种采用双向卷积长短期记忆网络的深度学习框架,该框架结合了卷积神经网络和长短期记忆网络的优势,用于行星齿轮箱的故障诊断。研究数据来自新南威尔士大学搭建的行星齿轮箱试验台 [316],涵盖了针对不同故障类型和工况的 252 次测试。这些数据被分割为二维矩阵,通过双向卷积长短期记忆网络进行处理。该方法的性能优于卷积长短期记忆网络、卷积神经网络 - 双向长短期记忆网络等基准方法,总体分类准确率达到 84.72%,其中对故障类型和位置的识别准确率为 100%。其他一些在机械设备故障诊断中应用循环神经网络的研究成果列于表 7 中。
4.2.3 基于自编码器的故障诊断
自编码器是一类用于无监督学习的神经网络,由于其能够从数据中提取复杂特征,并且凭借编码器 - 解码器结构可实现异常检测,因此在机械设备故障诊断中扮演着重要角色。基于自编码器的方法易于实现和训练。通过设置隐藏层节点数量少于输入层节点数量,自编码器还可作为一种非线性降维工具,其性能优于核主成分分析。
自编码器凭借其编码器 - 解码器结构,在机械设备故障诊断的无监督学习(USL:Unsupervised Learning)中至关重要,该结构在特征提取和异常检测方面效果显著。作为一种非线性降维工具,当自编码器的隐藏层节点数少于输入层节点数时,其性能优于核主成分分析等方法。它能凸显与正常状态的偏差,从而指示故障,并有助于故障类型的分类和部件诊断。自编码器的多种变体进一步增强了其性能,例如稀疏自编码器(SpAE:Sparse AE)、堆叠自编码器(StAE:Stacked AE)、去噪自编码器(DAE:Denoising AE)、变分自编码器(VAE:Variational AE)和收缩自编码器(CAE:Contractive AE),这些变体能够有效处理多模态数据和含噪数据。此外,将卷积神经网络等先进神经模块用于图像数据,将循环神经网络用于时间序列数据,可实现动态表示学习,这使得自编码器成为集成学习中的可靠选择,有助于提升机械设备故障诊断模型的泛化能力 [28]。在机械设备故障诊断中应用的自编码器变体包括:
稀疏自编码器:稀疏自编码器对隐藏层的激活施加稀疏性约束,迫使模型学习输入数据的紧凑且稳健的表示。在稀疏自编码器中,正则化项本质上是库尔贝克 - 莱布勒(KL:Kullback–Leibler)散度,它用于衡量隐藏层激活值的分布与预设目标概率分布之间的差异 [29]。部分在研究中使用稀疏自编码器的文献包括 [90,91,126]。
去噪自编码器:去噪自编码器旨在实现稳健的特征提取,其训练方式是从被刻意添加人工噪声的输入数据中重构出原始的、未受干扰的数据,从而增强模型对干扰的抵御能力。研究 [126, 318, 319] 在其工作中使用了去噪自编码器。
变分自编码器:变分自编码器是一种生成模型,它将推理网络与生成网络相结合,将输入数据映射到一个概率潜在空间。它们将特征提取构建为变分贝叶斯推理问题,通过优化似然函数来有效学习观测数据与潜在表示之间的概率关系。这种方法在潜在空间上施加了结构化的概率模型,其中编码器推断分布参数,从而实现稳健且有意义的特征生成 [28]。研究 [148, 186, 320–322] 在其工作中使用了变分自编码器。
收缩自编码器:收缩自编码器在经典的重构损失函数中添加了一个惩罚项,这有助于模型纳入一个正则化项,从而促进输入数据与潜在空间之间的平滑映射。由此产生的模型对输入数据中的微小扰动表现出更强的稳健性,并且能更好地泛化到新的故障模式。研究 [323–326] 是一些在智能系统中采用收缩自编码器进行机械故障诊断的案例。
堆叠自编码器:堆叠自编码器通过在损失函数中纳入一个正则化项(特别是雅可比矩阵的弗罗贝尼乌斯范数平方)来增强稳健的特征提取。该术语惩罚对输入变化的敏感性,从而鼓励模型学习从输入到潜在空间的平滑映射,并提高其对新模式的泛化能力,尤其是在存在噪声的情况下。2018 年之前,堆叠自编码器的一般应用得到了广泛研究 [28]。它们已成功应用于机械设备故障诊断,包括但不限于研究 [318, 320, 323]。
改进型和混合型自编码器:研究人员提出了各种自编码器的改进版本和混合版本,以改进机械设备故障诊断。例如,将循环神经网络或长短期记忆网络与自编码器结合,以捕捉时间依赖关系。卷积自编码器(ConvAE:Convolutional Autoencoder)利用卷积神经网络(CNNs:Convolutional Neural Networks)处理空间或时间数据,提高了故障检测性能 [317, 327–329]。结合聚类或分类算法的混合方法也增强了故障检测和诊断系统 [330–332]。一些在机械设备故障诊断中应用自编码器的研究成果列于表 8 中。
4.2.4 基于深度信念网络的故障诊断
深度信念网络由辛顿等人于 2006 年提出 [333],是一种深度学习网络,其结构通过堆叠多层受限玻尔兹曼机(RBMs:Restricted Boltzmann Machines)以分层方式构建而成。深度信念网络的第一层包含一个受限玻尔兹曼机,用于对输入数据进行建模;而后续各层则由受限玻尔兹曼机构成,这些层负责捕捉从上层衍生而来的隐藏表示。这种架构支持无监督预训练,通过对比散度或持久对比散度来初始化网络权重和偏置。这种预训练策略能够减轻过拟合问题,并增强模型对未知数据的泛化能力。受限玻尔兹曼机的主要组成部分包括用于可见单元和隐藏单元的二元随机变量。
深度信念网络在从特定数据表示中提取故障特征方面表现出色,其在机械设备故障诊断中的应用正不断增加。研究 [95] 提出了一种基于深度信念网络的轴承故障诊断方法。该方法使用凯斯西储大学轴承数据集的一维输入数据,构建了多个具有不同超参数的深度信念网络,并通过改进的集成方法对其进行整合。这些深度信念网络采用二元单元和高斯单元,通过对比散度进行训练。经交叉验证测试,该方法的准确率高达 96.95%,证明了其在复杂条件下故障诊断的有效性。此外,研究 [335] 提出了一种优化的深度信念网络,该网络采用改进的逻辑 sigmoid 单元,用于风力发电机齿轮箱的故障诊断。研究使用了来自人工设置故障的齿轮箱的振动信号数据集,并采用 Morlet 小波变换、峰度指数和软阈值法进行信号预处理。改进的 sigmoid 单元提高了收敛速度和分类准确率:在 MNIST 数据库、验证数据和齿轮箱故障数据上测试时,该方法的性能优于传统单元,准确率高达 96.32%,且收敛速度快。另外,Yan 等人在研究 [96] 中提出了多尺度级联深度信念网络,用于旋转机械的故障检测,其使用的数据来自凯斯西储大学轴承数据集和华北电力大学齿轮振动数据集的原始振动信号。该方法采用改进的粗粒度多尺度处理和三层深度信念网络进行特征提取,将数据分割和傅里叶频谱计算作为预处理技术,最终获得了超过 99% 的分类准确率。
陶等人的另一项研究 [336] 专注于基于深度信念网络(DBN:Deep Belief Network)架构的轴承故障诊断,该架构由多层受限玻尔兹曼机、反向传播神经网络(BPNN:Backpropagation Neural Network)以及多传感器信息融合组成。该方法包括从各种故障轴承中获取多个振动信号,从这些信号中提取时域特征,然后将数据输入深度信念网络以生成用于故障诊断的分类器。实验在 QPZ-II 数据集上进行,并与支持向量机、K 近邻和反向传播神经网络方法进行了对比,结果表明基于深度信念网络的方法对训练样本的识别准确率达到 97.5%,对测试样本的识别准确率达到 95.5%,表现更优。此外,研究 [337] 重点使用了三种不同的架构:深度玻尔兹曼机、深度玻尔兹曼机和堆叠自编码器。该方法通过四种方案对振动信号进行预处理,涵盖时域、频域和时频域。数据集包括从旋转机械系统中收集的七种滚动轴承故障模式。对深度学习网络模型的性能评估以准确率为指标,在最佳设置下准确率超过 99%。
除分类任务外,深度信念网络还被用于旋转机械的剩余使用寿命预测。研究 [106] 采用深度信念网络,结合局部线性嵌入(LLE:Local Linear Embedding)和扩散过程,对 FEMTO 数据集的轴承剩余使用寿命进行预测。其中,深度信念网络用于特征提取,局部线性嵌入用于确定健康指标(HI:Health Index)。健康指标基于扩散过程演化,并且根据首达时间推导得到预测剩余使用寿命的概率密度函数。此外,研究 [338] 提出了一种基于无监督学习的旋转机械故障诊断模型,该模型整合了稀疏自编码器(SpAE:Sparse Autoencoder)、深度信念网络和二进制处理器。该方法使用稀疏自编码器对频域信号进行编码,编码后的信号经二进制处理器处理后输入深度信念网络进行故障诊断。整个过程无需带标签的训练数据,因此完全属于无监督学习。研究所用数据集为凯斯西储大学轴承数据集和齿轮点蚀数据集,通过快速傅里叶变换将时域信号转换为归一化的频域信号。在预处理阶段,二进制处理器将稀疏自编码器的输出转换为二进制数据,从而提高深度信念网络中受限玻尔兹曼机的效率。其他一些在机械设备故障诊断中应用深度信念网络的研究成果汇总于表 9 中。
4.2.4 基于生成式神经网络的故障诊断
生成对抗网络(GAN:Generative Adversarial Network)由 [339] 于 2014 年提出,是一种出色的无监督生成算法,能够从随机分布中学习生成逼真的数据。生成对抗网络被公认为 “全球十大突破性技术” 之一 [26],它由一个从随机噪声中生成合成样本的生成器(G:Generator)和一个区分真实样本与合成样本的判别器(D:Discriminator)组成。生成器和判别器均被设计为深度神经网络。生成器通过其参数将潜在变量映射到数据空间;判别器则通过其参数估计样本为真实或伪造的概率。这种结构形成了一个双人极小极大博弈。
生成对抗网络已在众多研究领域得到应用,包括自然语言处理、计算机视觉等。在故障诊断领域,它们最初被用于数据增强—— 通过生成符合相同数据分布的额外样本,解决小样本量问题。随后,GANs 被应用于对抗性跨域故障诊断(即对抗性域适应),这与数据增强不同:它利用目标域和源域数据进行对抗性训练,以提取域不变特征。此外,这些算法还被用于半监督学习和异常检测 [121,340]。为解决 GANs 存在的模型崩溃、训练不平衡等局限性,研究者们进行了各种改进和优化,由此产生了不同的 GAN 变体。根据改进方向,这些变体可分为两类:结构导向型改进和损失导向型改进[26]。
结构导向型改进:基于结构改进的生成对抗网络可进一步分为三类:基于卷积的生成对抗网络、基于条件的生成对抗网络和半监督生成对抗网络。为解决原始生成对抗网络在特征提取和训练方面的低效问题,深度卷积生成对抗网络(DCGAN:Deep Convolutional GAN)被开发出来 [184]。它在判别器和生成器中采用卷积层和反卷积层,提高了稳定性,并通过权重共享和局部连接增强了性能。另一方面,基于条件的生成对抗网络(包括条件生成对抗网络(CGAN:Conditional GAN)[181]、信息生成对抗网络[341] 和辅助分类器生成对抗网络(ACGAN:Auxiliary Classifier GAN)[342])解决了标准生成对抗网络的模式崩溃问题。条件生成对抗网络利用类别信息进行引导生成;信息生成对抗网络采用潜在编码和额外的分类器来增强输入与输出的相关性;辅助分类器生成对抗网络集成了一个辅助网络,用于故障分类以及区分真实数据与合成数据。此外,半监督生成对抗网络(SSGAN:Semi-Supervised GAN)在低标签数据场景中能高效利用未标记数据。它在判别器中配备了一个 softmax 分类器,用于区分真实输入与合成输入,并对真实样本进行分类,从而实现半监督学习(USL:Unsupervised Learning)[341]。
损失导向型改进:损失导向型生成对抗网络的开发旨在稳定训练过程,并解决标准生成对抗网络中存在的梯度不稳定、模式崩溃等问题。瓦瑟斯坦生成对抗网络(WGAN:Wasserstein GAN)[343] 采用瓦瑟斯坦距离来更稳定地度量真实样本与伪造样本之间的差异,不过其性能受到权重裁剪的限制。带梯度惩罚的瓦瑟斯坦生成对抗网络[185] 通过添加梯度惩罚进一步优化,以解决这些局限性。毛等人提出的最小二乘生成对抗网络(LSGAN:Least Squares GAN)[344] 采用最小二乘损失函数,根据样本与决策边界的接近程度对其进行惩罚,从而稳定训练过程。此外,基于能量的生成对抗网络(EBGAN:Energy-Based GAN)[345] 和边界平衡生成对抗网络(BEGAN:Boundary Equilibrium GAN)[346] 分别在其判别器中创新性地引入了自编码器和编码器 - 解码器结构,其中后者还包含一种平衡强制算法。这些变体通过聚焦于损失函数和训练策略的修改,共同优化了标准生成对抗网络框架,以解决特定的挑战。
生成对抗网络在机械设备故障诊断中的应用(亦汇总于表 10 中)可分为以下几类:
数据增强与平衡:基于生成对抗网络(GANs)的数据增强和类别平衡技术的最新进展,有助于解决故障诊断中的小样本和数据不平衡问题。在数据增强方面,标准流程是收集各类故障状态数据,用真实样本训练生成对抗网络,然后将生成的合成样本与真实数据结合起来训练分类器。生成对抗网络主要用于机械故障诊断,尤其适用于处理传感器采集的振动信号,能从有限数据中生成伪样本。这些方法可分为针对一维时域、一维频域、二维图像信号以及一维特征集生成合成数据的类型 [26, 347]。
异常检测:在基于生成对抗网络的机械设备故障诊断中,异常检测正变得日益重要,尤其是在仅能获取正常运行数据的情况下。该方法通过对正常样本的学习来划定区分正常状态与故障状态的边界。现代方法借助对抗性学习改进这一过程,摆脱了对人工生成特征的依赖。其核心思想是利用生成对抗网络生成合成样本,然后通过这些样本与原始正常样本之间的重构损失来检测异常。这种方法不仅在故障诊断领域得到认可,还在其他需要高效且可靠异常检测的领域中得到应用 [130, 340]。
半监督对抗学习:在标记数据稀缺的情况下,半监督学习被用于利用未标记数据进行模型训练。这种方法将未标记数据与对抗策略相结合,以增强训练效果 [65, 121]。
用于迁移学习的对抗训练:对抗训练被应用于迁移学习,即所谓的对抗性域适应(ADA:Adversarial Domain Adaptation),它利用源域数据来补充有限的目标域数据。对抗性域适应模型分为两类:一类是对抗性判别模型,其生成用于故障分类的域不变特征;另一类是对抗性生成模型,其通过学习数据分布或在域间转换数据来促进域适应 [67, 68]。
强化学习是机器学习的一个子领域,它是一种计算技术,专注于训练智能体在环境中通过与环境交互,并从获得的奖励或惩罚反馈中学习,从而做出决策。强化学习起源于两个主要研究领域:第一个是通过利用价值函数和动态规划实现的最优控制;第二个则从动物心理学中汲取灵感,尤其是试错搜索的概念 [363]。在连接主义背景下,强化学习与监督学习(SL:Supervised Learning)存在明显区别 [364]。在强化学习中,从环境中接收到的反馈信号是用于评估行动的有效性,而非指导系统如何产生正确的行动 [149]。强化学习智能体的主要目标是学习一种最优策略,该策略能将状态映射到行动,以最大化长期的预期累积奖励。这一学习过程可通过多种算法实现,例如 Q 学习、深度 Q 网络(DQN:Deep Q-Networks)、近端策略优化(PPO:Proximal Policy Optimization)、演员 - 评论家方法(Actor-Critic methods)等 [365]。
近年来,将强化学习应用于机械故障检测、诊断、分类及剩余使用寿命预测的研究兴趣日益浓厚。强化学习已在多个领域得到应用,包括输电线路故障诊断 [366]、智能电网运行优化 [367]、液压机故障检测 [368]、工业过程控制 [363] 等。此外,强化学习的应用场景可分为离线和在线两种。在离线场景中,研究人员已探索了强化学习在制造业中的应用,相关研究 [369, 370] 便是例证。离线强化学习通常涉及基于历史数据训练模型,以进行预测和决策 [371]。另一方面,强化学习也适用于在线场景,在该场景下,它能实时运行以快速识别故障并采取纠正措施。强化学习在在线场景中的应用是一个动态且不断发展的领域,研究 [117, 372] 对此方面进行了探讨。在机械故障检测中选择离线还是在线强化学习,取决于多种因素,如机械的特性、实时数据的可用性以及期望的响应时间。这两种方法都为该领域做出了重要贡献,并且在不断发展,旨在改进工业流程、提高设备可靠性、减少停机时间,最终提升机械运行的整体效率和安全性。
在机械故障检测、诊断与分类中应用强化学习,涉及训练强化学习智能体基于观测数据(如振动信号、声发射信号或热成像图像)做出决策。强化学习智能体可通过与数据交互,并接收奖励或惩罚形式的反馈,来学习识别不同的故障状态。在大多数机械设备故障诊断研究中,故障诊断被视为一种类似猜谜游戏的分类任务。研究人员构建了一个类似 “故障诊断游戏” 的模拟环境:向智能体呈现带有故障样本和标签的问题,智能体需要对这些故障进行诊断。在 K 类故障诊断场景中,猜测动作空间的范围是 0 到 K-1,其中 0 表示正常状态,k 表示第 k 种故障类型。智能体猜对会获得奖励,猜错则会受到惩罚。通过多轮这种猜谜游戏,智能体旨在利用监测设备的传感器数据,学习出用于故障识别的最优策略。研究 [70] 中也采用了类似的方法,研究者将强化学习方法用于旋转机械的智能故障诊断。该研究中,智能体基于堆叠自编码器构建,通过深度 Q 网络学习故障诊断。这种方法结合了强化学习和深度学习,实现了机械的端到端故障诊断 —— 其中,经验回放和奖励机制帮助智能体在极少外部指导的情况下,从原始振动信号中学习故障映射关系。
除分类任务外,研究 [74] 中提出了一种基于强化学习的自动神经架构搜索(NAS:Neural Architecture Search)方法。该研究在生成器网络中采用了一种名为 Nascell 的特殊循环神经网络单元,并构建了由两个堆叠的 Nascell 单元组成的控制器层。控制器输出用于构建卷积神经网络(CNN:Convolutional Neural Network)架构的参数,包括每一层的卷积核大小、核数量和池化大小。整个过程包括迭代生成网络配置、训练子模型,并通过策略梯度更新以最大化模型准确率(作为奖励)。这种迭代过程持续进行,直到搜索收敛到最优架构,期间偶尔会注入随机性以避免陷入局部最优。简而言之,控制器充当智能体,塑造卷积神经网络架构,而强化学习则用于在架构搜索空间中寻找性能更优的模型。此外,研究 [159] 中采用了多标签迁移强化学习(ML-TRL:Multi-label Transfer Reinforcement Learning)用于轴承的复合故障诊断。该方法结合深度强化学习(DRL:Deep Reinforcement Learning)和迁移学习,以增强故障特征提取并提高复合故障识别的准确率。多标签迁移强化学习的性能优于传统方法,其对迁移学习的运用包括对卷积层进行预训练,从而降低了深度强化学习的训练复杂度。
类似地,研究 [72] 采用了一种结合强化学习和神经架构搜索的自动化方法来设计故障诊断模型。其中值得关注的优化包括:采用贪婪策略防止陷入局部最优,利用经验回放平滑学习过程,以及通过权重共享降低计算需求。此外,研究 [149] 中采用了基于深度 Q 网络的强化学习框架,用于优化带通滤波器的上下截止频率,以实现旋转机械信号的故障诊断。带通滤波器充当智能体,其状态由这些频率定义。智能体与信号环境交互,根据其突出故障特征频率的效果获得奖励信号,目标是最大化该奖励。深度 Q 网络算法通过迭代优化频段,找到用于故障识别的最佳范围。在齿轮和轴承故障信号上的实验结果表明,这种基于深度强化学习的方法在识别故障相关频率方面,性能优于快速峭度图、基尼指数图等传统技术。研究 [117] 专注于开发一种用于机械故障诊断的在线域适应学习方法,该方法通过胶囊网络(Cap-net:Capsule Network)作为智能体,自主从在线数据中提取故障特征。研究设计了基于粗粒度相似度(CS:Coarse-grained Similarity)的特征字典,用于标记在线数据,并采用基于粗粒度相似度的奖励机制来评估粗粒度标签。该方法的流程包括:初始化胶囊网络,利用在线数据响应和奖励更新网络,以及结合历史数据对网络进行微调。目标网络和评估网络会迭代更新,同时采用自修剪机制优化在线特征字典。其他一些在机械设备故障诊断中应用强化学习的研究成果列于表 11 中。
4.4.1 直接迁移
直接迁移方法是指利用在一个数据集(源域)上训练好的预训练模型,将其应用于另一个数据集(目标域),且几乎不进行额外训练或仅进行少量训练。这种方法在目标域数据稀缺时尤为实用,因为它能让模型利用从相似但不同条件中学习到的模式和特征。该方法的效果取决于源域与目标域之间的相似性:域的相似度越高,模型性能越好。如果两个域差异较大,可能需要进行微调,但直接迁移方法仍能有效解决带标签数据稀缺的问题。例如,在凯斯西储大学轴承等大型带标签数据集上预训练的模型,可应用于数据稀疏或运行条件不同的目标域。通过准确率、精确率等指标评估模型性能,必要时进行微调,以确保其良好适应新域。研究 [46-48, 114, 374-376] 是一些在机械设备故障诊断(MFD)中采用预训练模型的案例。
4.4.2 领域适配
近年来,域适应方法在机械设备故障诊断中得到了广泛应用,尤其适用于源域与目标域存在差异的场景。与直接迁移方法不同 —— 后者可能因域偏移导致性能显著下降,域适应方法通过专注于减小域间的分布差异来缓解这些问题。域适应放宽了传统假设中对训练数据和测试数据必须满足独立同分布的要求。通过利用不同但相关域之间的不变特征和核心结构,域适应方法能有效应对域偏移、目标域小样本量、数据集不平衡等挑战 [21, 373]。在这种方法中,会将先前训练好的模型适配到新的但相关的域,以最小化域间差异。深度迁移学习中使用的域适应方法可细分为三类:基于差异的方法、基于对抗的方法和基于重构的方法,下文将对其进行简要介绍。
[B.] 基于对抗的方法:基于对抗的域适应方法通过域判别器促进域混淆,并学习源域与目标域之间的不变特征。受生成对抗网络中双人博弈思想的启发,该方法由相互竞争的生成器和判别器组成 —— 生成器试图生成与目标域高度相似的数据,而判别器则尝试区分源域数据和生成的数据。在对抗训练过程中,生成器努力迷惑判别器,从而实现更好的域对齐。这些方法分为两类:带额外生成器的生成对抗域适应和不带额外生成器的非生成对抗域适应(non-GADA:non-generative adversarial DA)。生成对抗域适应利用生成器生成类似目标域的数据样本,通过耦合生成对抗网络和对抗性判别域适应(ADDA:Adversarial Discriminative Domain Adaptation)等方法中的变换辅助域对齐。而非生成对抗域适应则不生成新样本,而是将生成器作为特征提取器以最大化域混淆,从而实现域对齐。其采用基于瓦瑟斯坦距离的优化、课程学习和域对称网络等技术来减小域偏移。尽管基于对抗的域适应方法具有样本多样性高、理论上与目标数据接近等优势,但由于难以达到纳什均衡,其面临训练稳定性的挑战 [24, 373]。研究 [51, 52, 157, 378-381] 在其工作中应用了基于对抗的域适应方法。
[C.] 基于重构的方法:基于重构的领域自适应方法致力于通过对源域和目标域的数据进行重构来减小领域差异,在捕捉域间共性的同时确保域内的区分性。这些方法通常采用编码 - 解码框架,即先将数据编码为特征表示,再解码回原始输入,从而构建一个用于对齐的共享域空间。通过共享编码器,模型能够学习到领域不变特征,同时保留领域特定特征。自编码器和 KL 散度等技术可增强领域对齐效果,例如领域分离网络会将领域不变特征和领域特定特征分离开来,以防止负迁移。将自编码器与生成对抗网络相结合的混合模型通过融入循环一致性损失等任务进一步提升性能,这在无监督场景中尤为实用。尽管具有这些优势,但该方法仍面临一些挑战,如难以平衡生成样本的真实性和多样性,以及参数更新的复杂性问题,这使得基于重构的领域自适应成为一种强大但复杂的领域对齐方法 [21,373]。研究 [53,125,152,382] 在其工作中应用了基于重构的技术。
4.4.3 多领域适配
多源域适应(MDA:Multi-source Domain Adaptation)利用来自多个具有不同分布的源域的数据,以提升模型在目标域上的性能。与传统的单域适应不同,多源域适应通过对齐多个域的特征来应对信息冲突问题,从而增强模型的泛化能力。其主要方法包括:用于压缩和共享参数的残差自适应模块、用于寻找共性的潜在域发现,以及用于选择最相关源数据的域加权。结合生成对抗网络(GANs)的对抗训练通过最小化域间分布差异,进一步强化了多源域适应的效果。尽管多源域适应颇具成效,但在自动选择和对齐最相关数据方面仍面临挑战,这使其成为故障诊断领域持续研究的焦点 [2, 373]。
4.4.4 部分迁移学习
部分迁移学习是一种专门的方法,其中仅源域中的一部分特征或任务与目标域相关 [21]。在机械设备故障诊断(MFD)场景中,这意味着有选择地迁移与特定故障或运行条件相关的知识,而非应用来自源域的整个模型。当目标域的范围较窄,或者源域包含冗余或无关信息时,这种方法尤为实用。通过仅聚焦于最相关的数据,部分迁移学习可最大限度地降低负迁移风险(即无关知识可能导致模型性能下降的风险),并确保迁移的信息能提升目标模型的准确性和有效性。然而,识别相关的子集需要细致的分析和领域专业知识,这使其成为成功故障诊断中一个具有挑战性但至关重要的方面 [382]。
在概述了迁移学习的相关概念后,这些方法已被越来越多地应用于解决机械设备故障诊断中的实际挑战。郭等人 [99] 通过采用深度卷积迁移学习网络,解决了带标签数据有限以及训练 / 测试分布存在差异的问题。该网络包含两个模块:状态识别模块和域适应模块。状态识别模块利用一维卷积神经网络从原始振动信号中自动提取特征,并对机器健康状态进行分类。域适应模块通过整合域分类器和分布差异度量进一步增强一维卷积神经网络的性能,使模型能够学习域不变特征。这种设置在最大化域分类误差的同时,最小化源域与目标域之间的概率分布距离。通过在三个不同的轴承数据集上进行六项迁移故障诊断实验,该方法得到了验证,结果显示其故障诊断准确率较传统方法有显著提升。类似地,魏等人 [136] 的研究提出了一种针对清华大学行星齿轮箱数据集和 UA-FS 齿轮箱数据集的机械故障诊断方法。该方法利用原始振动信号和加权域适应网络,通过根据工况与目标工况的相似度为其分配权重,来解决因工况变化导致的数据分布偏移问题。研究以分类准确率和最大均值差异为指标,验证了诊断准确率的提升,强调了在变工况下域适应的重要性。另一项研究 [80] 提出了基于小波包变换(WPT:Wavelet Packet Transform)的深度特征迁移学习方法,用于不同工况下的轴承故障诊断。该方法结合了小波包变换(用于构建时频特征图)、深度残差网络(用于特征提取)和多核最大均值差异(用于评估跨域特征的分布差异)。在凯斯西储大学轴承数据集和 MFS-RDS(转子动力学模拟器)数据集上进行的研究显示,在 CWRU 数据集上的平均准确率为 88.59%,而在 MFS-RDS 数据集上的平均准确率为 97.14%。关于多源域适应,Rezaeianjouybari 等人 [68] 的研究指出了以往依赖单一源域且忽略工况变化的模型存在的局限性,并提出了特征级和任务特定分布对齐多源域适应(FTD-MSDA:Feature-level and Task-specific Distribution Alignment Multi-source Domain Adaptation)模型,以解决智能故障诊断系统中的域偏移挑战。在 CWRU 和 PU 轴承数据集上进行的实验表明,FTD-MSDA 模型框架在特征级和任务级对域进行对齐,使用切片瓦瑟斯坦差异来塑造任务特定的决策边界,并成功地将知识从多个带标签的源域迁移到单个无标签的目标域。此外,钱等人 [383] 的研究引入了一种名为自适应中间类别分布对齐的迁移学习方法,针对风力发电机行星齿轮箱的故障诊断,解决了域适应中收敛缓慢和损失振荡的问题。所提出的模型结合了域适应和泛化,利用自适应中间分布机制以及 AdaSoftmax 损失,动态对齐源域和目标域的分布,无需额外的分布距离损失或相关性正则化损失。还有一项研究 [384] 开发了方差差异表示方法,以增强旋转机械故障诊断中的域适应。在三个轴承数据集上的实验结果表明,该方法通过关注方差而非均值,改进了分布差异的表示,更准确地反映了源域与目标域之间的差异。其他一些应用迁移学习的研究成果列于表 12 中。
表12 应用迁移学习于机械故障诊断的论文
4.5.1 机械故障诊断作为异常检测
在机械设备故障诊断领域,带标签的故障数据匮乏是一项挑战,无监督 / 半监督异常检测技术在识别传统监督方法无法捕捉的故障模式和潜在异常方面发挥着重要作用。这些数据驱动的方法侧重于检测离群值或异常值(即与大多数正常数据样本存在显著偏差的数据点)[390]。多种经典的无监督方法被用于识别数据集中的异常,其中包括:Z 分数,用于衡量某个数据点与均值之间相差多少个标准差;四分位距,通过考虑数据的第一四分位数和第三四分位数之间的范围来识别离群值;孤立森林(iF:Isolation Forest),这是一种基于树的算法,通过构建孤立树并测量隔离某个数据点所需的分裂次数来孤立异常值;局部离群因子(LOF:Local Outlier Factor),用于衡量某个数据点相对于其邻域数据点的局部密度偏差;单类支持向量机,它学习正常数据样本周围的边界,并将该边界之外的所有数据都归类为异常值,等等。除了这些浅层学习算法之外,基于深度学习的方法,如自编码器、变分自编码器和生成对抗网络,也以不同方式应用于异常检测,例如作为特征提取器、从正常数据中学习表示的学习器以及端到端的异常分数学习器。更多细节可参见文献 [390]。
研究 [391] 提出了一种基于全图动态自编码器(FGDAE:Full Graph Dynamic AE)的异常检测方法,该方法旨在复杂多变的条件下有效运行。FGDAE 模型整合了全连接图(用于捕捉传感器通道间的全局结构关系)、图自适应自编码器(用于聚合多视角特征并适应运行条件变化)以及动态权重优化策略(用于处理不平衡多条件数据的训练)。类似地,研究 [130] 提出了故障注意力生成概率对抗自编码器(FGPAA:Fault-attention Generative Probabilistic Adversarial AE)方法,用于三个机械故障数据集的异常检测,该方法仅聚焦于健康类别。FGPAA 方法利用双对抗自编码器,采用故障注意力概率分布来有效评估机械的健康状态,能够动态适应信号噪声并实时进行异常检测。此外,研究 [392] 提出了一种用于船舶机械故障诊断的实时异常检测方法。作者开发了一个名为 RADIS 的框架,该框架基于长短期记忆网络的变分自编码器,并结合了多级大津图像阈值分割技术。还有研究 [358] 提出了一种基于生成对抗网络的异常检测方法,其中生成器采用编码器 - 解码器 - 编码器架构,仅对正常样本进行训练。通过潜在损失和表观损失来计算异常分数。
联邦学习引入了一种去中心化的模型训练方法,尤其适用于边缘学习环境 —— 在这类环境中,数据分布在多个设备上。它通过利用本地数据进行迭代更新来训练共享模型,避免了敏感信息的集中化。这种技术在促进协作训练的同时,能保护数据隐私并减少通信开销。联邦学习已被广泛应用于边缘机器学习模型,并成功用于网络攻击检测、垃圾邮件检测、智慧城市、自动驾驶等领域,近年来也应用于机械故障诊断,其主要目的是维护隐私 [398]。研究 [399] 中,研究者实现了一种基于联邦学习的混合故障检测方法,尤其聚焦于转子和轴承的故障检测。输入方法采用从加速度计收集的一维时间序列数据,数据集包含 48 个混合故障类别,共 92,160 个数据点。该方法包括一种使用双联分类器的联邦学习方案,数据在 30 个客户端之间按三种分区方案分布:平衡独立同分布、平衡非独立同分布和非平衡非独立同分布。预处理包括数据洗牌和分区。基于卷积神经网络训练的联邦学习模型在混合故障分类中达到了 90% 以上的准确率。另一项研究 [400] 致力于利用联邦学习改进滚动轴承的故障诊断。该研究使用凯斯西储大学基准数据集和蔚来汽车公司的项目数据集,旨在解决联邦学习中的客户端异质性问题(与样本量、质量和故障类型相关)。所提出的方法是一种多尺度逐层递归融合联邦学习方法(LLRFed:Layer-by-Layer Recursive Fusion Federated Learning)。数据通过滑动窗口进行预处理,并输入到带有快速傅里叶变换的深度神经网络中。研究表明,LLRFed 方法在基准数据集上显著提高了诊断准确率,提升幅度达 9.23%。类似地,研究 [401] 提出了一种用于高速和铁路系统中铁路转辙机的故障诊断方法,该方法使用时序异步联邦学习框架对这些机器在各种故障条件下的振动信号进行分析。数据集包括 16 种工况下的 960 个振动信号样本,每种工况 60 个样本,通过裁剪和零填充进行预处理,以确保统一的 10 秒向量长度。研究采用深度收缩全卷积网络作为全局模型,与之前的模型相比,参数减少了四分之一,从而减少了通信开销和数据包丢失。数据按 8:2 的比例分为训练集和测试集,标签采用独热编码。此外,Yang 等人 [402] 的研究采用联邦学习方法对轴承、机器人等工业机器进行迁移诊断。他们提出的基于分布重心介质的迁移学习架构整合了联邦学习框架与服务器 - 客户端架构,以解决数据去中心化的挑战 —— 由于隐私问题和高昂的传输成本,不同域的数据无法集中聚合。客户端构建基于残差网络的诊断模型,从本地数据中提取高级特征;服务器则实现基于堆叠自编码器的生成器模型,通过聚合特定域的分布参数生成分布重心介质。该方法利用不同健康状态下的振动数据平衡样本,通过生成的介质样本适配边缘分布和条件分布,并通过客户端与服务器之间的协作训练动态更新分布重心介质。研究 [403] 还提出了一种基于区块链的去中心化协作学习方法用于机器故障诊断。该方法使用来自两个数据集(高速列车转向架数据集和轴裂纹故障数据集)的一维机械数据,在一个结合了基于区块链的联邦学习和源数据独立迁移学习的框架中使用深度卷积神经网络进行分析,其中预处理技术包括使用频域信息。该方法的测试准确率达到了 90% 以上。另外,文章 [404] 介绍了一种异构联邦域泛化网络,该网络融合了公共表示学习,以解决故障诊断(FD)中的域偏移和隐私保护挑战。通过利用异构源客户端实现跨不同和未见过的目标客户端的泛化故障诊断,所提出的联邦迁移学习方法克服了传统方法的局限性 —— 传统方法依赖客户端之间的同质性,且在训练期间需要目标域数据。该模型使用解耦域适应基础模型,旨在最小化噪声影响并增强域混淆,从而改进故障相关特征的提取。
编辑:赵栓栓
校核:李正平、陈凯歌、曹希铭、赵学功、白亮、任超、海洋、陈宇航、陈莹洁、Tina、王金、赵诚、肖鑫鑫
该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除
来源:故障诊断与python学习