首页/文章/ 详情

综述 | 数据驱动的机械故障诊断:全面综述(中)

1天前浏览13

故障诊断是当前工业设备领域的研究热点。本期推荐的这篇是迪肯大学博士研究生迪拉杰・纽帕内的文章,这篇文章聚焦数据驱动机械故障诊断
,系统梳理了传统机器学习深度学习强化学习迁移学习等方法的应用分析了多机械故障数据的特征与应用,探讨了数据稀缺、模型泛化性等挑战,并提出了数据集优化、算法改进未来研究方向。其核心价值在于弥补现有研究在 RL (Reinforcement Learning:强化学习)应用、多源数据融合等方面的空白促进该领域的进一步发展。

由于文章篇幅过长,小编将分三次为大家翻译介绍这篇论文第一篇推文阐述 MFD(Machinery Fault Diagnosis:机器故障诊断) 重要性,指传统方法不足,数据驱动方案兴起;介绍故障诊断类别与维护策略,点明现有综述缺陷;说明本综述方法、分类体系;探讨机械故障数据,包含类型、增强技术、数据集三个方面;最后阐述传统数据驱动方法及各自优缺点

本篇推文将聚焦先进数据驱动方法,详解 DL(CNN、RNN 等)、RL、TL 在 MFD 的应用,DL 各模型处理不同数据与任务,RL 用于分类和架构搜索,TL 缓解数据与域差异问题,还提及异常检测等其他助力 MFD 的方法

希望对大家的学习有所帮助,文章质量很同时希望大家可以多多引用。

论文基本信息

论文题目: Data-driven machinery fault diagnosis: A comprehensive review

论文期刊:Neurocomputing

Doihttps://doi.org/10.1016/j.neucom.2025.129588

作者: Dhiraj Neupane(a), Mohamed Reda Bouadjenek(b), FaRichard Dazeley(c), Sunil Aryal(d)
论文时间: 2025年
机构: 

a School of IT, Deakin University, WaurnPonds, Geelong, Victoria 3216, Australia

作者简介:迪拉杰・纽帕内系迪肯大学的博士生,专攻基于先进机器学习算法的智能故障检测。他拥有韩国昌原国立大学信息与通信工程硕士学位,研究方向为机械设备故障检测与信号处理,同时对计算机视觉和声纳信号处理抱有浓厚兴趣,已发表多篇高影响力论文。此外,还积极担任多家知名期刊的审稿人。(来源:ResearchGate

摘要

在当今先进制造时代,尽早诊断机械故障以确保其安全高效运行变得比以往任何时候都更为关键。随着现代工业过程日益复杂,传统的机械健康监测方法已难以提供高效性能。在工业大数据激增以及传感与计算技术进步的推动下,基于机器学习/深度学习方法的数据驱动式机械故障诊断解决方案已在制造应用中广泛应用。在工业应用中,及时、准确地识别故障机械信号至关重要,为此已提出诸多相关解决方案,并在早期文献中多有综述。尽管目前存在大量关于机械故障诊断的解决方案和综述,但是现有文献大多聚焦于特定设备类型或分析方法,导致其在广泛制造环境中的适用性受限。此外,关于实施数据驱动方法所面临挑战的讨论(例如处理噪声数据、选择合适特征、以及调整模型以适应新的或未知故障)往往流于表面或完全被忽略。因此,本综述对采用不同类型机器学习方法检测和诊断各类机械故障的文献进行了全面回顾,重点评述了其优势与局限性;梳理了用预测分析的方法;详尽探讨了可用的机械故障数据集;向未来研究者介绍了应用这些方法进行故障诊断时可能遇到的挑战,并提出了缓解这些问题的可能解决方案。同时,本文也指明了未来研究前景,以促进对该领域的深入理解。我们相信,本文将为研究人员提供帮助,并促进该领域的进一步发展。

关键词数据驱动;深度学习;故障检测;联邦学习; 机械故障;机器学习 ;预测性维护;强化学习

目录

1 引言

   1.1 研究背景

   1.2 研究动机

   1.3 文章结构

实施的方法论与开发的分类法

机械设备故障数据(与分析)

   3.1 数据类型与分析

   3.2 数据增强

4 数据驱动方法

   4.1 传统数据驱动方法

   4.基于深度学习的数据驱动方法

   4.3 基于强化学习的故障诊断

   4.4 基于迁移学习的故障诊断

   4.5 其他方法

5 挑战

   5.1 数据相关挑战

   5.2 旋转机械面临的挑战

   6.3 现有方法面临的挑战

   5.4 应用机器学习/深度学习算法面临的挑战

   5.5 其他挑战

6 对未来研究者的建议

   6.1 机械设备与数据集增强

   6.2 算法开发

   6.3 其他建议

7 未来展望

8 结论


注:小编能力有限,如有翻译不恰之处,请多多指正~
     若想进一步拜读完整版,请下载原论文进行细读。

4 数据驱动方法

4.2 基于深度学习的数据驱动方法    

尽管基于传统机器学习的技术在机械设备故障诊断中展现出潜力,但在复杂工业环境下的早期故障检测方面仍存在不足。工业过程的动态性、非线性和多模态特性,使得数据分析变得复杂。传统机器学习方法需要人工进行特征提取和选择,这在处理大型数据集时颇具挑战性,且会导致特征挖掘与决策过程分离,进而造成效率低下 [250]。随着机器复杂度和数据维度的增加,这些局限性制约了经典模型的有效性。此外,依赖人工经验的传统故障检测方法耗时、易出错,难以满足现代工业系统的需求 [27]。噪声的存在以及机械设备信号的非平稳性,进一步增加了故障检测的难度。因此,深度学习在改进故障检测与诊断方面引起了广泛关注。深度学习于 21 世纪 10 年代中期兴起 [251],凭借直接从原始数据中学习有用表征、无需人工特征工程的能力,为机械设备故障诊断带来了变革。结合传感器和物联网的发展,深度学习能够处理海量数据,从而提高故障检测与诊断的准确性和效率 [29,252]。

基于先进数据驱动方法的旋转机械故障诊断,其流程建立在 3.1 节所述的步骤之上(如图 3 所示)。这些步骤包括:(a)收集能够反映设备健康状态的传感器数据;(b)利用各类模型和算法从收集的数据中提取特征;(c)基于提取到的故障敏感特征,识别并分类设备的故障状态 [32]。在这些方法中,振动、声发射、温度和电流数据是常用的数据类型,针对不同的域(时间域、频率域、时频域)会采用特定方法进行特征提取。随后,通过特征选择方法筛选出最相关的特征,用于训练机器学习模型,以实现故障分类、异常检测和剩余使用寿命预测。本节将探讨机械设备故障诊断中所用到的各类深度学习算法的原理、技术及应用。    

4.2.1  与最新先进模型的对比

卷积神经网络被广泛用于机器故障分类。事实上,机械设备故障诊断是基于卷积神经网络的故障诊断(CNNFD:CNN-based FD)中最早且探索最广泛的领域之一,其直接受图像分类原理的启发 [30]。在这种情况下,二维和一维卷积神经网络都有应用。一维卷积神经网络专注于时间序列数据,而二维卷积神经网络处理具有空间 / 时间相关性的多维数据。卷积神经网络的不同变体,如残差网络、密集连接网络、视觉几何组网络、胶囊网络(CapsNet:Capsule Network)、扩张卷积神经网络、基于区域的卷积神经网络等,也已被改编并应用于机械设备故障诊断中,以改进制造和工业流程。为了使综述更有条理,我们根据卷积网络的结构特征,将基于卷积神经网络的故障诊断研究细分为两个方面:使用一维卷积神经网络的故障诊断和使用二维卷积神经网络的故障诊断。

  1. 一维卷积神经网络故障诊断:将一维卷积神经网络用于故障诊断是一种直接的策略,其中原始一维数据可直接作为卷积神经网络模型的输入。如前所述,振动数据是该策略中常用的数据类型。研究 [111] 采用了一个一维卷积神经网络(包含 3 个卷积层和 2 个多层感知器层)对 IMS 数据集进行轴承故障分类。原始振动数据经过几个关键的预处理步骤:通过 8 倍抽取来降低复杂度,提供 12.5 kHz 的带宽;采用低通滤波去除高频成分;对数据进行归一化处理以保证尺度一致性。该研究的准确率达到了 97.1%。同样,Zhang 等人在研究 [76] 中,利用 CWRU 轴承数据集,在噪声干扰和工作环境多变的情况下,采用一维卷积神经网络进行轴承故障诊断。这项研究的独特之处在于使用了 dropout(丢弃)和小批量训练技术,且避免了复杂的预处理。通过重叠切片技术对训练样本进行处理,将其作为一种数据增强方法。研究取得了 99.77% 的出色分类准确率,尤其是在信噪比为 10 的情况下。此外,还采用 t-SNE 方法对分类结果进行可视化和理解。另外,研究 [77] 中实现了一种基于语义空间嵌入的零样本故障诊断方法。该方法使用一个带有两个卷积层和一个全连接层的一维卷积神经网络,从 CWRU 和 TEP 数据集的原始数据中提取故障特征。为实现零样本学习,构建了人工定义的故障标签嵌入作为故障属性矩阵,其中每个轴承故障都具有 7 个细粒度的故障属性。通过余弦距离将特征嵌入与故障属性进行匹配。还有,研究 [112] 利用 IMS 轴承振动数据集,通过一个多通道一维卷积神经网络分类器处理时域振动数据,以增强电动机轴承故障检测效果。对数据进行了 Z-score 标准化和线性缩放预处理。该双通道分类器通过同时使用 x 轴和 y 轴数据,准确率达到 100%;而一个双通道 / 两级分类器能够区分早期和晚期故障程度,平均准确率为 84.64%。同样,在研究 [82] 中,宽核卷积神经网络(WK-CNN:Wide-Kernel CNN)被用于处理三个工业机械故障数据集的原始时间序列数据,这三个数据集分别是 CWRU 轴承数据集、齿轮箱故障诊断数据集和帕德博恩轴承数据集。该方法通过 38880 次模型迭代,重点研究了不同的架构超参数(如核大小、步长和滤波器),分析它们对模型性能的影响。数据预处理包括数据分段、批处理以及划分为训练集和测试集。主要通过准确率分数衡量的结果显示,不同数据集和超参数配置下的性能差异显著,部分模型达到了接近完美的准确率。此外,还采用机器学习 / 深度学习算法进一步理解特定超参数与宽核卷积神经网络性能之间的非线性关系,强调了可训练参数数量对不同数据集的细微影响。

    除振动数据外,其他机械故障信号(如声发射、电流、温度等)也被用作一维卷积神经网络故障诊断的输入。研究 [253] 中,作者提出了一种离心风机叶片损伤识别方法。他们采用了一种多层融合算法,将振动声学信号(在不同风机转速和噪声水平下从声压传感器和加速度计收集)与一维卷积神经网络相结合。首先通过自适应加权融合在数据层面融合声学和振动信号,然后使用一维卷积神经网络进行特征提取,提取的特征随后通过全连接层进行组合。同样,研究 [141] 专注于通过将 ReliefF 特征提取与一维卷积神经网络堆叠双向门控循环单元模型相结合,预测风力发电机叶片结冰故障。该研究使用了中国 2017 年工业大数据竞赛的 SCADA 数据,初始数据预处理包括:利用 ReliefF 将特征维度从 20 维降至 15 维,并通过滑动时间窗口重构数据。采用加权准确率指标解决数据不平衡问题,并使用 5 折交叉验证。结果显示,与传统模型相比,加权准确率显著提高了 43.08%。研究 [254] 旨在通过分析定子电流信号诊断永磁同步电机的故障。收集了不同故障场景和转速下的定子电流数据,形成一个包含 2000 个数据点的数据集,经归一化后分为 1000 个训练样本和 1000 个测试样本。采用了一维卷积神经网络和小波包变换两种关键方法进行特征提取,其中一维卷积神经网络的诊断准确率达到 98.8%,性能优于其他方法。

    随着可解释人工智能(XAI:Explainable Artificial Intelligence)概念的日益普及,在复杂机械系统中对透明且可理解的模型的需求变得前所未有的迫切。为解决这一问题,研究 [101] 利用多小波核(MWK:Multi-Wavelet Kernel)卷积神经网络对齿轮箱的一维振动信号进行了分析。该研究采用了中国东南大学提供的 DDS 数据集和风力发电机齿轮箱数据集。通过将连续小波变换与传统卷积神经网络相结合,这项研究引入了多小波核卷积层和核权重重校准模块,并采用热图对学习到的特征图进行可视化,从而提高了齿轮箱故障诊断中脉冲检测的可解释性。数据预处理包括使用大小为 1024 的滑动窗口对信号进行切割,以及采用标准归一化技术。在不同条件下的齿轮箱故障诊断中,多小波核卷积神经网络的分类准确率均超过 98%。

  2. 二维卷积神经网络故障诊断:最初,应用于机械设备故障诊断的卷积神经网络架构模仿了图像处理中使用的二维结构。由于机械信号主要是一维时间序列,因此主要方法是将这些一维信号转换为二维形式。为此,研究人员采用了多种信号处理方法,下文将对其进行简要说明。

    许多研究人员通过数据矩阵变换将一维时间序列数据转换为二维图像格式,这种格式被称为 “振动图像”[42]。在此过程中,原始一维数据被转换为二维矩阵(图像结构)。例如,若有一个一维信号

           并希望将其转换为        维度的二维矩阵(其中        ),则可应用如下变换:对于        且         ,有        。过程有效地将时间序列数据重构为类似图像的格式,从而能够应用图像处理技术来分析信号模式。除 “振动图像” 外,热成像图 [255] 也被用作卷积神经网络(CNNs)的输入。在机械设备故障诊断(MFD)中,热成像技术是识别指示故障的温度异常的关键手段,可实现非侵入式、连续的监测与诊断,常与振动分析等其他技术结合使用,以预防机器出现重大问题。此外,峭度图[256]、尺度图[45] 和频谱图[42] 是机械故障诊断中重要的信号处理技术,用于分析机器信号与噪声。峭度图通过评估跨频段的信号峭度来检测瞬态故障,突出信号的突然变化。由连续小波变换(CWT:Continuous Wavelet Transform)生成的尺度图提供信号的时频视图,可有效突出随时间变化的频率特征。通过短时傅里叶变换(STFT:Short-Time Fourier Transform)生成的频谱图则提供时频分析,非常适合跟踪机器行为的变化。这些技术通过数学算法处理原始振动或声学数据,将信号转换为视觉形式,从而助力机械故障及潜在缺陷的检测。二维卷积神经网络所使用的数据类型列于表 5 中。

表5 输入类型划分的二维卷积神经网络在机械故障诊断中的应用        
   

作为数据矩阵变换方法的一项应用,Neupane 等人 [42] 利用该技术将原始数据转换为二维矩阵,随后采用一个简单的二维卷积神经网络模型对凯斯西储大学数据集进行轴承故障检测。同样,在一项创新性研究中,Jiao 等人 [302] 提出了一种深度耦合密集卷积网络(CDCN:deep coupled dense convolutional network)用于机械故障诊断。该网络采用一维卷积结构和密集连接,能有效从原始的非平稳机械信号中提取特征。与传统的数据拼接技术不同,该模型将多传感器数据作为并行输入进行整合。这些传感器同时捕捉横向和扭转振动,通过双层信息融合方法实现更精准的故障识别。深度耦合密集卷积网络模型的准确率达到 99.39%,相较于传统卷积神经网络、单传感器数据方法以及基于数据拼接的融合技术,在识别准确率、收敛速度和分类精度方面均表现更优。所有实验均在英特尔酷睿 i7 处理器和英伟达 GTX 1060 显卡上重复进行 10 次,以减少随机性。作者在试验台上模拟并测试了行星齿轮箱的 9 种健康状态,实验在 20Hz 驱动转速、2N・m 负载条件下进行,数据采样频率为 5kHz,最终针对 9 种状态形成包含 5400 个样本的数据集;他们还添加了高斯白噪声,以模拟真实恶劣的工业环境。尽管该模型可能会增加计算成本,并导致训练与测试数据分布之间出现差异,但其良好的实验结果及计划中的改进表明,该方法为智能故障诊断领域的发展做出了重要贡献。

另一种转换方法是将来自时域或频域的统计数据作为卷积网络的输入。在研究 [303] 中,研究人员使用带有加速度计和高速相机的齿轮试验台,以振动信号的快速傅里叶变换(FFT)频谱生成的二维灰度图像为输入,训练了一个卷积神经网络(VGG16 ConvNet)。该数据集包含 600 张图像,来自塑料齿轮耐久性测试,其中 500 张用于训练,100 张用于测试。研究采用迁移学习的方法,将最初在 ImageNet 上训练的 VGG16 网络用这些振动数据图像重新训练。在预处理步骤中,通过 FFT 频谱峰值提取方法将振动信号转换为图像。该方法包括以锯齿模式在 0Hz 至 1600Hz 的频率范围内每隔 16.67Hz 选取振幅峰值,生成 12×16 像素的灰度图像。每张代表频率振幅和相位的图像,根据高速相机的观测结果被标记为 “有裂纹” 或 “无裂纹”,为卷积神经网络训练提供带标签的数据。值得注意的是,这项研究的训练准确率达到 99%,测试准确率达到 100%,其主要目的是检测塑料齿轮的裂纹,重点重新训练了模型的最后两层。此外,研究 [83] 介绍了一种滚动轴承故障诊断方法,该方法将深度卷积神经网络(DCNN:Deep Convolutional Neural Network)与免疫算法相结合。这种技术使用从轴承故障信号的时域和频域转换而来的二维图像作为深度卷积神经网络的输入。利用凯斯西储大学数据中心的数据,该方法结合深度卷积神经网络进行特征提取,并利用免疫算法自适应学习新故障。预处理包括将振动信号转换为二维图像。该方法的故障识别准确率超过 98%,有效减少了误报和漏报,通过先进的机器学习技术展示了其在自适应学习和故障诊断准确性方面的优势。研究 [256] 则专注于利用卷积神经网络(具体是改进的 LeNet-5 架构)进行滚动轴承的故障诊断。它独特地将一维声发射信号转换为二维峭度图图像,以适应卷积神经网络的输入要求。该数据集包括来自不同故障状态和正常状态轴承的声发射信号。预处理包括使用 1/3 二叉树方法将一维信号转换为二维峭度图。快速峭度图算法中的 1/3 二叉树方法是一种扩展,它使用三个额外的带通滤波器对信号序列进行进一步分解,在几乎不增加计算成本的情况下实现了更精细的频率和分辨率采样。通过这种方法,不同转速下各种轴承状态的分类准确率超过 95%,其中部分状态在 500RPM 时的准确率达到 100%。研究 [81] 还介绍了 AntisymNet,这是一种用于旋转机械故障诊断的轻量级卷积神经网络,它将一维振动信号转换为二维图像进行处理。利用 MiniImageNet、CWRU 轴承、渥太华轴承和 Hob 等数据集,该模型取得了较高的准确率(在 CWRU 数据集上高达 99.70%)。AntisymNet 的创新架构结合了正向和反向分支,用于高效的特征提取和融合,在降低复杂度的同时,在不同数据比例下都表现出良好的性能,凸显了其在工业故障诊断中的实际应用价值。另外,在研究 [304] 中,研究人员对一台连接到 SpectraQuest MFS 的 0.5 马力感应电机进行了分析,使用了两个加速度计。该研究采用多头一维卷积神经网络,通过分析一维振动信号来诊断电机故障,包括轴弯曲和轴承问题。数据被划分为 256 个样本的窗口,来自四次实验运行。配备 Leaky ReLU 和早停功能的卷积神经网络,其故障识别准确率达到 99.92%。

除上述所用的图像类型外,一些研究人员还将热成像图用作卷积神经网络的输入。Li 等人 [255] 开发了一种基于卷积神经网络的红外热成像(IRT:Infrared Thermal)图像故障诊断方法,这些图像是通过红外热成像技术从机械设备上捕捉到的。从 SpectraQuest 机械故障模拟器获取的红外热成像图像是从热视频中选取的,用于构建数据样本,并将其输入到卷积神经网络模型中进行故障检测。所用的故障类别数量为 10 类,且使用 SoftMax 作为分类器。同样,在他们关于机器故障诊断的研究 [165] 中,研究人员采用了一个坚固的轴承试验台,该试验台配备有一台 220 伏、2 马力的直流电机,用于模拟各种轴承故障,如内圈故障、外圈故障、滚珠故障和润滑问题。通过单轴加速度计收集振动数据,并通过热成像相机获取红外热成像数据。他们采用二维卷积神经网络,通过连续小波变换将一维振动数据处理为二维尺度图图像,并通过红外热成像技术提取热成像图像。为提高计算效率,这些数据被转换为灰度图,这使得卷积神经网络在恒速条件下的故障诊断准确率达到 100%,而在转速变化时准确率略有下降。

采用结合可解释人工智能原理的二维卷积神经网络,研究 [101] 提出了一种用于机械设备故障诊断的多层小波注意力卷积神经网络(MWA-CNN:Multilayer Wavelet Attention CNN),该网络将卷积神经网络与小波变换技术相结合。它采用离散小波变换层和频率注意力机制,以增强抗噪声能力和可解释性。该方法在离散小波变换层和卷积层之间交替进行,实现信号分解和特征学习。研究所用数据来自高速航空轴承和电机轴承(DIRG 轴承数据集和 PU 轴承数据集),预处理阶段采用 Z-score 标准化,通过滑动分割进行数据增强。值得注意的是,多层小波注意力卷积神经网络取得了较高的诊断准确率(在 4 分贝信噪比下为 98.75%,在 - 4 分贝信噪比下为 87.61%)。这种方法通过使网络聚焦于相关特征信息,提高了可解释性,符合可解释人工智能原理,从而增强了决策的透明度。其他一些应用卷积神经网络的研究成果汇总于表6中。

表6 应用卷积神经网络于机械故障诊断的论文      
 

4.2.2  基于循环神经网络(RNN)的故障诊断(FD)

循环神经网络旨在通过顺序处理输入并利用反馈环路记忆过去的状态来处理时间序列数据,这使其非常适合分析振动、温度等机械信号的时间特性。这种能力使其能够有效地进行故障检测和剩余使用寿命预测。然而,循环神经网络常常受到梯度消失和梯度爆炸问题的困扰,这限制了它们从长序列中学习的能力 [1]。这促使了诸如长短期记忆(LSTM:Long Short-Term Memory)单元和门控循环单元(GRUs:Gated Recurrent Units)等高级版本的发展,这些网络融入了门控机制,以改善对长期依赖关系的学习 —— 这一点对于机械设备的可靠故障诊断至关重要。

  • 长短期记忆网络和门控循环单元:长短期记忆网络旨在解决循环神经网络的梯度消失问题。它们采用更复杂的单元结构,包含一个记忆单元、输入门、输出门和遗忘门,能够学习并保留输入序列中的长期依赖关系。门控循环单元(GRUs:Gated Recurrent Units)的架构比长短期记忆网络更简单,将输入门和遗忘门合并为一个单一的更新门,并将细胞状态与隐藏状态合并。这使得门控循环单元在计算上更高效,同时保持与长短期记忆网络相近的性能 [307]。

  • 双向循环神经网络:双向循环神经网络(BiRNN:Bidirectional RNN)结合了两个信息流向相反的循环神经网络(RNN:Recurrent Neural Network)层,增强了对时间序列的敏感性。它同时考虑过去和未来的数据,这使其在动态机械故障诊断中极具价值 —— 在这类诊断中,捕捉跨时间的信息对于识别故障类型和严重程度至关重要。这种方法显著提高了故障识别效果 [40]。

  • 混合方法:此外,混合方法如循环神经网络编解码器(可处理变长序列,将输入编码为嵌入向量并解码为不同长度的输出)[37, 38, 104, 308]、卷积循环神经网络(CRNN:Convolution RNN)模型(卷积神经网络提取空间特征,循环神经网络分析时间依赖关系)[132, 309–311]、隐马尔可夫模型 - 循环神经网络[307] 等,也被应用于机械设备故障诊断(MFD:Machinery Fault Diagnosis)中。

在针对往复式压缩机故障诊断的研究 [314] 中,研究人员通过贝叶斯优化对长短期记忆网络模型进行了优化。该方法包括对单个传感器的振动信号数据进行预处理,在保留时间细节的同时降低维度。这一过程结合人工数据增强,提升了长短期记忆网络检测 17 种不同故障状态的能力,其性能优于传统及先进的深度学习技术。研究通过混淆矩阵评估模型的诊断精度,重点关注准确率、精确率、召回率和 F 值等指标。表现最佳的长短期记忆网络模型取得了 93% 的显著平均准确率。同样,研究 [39] 开发了一种基于深度长短期记忆网络(DLSTM:deep LSTM)的方法,用于预测美国国家航空航天局涡扇发动机的剩余使用寿命,该方法利用了 CMAPSS 平台的 FD001 和 FD003 数据集。深度长短期记忆网络模型采用多传感器数据融合、网格搜索优化和 Adam 优化算法,并通过丢弃方法防止过拟合。预处理步骤包括通过指数平滑降噪,以及基于信号相关性和单调性的特征选择,这使得模型在多个性能指标上表现优异,如最低分数、R 值和剩余使用寿命误差范围。此外,研究 [307] 提出了一种基于改进门控循环单元网络的回转支承寿命预测模型,该网络通过飞蛾火焰优化算法进行优化,并与隐马尔可夫模型结合用于早期退化检测。该方法包括使用基于鲁棒局部均值分解的希尔伯特变换进行信号预处理,以及在时域和频域进行特征提取。通过与标准机器学习方法对比验证,该模型在挖掘机回转支承的趋势预测和剩余寿命预测中表现出更高的准确性和鲁棒性,其平均准确率达到 92%。研究 [40] 还采用了一种基于多时间窗口的卷积神经网络 - 双向长短期记忆网络,以解决工业中状态监测数据长度不一致的问题,并利用美国国家航空航天局 C-MAPSS 数据集预测涡扇发动机的剩余使用寿命。该方法的预处理包括特征选择、归一化,以及通过分段线性函数进行标签修正。研究使用不同的时间窗口大小来捕捉多样的时间依赖关系,相比固定窗口方法提升了模型性能。同时,采用加权平均法聚合多个基础模型的结果,优化集成框架的性能。在研究 [315] 中,研究人员开发了一种采用双向卷积长短期记忆网络的深度学习框架,该框架结合了卷积神经网络和长短期记忆网络的优势,用于行星齿轮箱的故障诊断。研究数据来自新南威尔士大学搭建的行星齿轮箱试验台 [316],涵盖了针对不同故障类型和工况的 252 次测试。这些数据被分割为二维矩阵,通过双向卷积长短期记忆网络进行处理。该方法的性能优于卷积长短期记忆网络、卷积神经网络 - 双向长短期记忆网络等基准方法,总体分类准确率达到 84.72%,其中对故障类型和位置的识别准确率为 100%。其他一些在机械设备故障诊断中应用循环神经网络的研究成果列于表 7 中。

表7 应用循环神经网络于机械故障诊断的论文    
 

4.2.3  基于自编码器的故障诊断

自编码器是一类用于无监督学习的神经网络,由于其能够从数据中提取复杂特征,并且凭借编码器 - 解码器结构可实现异常检测,因此在机械设备故障诊断中扮演着重要角色。基于自编码器的方法易于实现和训练。通过设置隐藏层节点数量少于输入层节点数量,自编码器还可作为一种非线性降维工具,其性能优于核主成分分析。

自编码器凭借其编码器 - 解码器结构,在机械设备故障诊断的无监督学习(USL:Unsupervised Learning)中至关重要,该结构在特征提取和异常检测方面效果显著。作为一种非线性降维工具,当自编码器的隐藏层节点数少于输入层节点数时,其性能优于核主成分分析等方法。它能凸显与正常状态的偏差,从而指示故障,并有助于故障类型的分类和部件诊断。自编码器的多种变体进一步增强了其性能,例如稀疏自编码器(SpAE:Sparse AE)、堆叠自编码器(StAE:Stacked AE)、去噪自编码器(DAE:Denoising AE)、变分自编码器(VAE:Variational AE)和收缩自编码器(CAE:Contractive AE),这些变体能够有效处理多模态数据和含噪数据。此外,将卷积神经网络等先进神经模块用于图像数据,将循环神经网络用于时间序列数据,可实现动态表示学习,这使得自编码器成为集成学习中的可靠选择,有助于提升机械设备故障诊断模型的泛化能力 [28]。在机械设备故障诊断中应用的自编码器变体包括:

  • 疏自编码器:稀疏自编码器对隐藏层的激活施加稀疏性约束,迫使模型学习输入数据的紧凑且稳健的表示。在稀疏自编码器中,正则化项本质上是库尔贝克 - 莱布勒(KL:Kullback–Leibler)散度,它用于衡量隐藏层激活值的分布与预设目标概率分布之间的差异 [29]。部分在研究中使用稀疏自编码器的文献包括 [90,91,126]。

  • 去噪自编码器:去噪自编码器旨在实现稳健的特征提取,其训练方式是从被刻意添加人工噪声的输入数据中重构出原始的、未受干扰的数据,从而增强模型对干扰的抵御能力。研究 [126, 318, 319] 在其工作中使用了去噪自编码器。

  • 变分自编码器:变分自编码器是一种生成模型,它将推理网络与生成网络相结合,将输入数据映射到一个概率潜在空间。它们将特征提取构建为变分贝叶斯推理问题,通过优化似然函数来有效学习观测数据与潜在表示之间的概率关系。这种方法在潜在空间上施加了结构化的概率模型,其中编码器推断分布参数,从而实现稳健且有意义的特征生成 [28]。研究 [148, 186, 320–322] 在其工作中使用了变分自编码器。

  • 收缩自编码器:收缩自编码器在经典的重构损失函数中添加了一个惩罚项,这有助于模型纳入一个正则化项,从而促进输入数据与潜在空间之间的平滑映射。由此产生的模型对输入数据中的微小扰动表现出更强的稳健性,并且能更好地泛化到新的故障模式。研究 [323–326] 是一些在智能系统中采用收缩自编码器进行机械故障诊断的案例。

  • 堆叠自编码器:堆叠自编码器通过在损失函数中纳入一个正则化项(特别是雅可比矩阵的弗罗贝尼乌斯范数平方)来增强稳健的特征提取。该术语惩罚对输入变化的敏感性,从而鼓励模型学习从输入到潜在空间的平滑映射,并提高其对新模式的泛化能力,尤其是在存在噪声的情况下。2018 年之前,堆叠自编码器的一般应用得到了广泛研究 [28]。它们已成功应用于机械设备故障诊断,包括但不限于研究 [318, 320, 323]。

  • 改进型和混合型自编码器:研究人员提出了各种自编码器的改进版本和混合版本,以改进机械设备故障诊断。例如,将循环神经网络或长短期记忆网络与自编码器结合,以捕捉时间依赖关系。卷积自编码器(ConvAE:Convolutional Autoencoder)利用卷积神经网络(CNNs:Convolutional Neural Networks)处理空间或时间数据,提高了故障检测性能 [317, 327–329]。结合聚类或分类算法的混合方法也增强了故障检测和诊断系统 [330–332]。一些在机械设备故障诊断中应用自编码器的研究成果列于表 8 中。

    表8 应用自编码器于机械故障诊断的论文          
       

4.2.4  基于深度信念网络的故障诊断

深度信念网络由辛顿等人于 2006 年提出 [333],是一种深度学习网络,其结构通过堆叠多层受限玻尔兹曼机(RBMs:Restricted Boltzmann Machines)以分层方式构建而成。深度信念网络的第一层包含一个受限玻尔兹曼机,用于对输入数据进行建模;而后续各层则由受限玻尔兹曼机构成,这些层负责捕捉从上层衍生而来的隐藏表示。这种架构支持无监督预训练,通过对比散度或持久对比散度来初始化网络权重和偏置。这种预训练策略能够减轻过拟合问题,并增强模型对未知数据的泛化能力。受限玻尔兹曼机的主要组成部分包括用于可见单元和隐藏单元的二元随机变量。

深度信念网络在从特定数据表示中提取故障特征方面表现出色,其在机械设备故障诊断中的应用正不断增加。研究 [95] 提出了一种基于深度信念网络的轴承故障诊断方法。该方法使用凯斯西储大学轴承数据集的一维输入数据,构建了多个具有不同超参数的深度信念网络,并通过改进的集成方法对其进行整合。这些深度信念网络采用二元单元和高斯单元,通过对比散度进行训练。经交叉验证测试,该方法的准确率高达 96.95%,证明了其在复杂条件下故障诊断的有效性。此外,研究 [335] 提出了一种优化的深度信念网络,该网络采用改进的逻辑 sigmoid 单元,用于风力发电机齿轮箱的故障诊断。研究使用了来自人工设置故障的齿轮箱的振动信号数据集,并采用 Morlet 小波变换、峰度指数和软阈值法进行信号预处理。改进的 sigmoid 单元提高了收敛速度和分类准确率:在 MNIST 数据库、验证数据和齿轮箱故障数据上测试时,该方法的性能优于传统单元,准确率高达 96.32%,且收敛速度快。另外,Yan 等人在研究 [96] 中提出了多尺度级联深度信念网络,用于旋转机械的故障检测,其使用的数据来自凯斯西储大学轴承数据集和华北电力大学齿轮振动数据集的原始振动信号。该方法采用改进的粗粒度多尺度处理和三层深度信念网络进行特征提取,将数据分割和傅里叶频谱计算作为预处理技术,最终获得了超过 99% 的分类准确率。

陶等人的另一项研究 [336] 专注于基于深度信念网络(DBN:Deep Belief Network)架构的轴承故障诊断,该架构由多层受限玻尔兹曼机、反向传播神经网络(BPNN:Backpropagation Neural Network)以及多传感器信息融合组成。该方法包括从各种故障轴承中获取多个振动信号,从这些信号中提取时域特征,然后将数据输入深度信念网络以生成用于故障诊断的分类器。实验在 QPZ-II 数据集上进行,并与支持向量机、K 近邻和反向传播神经网络方法进行了对比,结果表明基于深度信念网络的方法对训练样本的识别准确率达到 97.5%,对测试样本的识别准确率达到 95.5%,表现更优。此外,研究 [337] 重点使用了三种不同的架构:深度玻尔兹曼机、深度玻尔兹曼机和堆叠自编码器。该方法通过四种方案对振动信号进行预处理,涵盖时域、频域和时频域。数据集包括从旋转机械系统中收集的七种滚动轴承故障模式。对深度学习网络模型的性能评估以准确率为指标,在最佳设置下准确率超过 99%。

除分类任务外,深度信念网络还被用于旋转机械的剩余使用寿命预测。研究 [106] 采用深度信念网络,结合局部线性嵌入(LLE:Local Linear Embedding)和扩散过程,对 FEMTO 数据集的轴承剩余使用寿命进行预测。其中,深度信念网络用于特征提取,局部线性嵌入用于确定健康指标(HI:Health Index)。健康指标基于扩散过程演化,并且根据首达时间推导得到预测剩余使用寿命的概率密度函数。此外,研究 [338] 提出了一种基于无监督学习的旋转机械故障诊断模型,该模型整合了稀疏自编码器(SpAE:Sparse Autoencoder)、深度信念网络和二进制处理器。该方法使用稀疏自编码器对频域信号进行编码,编码后的信号经二进制处理器处理后输入深度信念网络进行故障诊断。整个过程无需带标签的训练数据,因此完全属于无监督学习。研究所用数据集为凯斯西储大学轴承数据集和齿轮点蚀数据集,通过快速傅里叶变换将时域信号转换为归一化的频域信号。在预处理阶段,二进制处理器将稀疏自编码器的输出转换为二进制数据,从而提高深度信念网络中受限玻尔兹曼机的效率。其他一些在机械设备故障诊断中应用深度信念网络的研究成果汇总于表 9 中。

表9 应用深度信念网络于机械故障诊断的论文      
 

4.2.4  基于生成式神经网络的故障诊断

生成对抗网络(GAN:Generative Adversarial Network)由 [339] 于 2014 年提出,是一种出色的无监督生成算法,能够从随机分布中学习生成逼真的数据。生成对抗网络被公认为 “全球十大突破性技术” 之一 [26],它由一个从随机噪声中生成合成样本的生成器(G:Generator)和一个区分真实样本与合成样本的判别器(D:Discriminator)组成。生成器和判别器均被设计为深度神经网络。生成器通过其参数将潜在变量映射到数据空间;判别器则通过其参数估计样本为真实或伪造的概率。这种结构形成了一个双人极小极大博弈。

生成对抗网络已在众多研究领域得到应用,包括自然语言处理、计算机视觉等。在故障诊断领域,它们最初被用于数据增强—— 通过生成符合相同数据分布的额外样本,解决小样本量问题。随后,GANs 被应用于对抗性跨域故障诊断(即对抗性域适应),这与数据增强不同:它利用目标域和源域数据进行对抗性训练,以提取域不变特征。此外,这些算法还被用于半监督学习和异常检测 [121,340]。为解决 GANs 存在的模型崩溃、训练不平衡等局限性,研究者们进行了各种改进和优化,由此产生了不同的 GAN 变体。根据改进方向,这些变体可分为两类:结构导向型改进损失导向型改进[26]。

  1. 结构导向型改进:基于结构改进的生成对抗网络可进一步分为三类:基于卷积的生成对抗网络、基于条件的生成对抗网络和半监督生成对抗网络。为解决原始生成对抗网络在特征提取和训练方面的低效问题,深度卷积生成对抗网络(DCGAN:Deep Convolutional GAN)被开发出来 [184]。它在判别器和生成器中采用卷积层和反卷积层,提高了稳定性,并通过权重共享和局部连接增强了性能。另一方面,基于条件的生成对抗网络(包括条件生成对抗网络(CGAN:Conditional GAN)[181]、信息生成对抗网络[341] 和辅助分类器生成对抗网络(ACGAN:Auxiliary Classifier GAN)[342])解决了标准生成对抗网络的模式崩溃问题。条件生成对抗网络利用类别信息进行引导生成;信息生成对抗网络采用潜在编码和额外的分类器来增强输入与输出的相关性;辅助分类器生成对抗网络集成了一个辅助网络,用于故障分类以及区分真实数据与合成数据。此外,半监督生成对抗网络(SSGAN:Semi-Supervised GAN)在低标签数据场景中能高效利用未标记数据。它在判别器中配备了一个 softmax 分类器,用于区分真实输入与合成输入,并对真实样本进行分类,从而实现半监督学习(USL:Unsupervised Learning)[341]。

  2. 损失导向型改进:损失导向型生成对抗网络的开发旨在稳定训练过程,并解决标准生成对抗网络中存在的梯度不稳定、模式崩溃等问题。瓦瑟斯坦生成对抗网络(WGAN:Wasserstein GAN)[343] 采用瓦瑟斯坦距离来更稳定地度量真实样本与伪造样本之间的差异,不过其性能受到权重裁剪的限制。带梯度惩罚的瓦瑟斯坦生成对抗网络[185] 通过添加梯度惩罚进一步优化,以解决这些局限性。毛等人提出的最小二乘生成对抗网络(LSGAN:Least Squares GAN)[344] 采用最小二乘损失函数,根据样本与决策边界的接近程度对其进行惩罚,从而稳定训练过程。此外,基于能量的生成对抗网络(EBGAN:Energy-Based GAN)[345] 和边界平衡生成对抗网络(BEGAN:Boundary Equilibrium GAN)[346] 分别在其判别器中创新性地引入了自编码器和编码器 - 解码器结构,其中后者还包含一种平衡强制算法。这些变体通过聚焦于损失函数和训练策略的修改,共同优化了标准生成对抗网络框架,以解决特定的挑战。

    生成对抗网络在机械设备故障诊断中的应用(亦汇总于表 10 中)可分为以下几类:

    表10 生成对抗网络在机械故障诊断中的应用          
           
  • 数据增强与平衡:基于生成对抗网络(GANs)的数据增强和类别平衡技术的最新进展,有助于解决故障诊断中的小样本和数据不平衡问题。在数据增强方面,标准流程是收集各类故障状态数据,用真实样本训练生成对抗网络,然后将生成的合成样本与真实数据结合起来训练分类器。生成对抗网络主要用于机械故障诊断,尤其适用于处理传感器采集的振动信号,能从有限数据中生成伪样本。这些方法可分为针对一维时域、一维频域、二维图像信号以及一维特征集生成合成数据的类型 [26, 347]。

  • 异常检测:在基于生成对抗网络的机械设备故障诊断中,异常检测正变得日益重要,尤其是在仅能获取正常运行数据的情况下。该方法通过对正常样本的学习来划定区分正常状态与故障状态的边界。现代方法借助对抗性学习改进这一过程,摆脱了对人工生成特征的依赖。其核心思想是利用生成对抗网络生成合成样本,然后通过这些样本与原始正常样本之间的重构损失来检测异常。这种方法不仅在故障诊断领域得到认可,还在其他需要高效且可靠异常检测的领域中得到应用 [130, 340]。

  • 半监督对抗学习:在标记数据稀缺的情况下,半监督学习被用于利用未标记数据进行模型训练。这种方法将未标记数据与对抗策略相结合,以增强训练效果 [65, 121]。

  • 用于迁移学习的对抗训练:对抗训练被应用于迁移学习,即所谓的对抗性域适应(ADA:Adversarial Domain Adaptation),它利用源域数据来补充有限的目标域数据。对抗性域适应模型分为两类:一类是对抗性判别模型,其生成用于故障分类的域不变特征;另一类是对抗性生成模型,其通过学习数据分布或在域间转换数据来促进域适应 [67, 68]。

4.3 基于强化学习的故障诊断  

强化学习是机器学习的一个子领域,它是一种计算技术,专注于训练智能体在环境中通过与环境交互,并从获得的奖励或惩罚反馈中学习,从而做出决策。强化学习起源于两个主要研究领域:第一个是通过利用价值函数和动态规划实现的最优控制;第二个则从动物心理学中汲取灵感,尤其是试错搜索的概念 [363]。在连接主义背景下,强化学习与监督学习(SL:Supervised Learning)存在明显区别 [364]。在强化学习中,从环境中接收到的反馈信号是用于评估行动的有效性,而非指导系统如何产生正确的行动 [149]。强化学习智能体的主要目标是学习一种最优策略,该策略能将状态映射到行动,以最大化长期的预期累积奖励。这一学习过程可通过多种算法实现,例如 Q 学习、深度 Q 网络(DQN:Deep Q-Networks)、近端策略优化(PPO:Proximal Policy Optimization)、演员 - 评论家方法(Actor-Critic methods)等 [365]。

近年来,将强化学习应用于机械故障检测、诊断、分类及剩余使用寿命预测的研究兴趣日益浓厚。强化学习已在多个领域得到应用,包括输电线路故障诊断 [366]、智能电网运行优化 [367]、液压机故障检测 [368]、工业过程控制 [363] 等。此外,强化学习的应用场景可分为离线和在线两种。在离线场景中,研究人员已探索了强化学习在制造业中的应用,相关研究 [369, 370] 便是例证。离线强化学习通常涉及基于历史数据训练模型,以进行预测和决策 [371]。另一方面,强化学习也适用于在线场景,在该场景下,它能实时运行以快速识别故障并采取纠正措施。强化学习在在线场景中的应用是一个动态且不断发展的领域,研究 [117, 372] 对此方面进行了探讨。在机械故障检测中选择离线还是在线强化学习,取决于多种因素,如机械的特性、实时数据的可用性以及期望的响应时间。这两种方法都为该领域做出了重要贡献,并且在不断发展,旨在改进工业流程、提高设备可靠性、减少停机时间,最终提升机械运行的整体效率和安全性。

在机械故障检测、诊断与分类中应用强化学习,涉及训练强化学习智能体基于观测数据(如振动信号、声发射信号或热成像图像)做出决策。强化学习智能体可通过与数据交互,并接收奖励或惩罚形式的反馈,来学习识别不同的故障状态。在大多数机械设备故障诊断研究中,故障诊断被视为一种类似猜谜游戏的分类任务。研究人员构建了一个类似 “故障诊断游戏” 的模拟环境:向智能体呈现带有故障样本和标签的问题,智能体需要对这些故障进行诊断。在 K 类故障诊断场景中,猜测动作空间的范围是 0 到 K-1,其中 0 表示正常状态,k 表示第 k 种故障类型。智能体猜对会获得奖励,猜错则会受到惩罚。通过多轮这种猜谜游戏,智能体旨在利用监测设备的传感器数据,学习出用于故障识别的最优策略。研究 [70] 中也采用了类似的方法,研究者将强化学习方法用于旋转机械的智能故障诊断。该研究中,智能体基于堆叠自编码器构建,通过深度 Q 网络学习故障诊断。这种方法结合了强化学习和深度学习,实现了机械的端到端故障诊断 —— 其中,经验回放和奖励机制帮助智能体在极少外部指导的情况下,从原始振动信号中学习故障映射关系。

除分类任务外,研究 [74] 中提出了一种基于强化学习的自动神经架构搜索(NAS:Neural Architecture Search)方法。该研究在生成器网络中采用了一种名为 Nascell 的特殊循环神经网络单元,并构建了由两个堆叠的 Nascell 单元组成的控制器层。控制器输出用于构建卷积神经网络(CNN:Convolutional Neural Network)架构的参数,包括每一层的卷积核大小、核数量和池化大小。整个过程包括迭代生成网络配置、训练子模型,并通过策略梯度更新以最大化模型准确率(作为奖励)。这种迭代过程持续进行,直到搜索收敛到最优架构,期间偶尔会注入随机性以避免陷入局部最优。简而言之,控制器充当智能体,塑造卷积神经网络架构,而强化学习则用于在架构搜索空间中寻找性能更优的模型。此外,研究 [159] 中采用了多标签迁移强化学习(ML-TRL:Multi-label Transfer Reinforcement Learning)用于轴承的复合故障诊断。该方法结合深度强化学习(DRL:Deep Reinforcement Learning)和迁移学习,以增强故障特征提取并提高复合故障识别的准确率。多标签迁移强化学习的性能优于传统方法,其对迁移学习的运用包括对卷积层进行预训练,从而降低了深度强化学习的训练复杂度。

类似地,研究 [72] 采用了一种结合强化学习和神经架构搜索的自动化方法来设计故障诊断模型。其中值得关注的优化包括:采用贪婪策略防止陷入局部最优,利用经验回放平滑学习过程,以及通过权重共享降低计算需求。此外,研究 [149] 中采用了基于深度 Q 网络的强化学习框架,用于优化带通滤波器的上下截止频率,以实现旋转机械信号的故障诊断。带通滤波器充当智能体,其状态由这些频率定义。智能体与信号环境交互,根据其突出故障特征频率的效果获得奖励信号,目标是最大化该奖励。深度 Q 网络算法通过迭代优化频段,找到用于故障识别的最佳范围。在齿轮和轴承故障信号上的实验结果表明,这种基于深度强化学习的方法在识别故障相关频率方面,性能优于快速峭度图、基尼指数图等传统技术。研究 [117] 专注于开发一种用于机械故障诊断的在线域适应学习方法,该方法通过胶囊网络(Cap-net:Capsule Network)作为智能体,自主从在线数据中提取故障特征。研究设计了基于粗粒度相似度(CS:Coarse-grained Similarity)的特征字典,用于标记在线数据,并采用基于粗粒度相似度的奖励机制来评估粗粒度标签。该方法的流程包括:初始化胶囊网络,利用在线数据响应和奖励更新网络,以及结合历史数据对网络进行微调。目标网络和评估网络会迭代更新,同时采用自修剪机制优化在线特征字典。其他一些在机械设备故障诊断中应用强化学习的研究成果列于表 11 中。

表11 应用强化学习于机械故障诊断的论文      
   
4.4 基于迁移学习的故障诊断
 
迁移学习是机器学习中一种极具前景的范式,它解决了深度学习在实际应用中的局限性,尤其是在处理数据有限以及训练数据集与测试数据集存在分布差异的情况时 [21]。深度学习模型通常需要大量带标签的数据才能表现良好,但在工业场景中,收集此类数据(尤其是故障数据)往往耗时且困难,因此这一要求在实际中常常难以满足。迁移学习通过从相关但不同的领域迁移知识,来提升模型在新任务中的性能,从而缓解数据稀缺问题并降低计算需求 [373]。借助从相关领域获取的知识,迁移学习不仅能在有限数据下增强学习效果,还能确保对复杂数据集的稳健泛化和有效特征提取。这使得迁移学习成为传统机器学习方法可能难以应对的应用场景中的宝贵工具。在机械设备故障诊断中,迁移学习的应用十分广泛。在本综述中,我们将其应用分为以下两类:  

4.4.1  直接迁移

直接迁移方法是指利用在一个数据集(源域)上训练好的预训练模型,将其应用于另一个数据集(目标域),且几乎不进行额外训练或仅进行少量训练。这种方法在目标域数据稀缺时尤为实用,因为它能让模型利用从相似但不同条件中学习到的模式和特征。该方法的效果取决于源域与目标域之间的相似性:域的相似度越高,模型性能越好。如果两个域差异较大,可能需要进行微调,但直接迁移方法仍能有效解决带标签数据稀缺的问题。例如,在凯斯西储大学轴承等大型带标签数据集上预训练的模型,可应用于数据稀疏或运行条件不同的目标域。通过准确率、精确率等指标评估模型性能,必要时进行微调,以确保其良好适应新域。研究 [46-48, 114, 374-376] 是一些在机械设备故障诊断(MFD)中采用预训练模型的案例。

4.4.2  领域适配

近年来,域适应方法在机械设备故障诊断中得到了广泛应用,尤其适用于源域与目标域存在差异的场景。与直接迁移方法不同 —— 后者可能因域偏移导致性能显著下降,域适应方法通过专注于减小域间的分布差异来缓解这些问题。域适应放宽了传统假设中对训练数据和测试数据必须满足独立同分布的要求。通过利用不同但相关域之间的不变特征和核心结构,域适应方法能有效应对域偏移、目标域小样本量、数据集不平衡等挑战 [21, 373]。在这种方法中,会将先前训练好的模型适配到新的但相关的域,以最小化域间差异。深度迁移学习中使用的域适应方法可细分为三类:基于差异的方法、基于对抗的方法和基于重构的方法,下文将对其进行简要介绍。

  1. [A.] 基于差异的方法:基于差异的域适应(DA)方法旨在通过减小神经网络特征层中的差异,来降低源域与目标域之间的差异。该方法主要侧重于对齐两个域的特征分布,使模型能够有效地泛化到目标域。在基于差异的域适应中,核心思想是通过对模型的特征层应用统计方法,来度量并减小源域与目标域之间的距离 [373, 377]。统计变换、结构优化和几何变换是域适应中最小化源域与目标域差异的关键策略。通过调整特征分布的统计特性(如均值和方差),最大均值差异(MMD:Maximum Mean Discrepancy)和相关对齐(CORAL:Correlation Alignment)等技术能够减小域间差异。结构优化涉及修改模型架构或添加层以增强域对齐。此外,几何变换对特征空间的几何属性进行对齐,确保源域与目标域之间的一致性,从而进一步减小差异。研究 [49, 50, 55, 57] 在其工作中应用了基于差异的域适应方法。
  2. [B.] 基于对抗的方法:基于对抗的域适应方法通过域判别器促进域混淆,并学习源域与目标域之间的不变特征。受生成对抗网络中双人博弈思想的启发,该方法由相互竞争的生成器和判别器组成 —— 生成器试图生成与目标域高度相似的数据,而判别器则尝试区分源域数据和生成的数据。在对抗训练过程中,生成器努力迷惑判别器,从而实现更好的域对齐。这些方法分为两类:带额外生成器的生成对抗域适应和不带额外生成器的非生成对抗域适应(non-GADA:non-generative adversarial DA)。生成对抗域适应利用生成器生成类似目标域的数据样本,通过耦合生成对抗网络和对抗性判别域适应(ADDA:Adversarial Discriminative Domain Adaptation)等方法中的变换辅助域对齐。而非生成对抗域适应则不生成新样本,而是将生成器作为特征提取器以最大化域混淆,从而实现域对齐。其采用基于瓦瑟斯坦距离的优化、课程学习和域对称网络等技术来减小域偏移。尽管基于对抗的域适应方法具有样本多样性高、理论上与目标数据接近等优势,但由于难以达到纳什均衡,其面临训练稳定性的挑战 [24, 373]。研究 [51, 52, 157, 378-381] 在其工作中应用了基于对抗的域适应方法。

  3. [C.] 基于重构的方法:基于重构的领域自适应方法致力于通过对源域和目标域的数据进行重构来减小领域差异,在捕捉域间共性的同时确保域内的区分性。这些方法通常采用编码 - 解码框架,即先将数据编码为特征表示,再解码回原始输入,从而构建一个用于对齐的共享域空间。通过共享编码器,模型能够学习到领域不变特征,同时保留领域特定特征。自编码器和 KL 散度等技术可增强领域对齐效果,例如领域分离网络会将领域不变特征和领域特定特征分离开来,以防止负迁移。将自编码器与生成对抗网络相结合的混合模型通过融入循环一致性损失等任务进一步提升性能,这在无监督场景中尤为实用。尽管具有这些优势,但该方法仍面临一些挑战,如难以平衡生成样本的真实性和多样性,以及参数更新的复杂性问题,这使得基于重构的领域自适应成为一种强大但复杂的领域对齐方法 [21,373]。研究 [53,125,152,382] 在其工作中应用了基于重构的技术。

    4.4.3  多领域适配

    多源域适应(MDA:Multi-source Domain Adaptation)利用来自多个具有不同分布的源域的数据,以提升模型在目标域上的性能。与传统的单域适应不同,多源域适应通过对齐多个域的特征来应对信息冲突问题,从而增强模型的泛化能力。其主要方法包括:用于压缩和共享参数的残差自适应模块、用于寻找共性的潜在域发现,以及用于选择最相关源数据的域加权。结合生成对抗网络(GANs)的对抗训练通过最小化域间分布差异,进一步强化了多源域适应的效果。尽管多源域适应颇具成效,但在自动选择和对齐最相关数据方面仍面临挑战,这使其成为故障诊断领域持续研究的焦点 [2, 373]。

    4.4.4 部分迁移学习

    部分迁移学习是一种专门的方法,其中仅源域中的一部分特征或任务与目标域相关 [21]。在机械设备故障诊断(MFD)场景中,这意味着有选择地迁移与特定故障或运行条件相关的知识,而非应用来自源域的整个模型。当目标域的范围较窄,或者源域包含冗余或无关信息时,这种方法尤为实用。通过仅聚焦于最相关的数据,部分迁移学习可最大限度地降低负迁移风险(即无关知识可能导致模型性能下降的风险),并确保迁移的信息能提升目标模型的准确性和有效性。然而,识别相关的子集需要细致的分析和领域专业知识,这使其成为成功故障诊断中一个具有挑战性但至关重要的方面 [382]。

    在概述了迁移学习的相关概念后,这些方法已被越来越多地应用于解决机械设备故障诊断中的实际挑战。郭等人 [99] 通过采用深度卷积迁移学习网络,解决了带标签数据有限以及训练 / 测试分布存在差异的问题。该网络包含两个模块:状态识别模块和域适应模块。状态识别模块利用一维卷积神经网络从原始振动信号中自动提取特征,并对机器健康状态进行分类。域适应模块通过整合域分类器和分布差异度量进一步增强一维卷积神经网络的性能,使模型能够学习域不变特征。这种设置在最大化域分类误差的同时,最小化源域与目标域之间的概率分布距离。通过在三个不同的轴承数据集上进行六项迁移故障诊断实验,该方法得到了验证,结果显示其故障诊断准确率较传统方法有显著提升。类似地,魏等人 [136] 的研究提出了一种针对清华大学行星齿轮箱数据集和 UA-FS 齿轮箱数据集的机械故障诊断方法。该方法利用原始振动信号和加权域适应网络,通过根据工况与目标工况的相似度为其分配权重,来解决因工况变化导致的数据分布偏移问题。研究以分类准确率和最大均值差异为指标,验证了诊断准确率的提升,强调了在变工况下域适应的重要性。另一项研究 [80] 提出了基于小波包变换(WPT:Wavelet Packet Transform)的深度特征迁移学习方法,用于不同工况下的轴承故障诊断。该方法结合了小波包变换(用于构建时频特征图)、深度残差网络(用于特征提取)和多核最大均值差异(用于评估跨域特征的分布差异)。在凯斯西储大学轴承数据集和 MFS-RDS(转子动力学模拟器)数据集上进行的研究显示,在 CWRU 数据集上的平均准确率为 88.59%,而在 MFS-RDS 数据集上的平均准确率为 97.14%。关于多源域适应,Rezaeianjouybari 等人 [68] 的研究指出了以往依赖单一源域且忽略工况变化的模型存在的局限性,并提出了特征级和任务特定分布对齐多源域适应(FTD-MSDA:Feature-level and Task-specific Distribution Alignment Multi-source Domain Adaptation)模型,以解决智能故障诊断系统中的域偏移挑战。在 CWRU 和 PU 轴承数据集上进行的实验表明,FTD-MSDA 模型框架在特征级和任务级对域进行对齐,使用切片瓦瑟斯坦差异来塑造任务特定的决策边界,并成功地将知识从多个带标签的源域迁移到单个无标签的目标域。此外,钱等人 [383] 的研究引入了一种名为自适应中间类别分布对齐的迁移学习方法,针对风力发电机行星齿轮箱的故障诊断,解决了域适应中收敛缓慢和损失振荡的问题。所提出的模型结合了域适应和泛化,利用自适应中间分布机制以及 AdaSoftmax 损失,动态对齐源域和目标域的分布,无需额外的分布距离损失或相关性正则化损失。还有一项研究 [384] 开发了方差差异表示方法,以增强旋转机械故障诊断中的域适应。在三个轴承数据集上的实验结果表明,该方法通过关注方差而非均值,改进了分布差异的表示,更准确地反映了源域与目标域之间的差异。其他一些应用迁移学习的研究成果列于表 12 中。

    表12 应用迁移学习于机械故障诊断的论文

 
4.5 其他方法  

4.5.1  机械故障诊断作为异常检测

在机械设备故障诊断领域,带标签的故障数据匮乏是一项挑战,无监督 / 半监督异常检测技术在识别传统监督方法无法捕捉的故障模式和潜在异常方面发挥着重要作用。这些数据驱动的方法侧重于检测离群值或异常值(即与大多数正常数据样本存在显著偏差的数据点)[390]。多种经典的无监督方法被用于识别数据集中的异常,其中包括:Z 分数,用于衡量某个数据点与均值之间相差多少个标准差;四分位距,通过考虑数据的第一四分位数和第三四分位数之间的范围来识别离群值;孤立森林(iF:Isolation Forest),这是一种基于树的算法,通过构建孤立树并测量隔离某个数据点所需的分裂次数来孤立异常值;局部离群因子(LOF:Local Outlier Factor),用于衡量某个数据点相对于其邻域数据点的局部密度偏差;单类支持向量机,它学习正常数据样本周围的边界,并将该边界之外的所有数据都归类为异常值,等等。除了这些浅层学习算法之外,基于深度学习的方法,如自编码器、变分自编码器和生成对抗网络,也以不同方式应用于异常检测,例如作为特征提取器、从正常数据中学习表示的学习器以及端到端的异常分数学习器。更多细节可参见文献 [390]。

研究 [391] 提出了一种基于全图动态自编码器(FGDAE:Full Graph Dynamic AE)的异常检测方法,该方法旨在复杂多变的条件下有效运行。FGDAE 模型整合了全连接图(用于捕捉传感器通道间的全局结构关系)、图自适应自编码器(用于聚合多视角特征并适应运行条件变化)以及动态权重优化策略(用于处理不平衡多条件数据的训练)。类似地,研究 [130] 提出了故障注意力生成概率对抗自编码器(FGPAA:Fault-attention Generative Probabilistic Adversarial AE)方法,用于三个机械故障数据集的异常检测,该方法仅聚焦于健康类别。FGPAA 方法利用双对抗自编码器,采用故障注意力概率分布来有效评估机械的健康状态,能够动态适应信号噪声并实时进行异常检测。此外,研究 [392] 提出了一种用于船舶机械故障诊断的实时异常检测方法。作者开发了一个名为 RADIS 的框架,该框架基于长短期记忆网络的变分自编码器,并结合了多级大津图像阈值分割技术。还有研究 [358] 提出了一种基于生成对抗网络的异常检测方法,其中生成器采用编码器 - 解码器 - 编码器架构,仅对正常样本进行训练。通过潜在损失和表观损失来计算异常分数。

4.5.2. 基于Transformer架构的故障诊断技术  
Transformer 最初由 Vaswani 等人 [393] 提出,它彻底改变了自然语言处理领域,并已成功应用于计算机视觉等其他领域。这类模型的特点是包含多层 Transformer 块,这些块具有多头自注意力机制和批归一化功能,能够高效处理任务,无需像卷积神经网络或循环神经网络那样进行复杂运算,且性能往往优于它们。近年来,Transformer 架构在机械设备故障诊断中也得到了应用。研究 [79] 引入了一种时间序列 Transformer(TST:Time-Series Transformer)模型,用于直接处理一维原始振动数据,无需任何信号预处理。TST 利用多头自注意力机制和 Transformer 块从轴承和齿轮故障中提取特征。在凯斯西储大学、西安交通大学和伦敦大学学院数据集上的评估显示出令人瞩目的准确率,例如,在 CWRU 数据集上为 98.63%,在 XJTU 数据集上为 99.78%,在 UoC 数据集上为 99.51%。通过 t 分布随机邻域嵌入可视化可以看出,TST 的特征向量具有更优的类内紧凑性和类间分离性。类似地,研究 [78] 提出了一种基于窗口的多头自注意力模型,采用了三个数据集:CWRU 数据集、UoC 数据集和山东大学数据集。数据预处理包括 1024 个样本长度和数据集划分。该模型将自注意力机制与卷积神经网络相结合,采用基于一维窗口的多头自注意力进行局部特征学习。结果表明,该模型具有优异的分类性能,在无噪声条件下准确率接近 99.99%,且在添加噪声(信噪比从 - 6 分贝到 6 分贝)的情况下仍能保持稳健性。此外,Wu 等人的一篇论文介绍了一种基于 Transformer 的机械故障分类器 [394]。作者采用连续小波变换从原始数据生成时频谱图作为输入,并运用基于马氏距离的技术来识别先前未见过的故障。  
4.5.3. 物理信息神经网络(PINN)  
物理信息神经网络是机器学习中的一种创新方法,它将物理定律融入神经网络结构中。这种整合提升了预测的准确性和可解释性。在机械设备故障诊断领域,物理信息神经网络通过实现对机械系统故障的精确识别与分析,带来了显著的进展。研究 [395] 采用了物理信息神经网络,通过应用物理信息损失函数,增强了模型在轴向柱塞泵故障严重程度识别中的可解释性。该研究利用高采样率收集轴向柱塞泵的数据,使用低通滤波器分离相关频率,识别出四个严重程度等级的活塞磨损。所提出的物理信息神经网络模型通过估计与泵健康指标相关的间隙,准确识别了磨损状态。类似地,研究 [396] 中,研究者对风力发电机主轴承的早期疲劳进行了研究,并旨在利用物理信息神经网络方法预测这些轴承的剩余使用寿命。该模型利用 1.5 兆瓦风力发电机的风速、轴承温度、润滑脂分析等数据,评估轴承疲劳和润滑脂退化情况。此外,Ni 等人 [397] 利用传动系统诊断模拟器的滚动轴承数据集,实现了一种用于故障诊断的物理信息残差网络。该网络具有以下特点:包含一个模态特性主导层,通过倒频谱指数滤波突出系统特性;一个域转换层,利用计算阶次跟踪处理转速变化问题;以及一个并行双通道架构,用于提取复杂的故障特征。这使得该网络在变工况下的诊断准确率得到了提升。  
4.5.4. 联邦学习  

联邦学习引入了一种去中心化的模型训练方法,尤其适用于边缘学习环境 —— 在这类环境中,数据分布在多个设备上。它通过利用本地数据进行迭代更新来训练共享模型,避免了敏感信息的集中化。这种技术在促进协作训练的同时,能保护数据隐私并减少通信开销。联邦学习已被广泛应用于边缘机器学习模型,并成功用于网络攻击检测、垃圾邮件检测、智慧城市、自动驾驶等领域,近年来也应用于机械故障诊断,其主要目的是维护隐私 [398]。研究 [399] 中,研究者实现了一种基于联邦学习的混合故障检测方法,尤其聚焦于转子和轴承的故障检测。输入方法采用从加速度计收集的一维时间序列数据,数据集包含 48 个混合故障类别,共 92,160 个数据点。该方法包括一种使用双联分类器的联邦学习方案,数据在 30 个客户端之间按三种分区方案分布:平衡独立同分布、平衡非独立同分布和非平衡非独立同分布。预处理包括数据洗牌和分区。基于卷积神经网络训练的联邦学习模型在混合故障分类中达到了 90% 以上的准确率。另一项研究 [400] 致力于利用联邦学习改进滚动轴承的故障诊断。该研究使用凯斯西储大学基准数据集和蔚来汽车公司的项目数据集,旨在解决联邦学习中的客户端异质性问题(与样本量、质量和故障类型相关)。所提出的方法是一种多尺度逐层递归融合联邦学习方法(LLRFed:Layer-by-Layer Recursive Fusion Federated Learning)。数据通过滑动窗口进行预处理,并输入到带有快速傅里叶变换的深度神经网络中。研究表明,LLRFed 方法在基准数据集上显著提高了诊断准确率,提升幅度达 9.23%。类似地,研究 [401] 提出了一种用于高速和铁路系统中铁路转辙机的故障诊断方法,该方法使用时序异步联邦学习框架对这些机器在各种故障条件下的振动信号进行分析。数据集包括 16 种工况下的 960 个振动信号样本,每种工况 60 个样本,通过裁剪和零填充进行预处理,以确保统一的 10 秒向量长度。研究采用深度收缩全卷积网络作为全局模型,与之前的模型相比,参数减少了四分之一,从而减少了通信开销和数据包丢失。数据按 8:2 的比例分为训练集和测试集,标签采用独热编码。此外,Yang 等人 [402] 的研究采用联邦学习方法对轴承、机器人等工业机器进行迁移诊断。他们提出的基于分布重心介质的迁移学习架构整合了联邦学习框架与服务器 - 客户端架构,以解决数据去中心化的挑战 —— 由于隐私问题和高昂的传输成本,不同域的数据无法集中聚合。客户端构建基于残差网络的诊断模型,从本地数据中提取高级特征;服务器则实现基于堆叠自编码器的生成器模型,通过聚合特定域的分布参数生成分布重心介质。该方法利用不同健康状态下的振动数据平衡样本,通过生成的介质样本适配边缘分布和条件分布,并通过客户端与服务器之间的协作训练动态更新分布重心介质。研究 [403] 还提出了一种基于区块链的去中心化协作学习方法用于机器故障诊断。该方法使用来自两个数据集(高速列车转向架数据集和轴裂纹故障数据集)的一维机械数据,在一个结合了基于区块链的联邦学习和源数据独立迁移学习的框架中使用深度卷积神经网络进行分析,其中预处理技术包括使用频域信息。该方法的测试准确率达到了 90% 以上。另外,文章 [404] 介绍了一种异构联邦域泛化网络,该网络融合了公共表示学习,以解决故障诊断(FD)中的域偏移和隐私保护挑战。通过利用异构源客户端实现跨不同和未见过的目标客户端的泛化故障诊断,所提出的联邦迁移学习方法克服了传统方法的局限性 —— 传统方法依赖客户端之间的同质性,且在训练期间需要目标域数据。该模型使用解耦域适应基础模型,旨在最小化噪声影响并增强域混淆,从而改进故障相关特征的提取。

其次,将数字孪生作为补充数据源,解决了从实际机器获取标注训练数据集的现实难题。基于目标机器未知新工况对数字孪生参数的持续调优,可确保生成数据与真实系统的几何特征及新工况保持一致。第三,域泛化网络混合模型(DGNM)的集成通过多域数据增强、对抗学习和域间差异度量,在保留域特有特征的同时提升了特征多样性,弥补了现有域泛化方法的不足。我们在三个旋转机械数据集上对系统进行了评估,结果表明,在跨工况和跨机器任务中,该系统性能优于现有前沿方法。因此,本研究证明了该系统在处理动态工业机械环境复杂性方面的有效性,为下一代信息物理系统中自主故障诊断系统的未来研究铺平了道路。未来工作中,我们将重点探索在源域与目标域存在类别偏移场景下提升诊断模型性能的方法。  
注:第三次推文将分析 MFD 多方面挑战,如数据、旋转机械、现有方法、算法等层面问题;为未来研究者提供 machinery、算法开发等多维度建议;指出 MFD 未来前景,如提升鲁棒性、整合模型等以推动故障检测发展  

编辑:赵栓栓

校核:李正平、陈凯歌曹希铭、赵学功、白亮、任超、海洋、陈宇航、陈莹洁、Tina、王金、赵诚、肖鑫鑫

该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除

来源:故障诊断与python学习

ACT振动疲劳非线性化学旋转机械航空航天船舶汽车电力pythonUM裂纹理论电机Fourier Transform创新方法数字孪生DAP
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-09-24
最近编辑:1天前
故障诊断与python学习
硕士 签名征集中
获赞 87粉丝 128文章 243课程 0
点赞
收藏
作者推荐

综述 | 铁路轮对故障诊断研究综述(下)

继上期综述 | 铁路轮对故障诊断研究综述(上),本期给大家推荐铁路轮对故障诊断研究综述(下)。及时检测与隔离轮对故障对保障轨道车辆安全至关重要。本文系统综述了现有诊断方法,并将其分为库内、轨旁和车载三类,然后根据声、光、力、电、热等多学科技术进一步细分。研究指出,当前人工智能技术多处于理论阶段,需推动其工程化应用,并建立故障特征与行车安全之间的量化关系。未来发展应注重多传感器与AI融合、定制化缺陷标准、高度自动化与集成化设备,以及三类方法的协同整合,以实现智能化、预防性维护。论文链接:通过点击最左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目: Fault diagnosis of railway wheelsets: A review 论文期刊:MeasurementDoi:https://doi.org/10.1016/j.measurement.2024.116169作者: Yunguang Ye* (a), Haoqian Li (a), Qunsheng Wang (a), Fansong Li (a), Cai Yi (a), Xinyu Peng (b), Caihong Huang (a), Jing Zeng (a) 论文时间: 2025年 机构: a: State Key Laboratory of Rail Transit Vehicle System, Southwest Jiaotong University, Chengdu 610031, China b: AVIC Chengdu Aircraft Industrial (Group) CO., LTD., Chengdu 610092, China作者简介:叶运广,工学博士,西南交通大学副研究员,硕士生导师。长期从事轨道车辆智能运维、轮轨动力学相关领域研究工作,着重解决高速列车服役安全监测、走行部机械故障诊断、轮轨损伤机理、出口动车组动力学性能评价标准等方面的问题。 通讯作者邮箱:yunguang.ye@swjtu.edu.cn 摘要及时检测并进一步隔离轮对故障对保障轨道车辆安全运行至关重要。迄今为止,研究人员已在轮对故障诊断方法领域开展了大量工作,本文系统综述了这些代表性成果。基于检测环境、设备布设场景及车辆通过速度,将文献中的故障诊断方法归纳为三大类:库内方法、轨旁方法和车载方法。进一步根据检测设备依赖的学科知识(包括声学、光学、力学、电磁学和热学)对三大类方法进行细分。随后总结并对比了各类方法的优缺点,探讨了发展趋势及待解决的关键问题。最后指出以下挑战与潜在方向:(1)人工智能(Artificial intelligence, AI)技术,包括深度学习(Deep learning, DL),正逐步引入轮对故障诊断,但当前研究多停留在理论层面,导致其工程价值未能体现;(2)需建立缺陷尺寸、信号故障特征与车辆运行安全间的关系,车载检测设备需实现真正的智能化,且不能违背降本增效的初衷;(3)应根据车辆自身特性及列车服役环境定制更合理的缺陷阈值与故障定义标准,以兼顾运行安全与维护成本;(4)利用多传感器融合技术与AI技术实现高可靠性智能诊断是研究者需攻克的难题;(5)检测过程高度自动化与设备高度集成化是未来发展方向;(6)库内、轨旁与车载方法需协同应用,并结合AI技术实现轮对的全面预防性维护。关键词:轮对,故障诊断,铁路车辆,库内,轨旁,车载 目录1 引言2 库内方法 2.1 声学法 2.2 光学法2.3 电磁法3 在线检测方法 3.1 轨旁方法3.2 车载方法4 对比 4.1 不同国家的研究进展 4.2 总体特点和发展方向5 讨论与发展6 总结(以上标记章节为本文内容)3 在线检测方法 轮对故障的在线诊断是指在列车运行过程中,在轨道或车辆部件上布置传感器以获取信号,通过不同的信号处理方法或ML算法对获取的信号进行分析,实现故障的检测或进一步分类。此外,还可以确定缺陷的大小。与库内检测方法相比,此类方法可以快速检测整列车的车轮状态,从而减少列车停运时间和维护成本。同时,通过应用此类方法可以获得大量的历史数据。结合对此历史数据的分析结果和库内检测方法的结果,可以做出更及时、准确的决策。这种数据驱动的决策有助于优化维护计划并提高运营效率。根据传感器的放置位置,本节将在线检测方法分为轨旁方法和车载方法。 3.1 轨旁方法 轨旁方法主要是指在干线轨道的某一段上或车站出入口附近放置传感器,以便在列车通过时快速检测故障或进一步对故障进行分类。轨旁方法具有成本低、适应性强和可靠性高的特点。与库内检测方法相比,其优势在于可以在较高的通过速度下实现故障诊断,且自动化程度相对较高。本节根据传感器的工作原理,将轨旁方法分为两类:(I)声学法和(II)机械法。 3.1.1 声学法 基于带有踏面缺陷的车轮与轨道碰撞时会产生周期性声音这一简单原理,声学方法可应用于轨旁。常用的轨旁声学方法包括(1)基于麦克风的检测方法和(2)基于声发射(Acousticemission,AE)的检测方法,这两种子方法的代表性文献如图22所示。 图22 轨旁声学检测法的代表性文献3.1.1.1 基于麦克风的检测方法 基于麦克风的检测方法的原理是在轨旁安装麦克风,捕捉通过的车轮与轨道碰撞产生的噪声,并对这些冲击噪声进行分析,以检查通过的轮对的健康状态。早在1978年,Nagy等[84]就证明了通过麦克风收集到的辐射到空气中的声音的声学特征可用于自动检测车轮缺陷,并开发了一种检测轮缘或轮盘裂纹的检测系统。然而,文中也指出,轨道安装的加速度计是检测扁平点或破碎轮缘的最佳方式[84]。2019年,Chen等[85]开发了一种基于麦克风阵列的时域峰度波束形成技术,该技术能够在高背景噪声环境中识别和定位轮轨系统中的缺陷。结果表明,通过观察波束形成声图上的峰度值,可以识别和定位车轮上的不同类型的故障(如凹痕、孔洞、扁平)。该技术克服了必须保持传感器与被测结构接触的挑战,更适用于具有宽频率的脉冲信号,例如轮扁引起的冲击噪声。然而,如文献 [84,85] 中所提到的,这些方法仅在实验室条件下使用滚动试验台进行了验证。为了验证基于麦克风的检测方法对在役车辆的可靠性,2021年,Komorski等[86]选择一辆带有扁平缺陷的电车作为研究对象,并在Franowo电车厂布置了基于麦克风的轨旁系统进行声学测量,如图23所示。当电车以20-40km/h 的速度通过时,通过三个麦克风收集声学信号,并通过傅里叶变换[87]和希尔伯特变换[88]成功检测到轮扁。2020年,在Railwatch GmbH提供的轨旁声音监测数据的帮助下,Dernbach等[89]利用支持向量机、经典卷积神经网络和U-Net模型成功检测到轮扁。他们证明,采用梅尔频谱图表示的卷积分割架构在参数数量相当的情况下优于其他方法。 图23 麦克风安装位置及测试示意图[86]3.1.1.2 基于AE的检测方法 基于声发射的检测方法的原理是,材料内部结构的变化会导致材料内部应力的突然重新分布,从而将机械能转化为声能,产生弹性波。当轮对发生故障时,所获得的声发射信号的能量与正常运行时所获得的声发射信号的能量有显著差异,因此通过设置适当的阈值,可以检测到轮对故障。这类方法在铁路行业早已得到应用,例如检测轨道损伤[90-94]。在过去的二十年中,基于AE的方法已被应用于轮对故障检测。2010年,Bollas等[95]对各种列车和电车进行了广泛的声发射测量。AE传感器安装在轨道旁,以便在车辆行驶时实时监测通过轨道传输的声发射,从而诊断轮对/轴箱故障,例如轮扁和轴承缺陷。2013年,Bollas等[96]进一步研究了该方法,并证明高频AE传感器对扁平缺陷足够敏感,且接收到的AE信号电平波动与单个缺陷的旋转频率一致。该方法如图24所示,使用两个PAC R15i传感器和两个R30a传感器来获取声发射信号。根据所获得的AE信号随时间的变化方式,可以确定车轮表面是否存在扁平缺陷。为了进一步量化轮扁的严重程度,2018年,Aktas等[97]在轨道上安装了一个AE传感器,以在列车通过时收集AE信号。通过基于搜索的监督训练方法对信号进行处理,然后可以定义缺陷分数的阈值曲线。通过将测量值与阈值曲线进行比较,可以确定轮对的健康状态。 图24 AE传感器数据采集处理及现场安装示意图[96]3.1.1.3 总结 轨旁使用的声学法包括基于麦克风的检测方法和基于AE的检测方法,这些方法总结于表4中。表4不同声学法的对比 综上所述,基于麦克风的检测方法的研究出现较早,近期的研究多以麦克风阵列的形式为主。此类方法适用于检测局部轮对缺陷,成本低,传感器无需与被测结构接触,设备易于部署。基于AE的检测方法成本较高,但对传感器的数量和安装位置要求较低。这两种方法的共同缺点是声学信号易受环境影响。未来的发展应着重提高对环境噪声的抗干扰能力,优化信号处理算法,以增强声学方法的鲁棒性。 3.1.2 机械法 机械法主要利用应变信号和加速度信号来检测或进一步分类轮对故障。选择合适的传感器来获取故障信号至关重要。根据传感器的类型,轨旁使用的机械方法主要包括(1)基于应变片的方法(Strain gauge,SG)、(2)基于光纤布拉格光栅(FiberBragggrating,FBG)传感器的方法和(3)基于加速度计的方法,这三种方法的代表性文献如图25所示。 图25 轨旁机械检测法的代表性文献3.1.2.1 基于SG的方法 在轨旁检测中,基于SG的方法主要是将SG粘贴在轨道(腹板、根部或头部)上。由于轨道的变形会导致SG的电阻发生变化,从而产生变化的电压信号,根据该信号与轨道变形之间的对应关系,可以精确测量垂直轮轨力。根据测得的力的大小,可以检测到轮对故障或对其进行进一步隔离。 为了诊断轮对故障,一些学者开发了专门的轨道应变检测系统,并使用信号分析方法和ML方法处理应变信号,以分析缺陷信息,例如是否存在缺陷以及缺陷的类型和大小。2007年,Stratman等[98]开发了一种基于一系列SG的车轮冲击载荷检测器(Wheel impact load detector,WILD),并将其安装在实际线路上以获取冲击载荷数据。通过分析冲击载荷数据,从垂直轮轨力的角度确定了故障车轮的移除阈值。当垂直轮轨力超过规定的阈值时,会自动生成关于故障车轮的报告,并发送给轨道交通控制中心和车间,以辅助维护工作。2015年,Meixedo等[99]介绍了一个葡萄牙国家项目,该项目开发了一种集成了多种功能(包括车轮冲击检测、列车称重和轴计数)的轨旁检测系统。该系统由多个组件组成,包括SG、射频识别和感应触发传感器,其中SG安装在轨道腹板上,以收集列车传递给轨道的动态载荷,通过评估动态载荷并补偿轨道温度变化,可以确定轮对故障。在列车通过期间,系统可以收集和分析所有连接车辆的数据,并自动生成维护报告。2018年,Krummenacher等[100]使用基于SG的车轮载荷检查点测量轨道的垂直力。如图 26 所示,每个车轮载荷检查点由四个1米长的测量杆组成,每个测量杆有四个SG。SG垂直于轨道中心线安装。使用两种ML方法处理测得的垂直力。一种是传统的ML方法,由通用小波特征和基于支持向量机的分类器[101]组成。另一种基于深度卷积神经网络,可以直接从时间序列或二维表示中自动学习和分类特征。结果表明,两种方法都能自动检测不同类型的车轮缺陷,例如轮扁、剥落和失圆,但深度卷积神经网络方法的性能更好。因为轮扁会产生高冲击力[102],所以车轮载荷检查点在识别轮扁引起的故障方面非常有效。但正如Costa等[103]所讨论的,它们通常会忽略较小的表面变形。文献[100]中还指出,这两种ML方法只能对缺陷进行分类,而无法获得更多关于缺陷的信息,例如缺陷位置、缺陷大小和缺陷形状。为了检测缺陷的位置,2020年,Zhou等[104]使用数值方法分析了不同轮扁情况下轨道的应变分布特征,并设计了基于多传感器阵列的集成布局方案和基于多源数据融合的算法,从而实现了车轮状态的实时检测和精确定位。为了确定扁平缺陷的严重程度,2020年,Mosleh等[105] 开发了一种基于SG的系统。在该系统中,根据车轮的等效周长,在轨道旁的12个位置分布SG,通过布置在两个轨枕之间的SG的变形可以间接测量轨道剪力。此外,引入了包络谱分析(Envelopespectruma nalysis,ESA)[106]来分析轨道剪力信号,以确定轮扁的严重程度。文献[105]中,他们得出结论,应制定合理的阈值,以便能够自动分类健康车轮和有缺陷的车轮。Mattsson等[107]在2024年报道了一个类似的概念,他们指出还应为不同的车辆状态(例如轴重)制定不同的阈值。 图26 一个测量杆上的应变片和四个应变片对车轮垂直力的测量[100]3.1.2.2 基于FBG传感器的方法 就传感器的工作原理而言,此类方法可归为光学法,但考虑到其变化是由外部应变引起的,且其测量的信号是机械信号,因此本文将其归类为机械法。FBG传感器利用外部扰动振动引起的位移或应变变化来改变光栅间距,进而转换为相应的波长变化,即波长的变化可以响应加速度和应变的变化[108],从而响应轮对的缺陷信息。FBG传感器已被应用于测量列车的动态载荷[109]。2012年,Filograno等[110]将FBG传感器应用于西班牙马德里至巴塞罗那高速铁路线的现场测试。列车通过速度在200至300km/h之间。使用FBG传感器解调系统同时监测安装在轨道旁的四个FBG传感器。不同位置的传感器用于不同的目的,例如列车识别、轴计数、速度和加速度检测、车轮缺陷监测和动态载荷计算。然而,用于确定车轮是否应进行维护/更换的阈值尚未明确定义。为了检测高速列车中的微小车轮缺陷,2019年,Liu等[111]引入了一种基于轨旁FBG传感器阵列的车轮状态监测系统,如图27所示。在该系统中,每两个FBG传感器间隔约0.15m,整个FBG传感器阵列的长度略大于车轮的周长。当列车通过该系统时,每个FBG传感器可以测量在动态车轮载荷激励下轨道底部的纵向应变,该应变由横截面弯矩引起。在该系统中,使用贝叶斯盲源分离方法对轨道应变信号进行分解,以获得包含缺陷敏感特征的分量,并基于Chauvenet准则通过分析历史时间中的异常来识别潜在的车轮踏面缺陷。现场测试结果表明,当列车以20-50km/h的速度通过检测系统时,该系统不仅能识别出车轮中的小缺陷,还定位了列车组中哪个车轮存在局部异常。然而,与文献[110]中提到的方法一样,仍然无法判断车轮缺陷的严重程度。为了解决该问题2020年,Ni等[112]基于分布式FBG监测系统收集轨道底部的纵向(弯曲)应变数据。基于该数据,开发了一种ML方法来定量评估车轮缺陷的严重程度。通过将在线检测数据与离线车轮半径偏差测量值进行比较,验证了所提出方法在完全贝叶斯推理框架下的可靠性。2023年,Wan等[113]使用短时傅里叶变换(Short-timeFouriertransform,STFT)[114]从一对FBG传感器收集的关于30多列列车通过的振动信号中提取时频特征。通过使用四种常见的无监督学习算法,即非负矩阵分解、一类支持向量机、多层感知器自动编码器和卷积神经网络自动编码器,导出五个健康指数用于监测列车车轮的健康状况,这进一步实现了缺陷的量化。结果表明,在检测轮扁和空洞方面,非负矩阵分解和多层感知器自动编码器优于一类支持向量机和卷积神经网络自动编码器。 图27 基于FBG传感器的系统示意图和不同SG的响应3.1.2.3 基于加速度计的方法 基于SG的方法易受电磁干扰,基于FBG传感器的方法易受环境温度影响。相比之下,加速度计基于惯性原理,抗干扰能力更强,能够在复杂环境中稳定工作。在车辆动态运行过程中,车轮缺陷(如轮扁、多边形化和裂纹)往往会导致加速度信号在时域或频域发生显著变化,这些变化中包含丰富的故障信息。随着车速的增加,故障信息变得更加明显。因此,基于加速度计的方法已成为当前研究人员关注的关键检测手段。 信号处理方法和统计分析方法已被广泛用于分析轨道的振动信号,从而响应轮对的缺陷信息。早在1997年,Bracciali等[115]开发了一种用于检测轮扁和轨道波纹的数值程序,该程序使用组合能量和倒谱分析(Cepstrum an alysis,CA)[116]处理收集到的轨道加速度信号,以检测和分类车轮缺陷。在这项研究中,他们还指出,未来需要用于故障判定的合理阈值。2004年,Skarlatos等[117]在不同速度(30km/h、50km/h、70km/h、90km/h和100km/h)下测量了健康车轮和具有已知缺陷的车轮的轨道振动信号。对监测信号进行统计分析,建立表征故障车轮状况的振动限值。基于这些限值,模糊逻辑模型[118]将获得的经验存储在数据库中,并评估车轮损坏的严重程度,以进行预防性维护。然而,该模型只能检测故障的存在,需要进一步研究以确定具体的故障类型。2006年,Belotti等[119]在意大利佛罗伦萨铁路车间人为加工了一个轮扁缺陷,并使用带有该缺陷车轮的车辆在仪表化轨道上进行了研究。基于故障车轮通过时轨道的加速度,使用小波变换(Wavelet transform,WT)[120]在不同速度(从10km/h到100km/h,增量为10km/h)下检测和量化轮扁缺陷。结果表明,该方法在确定轮扁存在方面具有可靠性,并且可以实现对扁平长度的粗略量化。然而,仍然需要更深入的定量评估方法。文献[121]中报道了一种类似的方法。2016年,Lunys等[122]基于立陶宛铁路系统中安装的轮轴冲击载荷检测器(由加速度计组成)所采集的数据,开展了关于货运货车的研究。在这项研究中,使用车轮冲击载荷检测器记录与车轮表面缺陷相对应的数据,并将其与通过人工测量获得的结果进行比较,以确定车轮缺陷的类型,例如车轮裂纹、扁平和平整度磨损。2021年,Mosleh等[123]研究了轨旁轮扁检测系统中传感器的类型及其最佳位置,并提出了一种多传感器布局方案,通过ESA[106]检测客运和货运列车上是否存在轮扁,检测过程如图28所示。他们发现,使用ESA方法,加速度信号在检测轮扁方面比应变信号具有显著优势。在实践中,轮扁的检测是通过使用两个加速度传感器实现的,每个传感器用于监测车轮圆周的一半。为了提高传感器的耐用性,2022年,Schalkwyk等[124]利用嵌入了加速度计和SG的3D打印智能轨垫来监测重载线路上列车车轮的状况。现场测试表明,它能够检测运营铁路线上60%以上的车轮缺陷。同时,它可以自动记录通过列车的数据,例如列车类型、车轮载荷、轴数等,这有助于建立全面的数据库。2023年,Salehi等[125]使用基于解析振幅的信号分解方法从由五个加速度计组成的轨旁数据收集装置获得的振动信号中提取车轮损伤特征,并研究了带有轮扁的两轴动车在不同运行速度(10km/h、20km/h、30km/h和40km/h)下的车轮损伤特征。2023 年,Gonçalves等[126]模拟了位于轨枕之间的多个SG和加速度计的动态响应,并使用ESA[106]检测轮扁和车轮多边形化。结果表明,加速度计和SG都可用于检测轮扁,而车轮多边形化只能通过加速度计检测。 图28文献[123]中的检测过程近年来,先进的ML技术已被引入轮对故障诊断中。2022年,Mosleh等[127]开发了一个考虑轮扁的三维车辆-轨道耦合动力学模型,通过布置19个加速度计收集实验数据,并使用离群值和聚类分析对缺陷车轮的严重程度进行分类。2022年,Mosleh等[128]开发了一种无监督的早期车轮损伤检测方法,该方法通过连续小波变换(Continuous wavelets transform,CWT)[120]从多个加速度计和应变片中提取信息,并将时间序列信号转换为损伤敏感特征。然后通过主成分分析(Principal component an alysis,PCA)[129]对特征进行归一化,并使用马氏距离进行融合。最后,基于高斯逆累积分布函数计算置信边界,自动区分车轮上是否存在扁平缺陷。文献[128]的检测过程如图29所示。使用多个传感器和不同的测量点来证明该方法对传感器类型和位置的敏感性。结果表明,该方法只需要一个加速度计或SG就可以对车轮缺陷的存在做出判断,并且所提出的方法不受列车类型、轨道不平度轮廓或车辆速度的影响,但无法区分特定的缺陷类型。同样,2024年,Guedes等[130]通过轨旁监测系统探索了用于分类铁路货运车辆多边形车轮的聚类技术。他们的方法分析振动加速度以分类不同类型的多边形损伤,从而增强预测性维护策略并提高整体铁路安全性和效率。2023年,Lourenço等[131]开发了一种在线自适应学习算法,用于检测不同波长的多边形车轮,自动检测列车通过,分割轴组,并对单个车轮的多边形化进行排名。实验结果表明,所提出的模型成功地对单个车轮的多边形化进行了排名,为更换干预建立了有用的优先级序列。为了检测不同特征提取方法对车轮多边形缺陷的敏感性,2023年,De等[132]开发了一个耦合列车-轨道模型,通过该模型模拟列车通过一组安装在轨道上的加速度计的过程,以捕获轨道的振动加速度。使用自回归外生方法[133]和CWT[120]提取加速度信号特征,并采用离群值分析[134]区分健康车轮和有缺陷的车轮。充分阐明了传感器数量及其位置对车轮缺陷检测系统准确性的影响。结果表明,在检测车轮多边形缺陷方面,连续小波变换方法比自回归外生方法更有效。同样,为了比较不同特征提取方法在检测轮扁缺陷方面的能力,2023年,Mohammadi等[135]使用四种无监督数据驱动方法检测轮扁,即自回归[136]、自回归外生[133]、PCA[129]和CWT[120]。结果表明,四种方法都能自动区分有缺陷的车轮和健康的车轮。然而,不同之处在于,自回归和自回归外生方法在检测轮扁缺陷方面最准确,并且对损伤侧敏感。CWT只能检测受损车轮,对缺陷侧不敏感。PCA在检测有缺陷的车轮方面准确性较低,自回归外生方法是唯一能够使用加速度稳健地检测轮扁缺陷的方法。 图29文献[128]中的检测过程在信号特征提取操作之后,研究人员通常需要使用PCA执行特征归一化操作。然而,PCA只能处理线性关系。在存在非线性现象的情况下,基于深度神经网络的方法表现更好,其强大的自适应能力使其在轮对故障诊断中表现出色。因此,2024年,Jorge等[137]提出了一种基于堆叠稀疏自动编码器的深度学习方法,并优化了轨旁检测系统,该方法指出只需要两个分别位于轨道两侧的加速度传感器就可以检测车轮的扁平和平行多边形故障。同样,2024年,Magalhaes等[138]进行了数值模拟,并开发了一个配备六个传感器的虚拟轨旁监测系统,通过车辆-结构相互作用软件获得轨道的垂直加速度,如图30所示。该加速度数据集分为健康车轮生成的数据集和有缺陷车轮生成的数据集。基于健康数据集,训练稀疏自动编码器模型,以进一步预测有缺陷车轮的后续车辆响应。基于该响应与原始车辆响应之间的差异定义损伤指数,并使用马氏距离将多变量数据转换为单个损伤指数。通过离群点分析检测车轮损伤,并运用聚类分析区分不同损伤指数。车轮损伤可根据类型和严重程度进行分类。 图30 外置式加速度传感器的部署[138]3.1.2.4 总结 轨旁使用的机械方法包括基于SG的方法、基于FBG传感器的方法和基于加速度计的方法,这些方法总结于表5中。 表5 各种机械法的对比(基于FBG传感器的方法也可以归类为光学方法) 综上所述,机械方法是轨旁检测中的一个热门方向,特别是基于加速度计的方法。基于应变片的方法发展较早,近年来的文献数量有所增加。基于FBG传感器的方法是一种新兴方法。基于加速度计的方法出现较早,近年来基于它们的研究数量激增。原因是加速度传感器抗电磁干扰能力强,丰富的信号处理方法和先进的ML方法为分析加速度信号提供了有利条件,这进一步促进了基于加速度计的方法的发展。基于FBG的方法应采用有效的方法消除温度干扰。基于SG的方法和基于加速度计的方法需要探索传感器的布局方案,提高传感器的耐用性,以应对线路环境的变化。在未来的研究中,这三种方法中使用的信号分析方法和自动故障识别算法需要进一步改进,检测设备应朝着多种检测功能集成的方向发展(例如轴计数、列车称重、测速等)。此外,在检测到缺陷后,应结合智能后处理方法存储数据并自动生成检测报告,以提高维护的自动化程度 [98, 99, 110, 117, 122, 124, 131]。 3.2 车载方法 车载方法主要是指在车辆部件(如轴箱、转向架构架、轮轴和车体)上安装传感器,实时获取轮对的故障信号,并通过统计方法、信号处理方法或ML算法对这些信号进行进一步处理,以确定轮对的健康状态。本节根据传感器的工作原理,将车载方法进一步分为三个子类别:(I)光学法、(II)热学法和(III)机械法。 3.2.1 光学法 在车载检测中,光学方法主要指激光检测方法,其核心技术是利用车载激光传感器以非接触方式测量振动信号。列车运行过程中,激光传感器可发射激光束并接收从被测物体表面反射的光信号,该光信号中包含车轮的振动信息。通过对该信息的处理和分析,可以识别特定的缺陷。2016年,Rolek等[139]在实验室中对有裂纹和无裂纹的车轴进行了全尺寸测量,如图31所示。通过测量车轴的弯曲振动,并基于与车轴旋转周期的整数倍(n×Rev)相对应的周期性谐波分量,诊断车轴中是否存在疲劳裂纹。有限元模型被用于复现并分析带有裂纹车轴的轮对在轨道上的滚动情况。实验室中的实验和数值研究结果表明,该方法有可能用于现场测试。如果裂纹面积在车轴横截面的16%或以上,则车轴弯曲振动的1×Rev、2×Rev和3×Rev分量可用于检测车轴中是否存在裂纹。需要注意的是,所提出的方法[139]不能替代常规的无损检测,但可以作为一种额外的安全措施,及时检测损伤过程后期的裂纹车轴。该方法目前仅处于实验室评估阶段,有待进一步进行现场测试。 图31 文献[139]中的LD传感器安装位置 3.2.2 热学法 车载检测中的热学法主要是基于温度传感器的方法,通过温度传感器检测轮对材料的温度变化,以分析异常故障。2023年,Liu等[140]提出了一种无监督的统一检测模型,该模型首先使用长短期记忆网络[141]预测车轴温度,从而生成残差序列。随后,使用核密度估计[142]和改进的局部离群因子分析车轴温度残差序列。如图32所示,通过检测车轴温度的异常变化,可以评估车轴的状态,并可以防止热轴和切轴故障,确保列车的运行安全。 图32 文献[140]提出的基于热成像的车轴故障检测方法的整体架构 3.2.3 机械法 在用于轨旁检测的机械方法中,已经描述了机械方法是基于传感器的类型进行分类的。使用相同的分类方法,车载检测系统中常用的机械方法同样主要包括(1)基于SG的方法、(2)基于FBG传感器的方法和(3)基于加速度计的方法,这三种方法的代表性文献如图33所示。 图33 车载检测机械法的代表性文献 3.2.3.1 基于SG的方法 在车载方法中,基于SG的方法将安装在轮对上的应变片收集的电信号利用轮对几何形状和弹性特性转换为应力,从而实现轮对故障信号的获取。在车载检测中,使用SG检测轮轨力的最常规方法是使用特制的仪表化轮对,即测力轮对。2021年,Maglio等[143]通过结合测力轮对的测量结果和车轴弯曲应力的数值模拟,研究了客运列车轮对滚动接触疲劳损伤演变的后果。在现场测试中,使用带有四个SG的测力轮对监测车轴应力,应力通过遥测获得,同时定期检测车轮失圆的演变。所开发的遥测系统称为SmartSet®系统,由安装在轴体上的SG和遥测发射机,以及安装在转向架或车体上的遥测接收机、遥测感应电源和嵌入式数据采集计算机组成。该系统自动化程度高,能够在正常通过速度(最高速度为200km/h)下自主执行数据采集步骤数年,如图34所示。 图34 文献[143]中的测力轮对和SG安装位置 3.2.3.2 基于FBG传感器的方法 与轨旁检测中的基于FBG传感器的方法不同,在车载检测中,该方法通过将FBG传感器安装在转向架上来工作。2020年,Wang等[144]开发了一种基于贝叶斯动态线性模型的实时缺陷检测方法,用于实时检测潜在的有缺陷车轮。所提出的方法包括以下功能:预测、潜在离群值检测、变化点识别以及损伤程度和不确定性的量化。依靠FBG传感器从高速列车转向架获取的应变监测数据,建立用于表征实际应力范围的贝叶斯动态线性模型,通过该模型在进行下一次观测之前引出一步预测分布。通过比较常规模型(由贝叶斯动态线性模型生成的预测分布)和替代模型(平均值偏移规定的偏移量)来判断哪一种模型更符合实际观测数据。若比较结果显示支持替代模型,则可判定潜在变化已发生。 为判断该观测值是异常值还是变化点的起始信号,我们采用三种指标(即贝叶斯因子、最大累积贝叶斯因子和运行长度)进行深入分析。一旦确认存在变化点,即通过贝叶斯假设检验对损伤程度评估及不确定性量化进行验证。若识别出严重变化,则表明列车轮组因缺陷导致质量出现显著改变。如图35所示,本方法已在兰新高铁上以时速200-250km/h运行的列车转向架在线监测数据中得到验证。 图35 文献[144]中部署在转向架上的FBG传感器的位置 3.2.3.3 基于加速度计的方法 基于加速度计的检测方法主要通过收集安装在列车部件(如车体、转向架构架、轨轴、轴箱)上的加速度计测得的加速度信号来诊断故障,这是当前实际工程应用和研究中的一个热门方向,也常用于检测轨道损伤[145, 146]。根据对获取的加速度信号的处理方式,该方法主要分为经典信号处理方法、传统ML方法和DL方法。这些方法的比较如表6所示。 表6 不同的基于加速度计的轮对故障诊断方法的比较 经典信号处理方法包括傅里叶变换[87]、WT[120]、经验模态分解(Empirical mode decomposition,EMD)[147]、希尔伯特-黄变换(Hilbert-Huang transform,HHT)[88]、ESA[106]、维格纳-威利变换(Wigner-Ville transform,WVT)[148] 等。一些学者研究了此类方法或其变体在轮对故障诊断中的应用。2007年,Jia等[149] 利用 Matlab-Simulink平台建立了考虑轨道不平度的轨道车辆耦合多体动力学模型,并采用小波能量平均和平均信号小波分解技术分析转向架垂直加速度,从而鉴别是否存在轮扁现象。2019年,Bernal等[150]建立了配备两个Y25转向架的货运列车的多体动力学模型,并在存在轮扁的情况下获得了转向架构架和车体的相应加速度。基于这两种加速度,提出了基于ESA[106]的可检测性指标,以区分健康轮对和有缺陷的轮对。结果表明,使用转向架加速度可以检测到轮扁,而使用车体加速度检测轮扁需要进一步研究。2020年,Song等[151]建立了考虑车轮和轨道柔性的耦合车辆-轨道多体动力学模型,并通过改进的集成EMD和WVT分析轴箱加速度。在仿真实验中,列车速度设置为200-350km/h,数值结果表明,最大轴箱加速度及其频率与谐波阶数和车轮失圆定量相关。2020年,Wang等[152]通过考虑更多的动态因素,如牵引传动、齿轮传动和轨道几何不平度,开发了更详细的车辆-轨道耦合多体动力学模型,并在仿真测试中车辆以200-350km/h的速度运行。使用包络分析[106]分析轴箱加速度以检测轮扁。类似的方法也用于检测车轮失圆缺陷。2020年,Xu等[153]提出了一种基于同步压缩STFT的广义希尔伯特包络解调方法,通过分析轴箱加速度实现了车轮多边形化的诊断。 为了比较经典时频信号处理方法在轮对故障检测中的有效性,2013年,Liang等[154]使用三种经典时频分析方法(包括STFT[114]、平滑WVT[155]和WT[120])检测早期轮扁和轨道表面缺陷的性能。结果表明,在滚动试验台的实验中,三种时频方法都能为两种缺陷产生的振动提供适当的时频信息。平滑伪WVT通过在时间和频率分辨率之间进行折衷,提供了更好的表示,而小波变换在时间和频率轴上都表现出良好的定位。文献[156]中也描述了相同的比较。2015年,Liang等[157]提出了一种使用时频信号处理的自适应噪声消除技术。通过两个轴箱加速度计在实验室中收集数据,并测试了四种时频分析方法(包括STFT[114]、平滑伪WVT[155]、崔-威廉姆斯变换[158]和WT[120])。分析表明,自适应噪声消除技术与传统的时频分析方法(如STFT和WT)相结合可以诊断车轮故障。 在传统的时频分析方法中,傅里叶变换仅响应频域信息,STFT和WT依赖于特定的窗函数,HHT方法存在模态混叠等问题。为此,一些学者尝试使用新的信号处理方法或从非时频域的角度诊断轮对故障。2017年,Li等[159]开发了一种自适应多尺度形态滤波算法,并使用该算法研究了轮扁引起的轴箱振动,以及轨道不平度和车辆速度对诊断结果的影响。该算法同时考虑了模拟和测量的轴箱振动信号。然而,所提出的方法仅设计用于恒速工况。为了检测变速条件下的轮扁,一些学者研究了角度域下的故障信息。2018年,Bosso等[160]从模拟和实际工况中收集轴箱加速度信号。基于收集的加速度信号和车轮的角位置,可以在时域中确定轮扁的存在和严重程度。由于实际运行环境的影响和车辆系统的非线性,为了实现该方法的实际应用,需要对算法进行特定校准,以适应所使用的特定车辆和路线。2021年,Shim等[161]结合CA[116]和互相关分析[162]方法,通过分析旋转角度域的轴箱加速度信号来检测轮扁并诊断扁平尺寸。最后,在韩国铁路研究院测试的数据验证了CA-互相关分析方法。2021年,Baasch等[163]引入倒谱分析[116]从轴箱加速度信号中提取与车轮磨损相关的特征。加速度信号由德国航空航天中心开发的多传感器系统获得,被测列车的行驶速度高达200km/h。作者提出了一种称为轮辋数域的数据表示法。在该域中,可以监测轮辋的周长,以确定轮辋的胎面是否周期性受激。此外,轮辋数域中的峰值振幅可以表示可能的轮辋缺陷的严重程度。2021年,Bernal等[164]提出了一种车载轮扁检测技术的动态验证,该技术使用模拟信号处理,降低了状态监测传感器节点的功耗和硬件成本。在1:4比例的转向架试验台上采集健康和有缺陷轮对的轴承适配器加速度信号。然后使用这些数据验证轮扁检测技术,该技术仅使用模拟计算,无需软件或复杂算法及相应硬件,就能有效区分健康和有缺陷的加速度信号。该技术有望进一步开发低成本和超低功耗的传感器节点系统,这些系统需要大量的传感器节点,例如重载和一般货运铁路应用。 为了诊断车轮失圆的阶数并定量估计相应的振幅,2021年,Sun等[165]提出了一种基于角度域同步平均技术的检测框架。文献[165]的检测过程如图36所示。结果表明,借助垂直轴箱加速度,该框架不仅实现了车轮失圆阶数和振幅的检测,还减轻了背景噪声的影响。文献[166, 167]中提出了类似的工作。类似的研究已被Zhou等[168, 169]应用于轮扁检测。2022年,Chen等[170]提出了一种基于自适应啁啾模式分解方法的非平稳条件下多边形车轮定量检测方法。动态仿真和现场测试结果表明,使用所提出的方法分析轴箱加速度可以实现车轮失圆谐波阶数及其振幅的定量识别。一种类似的方法[171]已应用于轮扁检测。 图36 文献[165]中的检测过程 传统的基于ML的方法在轮对故障诊断中具有重要意义。2018年,Gomez等[172]使用转向架试验台测量轴箱加速度,以检测一个车轴上的诱导裂纹。在这项工作中,使用两个完整的轮对作为实验对象,每个轮对两侧的轴箱上都安装有三个传感器。通过小波包变换能量处理获得的振动信号用于训练径向基函数网络[173],以自动检测车轴裂纹。结果表明,垂直加速度最能反映车轴裂纹。然而,该方法对速度和轴载敏感,仍需要进一步研究。2019年,基于克里金代理模型[174]和粒子群优化[175],Ye等[176]开发了一种克里金代理模型-粒子群优化反演模型,其中,克里金代理模型用于建立轮扁长度、车辆速度和轴箱加速度之间的关系,粒子群优化用于确定轮扁长度。仿真和现场测试结果表明,该方法可用于定量识别具有理想形状的轮扁。2020年,Kim等[177]基于轴箱加速度识别轮扁的深度和位置,轴箱加速度是由具有柔性轮对的列车动力学模型生成的。使用希尔伯特变换[88]和小波包分解[178]提取加速度信号的特征,并通过前馈神经网络[179]实现准确预测。当使用时频处理方法时,在选择包含故障信息的特征之后,应该构建诊断模型,传统的ML技术为此提供了解决方案。2020年,Gomez等[180]在实验室滚动试验台上测量全尺寸转向架的轴箱加速度,以检测包含四种不同深度(即 0mm、5.7mm、10.9mm 和15mm)的车轴裂纹。通过小波包变换处理加速度信号,并通过支持向量机[101]执行分类任务,结果证明了诊断模型的可靠性。2022年,Xiong等[181]在Simpack中模拟了具有扁平缺陷和失圆缺陷的轮对的动态性能,并分析了这两种缺陷的失效特征。基于分析结果,将轮扁和失圆等效为位移激励,并加载到裂纹轮对的有限元模型中,求解具有三种耦合故障的轮对的振动加速度响应。将生成的加速度输入到Light-GBM模型中,实现车轴裂纹、轮扁、车轮失圆以及耦合故障的故障分类。为了验证仿真结果的可靠性,在实验室中进行了实验以确认模型的检测能力。文献[181]的检测过程如图37所示。2023年,Ye等[182]提出了一种称为多层时频图像熵的时频熵特征,用于捕获轴箱加速度信号中的低振幅细节,并表征信号的频率稳定性和频率可变性。结合所提出的多层时频图像熵特征和经典神经网络分类器,构建了一种铁路车轮故障诊断方法。通过仿真和线路实验验证了该方法的可行性,其中仿真中的车辆速度为300km/h,现场线路测试中的最大运行速度分别为300km/h 和100km/h。2023年,Bustos等[183]研究了货运列车转向架的振动性能,并在实验室中测量了轴箱加速度。通过EMD[147]将获取的加速度分解为固有模态函数。将固有模态函数的频谱功率用作传统前馈神经网络的输入,该网络基于缺陷的严重程度对振动信号进行分类。结果表明,训练后的网络可以准确识别车轮中缺陷的存在及其严重程度。2023年,Shaikh等[184]开发了一个仿真模型来生成车轴的横向振动加速度,该模型用于构建车轮缺陷数据集。基于该数据集,使用多层感知器[185]作为特征提取器,并将其与各种基于ML的分类器相结合,即支持向量机[101]、随机森林[186]、决策树[187]和 k近邻[188]。结果表明,多层感知器-随机森林和多层感知器-决策树方法表现更好。由于ML技术的快速发展,需要更多的数据来训练更可靠的检测模型。因此,2024年,Su等[189]结合模拟和实验获得的加速度信号创建扁平数据集,该数据集用于构建智能检测模型。组合数据集及其构建方法可以促进数据挖掘在铁路运输领域的应用。 图37 文献[181]中的检测过程传统的ML方法只能处理给定的任务和数据集,不能处理复杂多变的数据和任务。DL方法作为ML方法的一个重要分支,能够自动提取加速度信号中的特征,是当今的一个热门研究方向。2020年,Shi等[190]通过现场线路测试收集了存在轮扁时的车体加速度,并开发了一种称为LightWFNet的轻量级一维卷积神经网络架构,用于诊断轮扁。结果表明,LightWFNet的计算成本远低于常用的信号处理方法,使得LightWFNet能部署在现有的远程信息处理设备上进行实时诊断。为了比较各个神经网络在检测缺陷特征和对其进行分类方面的有效性,2021年,Sresakoolchai等[191]使用动态仿真软件包D-Track模拟了1608个样本,并分别使用传统的深度神经网络、卷积神经网络和循环神经网络检测轮扁并对其严重程度进行分类。该研究评估了三个深度神经网络的三个不同方面,即整体准确性、检测轮扁的能力和对轮扁严重程度进行分类的能力。研究表明,深度神经网络具有最高的整体准确性。 一些学者将时域或频域特征与DL算法相结合,用于诊断轮对故障。2020年,Bai 等[192]认为频域特征比时域特征更能生动地表示车轮缺陷类型,因此提出了一种新颖的频域格拉姆角场算法,该算法将存在轮扁时的垂直轴箱加速度编码为特征图像。然后引入改进的迁移学习网络,在不涉及任何先验知识的情况下,使用少量样本实现特征图像的准确分类。在比例试验台(1:5比例的滚动试验台)上验证了该方法的可行性。2021年,Bai[193]使用比例试验台收集带有人工制造故障的轮对的轴箱加速度,并构建频域信号的一阶马尔可夫转移矩阵。以图像的形式表示信号的频谱特征。然后使用基于迁移学习[194]的训练DL模型检测这些图像,以识别车轮故障。该诊断方法具有较高的可靠性和分类准确性,但该研究缺乏变速条件下的数据,需要进一步发展。2022 年,Ye等[16]开发了一种名为OORNet的DL模型,用于失圆车轮的状态监测和故障诊断,该模型同时考虑了轴箱加速度的时域、频域和时频域特征。为了验证模型的可靠性,使用2000个不同车轮失圆曲线引起的轴箱加速度仿真数据集测试了OORNet的性能,诊断流程如图38所示。2023年,Ye等[195]提出了一种称为激活时域图像的自适应特征提取方法,并将其与深度神经网络相结合,分析轴箱加速度,实现轮扁缺陷的在线检测。所提出的方法具有鲁棒性,不受轨道不平度、轮轨磨损和其他干扰冲击的影响,并且在某一速度下训练的激活时域图像-深度神经网络模型可以直接应用于其他速度,克服了传统方法对车辆速度敏感的缺点。2023年,Galdo等[196]从安装了全尺寸铁路车轴的实验系统中收集轴箱加速度,并基于用于振动信号时频表示的差分二维卷积神经网络开发了一种实时轴箱裂纹诊断技术。结果表明,该网络可以诊断在32种不同工况组合(例如载荷、速度、旋转方向和振动方向)下测试的三个不同轮对的裂纹。然而,由于实验资源的限制,研究人员难以获得大量真实世界的数据来训练DL模型。Shi等[197]和Shim等[198]提出了结合模拟和实验数据创建大量样本的想法,并使用DL模型验证了这一想法,为解决故障样本不足的问题提供了解决方案。 图38 文献[16]将工程问题(a)转换为DL问题(b) 3.2.3.4 总结 车载检测中的机械法具体分为基于SG的方法、基于FBG传感器的方法和基于加速度计的方法,总结于表7。 总体而言,车载检测中的机械法是当前主流方向,其中基于加速度的方法更受研究者青睐。近年来该方法的应用数量激增,这得益于加速度计成本低廉且易于安装、信号处理方法和AI算法(如DL)日趋成熟,以及在线监测设备的逐步普及。基于SG方法的优势在于所用传感器结构简单。与道路检测不同的是,车载检测中SG方法的缺点在于通常需要配备专用测力轮组,这类设备价格昂贵。因此需综合考虑成本、传感器部署位置及数据采集方式。FBG传感方法在车载检测领域的关注度相对较低。未来需解决FBG传感方法存在的温度干扰问题。加速度计方法虽应用最广,但易受车辆子系统振动干扰,因此开发高效的特征提取与识别技术备受关注。此外,基于加速度计的方法在理论上可以用来量化缺陷的大小,但关键是针对不同车辆在不同轨道条件下的运行情况制定适当的故障判断标准[160]。 表7 各种机械法的对比(基于FBG传感器的方法也可以归类为光学方法) 4 对比综上所述,目前的轮对故障诊断方法主要包括库内诊断法、轨旁诊断法和车载诊断法。本节将对比不同国家在该领域的研究现状,以及这三种方法的总体特点和发展方向。 4.1 不同国家的研究进展 不同国家在轮对故障诊断方面的已发表论文数量如图39所示,从中可以发现以下特点: 图39 本文调研的不同国家的文献 (1)中国研究机构发表的学术论文数量遥遥领先于其他国家。原因如下:在过去 15年中,中国大力投入高速列车故障诊断技术的研发。在此背景下,轮对故障诊断相关研究迅速增多,其中库内诊断法最为成熟且应用广泛,因此相关报道也最为频繁。中国也在积极研究和应用轨旁诊断法,这与中国高密度的铁路网络和商业需求密切相关。此外,中国特别重视AI技术在高速列车实时健康监测中的应用,因此车载诊断法的研究和报道也显著增加。 (2)除中国外,在亚洲国家中,韩国和日本在库内诊断法方面的研究相对较多。在欧洲国家中,许多国家都积极参与轮对故障诊断的研究,其中葡萄牙、西班牙、德国和意大利发表的论文数量较多,这反映出它们为支持铁路运输业的持续发展,在轮对故障检测技术创新方面的不断投入。西班牙和意大利在库内诊断法方面的研究较多,葡萄牙则在轨旁诊断法方面表现出浓厚兴趣。此外,德国、英国和西班牙在车载诊断法方面也取得了相当大的进展,尤其是德国,由于其铁路工业的高技术水平以及对轮对在线检测技术的强烈需求,在该领域表现突出。在非洲国家中,关于车轮故障检测的研究较少。像埃塞俄比亚等一些国家发表的论文数量有限,这可能与铁路基础设施的完善程度以及科技投入有关。此外,一些中东欧国家(如立陶宛和捷克)的相关研究也较少,尽管它们对铁路运输的需求较大,但在检测技术研发方面的投入有限。总体而言,这些国家在轮对故障诊断方面的研究数量尚未能与亚洲和西欧国家相比。 表8列出了每个国家在三种主要方法的不同子类别中的发表论文数量,从中可以得出以下结论: 表8 按国家列出的三种主要方法的不同子类别的文献 (1)库内诊断法(包括声学法、光学法和电磁学法)在许多不同国家都取得了进展。在声学法的研究中,中国、意大利和西班牙等国家发表了较多论文,并在工业中应用了相关的超声检测设备。例如,中国的LY-30A系统(见图40(a))、意大利的 BAT III系统(见图 40(b))和西班牙的ULTRASEN®系统(见图 7)已在车间安装使用[200]。在光学法的研究中,中国发表的论文数量最多。在实际应用中,也开发了相应的工业设备,例如高等[49]开发的激光检测系统(见图13)。在电磁学方法的研究中,韩国发表的论文数量最多,特别是在ICFPD方法方面。中国、捷克和西班牙等国家的相关发表较少。在工业中,库内普遍使用磁粉检测设备(见图 17),如文献[70]中介绍的那样。 (2)轨旁诊断法包括声学法和力学法。在声学方法的研究中,各国的发表论文数量相对均衡。在工业领域,声学技术也得到了发展。在实际应用中,也开发了不同的声学检测设备,这些设备通常由多个传感器组成,例如波兰学者Komorski等[86]开发的麦克风系统(见图 23)。参与力学法研究的国家最为广泛,其中葡萄牙发表的论文数量最多。许多国家在该方法的工业应用方面已经相当成熟,例如中国的 TPDS 系统(见图 40(c))[201]、美国和瑞典的 WILD 系统(见图 40(d))[99, 107, 202]、德国的 MULTIRAIL® WheelScan 系统[203]等。 (3)车载诊断法包括光学法、热学法和力学法。在光学法和热学法的研究中,发表的论文较少,主要由意大利和中国报道,迄今为止,尚未公开报道有成熟的工业应用案例。在力学法的研究中,涉及的国家较多且发表的论文数量庞大。在工业领域,也应用了许多成熟的测试设备,例如瑞士和丹麦分别开发的用于采集加速度信号的KISTLER传感器和BK传感器(见图 40(e))、瑞典使用的用于测量动态载荷的测力轮对(见图34)、北美使用的用于检测车轮扁疤的遥测设备(见图 40(f))等。 图40 世界各地不同的检测设备:(a)LY-30A系统[199],(b)BAT III系统[200],(c)TPDS系统[201],(d)WILD系统[202],(e)KISTLER和BK传感器,以及(f)遥测设备[204]4.2 总体特点和发展方向 本文总结的这三种方法为轮对故障诊断提供了丰富的解决方案。现将这三种方法的总体特点和发展方向总结如下: (1)库内诊断法的优点是可以对轮对进行全面检查,为定期维护提供重要帮助,但该方法耗时较长。未来,库内诊断法应向高智能化、高自动化和低成本方向发展。维护部门在制定维护周期时,应兼顾车辆运行的安全性和轮对维护的经济性。 (2)轨旁诊断法的主要优点是只需少量传感器即可诊断整列列车所有轮对的健康状况,与库内诊断法相比,效率更高且成本更低。此外,该方法还可以整合其他功能,如检测轴数、车辆速度和列车重量等,形成一体化的轨旁检测系统。未来,轨旁诊断法应向更高的智能化、自动化和集成化方向发展。它可以成为构建整条线路列车运行完整数据库的重要手段。 (3)车载诊断法可以通过特定的车载设备实时检测轮对故障。然而,从安装、实施和维护的角度来看,使用该方法检测列车所有轮对的成本较高。此外,车载诊断法涉及大量复杂的信号处理技术和未经验证的ML模型,这增加了该方法的推广难度。未来,车载诊断法应注重提高设备的耐用性,开发智能算法以提高自动化程度,并降低成本。此外,还应收集更多与故障轮对相关的数据集,为ML模型(包括DL模型)提供可靠的数据来源。5 讨论与展望尽管现有的轮对故障诊断方法已取得显著进展,但在实际应用中仍面临诸多挑战。当前研究不仅需要解决理论与实践脱节的问题,还要平衡检测精度、效率和经济性。此外,随着智能化和自动化技术的快速发展,如何将这些新兴技术有效整合到现有的检测和维护系统中,以进一步提高故障诊断的准确性和可靠性,已成为一个亟待解决的问题。以下是值得探索的挑战: (1)如何弥合理论研究与工程应用之间的差距? 目前,许多在役检测方法(包括轨旁方法和车载方法)用于轮对故障诊断时,都基于AI算法,且需要训练ML模型,这需要大量数据作为支撑[205]。然而,由于实验资源的限制,研究人员难以获取海量的真实世界数据。在当前已发表的与基于AI的故障诊断方法相关的研究中,涉及的训练数据集主要有三类:(a)理想故障数据集,例如在理想故障条件下[176]或理想实验室环境中[159]获得的数据集;(b)模拟数据集,例如根据理想理论方法构建的缺陷,包括用半正弦函数描述的车轮扁疤[176]、用正弦函数描述的车轮多边形化[182],或使用深度学习生成的模拟故障数据集,例如生成对抗网络[68];(c)结合模拟和实验的数据集 [189, 197, 198],例如根据特定理论方法将实测的真实世界信号和模拟信号相结合,构建接近真实故障信号的理论信号。这些数据集与真实世界的数据集存在一定差异,基于这些数据开发的理论AI模型的适用性值得怀疑。如何弥合理论研究与工程应用之间的差距,是推动智能故障诊断方法发展的一大挑战。 (2)如何建立缺陷尺寸、信号中的故障特征与车辆运行安全性之间的关系? 合理设计的车载方法能够准确判断采集的信号中是否存在故障特征,但由于轮轨系统存在强烈的非线性因素,大多数车载方法无法准确识别缺陷的位置、类型和尺寸,更无法建立缺陷尺寸、信号中的故障特征与铁路车辆运行安全性之间的关系。其最终结果是,一旦检测系统在分析的信号中检测到故障特征,即使是微小缺陷或早期故障,也可能触发警报。然而,这些微小缺陷在车辆运行过程中是不可避免的。例如,列车制动过程中,很容易产生尺寸远小于维护阈值的车轮扁疤。一方面,这些微小缺陷对铁路车辆的运行安全和乘客的乘坐舒适性没有影响。另一方面,它们可能只有在轮对运行足够长的距离后才会演变成可见缺陷,甚至可能被磨掉。通过与车辆制造商和列车运营商(如西门子、中国中车和铁路运输管理部门)的讨论,我们了解到许多列车运营商不愿意在其车辆上配备车载检测设备,因为其中涉及的许多故障诊断算法“过于敏感”,无法准确反映缺陷的大小,这会引发频繁的警报。这不仅无法达到智能维护的目的,还会带来更多无意义的工作并增加运营成本。因此,如何建立故障尺寸、信号中的故障特征与车辆运行安全之间的关系,是推广车载故障诊断方法面临的一个严峻挑战。 (3)如何制定平衡运行安全性和维护经济性的缺陷尺寸限值? 与在役检测方法相比,库内方法可以用于检测轮对缺陷的特定尺寸甚至形状,但这些缺陷限值的制定仍是一个挑战。如今,不同国家/地区对车轮扁疤的限值有不同的标准。例如,中国CRH380B动车组车轮扁疤的长度和深度限值分别为30mm和0.25mm(车轮直径>840mm);EN 15313-2010[206]规定,对于轴重小于18t、速度小于160km/h、车轮直径为840至1000mm的车辆,车轮扁疤长度的限值为60mm。然而,中国的大量实际运营经验表明,即使扁疤长度超过100mm,在长期使用过程中,车辆的运行安全和轨道的疲劳行为也未受到显著影响。另一个例子是高阶车轮多边形化的限值,中国 CRH380B动车组规定18-23阶对应的粗糙度不应超过25dB。该限值的得出没有理论依据,而是通过观察在多边形车轮激励下轴箱上安装的螺栓的松动情况得出的经验值。然而,对于不同的车辆是否应遵循该阈值,这是一个需要进一步研究的问题。因此,对于在不同条件下运行的车辆,制定满足运行安全性和维护经济性的缺陷阈值是一项挑战,这涉及到故障的判定和后续维护措施的制定。 (4)未来如何有效应用多传感器融合技术? 现有的车载方法大多仍依赖单一传感器的信号,这使得单个转向架内车轮之间的耦合效应未能得到充分考虑。例如,当转向架中的一个车轮出现故障时,故障信息不仅存在于该车轮对应的轴箱加速度中,还存在于该转向架其他车轮对应的加速度中[157]。然而,基于单一传感器的故障检测方法往往难以充分捕捉这些复杂的相互关系。这些方法不仅无法准确获取缺陷的几何信息(如缺陷长度和深度),甚至可能导致对故障车轮位置的错误判断。多传感器耦合网络可以用于捕捉不同位置的信息,提供多角度的信号观测,以充分获取故障信息。此外,多种类型的传感器可以同时监测车轮的多种物理量,例如加速度、温度和应变信号[144]。通过融合这些传感器的信号,还可以提供多方面的诊断依据。未来,多传感器融合技术的发展将进一步推动智能在线故障诊断系统的进步。AI技术可以进一步提高多传感器数据处理的效率和准确性。如何利用传感器融合技术和AI技术实现高度可靠和高度智能的诊断,是研究人员需要解决的挑战。 (5)如何实现检测过程的高度自动化和检测设备的高度集成化? 未来,检测设备将向功能更全面、组件更紧凑的方向发展。除了单一故障检测外,检测系统正朝着多故障检测的方向发展,系统结构越来越精简 [98, 99, 110, 117, 122, 124, 131]。随着现代智能软件的应用,一线工作人员的工作将大大简化。故障的类型、大小和位置等信息将由系统自动识别,并用于生成故障维护表单,显著提高生产效率。然而,实现检测过程和检测系统的自动化仍需要系统且深入的研究。 (6)如何协同运用库内方法和在役方法,并结合AI技术,实现轮对的预测性和综合性维护? 目前,库内检测和在役检测的数据共享不畅,这阻碍了AI技术在预测性维护中的应用。AI技术依赖大规模数据集和高质量的特征提取。然而,在现有的数据环境中,库内检测和在役检测的数据往往存在格式差异、内容差异,且缺乏共享平台,使得AI模型在训练和应用过程中难以获得全面的数据支持,从而影响预测的准确性和可靠性。此外,由于缺乏真实的数据库 [191],且现有研究大多局限于特定的故障类型,当前用于轮对预测性维护的AI算法尚未得到系统的验证和优化。大多数研究仅限于故障类型和大小的识别,缺乏对全生命周期数据的预测分析,未能充分发挥AI在复杂工况下的卓越能力。例如,对于复杂故障(如车轮磨损和疲劳裂纹)的长期演化,AI模型往往无法有效捕捉其微观变化特征。未来,随着AI、物联网和大数据技术的不断进步,轮对故障诊断有望向更加智能化和集成化的方向发展。未来的系统应能够对车辆运行状态进行多维度、实时监测,同时通过自学习和不断的数据积累优化维护策略,最终形成真正的智能预防性维护框架。这将显著提高铁路运营的安全性和经济性,推动铁路技术进入智能化新时代。实现这一目标还需要建立标准化的数据平台和行业规范。因此,如何通过协同库内方法和在役方法,深入研究轮对故障数据的特征和规律以及先进的AI算法,值得研究人员思考。6 总结为确保在役列车的安全运行,建立合理高效的轮对故障诊断方案尤为重要。目前,轮对故障诊断的三种方法分别是库内方法、轨旁方法和车载方法。本文讨论了相关研究进展,并比较了每种方法的优缺点。结论如下: (1)通过定期的库内检测,维护人员可以及时发现并处理潜在的轮对故障。在库内检测中,声学法主要包括PEU、EMU和LU方法,这三种方法都得到了广泛应用。未来学者需要关注的是无需耦合介质、检测速度更快、自动化和智能化程度更高的方法。光学法主要包括LD、TI和基于CV的方法。LD方法要求检测设备的光出口易受油污和灰尘污染,未来应开发更强的防污染装置。热成像检测设备应向高分辨率和高自动化方向发展。基于CV的方法应增强环境适应性,并开发更高效的多种故障检测和分类技术。电磁学法包括MP、ICFPD和HSA方法。降低成本、提高自动化程度以及开发能够检测深层缺陷的多传感器阵列配置是未来发展的关键方向。 (2)在列车运行过程中,利用轨旁传感器监测轮对缺陷可以有效减少运营中断和维护成本。在轨旁检测中,声学方法主要包括基于麦克风的检测和基于AE的检测。这两种方法都易受环境影响,因此未来的研究应致力于开发高效的降噪技术。力学方法主要涉及基于SG的方法、基于FBG传感器的方法和基于加速度计的检测。作为一种相对较新的方法,基于FBG传感器的方法未来可能会受到更多关注。但需要注意应变和温度的交叉敏感问题。基于SG和基于加速度计的方法需要探索更合适的信号处理技术和传感器布局安排。此外,近年来DL技术在应变和加速度信号分析中的应用日益增多,这符合当前AI时代的大趋势。 (3)车载传感器在列车运行过程中收集轮对相关信号,可以实时监测轮对异常。在车载检测中,光学法主要指激光检测方法,其受环境条件影响较大。值得注意的是,随着硬件和DL技术的进步,库内方法中的基于CV的方法有望应用于车载检测。热学法主要依赖温度传感器,需要考虑环境温度干扰。因此,未来应探索更高效的信号处理方法。力学法包括基于SG、基于FBG传感器和基于加速度计的方法。对于基于SG的方法,未来的重点应放在成本、传感器布局和数据采集技术上。对于基于FBG传感器的方法,应解决温度和应变的交叉敏感问题。基于加速度计的方法是目前研究最广泛的。然而,收集到的信号容易受到车辆子系统的干扰。未来的研究应集中在如何消除干扰以及如何利用AI技术实现故障的自动诊断。 综上所述,每种故障诊断方法都有其优缺点。未来的研究应通过协同利用库内方法、轨旁方法和车载方法,提高检测效率和精度。此外,还应特别关注以下几点:(1)AI技术(包括DL)已逐渐引入轮对故障诊断中。然而,目前大多数研究仍停留在理论层面,AI技术的工程价值仍难以体现。(2)需要建立缺陷尺寸、信号中的故障特征与车辆运行安全性之间的关系,车载检测设备需要实现真正意义上的智能化,且不能违背降低成本、提高效率的初衷。(3)应根据车辆自身特点和列车的服务环境,定制更合理的缺陷阈值和故障定义标准,以兼顾运行安全性和维护经济性。(4)利用多传感器融合技术和AI技术实现可靠且高度智能的诊断,是研究人员面临的挑战。(5)检测过程的高度自动化和检测设备的高度集成化是未来的发展方向。(6)需要协同应用库内方法、轨旁方法和车载方法,并结合AI技术,实现轮对的全面预防性维护。 编辑:陈宇航校核:李正平、陈凯歌、曹希铭、赵学功、白亮、任超、海洋、赵栓栓、陈莹洁、Tina、王金、赵诚、肖鑫鑫该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈