首页/文章/ 详情

综述 | 数据驱动的机械故障诊断:全面综述(下)

12小时前浏览49

本期给大家分享一篇小编近期阅读的2区top综述文章。如果有故障诊断相关方向研究人员希望宣传自己研究成果欢迎大家在公众 号后台与小编联系投稿,大家一起交流学习。

故障诊断是当前工业设备领域的研究热点。本期推荐的这篇是迪肯大学博士研究生迪拉杰・纽帕内的文章,这篇文章聚焦数据驱动机械故障诊断
,系统梳理了传统机器学习深度学习强化学习迁移学习等方法的应用分析了多机械故障数据的特征与应用,探讨了数据稀缺、模型泛化性等挑战,并提出了数据集优化、算法改进未来研究方向。其核心价值在于弥补现有研究在 RL (Reinforcement Learning:强化学习)应用、多源数据融合等方面的空白促进该领域的进一步发展。

由于文章篇幅过长,小编将分三次为大家翻译介绍这篇论文第一篇推文阐述 MFD(Machinery Fault Diagnosis:机器故障诊断) 重要性,指传统方法不足,数据驱动方案兴起;介绍故障诊断类别与维护策略,点明现有综述缺陷;说明本综述方法、分类体系;探讨机械故障数据,包含类型、增强技术、数据集三个方面;最后阐述传统数据驱动方法及各自优缺点第二篇阐述先进数据驱动方法在机械故障诊断(MFD)中的应用,详细阐述了深度学习、强化学习、迁移学习的技术原理及实践效果,同时介绍了异常检测、Transformer 架构、物理信息神经网络、联邦学习等辅助方法的应用场景,各类方法均通过多个数据集验证了高准确率与强适配性,为复杂工业环境下的 MFD 提供了高效解决方案。

本篇推文将聚焦先进数据驱动方法,详解 DL(CNN、RNN 等)、RL、TL 在 MFD 的应用,DL 各模型处理不同数据与任务,RL 用于分类和架构搜索,TL 缓解数据与域差异问题,还提及异常检测等其他助力 MFD 的方法

希望对大家的学习有所帮助,文章质量很同时希望大家可以多多引用。



论文基本信息

论文题目: Data-driven machinery fault diagnosis: A comprehensive review

论文期刊:Neurocomputing

Doihttps://doi.org/10.1016/j.neucom.2025.129588

作者: Dhiraj Neupane(a), Mohamed Reda Bouadjenek(b), FaRichard Dazeley(c), Sunil Aryal(d)
论文时间: 2025年
机构: 

a School of IT, Deakin University, WaurnPonds, Geelong, Victoria 3216, Australia

作者简介:迪拉杰・纽帕内系迪肯大学的博士生,专攻基于先进机器学习算法的智能故障检测。他拥有韩国昌原国立大学信息与通信工程硕士学位,研究方向为机械设备故障检测与信号处理,同时对计算机视觉和声纳信号处理抱有浓厚兴趣,已发表多篇高影响力论文。此外,还积极担任多家知名期刊的审稿人。(来源:ResearchGate

摘要

在当今先进制造时代,尽早诊断机械故障以确保其安全高效运行变得比以往任何时候都更为关键。随着现代工业过程日益复杂,传统的机械健康监测方法已难以提供高效性能。在工业大数据激增以及传感与计算技术进步的推动下,基于机器学习/深度学习方法的数据驱动式机械故障诊断解决方案已在制造应用中广泛应用。在工业应用中,及时、准确地识别故障机械信号至关重要,为此已提出诸多相关解决方案,并在早期文献中多有综述。尽管目前存在大量关于机械故障诊断的解决方案和综述,但是现有文献大多聚焦于特定设备类型或分析方法,导致其在广泛制造环境中的适用性受限。此外,关于实施数据驱动方法所面临挑战的讨论(例如处理噪声数据、选择合适特征、以及调整模型以适应新的或未知故障)往往流于表面或完全被忽略。因此,本综述对采用不同类型机器学习方法检测和诊断各类机械故障的文献进行了全面回顾,重点评述了其优势与局限性;梳理了用预测分析的方法;详尽探讨了可用的机械故障数据集;向未来研究者介绍了应用这些方法进行故障诊断时可能遇到的挑战,并提出了缓解这些问题的可能解决方案。同时,本文也指明了未来研究前景,以促进对该领域的深入理解。我们相信,本文将为研究人员提供帮助,并促进该领域的进一步发展。

关键词数据驱动;深度学习;故障检测;联邦学习; 机械故障;机器学习 ;预测性维护;强化学习

目录

1 引言

   1.1 研究背景

   1.2 研究动机

   1.3 文章结构

实施的方法论与开发的分类法

机械设备故障数据(与分析)

   3.1 数据类型与分析

   3.2 数据增强

4 数据驱动方法

   4.1 传统数据驱动方法

   4.2 基于深度学习的数据驱动方法

   4.3 基于强化学习的故障诊断

   4.4 基于迁移学习的故障诊断

   4.5 其他方法

5 挑战

   5.1 数据相关挑战

   5.2 旋转机械面临的挑战

   6.3 现有方法面临的挑战

   5.4 应用机器学习/深度学习算法面临的挑战

   5.5 其他挑战

6 对未来研究者的建议

   6.1 机械设备与数据集增强

   6.2 算法开发

   6.3 其他建议

7 未来展望

8 结论


注:小编能力有限,如有翻译不恰之处,请多多指正~
     若想进一步拜读完整版,请下载原论文进行细读。

5 挑战

在MFD领域,尽管受到了学术界的广泛关注,但有效地将先进的数据驱动算法应用到实际应用中仍然存在挑战。这些挑战涵盖了各个方面,包括数据集问题、模型架构和现有方法,在后续章节中进行了详细阐述。

智能传感器:与传感器网络相关的挑战包括安全和隐私、网络流量和能量效率。确保安全和隐私是至关重要的,特别是在保护组织边界和云计算背景下的数据方面。网络流量是另一个重要的挑战,因为来自多个传感器的同时数据传输会导致拥塞和潜在的数据丢失。最后,能量效率对于最小化功耗至关重要,同时优化整个传感器网络的资源利用率。

5.1 数据相关挑战
   

采用先进的学习方法进行MFD需要大量的数据。然而,可用的数据集有许多限制,限制了所采用模型的性能。以下是研究人员在处理机械故障数据集时面临的挑战:

    1. 真实世界数据面临的挑战:

      智能传感器:与传感器网络相关的挑战包括安全和隐私、网络流量和能量效率。确保安全和隐私是至关重要的,特别是在保护组织边界和云计算背景下的数据方面。网络流量是另一个重要的挑战,因为来自多个传感器的同时数据传输会导致拥塞和潜在的数据丢失。最后,能量效率对于最小化功耗至关重要,同时优化整个传感器网络的资源利用率。

      多传感器数据融合:多传感器数据融合中的挑战包括处理不精确和不确定性,集成同质和异质传感器数据,以及有效地分析来自不同来源的数据。 分布式系统中的数据同步对于保持系统的实时性能至关重要。此外,在边缘计算和云计算之间平衡监测框架和数据采集系统的高成本和计算决策仍然是一个关键的挑战。

    2. 真实世界数据面临的挑战:真实世界的机械数据往往是有噪声的、不一致的、来自异构传感器的、非平稳的、不完整的,使得故障分析具有挑战性。这可能是由于传感器故障、间歇性故障或数据收集过程中的通信问题造成的[ 237 ]。真实世界场景和受控实验室环境之间的数据质量差异给实际应用带来了巨大的挑战。此外,各行业不愿提供真实的工业数据用于研究也是一个存在的问题。

    3. 故障数据稀缺:真实世界的故障机器数据往往是稀缺的,使得训练先进的ML模型具有挑战性。获取足够的故障数据用于机械故障检测是具有挑战性的,因为机械通常在正常条件下运行。再次,故障具有不同的类型和严重程度,为每种类型的故障获取足够的数据是一项具有挑战性的任务[ 1 ]。

    4. 标注数据不足:如前所述,大多数工作依赖于监督学习,需要标注数据。然而,准确标记故障类型和严重程度是具有挑战性的,这导致了标记数据集的稀缺。在现实世界的工业环境中,标记数据的短缺是一个重大的挑战,因为标记是一个昂贵和耗时的过程,通常缺乏多样性,以确保对未见过的故障进行有效的泛化[ 25 ]。

    5. 数据不平衡:故障数据稀缺导致类别不平衡问题,正常状态的数据多于故障,导致某些故障类型的代表性不足。这种不平衡会阻碍学习过程,使模型偏向多数类[ 405 ]。

    6. 数据不相容性:当数据来自不同的来源时,检测机械故障变得具有挑战性,每个来源都有自己的目标、复杂性和数据处理的标准。 此外,数据库中数据存储深度的变化为机械中的故障检测创造了建模问题[ 406 ]。

    7. 从研究到实践的知识转移:大多数研究是使用在受控实验室环境中获得的公开可用的数据集进行的。目标是应用这些知识来检测未见过的机械故障,包括从实验室产生的数据中预测真实世界的故障。然而,要做到这一点,必须解决几个技术挑战[ 8 ]。

    8. 现有数据集存在的问题:大多数机械故障数据集具有局限性,其中一些数据集列举如下:

      • 在MFD中使用公开的数据集面临各种挑战,包括非经典故障识别特征、非平稳特性、难以准确识别所有故障、高方差、数据损坏、频率成分不规则、缺失值、对某些标签或类的偏见、故障类型的代表性有限、可访问性受到限制以及运行条件[8、13、21、44]范围较窄。

      • 一些数据集包含多种来源的异构数据,阻碍了数据的一致性和模型的训练。此外,许多是复杂的和具有挑战性的分析,而一些是相对较小的,限制了模型性能[1、34]。

5.2 旋转机械面临的挑战        
  • 复杂运动:真实世界的机械经常涉及组件之间的滑动,这使得故障频率的计算变得复杂,并影响特征信息。

  • 频率干扰:在同时发生多种类型机械故障的情况下,它们的相互作用可能导致复杂的频率相互作用,使信息频率变得不清晰。

  • 外部噪声:额外的振动或声发射源或其他类型的噪声可以引入干扰,并模糊相关特征。

  • 具有挑战性的故障类型:一些机械故障可能表现出非平稳行为,缺乏特征循环频率,使其难以检测。

  • 敏感性可变性:与机械缺陷相关的特征可以对不同的操作条件敏感,需要系统的适应。

  • 传感器布置:获取准确的机械故障信号需要昂贵的传感器和专家参与将其安全地安装到机器上。传感器布置不当导致的数据质量不足会对DL模型在故障检测中的性能产生不利影响[407]。

5.3 现有方法面临的挑战        

1. 监督学习:MFD中最主要的方法是SL技术。然而,也存在一定的挑战,具体如下所述:

    • 这些方法善于发现已知的故障,但与新的或看不见的类型作斗争。

    • 这些方法擅长检测已知的故障,但难以发现新的或看不见的类型。

    • 为监督方法获取一个多样化、标记良好和平衡的数据集是资源密集型和耗时的,往往导致模型泛化能力有限。

    • 特征选择在监督学习中至关重要,影响模型性能。

    • 有监督学习会导致过拟合,特别是在训练数据有限的情况下,导致在新数据上的表现不佳。

    • 有监督学习算法对数据噪声的敏感性会导致误报和漏报。

2. 半监督学习:SSL在MFD中的使用仍然有限,但逐渐增加。它们在一定程度上克服了监督学习技术的局限性;但是,也存在一定的局限性,需要加以解决。

    • 与监督方法相比,SSL需要更少的标记数据,但在获得质量标签方面仍然面临挑战,这在MFD中可能是昂贵的。

    • 确定最佳标记数据量的挑战,因为过少会导致性能不佳,而过多会导致过拟合。

    • 一致地结合标记和未标记数据会引入偏差,并且不总是直接的。

    • 像在监督学习中一样,类别不平衡可能是SSL中的一个挑战,其中标记样本在不同类中的不平等分布可能会使模型产生偏差。

    • 由于在监督和非监督领域都需要专业知识,因此复杂的实现。

    • 对标记数据质量的敏感性会降低算法性能。

    • 从多种方案中选择合适的半监督学习算法存在困难。

3. 无监督学习:在MFD中使用USL方法面临的挑战如下:

    • 无监督技术的最大优势,即不需要有标记的数据,这可能是它的局限性,因为它可能难以评估模型的性能。

    • 无监督技术依赖于检测异常,这可能难以应对复杂和多样化的操作行为。

    • 设置适当的阈值进行异常检测是主观的,可能需要专家经验。

    • 这些方法在处理复杂的机械数据时可能会产生误报,影响可靠性。

    • 无监督方法可能缺乏明确的结果解释,阻碍精确的故障诊断。

4.强化学习:RL在MFD中的局限性如下:

    • 尽管RL在其他领域取得成功,但其在MFD中的应用受到限制。

    • 在现有系统中,RL在优化维护决策和故障检测方面的潜力没有得到充分利用。

    • 目前用于MFD的RL算法通常将故障诊断简化为猜测游戏,类似于分类任务。

    • RL算法在适应各种机械或环境设置方面的局限性[ 117 ]。

    • RL在平衡探索和利用方面的挑战,以发现最优策略和最大化回报[ 365 ]。

    • RL通常需要与环境进行广泛的交互,使其难以推广到不可见的环境或任务。

    • RL在处理连续动作和高维状态空间时面临的困难。

        5.3 应用机器学习/深度学习算法面临的挑战        

        ML / DL算法在使用连续几何变换将一个空间X映射到另一个空间Y方面取得了重大进展,特别是在大量数据可用的情况下。这一成果在各个行业都是革命性的[ 409 ]。然而,人类层面的人工智能仍然是一个难以实现的目标。研究人员面对更深层次网络的挑战包括:

          1. 经典ML的特征工程挑战:在MFD中,经典ML算法依赖于特征工程,根据运行参数和物理特征来识别相关故障指标。然而,这种方法面临着影响故障分类精度的挑战[ 8 ]。

          2. 复杂模型训练:训练用于机械故障检测的ML / DL模型需要大量的计算资源和时间,特别是深度神经网络需要大量的数据。

          3. 模型可解释性:深度学习模型常被视为黑箱模型,缺乏透明性和可解释性。这对于像机械故障检测这样的安全关键应用来说是一个值得关注的问题。在故障检测系统中确保信任和促进决策是至关重要的,因此有必要研究在此背景下增强DL模型的可解释性[410、411]。

          4. 通用化:大多数技术侧重于特定的情况,而不是集成的工程环境,影响了它们的通用性。此外,现有的算法往往很难在逼近和泛化之间找到最佳的平衡。对训练数据的过拟合会降低在未知数据上的性能,而过度泛化会导致较差的训练精度[410、412]。

          5. 数据依赖性:DL模型严重依赖大量数据进行有效学习。它们在数据稀缺的情况下表现不佳,并且与不平衡数据集斗争,经常将样本较少的类错误分类。此外,在MFD [ 413 , 414]的背景下,DL模型在学习低质量或冗余数据时面临挑战。

          6. 计算开销大:这些模型计算密集,需要强大的硬件进行训练和执行,使得它们的成本很高。这对于资源有限的小型研究团队和工业应用来说可能是一个限制因素[ 1 ]。

          7. 特征提取的挑战:从原始传感器数据中选择相关和重要的特征对于准确的故障检测至关重要,但在大型数据集中识别最具信息的特征可能是复杂的。为了捕获故障相关模式,需要有效的特征提取方法和领域专业知识。

          8. 没有选择DL架构的标准化方法:由于缺乏标准化的指导原则,为机械故障检测选择合适的DL工具和架构是具有挑战性的。DL模型具有众多的超参数,需要专家知识和计算资源以获得最佳性能。 此外,大多数现有的深度学习架构都是针对图像数据设计的,因此鼓励工程师探索根据工业机械数据的独特特征量身定制的卷积架构,这些架构具有改进故障诊断的潜力[ 415 ]。MFD中一些最常用的DL架构的局限性如下:

          • 自编码器:传统的自编码器通常包含一个预训练阶段来初始化网络权重,第一层的错误会导致网络学习重构训练数据的平均值。此外,自动编码器具有有限的可解释性,因为模型通常学习压缩的表示。

          • CNN:CNN依赖于标记数据,需要多个层来捕获整个层次结构。它们还面临捕获时间序列数据中的长期依赖关系的挑战,具有固定的输入大小约束,对变长度的时间序列造成问题,对超参数的调整高度敏感,以及与不规则采样数据或缺失值的斗争。

          • DBN:DBNs具有局限性,例如基于最大似然训练近似的优化步骤不明确以及无法考虑输入图像的二维结构,影响了其在计算机视觉和多媒体分析任务中的性能和适用性[ 416 ]。

          • GAN:GANs在训练收敛中可能会遇到不稳定性和挑战,容易发生模式崩溃,其中生成器仅产生有限种类的样本,在评估生成样本的质量和性能方面面临困难,并且需要仔细调整架构和训练过程[ 417、418 ]。

          • RNN和LSTM:这些模型由于梯度消失/爆炸而难以在长序列上进行训练,捕捉复杂时间依赖的能力有限,并且在训练过程的并行化方面存在挑战。

          • TL:-迁移学习可以帮助缓解数据相关的挑战,但由于操作条件、传感器配置和机器类型的差异,可能并不总是适用于MFD应用,这可能会限制从一个任务到另一个任务的知识转移的有效性;

            -由于不同工作条件之间的转移误差、不同组件的独特特性、实验室和工业领域之间的尺度放大问题以及样本容量和先验知识的限制等因素,提高诊断精度具有挑战性;

            -迁移学习中的负迁移会导致目标任务的性能不佳。 防止负迁移仍然是一个开放的挑战,因为如果源任务与目标任务有显著差异,负迁移更有可能发生。选择与目标数据相似的源数据有助于减轻负迁移[ 21 ]。

            -开发适用于不同机器或设备类型的故障检测模型具有挑战性。每台机器都有其独特的运行特点、环境条件和故障表现形式。确保故障检测模型对新的、看不见的机器的可推广性仍然是一个重大挑战。

            -尽管MFD在故障识别、特征提取、动态状态监测、故障严重程度评估和RUL预测等方面取得了显著进展,但目前的研究表明,深度迁移学习技术已主要用于故障特征提取。

            -在源域和目标域之间的迁移过程中,由于额外的复杂性,以及深度学习架构固有的计算需求,计算负担增加。

          • XAI:XAI识别了重要的特征,但往往无法解释它们为什么是关键的。

          5.5 其他挑战

            • 大多数研究缺乏交叉验证和实验重复;

            • 所提方法对伪代码的解释不足;

            • 选择适当的评估指标,准确地反映误报和漏报的真实影响,具有挑战性;

            • 与机械故障数据进行适当的交叉验证,由于其时间性质和防止数据泄漏的需要,具有挑战性;

            • 在一些行业中,实施和验证故障检测系统的监管要求增加了额外的复杂性;

            • 在整个工业设施中使用大量机器的故障检测系统,可能会在硬件和基础设施方面带来挑战。

          6 对未来研究者的建议

          6.1 机器和数据集增强

          1.特征提取的挑战:从原始传感器数据中选择相关和重要的特征对于准确的故障检测至关重要,但在大型数据集中识别最具信息的特征可能是复杂的。为了捕获故障相关模式,需要有效的特征提取方法和领域专业知识。研究和分析:作为最初和最重要的一步,我们建议未来的研究人员对他们将要工作的数据集进行深入和详细的研究。正如多次提到的,数据是任何算法性能的基础。因此,在模型开发之前仔细分析数据可能会更好地理解问题并提高模型性能。

          2.数据集创建:在生成数据集时,要慎重考虑。

              • 集成高质量的传感器,如加速度计和声发射传感器,用于不同条件下的数据采集(健康和故障状态,不同的严重程度);

              • 适当的传感器布置对于准确的数据采集至关重要,要求传感器靠近源并安全安装,以尽量减少干扰和噪声[ 33 ];

              • 测试床应设计为复 制真实世界条件,并仔细选择材料和配置;

              • 收集不同负载和速度设置的数据,以确保捕获有意义的故障特征;

              • 准确标记数据集,详细说明故障类型、严重程度和实验条件。

              • 应用滤波、归一化等预处理技术对数据进行精化处理,用于算法开发。

              • 系统地组织数据,以便于访问和分析。如果公开共享,将数据集托管在可靠的平台上,并提供全面的文档,以支持该领域的其他研究人员。

          3.传感器策略:根据选择的方法调整传感器的数量。经典方法可能需要更少的传感器,而深度学习方法则受益于不同位置的多个传感器。整合来自不同来源的数据,如振动、温度、声信号和扭矩,以增强故障模式识别和模型性能[ 32 ]。

          4.数据集扩充:保证足够的数据集大小用于训练鲁棒的深度学习模型。使用数据增强、信号处理技术和合成数据生成来增加数据集的多样性。迁移学习和领域自适应等技术可以缓解与数据稀缺相关的问题[ 406 ]。

          5.数据预处理:实现预处理技术,去除噪声,解决缺失数据,过滤掉无关信息。将原始数据转换到频率域或时频域,以揭示隐藏的模式,从而提高故障检测算法的有效性。

          6.综合模型评估:使用通用的基准测试集和真实的工业数据进行全面的模型评估,确保模型在不同的条件下进行测试,并能够处理机械故障检测中的实际挑战。

          7.数据融合与处理:

              • 通过多传感器数据融合加强数据收集,以进行全面的多故障诊断。

              • 应用代价敏感学习和具有重采样策略的集成方法来管理数据分布。

              • 使用反映真实工业设置不平衡性质的数据集进行鲁棒模型训练。

          6.2 算法开发

          • 建议对工作环境和操作条件进行适当评估。对于更简单的设置,经典的ML方法或基于频率的模型是合适的。在具有多个工作点的噪声或复杂环境中,应考虑先进的DL方法,并结合噪声弹性的去噪技术。

          • 一些研究表明,深度学习在机械健康监测中并不总是优于传统方法。建议以更简单的方法开始解决问题。

          • 为特定的机械故障检测任务选择适当的DL / ML架构,以平衡复杂性、可解释性和计算需求[ 24 ]。

          • 无监督异常检测方法可以解决标记数据稀缺和类不平衡问题。由于故障数据表现出异常模式,异常检测方法可以在不需要标记数据的情况下对其进行识别。此外,它们还可以检测新的和不可见的故障。

          • 半监督或无监督学习算法也可以缓解标记数据稀缺的问题。当使用半监督学习时,在利用未标记实例的同时,使用适当比例的标记数据。

          • 除了数据增强技术,还可以通过设计损失函数来解决数据不平衡问题。例如,文献[ 420 ]中基于帕累托优化的方法引入了多任务学习框架来平衡任务之间的权衡,有效地处理了数据不平衡问题。同样地,自适应交叉熵损失在训练过程中自动地对多数类和少数类样本的影响进行重加权,提高了模型在不平衡数据上的性能。

          • 应用正则化技术和去噪方法来清洗信号,避免过拟合,并提高DL模型在机械故障检测中的泛化性能。

          • 使用交叉验证方法和重复实验进行综合测试,以验证模型性能、稳定性和可推广性。

          • 将DL与传统的ML、信号处理、特征工程等技术集成,以利用它们的组合优势,实现稳健的机械故障检测算法[ 167 ]。

          • 研究领域自适应方法,以提高迁移学习在机械故障检测应用中的有效性,考虑不同的操作条件和机器配置。

          • 针对强化学习应用,探索适合机械故障检测挑战的新的奖励函数、算法和学习范式的开发。

          • 结合可解释的AI技术,以增强深度学习模型的可解释性,为其决策过程提供见解,并增加对其预测的信心。

          6.3 其他建议

          • 扩大研究范围,以覆盖更广泛的故障和机械。虽然现有的研究主要集中在特定的机器部件,如轴承、齿轮和电机,但现实世界的应用往往涉及这些部件共同运行。这就需要开发能够评估组合系统中各机器部件之间相互作用的诊断方法。

          • 为了增强方法的可访问性和可比性,我们强烈建议发布机械故障检测算法的源代码。开源代码允许其他研究人员在现有工作的基础上实施、评估和构建,促进了该领域的透明度、协作和创新。 

          • 研究人员应采用全面和结构化的文档方法,以使该领域的未来研究人员受益。

          • 考虑在机械故障检测中结合在线学习技术,以使其能够持续适应不断变化的机器条件和新的故障类型[ 117 ]。

          • 使用数字孪生可以帮助模拟场景了解故障的根本原因,预测故障以进行主动维护,并实现实时监控[ 319 ]。

          • 虽然该领域的开源代码稀缺,但少数研究人员维护开源资源。我们建议未来的研究人员访问这些网站以获得帮助:https://qinyi-t eam.github.io, https://biswajitsahoo1111.github.io/, https://gith ub.com/liguge,等。我们还敦促未来的研究人员使他们的代码和数据集开源,以使整个研究社区受益。

          7 未来展望

          在MFD领域,尽管受到了学术界的广泛关注,但有效地将先进的数据驱动算法应用到实际应用中仍然存在挑战。这些挑战涵盖了各个方面,包括数据集问题、模型架构和现有方法,在后续章节中进行了详细阐述。

          机械故障诊断的未来有许多机会,其发展的目的是提高诊断系统的准确性、可靠性和在工业环境中的适应性。研究人员正致力于通过开发新的方法来增强故障检测和分类的鲁棒性,以检测快慢结合条件下的裂纹损伤。这项工作强调了抗噪算法的重要性,这些算法对于在嘈杂的工业环境中进行准确诊断至关重要。进一步地,将变压器结构和物理信息神经网络等高级模型集成起来,以推进MFD系统。 研究人员也在探索各种数据融合方法- -包括传感器、特征和决策融合- -来融合不同的数据类型,如振动、电流、扭矩、声音信号和视觉图像。这种方法优化了这些数据类型的预处理,提高了故障检测的精度和效率。因此,开发处理不同融合层次复杂性的方法是未来研究的一个前瞻性领域。

          半监督和强化学习在MFD中的探索正在兴起,重点是减少对标记数据的依赖,并利用序列学习来预测故障并提高检测效率。未来MFD的研究将越来越强调离线RL的实际应用,以在新的环境中更好地推广。这种转变将检测故障放在优先地位,而不是简单地对故障进行分类,反映了一种更加动态和主动的故障管理方法。

          进一步,集成领域泛化、领域混淆和领域自适应等先进技术,以解决不可预见的机械故障条件、数据不平衡和标记数据有限等问题。 此外,XAI方法的发展有望使MFD更加透明和可解释,并在这些系统的决策过程中建立信任。然而,尽管XAI确定了哪些特征是重要的,但它往往不能解释为什么这些特征是关键的,这突出了需要进一步研究来弥合这种差距,并提供更深入的特征意义的见解。总体而言,未来MFD的研究具有创新性和实用性,有望为工业应用提供更可靠、准确和自适应的故障检测方法。

          最后,为了应对实时诊断的计算挑战,提高数据处理能力和计算效率是至关重要的。预训练、神经架构搜索、模型压缩等方法将起到关键作用。将机理知识与深度学习相结合,有望提高模型的可解释性和泛化性,从而实现更加自主和复杂的监测系统。数字孪生技术和混合数据驱动方法的结合也将在最小化预测误差和改进维修策略方面发挥重要作用。 总的来说,这些未来研究的可能性将促进MFD不仅满足现代工业的复杂需求,而且将朝着更可靠和更有效的故障检测方法的方向发展。

          8 结论

          本文对机械故障诊断方法进行了全面的综述,涵盖了从数据源到预测性维修策略的主题。它探讨了该领域广泛的数据集,并讨论了传统和先进的方法,包括深度学习、联邦学习、强化学习、迁移学习和物理知情的神经网络。该综述强调了数据收集和维护分析的关键作用,强调了各种预测方法在提高故障检测和机器可靠性方面的潜力。所识别的挑战是未来研究的关键领域,而所提供的建议旨在提高数据集质量、算法选择和实际应用。 

          本综述为机械故障检测领域的新进者和专家提供了宝贵的资源,有助于在不同行业中提高故障检测和机器可靠性。 

          编辑:赵栓栓

          校核:李正平、陈凯歌曹希铭、赵学功、白亮、任超、海洋、陈宇航、陈莹洁、Tina、王金、赵诚、肖鑫鑫、张优

          该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除

          来源:故障诊断与python学习


          振动化学旋转机械通用航空UGpython通信云计算海洋裂纹电机爆炸材料游戏数字孪生数控
          著作权归作者所有,欢迎分享,未经许可,不得转载
          首次发布时间:2025-11-22
          最近编辑:12小时前
          故障诊断与python学习
          硕士 签名征集中
          获赞 87粉丝 137文章 259课程 0
          点赞
          收藏
          作者推荐

          MSSP论文学习|基于深度代理建模的混凝土结构损伤反演与健康评估新框架

          本期聚焦结构健康监测的新突破:在材料疲劳与环境作用下,工程结构常面临性能退化与安全隐患。反演分析能够通过结构响应推断内部状态参数,是实现状态评估与预测维护的核心手段。然而,传统有限元模型更新(finite element model updating, FEMU)方法在大规模或复杂结构中的应用往往受制于高昂的计算成本与时间消耗。为此,本文提出了一种人工智能驱动的可微优化反演分析框架:通过深度学习代理模型替代有限元计算,并结合基于梯度的优化策略,显著提升计算效率,降低资源消耗。同时,该框架突破了传统 AI 端到端映射的局限,实现了正向计算与反演分析的解耦,能够估计状态参数的概率分布并兼容多解情形。在受损钢筋混凝土框架-剪力墙结构上的验证表明,该方法在保证精度的同时,计算效率提升近十倍,可在数秒内完成反演,为实时的结构健康监测与预测性维护提供了全新的解决方案。 论文基本信息论文题目: Towards efficient structural inverse an alysis based on AI-driven differentiable optimization method 论文期刊:Mechanical Systems and Signal Processing论文日期:2025年论文链接:https://doi.org/10.1016/j.ymssp.2025.112618作者:Chen Wang (a), Chong Zhang (a), Chen Yang (a*), Jian-sheng Fan (a,b)机构:a. Department of Civil Engineering, Tsinghua University, Beijing 100084, PR China;b. Key Laboratory of Civil Engineering Safety and Durability, Ministry of Education, Department of Civil Engineering, Tsinghua University, Beijing 100084, PR China第一作者简介:王琛老师,现任北京清华大学土木工程系助理教授。王琛老师长期从事结构计算力学与人工智能的交叉研究,主要研究方向包括数据与物理混合驱动的结构智能仿真、工程智能设计与优化、工程结构数字孪生等,致力于推动智能计算方法在重大工程结构安全与性能提升中的创新应用。在科研项目方面,他参与了多项国家级重要课题,包括国家重点研发计划子课题“重要历史建筑安全评估和全寿命期性能提升关键技术与应用示范”,以及国家自然科学基金项目“数据与理论混合驱动的工程结构体系智能计算方法研究”。相关研究成果已在《Mechanical Systems and Signal Processing》、《Advanced Engineering Informatics》等国际高水平期刊上发表多篇学术论文。(来源:https://www.civil.tsinghua.edu.cn/ce/info/1134/2436.htm)目录1 摘要2 引言3 方法论3.1 问题阐述3.2 可微分反演分析框架4 验证4.1 案例概述4.2 有限元模型仿真4.3 代理模型实现4.4 反演分析结果5 讨论5.1 模型参数分析5.2 与传统算法的效率对比6 结论1 摘要由材料疲劳和环境因素引起的结构劣化对工程结构的安全性与性能构成重大威胁。反演分析在从已观测的结构响应中识别内部状态参数方面发挥着关键作用,从而支持有效的维护与性能评估。然而,主流有限元模型更新(FEMU)方法在大规模或复杂系统中的应用面临显著挑战,主要体现在计算成本高昂与时间消耗过大。为克服这些局限,本文提出了一种基于人工智能驱动的可微优化结构反演分析框架。该框架集成了深度学习代理模型以替代有限元计算,大幅提升了计算效率;并结合基于梯度的优化方法以最小化资源需求。不同于依赖确定性端到端映射的传统人工智能方法,本框架将正向计算与反演分析解耦,能够对状态参数的概率分布进行估计,并适应多种潜在解。在一项关于受损钢筋混凝土(reinforced concrete, RC)框架-剪力墙结构的验证实验中,结果证明了该框架的有效性。单次迭代的损伤参数估计精度达 83.0%,通过迭代更新进一步提升至 88.2%,其空间分布与真实值高度吻合。与 FEMU 方法相比,该框架的全链条耗时缩短至原来的十分之一,部署后可在数秒内完成反演分析。其在状态参数与结构响应选择上的灵活性,确保了在多样化结构体系和监测策略中的适应性。关键词:反演分析,可微分优化,基于人工智能的代理模型,损伤识别,结构健康监测2 引言近几十年来,许多国家快速的城市化进程推动了大量建筑和基础设施项目的建设。然而,材料疲劳和环境因素导致许多结构出现损伤,损害了其力学性能和功能,为运营和维护带来了重大挑战。及时识别结构损伤对确保可靠性至关重要。除先进的损伤检测设备外,基于采集数据的结构状态反演分析在性能评估和预测性维护中发挥着关键作用。目前,有限元模型修正(FEMU)是反演分析的主要方法。该技术通过迭代调整有限元模型(finite element model, FEM)的参数,使其力学响应与通过传感器测量的结构实际响应相匹配。当响应之间的残差低于指定阈值时,该模型即被视为真实结构的准确表征,从而可实现可靠的损伤评估。FEMU是典型反演分析过程的范例。灵敏度分析和启发式算法是修正有限元模型参数的两种主要方法。灵敏度分析通过评估输入参数变化对模型输出的影响,有助于识别过程中最关键的影响因素。基于灵敏度的FEMU方法建立在可测量输出与需要调整的结构模型参数之间的线性化基础上。然而,推导大规模复杂结构的灵敏度矩阵面临重大挑战,且有限差分等数值方法需要大量计算资源。为克服这些局限性,研究人员在FEMU过程中引入了代理模型(如响应面法RS),显著加速了目标函数的评估并简化了其灵敏度计算。Zhou 等研究人员应用基于径向基函数的响应面法建立斜拉桥等大型结构的输入-输出关系模型,通过缩尺模型试验验证了该修正方法。另一种常用的FEMU方法是启发式算法。这类算法依靠经验法则、实践经验或合理推测来探索搜索空间,快速找到近似最优解,典型代表包括遗传算法(GA)、模拟退火算法(SA)和粒子群优化算法(PSO)。FEMU方法面临若干重大挑战,特别是在应用于大型复杂工程结构时。首先,大规模非线性有限元模型的计算既耗时又占用大量资源。根据结构复杂性和模型非线性程度,单次仿真可能需要数小时甚至数天才能完成,这使得实时应用和快速决策几乎不可能实现。其次,现有反演分析方法往往难以满足实际工程应用的需求。灵敏度分析技术通常仅限于小型线性结构,在处理复杂系统或非线性问题时效果会大打折扣。虽然启发式算法具有更强的灵活性并能处理非线性问题,但它们通常需要大量迭代才能收敛。每次迭代都需要运行有限元模型,消耗大量计算资源,导致这些方法计算成本高昂且耗时过长。近年来人工智能(AI)方法特别是机器学习的进步,使得结构状态反演分析效率显著提升。与传统有限元方法相比,深度学习(DL)方法具有更快的计算速度,大幅提高了反演分析的整体效率。尽管这些基于AI的方法比FEMU更快,但它们存在一个显著局限:试图直接将结构响应映射至状态参数。这种端到端的方法虽然提高了分析效率并有利于大规模数据处理,但实测结构响应往往缺乏足够信息,导致结构响应与状态参数之间存在一对多的映射关系。机器学习模型具有确定性——对于给定输入(结构响应),模型只会产生单一输出(状态参数)。这种特性使得这些方法难以处理多个潜在解,降低了其在实际工程问题中的适用性。对于更复杂的结构形式,这些模型在训练过程中还可能面临收敛困难。为解决这些挑战,本文提出了一种基于DL代理模型和梯度优化方法的可微分反演分析框架。该框架使用 DL 代理模型替代有限元模型进行正向计算,从而实现计算速度的数量级提升。同时,将反演分析任务构建为优化问题,利用神经网络的可微分特性,通过基于梯度的算法最小化时间和资源消耗。与现有基于DL的反演分析方法不同,本框架仅将DL用于正向计算,而反演过程则通过优化算法处理。这种方法使框架能够容纳结构损伤状态的多个潜在解,并提供状态参数的概率分布估计,而非固定数值解。3 方法论3.1 问题阐述结构反演分析可理解为优化问题,其核心目标在于基于已知结构响应(如位移、应力或形变)估计未知状态参数(例如刚度折减或裂缝深度)。在此背景下,反演分析的目标是最小化模型生成的结构预测响应与从结构实际测得的响应之间的差异。这类似于典型的优化问题:通过调整未知状态参数(记为 )来最小化目标函数 ,该函数用于量化预测响应与实测响应之间的误差。令 表示预测结构响应, 表示实测响应,则目标函数可表述为: 其中‖・‖₂表示欧几里得范数,用于计算预测值与观测值之间残差的大小。优化过程的目标是找到使该损失函数最小化的最优参数集 : 通过迭代调整未知参数 ,反演分析寻求收敛于使误差最小化的解,从而有效地使模型"拟合"真实结构行为。这种基于优化的方法能够准确推断未知结构特性,对于理解复杂工程结构的行为与健康状态至关重要。3.2 可微分反演分析框架 图 1 展示了本文提出的可微分反演分析框架。首先,为给定结构随机生成初始状态参数;随后将这些参数代入代理模型并施加外部激励(如地震作用);通过对比预测响应与实测响应,根据计算损失函数;最后基于损失函数进行梯度下降来更新状态参数。该过程迭代执行直至收敛。 图 1 可微分逆向分析框架的工作机制基于深度学习的代理模型与基于梯度的优化方法是本框架的两大核心组件。然而方法部分暂不引入具体DL算法或梯度下降方法,因为本框架可适配任意DL算法与梯度优化方法,重点在于突出其解决反演问题的创新思路。当前主流反演分析方法(如基于灵敏度分析的FEMU方法或启发式算法)通过批量调整状态参数并进行有限元计算来获取对应结构响应,继而通过这些映射"观察"输入与输出间的可能关系并调整状态参数。这种优化过程是间接的——因其计算过程中不存在真正的从输出到输入的反向过程,导致计算资源浪费。由于有限元计算过程的梯度难以获取,无法通过有限元结合梯度下降来求解该优化问题。此外,直接将结构响应映射至状态参数的方法颠倒了因果关系,导致精度与泛化能力较差。基于研究现状,本框架的创新性与优势可归纳如下:在前向计算方面,开发了深度学习代理模型以替代有限元法,大幅加速了正分析计算过程。与传统代理模型相比,深度学习技术能更精准地处理非线性结构分析问题。在逆向计算方面,与有限元法不同,深度学习模型的梯度可便捷求解,使得梯度下降算法能够替代灵敏度分析或启发式算法,以更具针对性和直接性的方式优化状态参数,同时提升处理高维问题的能力。该框架中深度学习代理模型显著减少了单次正分析所需时间,而梯度下降算法进一步降低了正分析次数,从而全面提升逆向分析过程的整体效率。与现有将结构响应直接映射至状态参数的深度学习方法不同,本框架将深度学习严格限定于正计算环节。这种设计保持了分析过程的因果逻辑,能够输出多重潜在解并提供状态参数的概率分布估计。3.2.1 基于深度学习的代理模型精确的正向计算对逆向过程中模型更新时获取可靠状态参数估计至关重要,因此代理模型具有关键作用。代理模型不仅需精确模拟正向过程,还必须捕捉状态参数的影响。在所提出的可微分逆向分析框架中,代理模型不限于特定类型,其核心要求是模型计算过程必须可微分,而深度学习模型是最常见的选择。神经网络构成深度学习的基础组成部分。通过层级之间的连接处理和学习信息,模拟人脑的工作机制。标准神经网络由 层组成,每层承担向量空间之间的映射任务。网络输入记作 ,通过全部层级转换后输出为 。第 层的输出表达式为: 其中, 是第 层的权重矩阵, 是偏置向量, 是激活函数(通常采用 ReLU、Sigmoid 或 Tanh 等非线性函数)。这些激活函数具有可微性,即存在 ,确保整个网络输出相对于输入是可微的。神经网络的最终输出为: 神经网络训练依赖于可微分性,采用反向传播算法计算损失函数 对每个参数 和 的梯度。该过程运用链式法则: 由于每层输出 具有可微性,因此可通过计算各层局部梯度来传播误差,并迭代更新权重与偏置。具体而言,对于任意激活函数 ,其梯度 被用于调节权重 和偏置 ,从而最小化损失函数 。3.2.2 基于梯度的优化方法在逆向分析的优化过程中,利用代理模型的可微特性。状态参数 通过基于梯度的优化方法进行更新,其核心原理是通过计算目标函数的梯度迭代调整参数,直至找到使目标函数最小化的最优解。梯度表示函数值最速上升的方向,其计算公式如下: 其中, 可通过链式法则计算。唯一区别在于待优化参数现为状态参数而非权重参数。实际应用中采用自动微分计算梯度。该方法在前向传播过程中记录运算操作,并在反向传播阶段应用链式法则计算各参数梯度,这种机制能高效处理复合函数。优化算法利用梯度信息确定最速下降方向,通过参数更新实现目标函数最小化。梯度下降法作为经典优化方法,其参数更新规则可表示为: 其中, 表示第 次迭代时的状态参数, 为步长(用于控制每次参数更新的幅度)。梯度下降法存在多种变体,例如随机梯度下降(SGD)、均方根传播(RMSProp)和自适应矩估计(Adam),可根据所解决问题的具体需求与特性选择适用算法。4 验证4.1 案例概述 在先前研究中,对三层RC框架-剪力墙结构进行了振动台试验,采集加速度与位移时程数据。通过计算机视觉方法获取客观损伤参数,为本研究模型验证提供参考依据。试件共3层,每层高2300 mm,平面尺寸为4700 mm × 3000 mm。每层四角布置立柱,沿x轴方向设置剪力墙。楼板厚度80 mm,y轴方向次梁传递重力荷载。图 2(a)-(c) 展示了72个损伤位置编号(不考虑次梁损伤)。如图 2(d) 所示,采用常用于非线性分析的MSC Marc软件建立结构有限元模型。模型中梁柱采用纤维梁单元模拟,剪力墙采用分层壳单元建模。两类单元均为三维单元,每个节点具有六个自由度。楼板通过刚体单元(RBE2)约束实现平面内刚性假定,无需明确定义楼板单元。基于刚性楼板假定,这种简化对常规结构带来的误差可忽略不计。荷载与楼板质量通过梁的传递密度施加。梁柱构件离散为100 mm单元段,损伤参数施加于端部相邻两个单元段。剪力墙在x方向按130 mm间距、z方向按100 mm间距划分单元。 图 2 试件基本信息及其有限元模型本案例中,逆向分析的优化问题可表述为:状态参数 定义为损伤参数 ,其包含所有柱端、梁端及剪力墙的刚度折减系数 与强度折减系数 。这是由于梁柱的宏观损伤通常发生在构件端部。混凝土主要贡献抗弯刚度,钢筋则提供强度。因此,在对应有限元模型中,刚度折减 应用于混凝土强度参数,强度折减 应用于钢筋屈服强度参数。通过堆叠所有构件的损伤参数,形成损伤参数向量: 结构响应定义为各层加速度响应时程( )与结构固有频率( )。相较于频域特征,时域特征更能有效描述大规模非线性结构,因此选择 作为目标参数之一。若每层楼均安装加速度传感器,可通过收集震后加速度时程快速识别地震损伤。选择 是因为固有频率可通过多种结构检测方法获取,为结构健康状态提供额外重要信息。优化目标表述为: 其中, 表示在损伤参数为 时输出地震激励 作用下加速度响应的模型, 表示在损伤参数为 时输出固有频率的模型。 用于控制这两项的相对权重。4.2 有限元模型仿真 虽然有限元模型未直接集成到所提出的逆向分析框架中,但其用于生成训练深度学习代理模型所需数据。在建立有限元模型后,采用实测加速度时程数据验证模型有效性。图3对比了x方向 JMA Kobe NS 波激励下顶层加速度响应的实测值与有限元计算结果。图3(a)中峰值地面加速度(PGA)为700 mm/s²,属于常遇地震水平。由于结构在此荷载下预期基本无损伤,模型中未考虑损伤效应。在12秒至15秒之间存在偏差,这可能是实际结构中未在模型内考虑的轻微损伤所致。总体而言,计算加速度响应与实测数据基本吻合。 图 3 有限元结果与实测结果的对比 图3(b)所示地震激励的峰值地面加速度(PGA)达到6200 mm/s²,这属于罕遇地震等级。在此之前,结构已承受2000 mm/s²和4000 mm/s²的地震激励作用,导致明显损伤。通过绿色曲线(未考虑损伤的有限元结果)与蓝色曲线(实测值)的对比可见:若不考虑损伤影响,计算结果呈现基频过高、振幅过低的特征,说明模型刚度估计偏大,对损伤单元材料强度作如下调整: 其中, 与 分别表示损伤前与损伤后的混凝土抗压强度, 与 分别表示损伤前与损伤后的钢材屈服强度。红色曲线(有限元结果,考虑损伤)表明,在引入损伤效应后,计算得到的频率与相位与实测数据吻合良好,尽管在幅值上仍存在一定差异。这些差异可能源于实验与有限元模型中损伤施加方式的不同,以及模型无法反映损伤随时间演化的局限性。尽管如此,引入损伤后得到的精度提升验证了所采用损伤机理的合理性,并为进一步数据生成、代理模型训练以及损伤识别提供了支持。共抽取了1000组损伤参数,并分批用于建立有限元模型。有限元模型输出地震作用下的加速度响应与自振频率。采用了拉丁超立方采样(LHS)方法确定损伤参数,该方法具有良好的参数覆盖性。参数上下限由试验过程确定,如表 1 所示。这定义了损伤参数的先验分布,而损伤识别的任务即是利用实测数据推断后验分布。表 1 损伤参数的上下限 图 4 展示了损伤参数的抽样分布,特别给出了ID为0、24和60的情况。在图4(a)中,各参数的边缘分布近似均匀;而图4(b)表明三个参数的联合分布在上下限范围内均匀覆盖整个参数空间。这表明LHS能够在有限的采样点数下有效覆盖参数空间。其他损伤参数的边缘分布也呈现类似特征。 图 4 抽样损伤参数的分布:(a) 损伤参数分布图; (b) 损伤参数散点图图 5 给出了1000组样本对应的前三阶自振频率分布。本研究中 特别关注第二阶模态频率,因为其代表了结构在x方向上的主要水平振动模态,而该方向亦为地震作用方向。第二阶模态频率范围为1.82 Hz至2.05 Hz,中位值为1.95 Hz。 图 5 前三阶自振频率的分布 图 6 展示了各层归一化加速度响应时程的分布。加速度通过对输入地震动的PGA进行缩放并减去平均加速度以消除趋势实现归一化。横轴为时间步,纵轴为归一化加速度,亮色 区域表示数据点集中度较高。该分布呈现均匀且离散的特征,适合作为代理模型的训练数据。 图 6 归一化加速度响应时程的分布 4.3 代理模型实现本节实现了两类代理模型:加速度响应代理模型 与自振频率代理模型 。这些模型的结构及实现过程将在后续小节中详细介绍。4.3.1 代理模型的结构模型 的输入包括地震激励加速度 与损伤参数 ,序列 的维度为 ,其中 为总时间步数,离散时间步从 到 , 为总时长。损伤参数向量 的维度为 ,其中 为构件总数。模型的输出为加速度响应 ,其维度为 ,其中 为结构的层数。换言之, 表示所有楼层加速度响应序列的拼接结果。结构的加速度响应属于非线性动力系统。理想的代理模型应采用自回归方式生成响应,即基于地震激励与先前的输出逐步预测每一时间步。这与有限元中的非线性时程分析类似,通过本构关系与牛顿第二定律更新状态变量(如塑性应变与应力)。然而,自回归模型对误差极为敏感,每一步预测均依赖于前一步结果,微小误差会逐渐累积,最终导致显著偏差。在损伤识别之前,完整的实测加速度响应序列已知。因而在预测每一时间步时,模型可以将前一时间步的实测响应作为输入。因此,加速度响应代理模型可表示为: 其中, 表示在时间步 的预测加速度响应。加速度响应代理模型基于 Transformer 架构构建,如图 7 所示。该架构是序列预测领域表现突出的深度学习模型。 图 7 加速度响应代理模型的结构输入到 Transformer 模型的地震加速度激励需要进行线性维度变换与特征增强,如图 8 所示。地震激励 首先由一维线性变换至模型维度 。同样,损伤参数 也被线性变换至 ,并复 制 次。二者随后逐元素相加,以确保每个时间步都包含完整的损伤参数信息。 图 8 输入序列的特征增强 模型 的结构较为简洁,因为其预测损伤结构的自振频率,不涉及序列处理。 的输入为损伤参数向量 ,输出为自振频率 ,其维度为 ,表示前 阶频率。该模型采用多层感知机(MLP)实现,如下所示: 其中,MLP 由全连接层构成,每一层的神经元与下一层的所有神经元相连。在每个隐藏层之后引入非线性激活函数,以增强模型的表达能力。4.3.2 代理模型的训练 由于自振频率代理模型实现简单且精度较高,本文主要关注加速度响应代理模型的训练过程。本文训练了两类加速度响应模型:一阶模型与二阶模型。一阶模型基于时间步 至 的输入数据预测 时刻的加速度响应,而二阶模型则在相同输入条件下预测 时刻的响应。由于地震反应分析的时间步较小(0.012 s),加速度的变化幅度有限,因此模型仅通过将当前响应平移至下一步即可达到较高精度。但这种方式可能导致模型忽略损伤参数,从而降低反演精度。为解决这一问题,同时训练了二阶模型以提升准确性。表2列出了两类代理模型的主要结构参数。模型参数总数为364,227。表 2 代理模型架构参数 两类模型的训练曲线如图 9 所示。经过20,000次训练后,一阶模型在测试集上的精度达到97.16%,二阶模型则为94.26%。训练集与测试集精度接近,表明模型不存在过拟合。对比而言,一阶模型的训练确实比二阶模型更为容易。 图 9 加速度响应代理模型训练曲线:(a) 一阶模型训练曲线; (b) 二阶模型训练曲线表 3 将两类代理模型的精度与朴素模型进行了比较。朴素模型仅通过复 制当前加速度来预测下一步响应,作为基线模型,任何有效的代理模型都应优于其表现。结果显示,一阶与二阶模型的精度均显著提升,能够有效捕捉损伤参数的影响。表 3 代理模型精度对比 4.4 反演分析结果采用二阶加速度响应代理模型与自振频率代理模型对结构损伤参数进行更新。图 10 展示了随着迭代步数增加,模型更新精度的变化情况。在过程初期,为避免过早收敛而设置的较大优化步长,导致代理模型精度与损伤参数精度均出现明显振荡。约10步之后,随着迭代的继续,代理模型精度逐渐提高。与此同时,损伤参数的精度也随之提升,并与代理模型的改进趋势高度一致。 图 10 精度随更新步数的变化曲线图11给出了结构损伤参数的空间分布。为简明起见,主要展示了结构朝南面的真实值与预测值。颜色越深的圆点表示损伤参数越接近1,即损伤越轻。整体来看,刚度与强度削减系数均被合理估计。但在部分构件中,尽管整体损伤程度估计准确,构件两端的相对大小却出现反转。 图 11 损伤参数的空间分布这说明该方法在构件层面具有较高精度,但在构件端部层面尚存在不足。有关预测与真实损伤参数的详细对比见表4。表 4 真实与预测损伤参数对比 对于刚度削减系数,三层梁及二层剪力墙左侧梁的估计较为准确。尽管二层右侧梁两端的损伤系数出现反转,但整体数值与真实值接近。同样,一层左侧梁的估计准确,而右侧梁右端存在一定误差。柱类构件的估计精度相对较低。二层柱与一层、三层右侧柱的估计与真实值吻合,但一层与三层的左侧柱系数出现反转。二、三层剪力墙的刚度削减系数预测准确,但一层剪力墙上下端存在反转。对于强度削减系数,大多数构件损伤较轻,仅在三层剪力墙右梁左端、一层剪力墙左梁左端、三层右柱两端、二层左柱上端以及一层左柱两端存在较大损伤。所提方法在7处显著损伤中成功预测了6处。如前所述,单次模型更新的精度可能因随机性而存在差异。由于本研究采用基于梯度的优化算法,损伤参数的初始值会影响结果。为此,进行了多次模型更新,以估计损伤参数的近似概率分布。图 12 展示了在100次更新后,4处损伤位置的初始与最终概率分布,利用高斯核的核密度估计(KDE)获得。 图 12 损伤参数的初始与最终概率分布为更清晰展示更新前后的变化,对分布进行了对称化处理,并根据表1中的上下限对分布区间进行了截断。纵轴表示对应损伤参数值的概率密度。浅蓝色分布为初始状态,浅橙色为更新后的状态,绿色线为真实值,蓝色与橙色线分别为初始与最终分布的中位数。更新后,概率分布由均匀状态逐渐集中于真实值附近,中位数也更接近真实值。这表明多次模型更新能够降低损伤参数估计的不确定性。虽然近似概率分布能全面反映损伤参数的分布情况,但在实际应用中通常需要一组具体的参数估计值,例如作为有限元模型输入进行剩余承载力分析。概率分布常用的统计量包括均值、中位数与众数,不同分布类型下各有优势。表 5 给出了这些统计量的精度,单次试验的精度按所有试验的平均值计算。结果表明,统计量的精度均优于单次试验,其中均值提升了5.2%,为最高增幅。因此,在实际应用中,可通过对多次模型更新结果取平均来获得损伤参数的估计值。表 5 多次模型更新后损伤参数估计精度对比 在完成损伤参数估计后,将其输入有限元模型进行完整的时程分析,以验证代理模型更新参数的有效性。结果如图 13 所示,修正后的结构加速度响应(橙色虚线)与基于真实损伤参数的响应高度一致,仅在二层与三层少数峰值点存在微小差异。 图 13 使用真实与预测损伤参数的有限元结果对比5 讨论5.1 模型参数分析本节通过分析关键模型参数,评估其对损伤参数识别精度的影响。对比参数包括:模型阶数:指预测加速度响应与当前时间步之间的时间步距离。本文对比了一阶、二阶和三阶模型的性能表现。特征增强方法:采用加法特征增强,另一种可选方案是拼接法——将加速度激励与损伤参数经线性维度变换后沿特征维度拼接。为保持维度大小为 ,需先将加速度激励和损伤参数的特征维度降至 再拼接。模型维度( ):考察64(原始)和128两种维度设置对精度的影响。表 6 展示了不同模型配置对损伤参数估计精度的对比结果。在一阶、二阶和三阶模型中,二阶模型的损伤参数估计精度最高,三阶次之,一阶最低。这可能是因为一阶模型虽易于训练,但从损伤参数中获取的信息增益有限。尽管三阶模型信息增益更大,但其估计精度仅略高于一阶模型且低于二阶模型。这可能源于其对加速度响应的预测精度较低,限制了目标函数的最小化进程,从而制约了最终估计精度。因此,要实现准确的损伤参数估计,既需要结构响应的高预测精度,也需要损伤参数带来的显著信息增益,二者对模型更新均至关重要。表 6 不同模型参数对损伤参数估计精度的影响 在特征增强方法方面,加法优于拼接法。对于相同二阶模型,加法最高精度达88.2%,而拼接法为87.4%。就模型维度而言,128维和64维的最高精度持平,表明维度大小对精度影响甚微。但需注意:128维模型参数量达1,424,771个,是64维模型(364,227个参数)的3.9倍。为节约计算资源,实际应用中建议将模型维度设置为64。5.2 与传统算法的效率对比 表 7 给出了本文提出的反演分析框架与采用启发式算法的有限元模型更新(FEMU)方法的效率对比。假定两种方法均需进行相同迭代次数,且每次有限元时程分析耗时40分钟。本文框架需要数据生成与训练阶段——生成1000组数据耗时40000分钟,代理模型训练额外增加55分钟。FEMU方法无需这两个步骤,节省了相应资源。在模型更新阶段,本文框架每次评估仅需0.03秒,而FEMU方法依赖时程分析,每次评估需40分钟。当种群规模为50时,FEMU方法每轮迭代需2000分钟,200次迭代总耗时达400000分钟;相比之下本文框架仅需6秒。表 7 反演分析所需时间资源对比 有限元并行计算可加速两种方法:本文框架通过缩短数据生成时间实现加速,而FEMU方法则通过减少每轮迭代中的模型评估时间实现加速。在50进程并行条件下,本文框架数据生成时间降至800分钟,总时间缩短至855分钟;FEMU方法则需8000分钟。若采用无限并行方案,本文框架总时间可进一步压缩至95分钟,但FEMU方法仍保持8000分钟(因每轮迭代仅需50次评估,并行度受限)。对比结果表明:相较于采用启发式算法的FEMU方法,本文提出的框架具有显著的时间效率优势。5 结论本文提出了一种可微分的反演分析框架,将基于深度学习的代理模型与梯度优化方法相结合。通过对受损钢筋混凝土(RC)框架-剪力墙结构的结构状态预测验证了该框架的有效性,证明其具备准确执行反演分析的能力。主要结论如下:(1) 基于 Transformer 的加速度响应代理模型实现了超过 94.26% 的预测精度,成为一种可靠工具,可在模型更新过程中快速评估结构响应。该能力显著加速了损伤识别与模型修正的迭代过程。(2) 在单次模型更新中,损伤参数估计精度达到 83.0%,其空间分布在构件层面与真实值高度吻合;多次更新后,精度进一步提升至 88.2%。此外,该框架可提供状态参数的概率分布,而非固定取值,从而增强结果的稳健性。(3) 损伤参数估计精度取决于代理模型的预测精度与损伤参数所提供的信息增益。较高的预测精度可确保结构响应评估的可靠性,而更大的信息增益则使框架更好地捕捉损伤参数的影响。两者之间的平衡至关重要。(4) 所提框架具备极高效率,部署后在处理时程数据时仅需数秒即可完成反演分析。即使在全链条实现(包含数据生成与训练)的情况下,其所需时间资源也仅为依赖启发式算法的有限元模型更新方法的十分之一。(5) 该框架在状态参数与结构响应的选择上具备高度灵活性,可适应多种结构体系与监测策略,从而拓展了其应用前景。编辑:Jin校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、Tina、陈宇航、陈莹洁、肖鑫鑫、赵诚该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除来源:故障诊断与python学习

          未登录
          还没有评论
          课程
          培训
          服务
          行家
          VIP会员 学习计划 福利任务
          下载APP
          联系我们
          帮助与反馈