本期给大家分享一篇小编近期阅读的数字孪生技术相关文章。如果有故障诊断相关方向研究人员希望宣传自己研究成果,欢迎大家在公众 号后台与小编联系投稿,大家一起交流学习。
数字孪生是当前故障诊断领域的研究热点。本期推荐的这篇是林奈大学博士研究生迈赫迪·萨曼·阿扎里的文章,这篇文章中提出了一种结合多个范式的自适应故障诊断系统,即基于共享知识的监控-分析-规划-执行(MAPE-K)循环,领域泛化网络(DGNMs)模型和数字孪生(DT)。MAPE-K循环能够实时适应,DT生成补充数据解决标记数据不足问题,DGNM通过对抗学习和领域差异度量增强特征泛化。实验证明,该系统在相关工作操作和跨机器任务中表现优于现有技术。
由于文章篇幅过长,小编将分两次为大家翻译介绍这篇综述,本节推文是这篇文章的上半部分,希望对大家的学习有所帮助,文章质量很高同时希望大家可以多多引用,特别是对所提方法的借鉴。
论文链接:通过点击最左下角的阅读原文进行在线阅读及下载。
论文题目: Self-adaptive fault diagnosis for unseen working conditions based on digital twins and domain generalization
论文期刊:Reliability Engineering and System Safety
Doi:https://doi.org/10.1016/j.ress.2024.110560
1 引言
2 相关工作
2.1 传统机器学习和深度学习
2.2 领域自适应
2.3 领域泛化
2.4 数字孪生体
2.5 MAPE-K
3 预备工作
3.1 构建诊断数字孪生
3.2 领域泛化问题设置
3.3 混合
4 自适应故障诊断系统设计
4.1 监视器
4.2 分析仪
4.3 规划者指标
4.4 执行者
4.5 知识
5 旋转机械案例研究
6 实验验证与性能分析
6.1 数据集
6.2 对比方法
6.3 实施细则
6.4 诊断结果与分析
7 结论
工业传感技术和计算能力的发展极大地推动了数据驱动的方法在信息物理框架内的机械设备故障诊断[ 1 ]。在此,尽管深度学习( DL :Deep Learning )方法在从大型数据集中提取隐含的故障相关特征方面优于传统机器学习( ML:Machine Learning )方法,但它们仍然依赖于跨训练和测试阶段数据分布一致的假设。由于机械设备的高度动态性,导致工况和数据分布不断变化,这种严格的假设在实际应用中几乎不成立。由于DL模型是在特定的工况下训练的,因此上述差异(通常称为域偏移)构成了一个关键的挑战[ 2 ]。在试图克服领域迁移问题时,深度学习方法需要收集大量与新工况相关的数据,并从头开始对模型进行训练。
然而,这个过程是资源密集型的,可能并不总是实用的,因此确定了在不同的工况下增强模型适应性的替代策略的必要性[ 3 ]。
为了解决领域迁移问题,领域自适应( DA:Domain Adaptation )技术应运而生,以增强DL模型的弹性和适应性[ 2 ]。DA策略寻求最小化训练(源)和测试(目标)数据之间的差异。尽管基于DA的故障诊断方法是有效的,但其实用性取决于适应过程中目标域数据的可用性。在真实情况下,特别是当机械设备在新的工况下运行时,只有代表正常运行状态的数据可用于训练,而有缺陷的数据则无法获取。这些条件,通常被称为不可见的工况,普遍存在于高动态机械设备和不断变化的环境中,例如旋转机械[ 4 ],因此,大多数DA方法的适用性仅限于离线跨域故障诊断任务。
为了应对未知工况带来的开放性挑战,研究人员越来越关注智能故障诊断系统领域的领域泛化( DG:Domain Generalization )技术。这些技术旨在将源域中的诊断知识的适用性推广到未知的工作环境中[ 5 ]。尽管在推广性方面取得了可喜的成果,但现有的基于DG的未知工况处理方法面临以下挑战。首先,许多DG方法旨在通过将所有领域整合到单个潜在空间来学习领域不变的表示,通常忽略了对精确诊断至关重要的特定领域特征[ 6 ]。这种监督不仅限制了特征的多样性,而且增加了源域特征过拟合的风险,所以该模型可能难以有效地推广到新的、看不见的工况。由此迫切需要改进基于DG的故障诊断系统,以便更好地整合和利用特定领域的信息,从而提高其在不同工业工况下的泛化能力。其次,为了开发具有足够泛化能力的模型,这些方法依赖于从具有不同数据分布的不同源域获得大量标记训练数据的假设。然而,在实际工程场景中,从不同工况下的相同机器或从不同但相似的机器收集如此广泛的训练数据集是一个挑战。这些挑战源于与数据收集相关的高成本,包括设备设置、维护和操作停机时间。此外,现实工业环境中固有的多样性和多变性往往导致数据集稀疏或不完整,特别是涉及罕见的故障事件或特定的操作场景。这种数据的稀缺性会严重限制仅在有限且同质的数据集上训练的诊断模型的泛化能力。因此,探索一种可靠的补充源来提供训练数据集变得至关重要。第三,工业机械运行在动态和不断变化的环境中,需要能够适应和更新其评估的诊断模型,以应对新的数据和不断变化的工况。传统的方法往往缺乏持续的模型更新机制,而依赖于可能很快过时的静态数据集。因此,迫切需要探索能够自主监测运行工况变化并据此调整诊断策略的自适应广义诊断模型。这样的模型不仅可以随着时间的推移增强可靠性,而且可以确保诊断系统在不断变化的工业环境中保持有效和准确。
针对上述开放性问题,本文提出了一种将MAPE - K、领域泛化网络模型和数字孪生技术高度集成的自适应故障诊断系统。在这里,DGNM被用于处理由于特征多样性有限而导致的丢弃特定领域特征和过拟合的问题。为此,需要结合多种技术,包括多领域数据增强、对抗学习和基于领域的差异度量。更具体地说,多域增强采用基于狄利克雷分布的混合技术,生成融合了来自不同域特征的增强数据。然后将这些丰富的数据用于对抗学习和基于领域的差异度量,以提取更多样化的特征,提高网络的泛化性。DT被嵌入到所提出的平台中,作为可靠的数据供应商,从而解决了从实际机器中获取足够训练数据集的问题。事实上,DT模型是不断调整的,可以反映新的看不见的工况的运行动态,并提供了丰富的诊断知识来源。最后,为了应对工业机械环境的动态性,将MAPE - K自适应回路引入到所开发的故障诊断系统中。该循环有利于实时适应新的不可见的工况,从而减少了直接人为干预的需要,增强了系统的自主性。
因此,这项工作的关键新贡献可以概括如下:
本文的结构如下:第2节简要回顾相关研究,随后是第3节的基础知识和背景信息。在第4节,提供了对所提出的自适应故障诊断系统的全面描述。第5节阐明了将该系统应用于旋转机器作为案例研究。此外,第6节提供了实验结果及其分析。最后,在第7节中,总结论文并讨论未来研究的潜在方向。
本节回顾了与本文相关的最新概念。为了增强条理性,每个概念,即传统机器学习和深度学习、领域自适应、领域泛化、数字孪生和MAPE-K,将分别进行讨论。
表1 相关工作总结和我们提出的方法
3.1 构建诊断数字孪生
开发DTs是一项具有挑战性的任务,因为它需要在足够可接受的模拟性能和真实机器的复杂性之间找到平衡。换句话说,必须选择建设性地确定抽象层次,以涵盖所有相关细节。对于诊断目标,有必要定义最关键组件的详细模型,而不是整个机器的详细表示。
接下来,为了方便和提供一个标准的框架,将设计过程分解为以下4个高级步骤:
一旦建立并初步校准了预测某些目标变量值的数字模型,其预测能力将根据工况数据和测量值进行不断更新和调整。
挑战在于使用来自这K个源域的数据训练模型,并辅以增强数据,以确保其获得足够的泛化能力。这将使模型能够在未知的目标域Dt上有效地执行诊断任务,尽管源域和目标域之间的数据分布存在差异。
工业传感技术和计算能力的发展极大地推动了数据驱动的方法在信息物理框架内的机械设备故障诊断[ 1 ]。
故障诊断系统( FDS:The fault diagnosis system )用于检测潜在缺陷,将其隔离,并识别出具体的故障类型。在实际的应用中,真实的机器性能受到各种工作操作和环境条件的影响。在这些条件下,真实机器数据的分布通常会随着新的工况而变化。传统的基于DL和领域自适应技术的FDS在训练阶段需要同时访问新工况下的健康和故障数据,以保持其功能或适应其行为;然而,在模型训练过程中,只有健康状态是正常可用的,而故障数据往往是无法访问的。为了克服这个问题,需要消除依赖关系,并使诊断模型能够泛化到新的工况。为此,我们引入了自适应,其主要目的是使FDS能够在无法访问其故障数据的情况下对新的未知工况进行自主重构。
在信息物理系统的新兴技术和计算范式的背景下,所提出的自适应FDS的参考框架如图1所示。它包括被管理和管理元素层,而管理元素层负责实现自适应。MAPE - K循环是专门为设计、开发和实现FDS自适应而定制的,如图2所示。
图1 自适应故障诊断参考架构
图2 利用MAPE - K进行自适应故障诊断
MAPE - K环由以下四个重要的功能组件( FC:Functional Components )组成:
管理元素使用这些组件之间的共享知识来协同实现自适应。在接下来的章节中,我们将详细介绍MAPE - K的各个组成部分。
4.1 监视器
监测是该循环的初始阶段,有责任为后续阶段提供必要的数据。在监测阶段,定期从FDS中的传感单元收集数据。Monitor组件处理来自传感器的数据,进行均匀化和噪声去除,使其适用于分析阶段和规划阶段。然后将处理后的信息存储在共享知识中。
4.2 分析仪
更新了通过监视器与机器最新操作数据共享的知识后,分析仪利用这些数据来检测机器工况的任何变化。为了衡量机器工况的变化,我们需要引入一些指标。首先,我们定义指标WCC(WCCWork Condition Change)如下:
其中 和 分别表示当前时刻和前一个采样时刻的工作状态。 为设计参数,由系统设计者定义,是在变化非常小的情况下防止误报的阈值。换句话说, = 意味着检测到了工况的变化,因此需要进行适应性调整。
为了衡量新工况下DT的响应( )与真机的响应( )之间的差异,定义了以下指标:
其中 表示响应信号之间的计算误差, θ
4.3 规划者指标
分析器计算并存储在知识中的指标作为触发器,供规划者指导该功能组件。事实上, 的价值激活或失活了Planner。而 的价值驱动对系统变化做出适当的反应。具体来说,当检测到显著差异 (例如, 时, 表明当前DT模型已经过时,需要进行更新,因此规划者指标选择了三个适应任务,例如,更新策略、数据生成和领域泛化,分别为 , , ,更新策略详见第4.3.1节,在 中执行,而 提供来自多个域的带标签训练数据,并提供所需的数据分布,以启用后续的域泛化网络模型(见第4.3.2节)。最后,在第4.3.3节中介绍了 ,其责从多个源域中泛化已有的诊断知识。相反,在有限偏差(例如, 的情况下,即当DT不需要调整就能有效运行时,只有 和 被执行。
4.3.1 : 更新Dt模型
在所提出的自适应故障诊断系统中,DT模型的更新是一个关键的过程,该过程被视为一个优化问题。主要目标是最小化DT模型与真实机器演化条件之间的差异,确保DT与真实世界的变化保持同步。如图3所示,引入基于参数灵敏度分析的模型更新策略,使DT模型与目标真机状态对齐。该模型更新策略被定义为一个优化问题,其目标函数是最小化这些差异。
为了实现DT更新概念,选择合适的响应信号来衡量真实目标机器状态的实际行为与DT模型预测的行为之间的相似性是至关重要的。基于所选择的响应信号,所开发的更新策略的优化函数可以定义为Eq.( 3 ) 。更新策略的成功取决于选择合适的度量标准来衡量真实系统行为和DT模型预测行为之间的相似性。例如,振动数据是监测工业系统健康状态的最具信息量的信号之一。然而,直接在时域中比较振动数据可能会具有挑战性,需要一种专门的度量标准来评估从模拟和真实场景中得出的频谱之间的相似性。
根据响应信号和定义的指标计算真实响应和模拟响应之间的相似度后,选择和调整更新参数,以减少RM与其DT之间的差异。一旦误差的平方范数落在可接受的范围内,表明DT的响应与机器新的、不可见的操作条件保持一致,则认为更新策略是成功的。
4.3.2 : 提供训练数据
从具有不同数据分布的多个领域中获取大量有标签的训练数据是使DG模型能够有效泛化的必要条件。作为对这种必要性的回应, 侧重于提供来自多个源域的训练数据集。该活动是 后续阶段的基础,分为两个步骤:
-多源域的定义
的范围是定义一个来自多个源域的训练数据集。第一步,执行真实机器的DT模型,构建源域数据集。因此,DT适用于不同健康状态下的仿真,包括不同的故障尺寸。为了补充这个主要数据集,我们探索了从目标机械的先前工作操作中收集的历史数据,并将其存储在知识库中。然而,在不同工作操作下从同一测试轴承中获取训练数据集的实际挑战使得该任务在某些情况下不可行。在这种情况下,可以从其他轴承中获得另一个可靠的训练数据集,其中丰富的诊断知识可在云存储库中获得,因为存在不同工业工厂、公司和数字平台的同类机器。这允许创建一个多样化的训练数据集,它作为 中领域泛化过程的基础。
-数据增强
其目的是通过使用来自不同领域的样本来生成新的样本(域间样本),从而探索领域相关性表示。因此,该模块在增加数据多样性的同时,在一定程度上保留了领域特异性,从而增强了学习到的特征的泛化性。此外,它确保了域间数据分布的平滑,促进了域不变表示的学习。
为了实现这一目标,我们从混搭概念(参见第3.3节)中获得了灵感。然而,传统的混合技术仅限于在两个域之间生成样本,忽略了对其他域的考虑。认识到这些在多源场景下的局限性,我们引入了多域混合,如图4所示。为了有效地利用来自多个领域的信息,我们采用狄利克雷分布代替贝塔分布对混合因子进行采样。
这里, 表示从Dirichlet分布 中随机取样的混合因子的集 合,其中 是一个m元序组数组,它的所有元素的值在本文中设置为相同.此外,为了促进域不变表示和最小化域差异,生成与增强样本相对应的软域标签用于对抗训练,如下面的方程所描述:
总之,通过强调样本级别的增强和引入软领域标签进行对抗训练,我们为领域泛化网络赋权,以更有效地提取领域不变表示。
4.3.3 :领域泛化网络模型
图5 方案A2、A3的总体架构
为了保证FDS的泛化性和自适应性,我们采用了多种技术,包括对抗学习和基于领域的差异度量。DGNM由特征提取器 和分类器 组成,可以有效地处理跨域故障诊断任务。此外,基于对抗学习的判别器 有助于训练网络平等对待所有源域,从而促进跨不同运行条件的有效故障诊断所需的域不变表示的学习。此外,基于领域的差异度量 在最小化多个领域之间的分布差异方面起着至关重要的作用,从而增强了系统有效概括诊断知识的能力。最后,通过对原始数据和增广数据中的数据进行探索,对所开发的DGNM进行优化,以提取领域通用特征。
当模型训练完成后,DGNM保证了学习到的特征具有鲁棒性,从而增强了系统在目标机未见工况下的故障识别性能。
这项活动的执行分为以下基本步骤:
-特征提取器和故障分类器模块
与 更广泛的框架一致,特征提取器和故障分类器模块在DGNM中充当不可或缺的组件。利用基于CNN模型的广泛有效性,我们的方法使用 作为源标签分类器和特征提取器。这种选择是由 在处理工业机械中常见的信号,特别是振动信号的有效性所驱动的[36]。
特征提取过程涉及三个卷积层的序列,其次是平坦层和全连接层。该序列生成的高级表示记为 。我们使用LeakyReLU作为非线性激活层,并结合批量归一化来加速训练过程。这些表示作为后续故障诊断分类器模块的基础,其目的是创建依赖于域不变特征表示的判别分类器。该分类器模块以 为输入,包含两个全连接层,有效地将特征提取器的高维特征表示降为一个 维向量,表示为 。对于来自多个源域的原始样本和多域混合算法的增广数据,分类损失 可以写为:
其中 是增广样本的个数。
-域判别器模块
在所提框架的背景下,域判别器模块基于生成对抗网络的原理,由生成器和判别器组成,通常被描述为一个两人游戏[ 37 ]。为了培养网络公正对待所有数据源的能力,我们设计了一个使用对抗学习的多域判别器。这种方法有助于从多样化的源域获取领域不变的特征表示,最终加强了故障分类器在不同领域中的泛化性能。
领域判别器模块采用类似于分类器模块的结构来产生与特征表示Xg相关的概率。与领域对抗训练方案一致,我们采用交叉熵函数作为领域分类损失,定义为:
基于领域的差异度量模块
其中 表示 在不同类中的平均值。综上所述,通过整合聚类紧致性 和可分性 的概念,我们将距离度量学习的优化目标表述如下:
DGNM的优化涉及3个主要目标,重点关注特征提取器参数 、故障诊断分类器参数 、领域判别器参数 和基于领域的差异度量参数 。一个合适的优化目标有三个:最小化 和 的损失,同时最大化 的损失。
这样,综合目标函数L可以表示为:
其中超参数 和 用于对三个分量进行加权。
一旦建立整体损失函数L,对模型进行优化,使得:
Planner ( 即 )中的最后一个活动生成一个经过训练的模型,该模型存储在Knowledge中,必须由被管元素中的FDS单元执行。因此,执行器负责将开发的诊断模型加载并传递给FDS。
“ WCC ”和“ ”指标由分析器评估。
数据来源于DT,包括机械的虚拟模型及其相关的几何参数,以及故障尺寸。
活动模型( 、 、 ),计划者需要在每个场景中执行。
设计参数(即阈值T , , , )。
历史数据,包括目标机器的先前工况,以及来自不同工业工厂、公司和数字平台的同类机器的数据。