首页/文章/ 详情

ESWA论文学习 | 数字孪生增强的基于相对比电流点模式的半监督电机故障诊断框架

1天前浏览22

本期给大家推荐的文章是《数字孪生增强的基于相对比电流点模式的半监督电机故障诊断框架》。本文基于多物理场仿真建立了精确的感应电机DT模型,并提出了一种新颖的PCCDP方法,将三相电流信号转换为有序排列的灰度图像。适合于数字孪生电机故障诊断的学习者。

论文基本信息

论文题目:A digital twin-enhanced semi-supervised framework for motor fault diagnosis based on phase-contrastive current dot pattern

论文期刊:Reliability Engineering and System Safety

论文日期:2023年

作者:

Pengcheng Xia (a,b), Yixiang Huang (a,b,∗), Zhiyu Tao (a,b), Chengliang Liu (a,b), Jie Liu (c)
机构:
a: State Key Laboratory of Mechanical System and Vibration, Shanghai Jiao Tong University, Shanghai 200240, PR China;
b: MoE Key Lab of Artificial Intelligence, AI Institute, Shanghai Jiao Tong University, Shanghai 200240, PR China;
c: Department of Mechanical and Aerospace Engineering, Carleton University, Ottawa, ON K1S 5B6, Canada

第一作者:夏鹏程,上海交通大学博士后,分别于2018和2023年在上海交通大学获学士和博士学位。主要从事复杂机电系统健康评估、诊断与预测研究,以第一作者在IEEE TII、IEEE TNNLS、RESS等期刊发表多篇论文。入选国家资助博士后研究人员计划、上海市“超级博士后”激励计划,曾获SDPC2021、PHM2024等国际会议Best Paper Award。

联系方式:xpc19960921@sjtu.edu.cn

通讯作者:黄亦翔,上海交通大学副研究员,博士生导师。从事智能维护理论与应用研究,近年来,主持国家自然科学基金项目3项、国家重点研发计划课题2项等,发表SCI期刊论文42篇,EI期刊论文14篇,授权中国发明专利62项,软件著作权4项。获中国机械工业科学技术奖特等奖、江苏省科学技术奖一等奖。

联系方式:huang.yixiang@sjtu.edu.cn

目录

   摘要
1 引言
2 预备知识
2.1 数字孪生
2.2 问题公式化
2.3 域自适应
物理电机实体和数字孪生模型
3.1 物理电机实体
3.2 电机数字孪生模型
所提出的半监督电机故障诊断框架
4.1 框架概述
4.2 PCCDP
4.3 样本生成
4.4 知识迁移
      4.4.1 空间注意力
      4.4.2 残差块
      4.4.3 故障分类器
      4.4.4 域判别器
      4.4.5 分布差异
4.5 基于聚类的度量学习
半监督诊断实验及结果
5.1 实验设置
5.2 与近期提出的方法比较
5.3 消融实验
5.4 结果分析
5.5 PCCDP的有效性
6 结论

摘要

电机在多数工业设备中起着重要作用,对电机进行精确故障诊断至关重要。数据驱动方法虽取得显著进展,但在工业应用中获取足够的标记数据来训练模型既昂贵又费力,且如何有效利用三相电流信号仍是一项挑战。为解决这些问题,本文提出数字孪生增强的半监督框架,用于标签稀缺情况下的电机故障诊断。首先,基于多物理场仿真建立精确的电机数字孪生模型,并进行从虚拟空间到物理空间的知识迁移。其次,提出一种新型的相对比电流点模式(Phase-Contrastive Current Dot Pattern, PCCDP)表示方法,将三相电机定子电流转换为有序排列的灰度图像,以便在紧密区域对比三相特征实现高效处理。然后,提出空间样本生成方法用于连续特征流形学习,以解决空间差异问题。最后,引入空间内样本生成和基于聚类的度量学习,提升半监督故障诊断性能。除此之外,进行了感应电机故障实验并构建了相应的数字孪生模型。实验验证了所提框架的有效性和优越性。

关键词:数字孪生;故障诊断;电机;半监督学习;迁移学习

1 引言

作为大多数工业设备的核心部件,电机在现代工业生产中应用广泛。在这些生产场景中,维持机器部件的健康状态至关重要。然而,电机在长期运行过程中,不可避免地会受到各种外在压力的影响,从而出现意外故障。随着工业设备的复杂性不断增加,进而降低整个设备的可靠性。例如,由于包含多个耦合子系统导致电机的轻微故障,可能会对其他部件产生干扰等。尽管整机系统的可靠性主要由其可靠性设计所决定,但通过修复或更换故障部件进行有效的状态监测与维护,能够防止轻微故障给系统引入更多风险因素,使其达到固有设计可靠性。监测信号能够为设备的主动维护提供指导,通过这种方式识别电机健康状况,可以维持系统的可靠性,减少意外故障甚至严重事故的发生,从而降低巨大的经济损失,确保生产安全。

基于信号特征分析的电机故障诊断方法在学术界和工业界都有广泛应用。由于振动信号和电流信号测量的有效性和低成本,故障通常通过信号处理和分析技术来检测。然而,由于实际工作条件的多样性和故障特征信号的低信噪比,导致上述方法难以应对复杂的实际情况。近年来,数据驱动方法,尤其是基于深度学习的方法成为主流。这些方法利用深度神经网络处理原始振动或电流信号,无需先验知识即可直接给出诊断结果,提高了复杂条件下的诊断性能。例如,有研究提出了具有多尺度内核的残差卷积神经网络和全局上下文残差卷积神经网络,用于从原始电机振动信号中进行故障诊断。电流信号也被应用于基于深度学习的方法中。由于电流信号受电源频率的高度调制,故障特征可能会被噪声污染,因此在输入网络之前通常需要进行预处理。例如,有研究利用最大重叠离散小波变换对电机电流信号进行预处理,并提出了瞬时电流残差图来反映故障相关行为。

尽管基于深度学习的智能电机故障诊断方法取得了巨大成功,但在实际应用中仍存在一个主要限制。深度学习算法高度依赖大量数据来训练模型,而这一要求在工业环境中往往难以满足。当电机投入生产使用时,频繁检查其健康状况既不现实,又成本高昂且耗费人力。更重要的是,收集带有故障标签的大量样本意味着设备需要在已发生故障且已被检测到的情况下长时间持续运行,这一过程会损害整个系统的可靠性,甚至可能导致安全事故。因此,出于安全考虑,只有在设备维护阶段才能获得非常有限的有标签样本,而其他大量数据则是未标记的。这些未标记数据无法直接用于训练模型,仅利用有限的标记数据会导致模型过拟合,从而使其泛化能力较差。 

这种从部分标记数据集学习的问题可归类为半监督学习(Semi-Supervised Learning, SSL)。未标记数据可通过利用其数据结构来辅助模型构建或提高诊断准确性。已有一些研究使用自动编码器(AutoEncoder, AE)对没有标签的数据进行特征提取器预训练,如将SSl用于变速箱故障诊断;结合聚类的基于AE的诊断方法等。SSL的另一种直观方法是通过数据增强或生成方法增加现有有标签样本的数量。类似于二维图像常用的旋转、裁剪和翻转等变换,一些针对一维序列的数据增强技术,如数据反转、缩放、切片等方法也广泛用于增强信号样本。生成对抗网络(Generative Adversarial Networks, GANs)也被研究用于生成与真实标记数据相似的合成样本。与AE相关的方法充分利用了未标记数据,使学习过程更高效。数据增强和生成方法则利用生成的数据提高模型的泛化能力。然而,一个主要问题是这些方法无法增加类别信息,因此模型性能仍然受到标签数量的限制,并且过拟合的风险依然存在。

因此,解决数据稀缺问题最直接有效的方法仍然是获取更多类别信息。但从实际场景中收集更多标记数据大多不切实际或成本高昂。随着智能制造技术的快速发展,数字孪生(Digital Twin, DT)应运而生,它通过将物理实体与其虚拟模型相连接,为获取物理实体的状态提供了新途径。通过DT模型收集仿真条件数据来丰富标签稀缺的数据集,有望实现更可靠的故障诊断。已有一些初步研究,例如,Wang 等人建立了液压系统的DT模型,在实际故障数据不足时丰富故障数据集,并在故障数据积累时利用更多真实数据。尽管DT技术发展迅速,但DT仿真数据仍不可避免地与真实数据不完全一致。如何克服这种差异,并将可靠的诊断模型推广到实际实体中,是确保诊断准确性的关键问题。Xia 等人利用三缸泵DT模型的仿真数据对稀疏去噪AE进行预训练,然后在真实数据集上微调模型参数。Xu 等人提出利用车身侧生产线的DT来辅助故障诊断,并使用迁移学习,通过堆叠稀疏AE提取特征,利用最大均值差异来估计DT数据与真实数据之间的分布差异。这些研究为DT辅助故障诊断提供了初步范例。然而,据我们所知,尚未涉及对电机等主要机械部件的精确多物理场建模,且将模型推广到物理实体的方法也相对基础。

鉴于上述讨论,本文提出一种结合深度知识迁移的DT增强半监督电机故障诊断框架。首先,为填补DT辅助电机故障诊断的空白,基于多物理场仿真构建了感应电机DT模型。生成各种故障状态下的电机状态数据,用于扩充带有少量有标签样本的数据集,并通过深度域自适应(Deep Domain Adaptation, DDA)实现从虚拟空间到物理空间的知识迁移。

其次,在实际应用中,电流测量完全是非侵入性的,与振动信号相比,电流信号在复杂系统中受其他部件的影响较小。对于电机DT模型,定子电流信号的仿真也比振动信号更精确和简化。然而,由于电机电流信号在电源频率的正弦波上受到高度调制,如何对电流信号进行预处理以突出故障特征并有效融合三相信号是一项具有挑战性的任务。本文提出一种相对比电流点模式(Phase-Contrastive Current Dot Pattern, PCCDP)表示方法,将三相电流信号转换为灰度图像。将各相电流信号映射到极平面上的图形中,使各相的幅值和频率能够在特定区域内有序排列并直观对比。

此外,为进一步解决数据差异问题,我们提出设计一种空间样本生成方法,用于在特征空间中进行连续流形学习。同时,进行空间内样本生成,以增加标记的物理样本数量。最后引入基于聚类的度量学习,通过减少类内结构差异性来增强诊断能力。 

本文在一个感应电机实验数据集上对所提框架进行了验证,并建立了相应的DT模型。实验结果表明了所提方法的有效性和优越性。所提框架为工业应用中标签稀缺的电机故障诊断提供了DT辅助解决方案。该方法只需少量有标签样本,同时通过DT仿真获得大量样本,确保了生产过程中数据收集的安全性。高诊断准确率可为电机的主动维护决策提供可靠指导,有效提高工业设备的可靠性。本文的主要贡献可总结如下:

1.首次提出用于电机的DT增强故障诊断框架,以解决标签稀缺问题。基于多物理场仿真建立精确的感应电机DT模型,并通过基于DDA的从虚拟空间到物理空间的知识迁移,获得用于实际实体的可靠诊断模型。

2.提出一种新颖的PCCDP模式,用于高效的电流信号处理。将三相电流信号转换为有序排列的单幅灰度图像,在极平面的特定区域内可直观对比三相的幅值和频率,进而进行高效处理。

3.提出一种空间间样本生成方法,通过在特征空间中引导连续流形学习来解决空间间的数据差异问题。此外,引入空间内样本生成和基于聚类的度量学习,以提升半监督诊断性能。

本文的其余部分组织如下:在第 2 节中,介绍了一些理论描述,包括DT概念、问题公式化和DDL;在第 3 节中,给出了物理感应电机实体的DT模型;第 4 节详细描述了所提出的半监督电机故障诊断框架;第 5 节展示了半监督故障诊断实验及结果;第 6 节对本文进行总结。

2 预备知识

2.1 数字孪生

图1 所提出的方法中数字孪生的说明

DT是智能制造领域的一项新兴技术,可以理解为一个多物理、多尺度和概率性的集成仿真过程。DT通过各种数字技术在物理空间中建立真实实体的仿真模型,实现虚拟空间和物理空间的连接与相互通信。如今,DT的五维模型已被广泛接受,该模型将DT定义为五个部分的集成:物理空间、虚拟空间、DT数据、服务以及它们之间的连接。DT数据存储来自其他部分的所有数据,并进行数据处理和融合。服务模型包含利用这些数据和知识提供诸如监测状态、预测和诊断结果等信息的服务。

在本文中,DT用于辅助物理电机实体的故障诊断过程。图 1 展示了本文DT方案的示意图。首先,根据物理空间中真实电机的详细结构和参数,在虚拟空间中使用多物理场仿真建立DT模型。然后,DT模型根据来自物理空间的信息,包括真实电机的工作条件,模拟所关注的工作状态,并生成仿真监测数据。接着,将来自两个空间的仿真数据和物理测量数据传输到DT数据部分,进行数据融合和处理。在服务部分建立诊断模型,利用这些数据为物理电机实体做出故障诊断决策,以便及时进行维护。

2.2 域自适应

域自适应是最流行的迁移学习方法之一,已被用于智能故障诊断。在实际场景中,源域中的数据通常与目标域中的数据具有不同的概率分布,即  ,这被称为域迁移问题。域自适应旨在学习域不变特征,使基于源数据集建立的模型仍能准确诊断目标数据集中的故障。通过减少特征空间中的域差异,学习一个具有映射函数  的共享特征提取器,使得  。一种常用的域自适应方法是使用差异度量,包括相关对齐(CORrelation ALignment, CORAL)损失和最大均值差异(Maximum Mean Discrepancy, MMD)来最小化分布差异。域对抗是另一种域自适应方法,通过对抗训练特征提取器和域判别器来识别域标签。在本文中,为电机故障诊断任务设计了一个具有空间注意力和熵正则化的深度残差网络,并采用一种结合差异最小化和对抗训练的DDA方法进行知识迁移。

3 物理电机实体和数字孪生模型

在本研究中,我们使用一个真实的电机实体进行研究,并基于多物理场仿真构建其DT模型。在本节中,将描述物理电机实体和DT模型,并展示在物理空间和虚拟空间中进行的实验。

3.1 物理电机实体

图2 在物理和虚拟空间中进行电机实验。

(a)感应电机实验平台。

(b)感应电动机的数字孪生模型。

表1 试验电机参数

用于实验的真实电机安装在 SpectraQuest 公司的传动系统动力学模拟器(Drivetrain Dynamics Simulator, DDS)平台上,如图2(a)所示。该平台主要由一台测试电机、电机控制器、电流传感器、变速箱以及电磁制动器/负载组成。测试电机是一台三相鼠笼式感应电机,额定转速为 3450RPM。电机的一些主要参数列于表1中。

在实验中,信号是在转速为 2700RPM(45Hz)的稳定条件下采集的,并通过电磁制动器施加 6.1N·M 的恒定负载。以 5120Hz 的采样率采集三相电流信号。分别更换一台正常电机(N)和三台有不同故障的电机,以获取不同健康状态下的电流信号。这三种故障类型分别是:断条故障(Broken Rotor Bar Fault , BRB),即三根转子导条断裂;定子绕组故障(Stator Winding Fault, SWF),由匝间短路引起;转子不对中故障(Misaligned Rotor Fault, MR),由转子平行不对中导致。

3.2 电机数字孪生模型

使用 COMSOL Multiphysics 软件建立并仿真真实电机的DT模型。建模和仿真过程主要包括五个步骤:首先,参考实验中使用的真实电机的详细结构和几何参数构建电机的几何模型。将气隙内部和转子设置为转子域,气隙外部和定子设置为定子域,并配置两个域之间的身份对。几何模型如图 2(b)所示。需要注意的是,一些外部部件,如冷却风扇及其外壳,并未完全精确构建,因为它们对电磁场的影响较小,而复杂的结构会带来大量计算量。

其次,为各部件设置材料参数,定义并加载工作条件变量。实时采集物理电机的工作条件并传输到虚拟空间,然后通过加载条件参数对DT模型进行多物理场仿真。工作条件包括电机转速和负载。在仿真中,电机转速由电源电压频率控制,负载通过施加在电机轴上与旋转方向相反的扭矩来模拟。第三步,使用旋转机械磁接口定义电磁场,定义边界条件和约束,并构建电路模型。然后通过将电路部分与定子绕组连接,将电路与电磁场耦合。第四步,使用三角形网格对定子、转子域和气隙进行网格划分,气隙和转子导条的最大单元尺寸分别为 0.25mm 和 0.5mm,其余部分为 3mm。最后,配置瞬态求解器并使用 MUMPS 求解器进行仿真,初始时间步长为10-6秒,最大时间步长为 1/5120 秒,输出步长为 1/10240 秒,即电流信号的输出频率为 10240Hz。

图3 多物理场仿真模型

(a)电机四分之一部分的二维网格模型 

(b)正常电机运行时的磁势分布截图

由于电机内部轴向电磁场的变化较小,而三维仿真计算量远高于二维仿真,根据学术界的常见做法,我们使用二维电磁模型进行仿真,以在精度和计算量之间取得平衡。然而,这样无法对轴端的电磁场进行建模,会给仿真结果带来一些误差。此外,仿真中使用标准正弦电源电压,而实际电压由近似正弦波的变频驱动器产生,且未对电源不稳定和其他部件干扰引起的电压变化进行建模。这些因素会使仿真电流信号过于理想,与物理信号存在差异。由于电机具有对称几何结构,为更清晰地展示,图 3(a)给出了电机四分之一部分的二维网格模型,图 3(b)展示了正常电机运行时的磁势分布截图。

图4 (a)BRB故障电机电流密度;

(b)MR故障电机的最窄(顶部)和最宽(底部)气隙区域

对处于正常状态和所有潜在故障状态的电机DT模型进行仿真,以辅助物理电机的故障诊断。在完成正常状态的仿真后,通过修改正常状态下DT模型的特定结构或参数,对电机DT模型的三种故障状态进行仿真。

1.断条故障:转子导条的断裂相当于相应导条电导率的降低。在DT模型中,将三根转子导条的电导率设置为 1s/m,以模拟断条故障状态。图4(a)展示了运行时带有断条故障的电机的电流密度。可以看到,三根断条中没有电流通过,周围的转子导条承受较高的电流密度。

2.定子绕组故障:定子绕组的匝间短路相当于匝数的减少。将 A 相一个定子绕组的匝数减少 5%,以模拟定子绕组故障状态。

3.转子不对中故障:平行不对中意味着定子和转子的中心线不重合。因此,将转子从定子中心线偏移 0.01 英寸,以模拟转子不对中状态。从图 4(b)中转子不对中故障模型中最窄和最宽气隙的几何示意图可以看出,气隙宽度分布不均匀。

综上所述,转子不对中故障状态通过调整几何结构来模拟,而断条故障和定子绕组故障则分别通过改变转子导条电导率和定子绕组匝数来模拟。其余结构和参数与正常状态下的DT模型保持一致。换言之,只有针对特定故障修改的结构或参数的变化引起电机健康状态的变化。

图5 各种健康状态下的三相定子电流仿真信号

针对每种健康状态,模拟电机启动和稳定运行的过程,并在稳定运行状态下使用三相定子电流模拟信号进行后续处理。图5为各健康状态下的信号片段。可以看出,正常状态下的电流信号具有三相平衡的正常和稳定正弦波形。此外,断条故障故障信号的波形和幅值随时间变化,定子绕组故障信号三相明显不平衡。此外,转子不对中故障故障信号与正常状态下的信号肉眼观察差异不大。

4 所提出的半监督电机故障诊断框架

本节将首先给出所提出的DT增强型半监督电机故障诊断框架的总体概述,然后将详细介绍框架中的各个方法细节。

4.1 框架概述

图6 DT增强的半监督电机故障诊断框架概述

图6展示了所提出框架的概览示意。整个框架主要包括以下五个阶段:

1)数据采集:从物理空间中的真实电机采集标签稀缺的三相定子电流信号。同时,在多物理场仿真环境中建立该电机的DT模型,将真实电机的工作条件参数捕获并传递到DT模型中进行相同工况下的仿真,进而在虚拟空间中获得三相定子电流仿真信号。需要注意的是,高保真仿真通常需要一定的计算时间,无法实时完成。如果希望在实际应用中尽可能实现准实时的DT仿真,可以将典型的工作条件参数离散化为多级(如高速/中速/低速或按需负载等级),并提前在这些工况下完成仿真,将仿真数据存储后按实时工况加载。虽然这样会降低仿真精度,但能够实现准实时的DT仿真。

2)PCCDP图像生成:首先,将物理空间和虚拟空间中的三相信号划分成固定长度的一系列样本。由于仿真环境理想化,在虚拟空间样本中注入高斯白噪声以模拟实际应用中的背景噪声。然后,将两个空间的所有样本统一转换为固定尺寸的灰度PCCDP图像,供后续处理。

3)样本生成:为了进一步应对数据分布差异问题,首先在特征空间中进行跨空间样本生成,以实现连续流形学习。同时,还在物理空间内部进行样本生成,以增加带标签的物理样本数量。这些合成样本与原始样本一起输入到后续的知识迁移阶段。

4)跨空间知识迁移:通过DDA网络,将诊断知识从虚拟空间数据集迁移到物理空间数据集。源域由虚拟空间的带标签样本组成,目标域由物理空间的带标签和未标注样本,以及前一阶段生成的样本组成。为了学习领域不变的特征,设计了一个包含空间注意力机制的共享深度残差网络。

5)基于聚类的度量学习:首先,提取物理空间中带标签和未标注样本的深层特征。然后,使用K-means方法对降维后的特征进行聚类。接着,引入度量学习,减少结构性类别内变异,即使同类样本在特征空间中更加接近。最终,通过深度网络给出故障诊断结果。

4.2 所提出的半监督电机故障诊断框架

定子电流是电机故障诊断中一种关键的信号类型,具有非侵入性和干扰较小的优点。然而,电流信号在供电频率的正弦波上高度调制,因此使用某些预处理技术以突出故障成分至关重要。本文提出了一种PCCDP表示方法,用于实现电机电流信号到图像的转换,灵感主要来源于以下两个方面:

1)电流信号具有很强的周期性,这意味着电流信号样本中包含大量重复的冗余信息。理想的预处理方法应减少冗余,同时保留重要的幅值和频率信息。对称点模式(Symmetrical Dot Pattern, SDP)是一种将一维序列转换为图形的时间序列变换算法,已在一些故障诊断任务中用于振动信号到图像的转换。在SDP中,序列中的数据根据其幅值及其相邻数据被映射到归一化的极坐标平面上的点。因此,本文基于SDP原理开发了电流信号到图像的方法。

2)感应电机的定子电流信号具有三相。当电机处于正常工作状态且电源平衡时,三相电流应具有相同的幅值和模式,唯一的区别是相位偏移。然而,某些类型的故障会导致各相之间的幅值和形状出现差异。因此,理想的预处理方法需要突出这些差异。为此,本文提出将三相电流信号按顺序映射到极坐标平面的特定区域上,在同一张图中直观地对比多个相位的幅值和频率。

图7 (a)PCCDP原理图;
(b)-(e)健康状态和三种故障类型的示例PCCDP

图7(a)展示了所提出PCCDP的示意图。整个单位极坐标平面被划分为六个60°的扇区,每个扇区映射两相电流信号。在这些紧密的扇区区域内,对相同或不同相位的信号特征进行对比。每一相的信号序列分别映射为两个凸起的瓣片和两个凹陷的瓣片。对于序列中时间点  的数据  ,其在PCCDP中的半径被定义为:

 

其中,  和  分别表示当前信号的最小值和最大值。需要注意的是  和  是在三相信号中共同计算得出的,以便反映各相之间的幅值差异。在凸瓣(convex flap)内的偏转角  计算公式为:

 
 

其中,  表示在时间点  处的幅值,  是预定义的时间间隔因子,  表示角度放大因子。在凹瓣(concave flap)内的偏转角  计算公式为:

 
 

在六个扇区中绘制的图形形成了一个不对称的雪花形状图像。上半部分平面包含同一相的图形,每个扇区的两个瓣片由单一相电流绘制,分别对应三相。下半部分平面包含不同相的瓣片,每个花瓣由两个不同相的电流绘制。 为了实现相同或不同相位之间的有效对比,  和  被设置为25°和2,以使得同一扇区内的两个瓣片绘制得接近但不重叠。随后,PCCDP图像被转换为灰度图并调整为128*128的尺寸。图7(b)–(e)展示了四种不同健康状态下物理电机的灰度PCCDP图像示例。 可以看到,SWF样本在不同相的瓣片形状和长度上存在明显差异,而MR样本则与正常样本相比在瓣片的曲率上有细微差异。这些差异将被深度网络捕捉并用于有效的故障识别。

4.3 样本生成

虽然采用了DDA来减少虚拟空间与物理空间之间的分布差异,但在特征空间中样本无法完全对齐仍然是不可避免的。这意味着来自不同空间但属于同一类别的映射特征可能彼此独立聚集。根据SSL中的常见假设,决策边界应穿过边缘数据分布的低密度区域,决策边界可能会穿过两个空间聚类之间的低密度区域,从而导致部分样本被误分类。

本文提出通过生成合成样本的方法来应对这一问题,引导模型在特征空间中学习连续的流形。我们提出了一种跨空间样本生成方法,用于在两个空间的聚类之间的低密度区域生成新的特征。通过这种方式,可以增加这些聚类之间区域的密度,并使同一类别的特征流形变得更加连续。因此,分类器的决策边界更有可能远离这些区域,并穿越其他密度更低的区域,从而减少误分类并提高模型的准确率。

在跨空间样本生成中,我们提出对来自两个空间、属于相同类别的PCCDP样本进行线性插值。插值系数采用Mixup中使用的Beta分布生成,但需要注意的是,物理空间样本的系数  要大于虚拟空间样本的系数,以便更多地利用稀缺的真实标签信息,指导分类器更好地识别目标样本。对于来自物理空间的一个有标签样本  我们随机选择一个来自虚拟空间、类别相同的样本  ,即  ,然后,生成样本的公式如下:

 

其中,  ,  ,  是Beta分布的参数。生成样本  的标签与两个输入样本相同,即  。由于PCCDP图像具有特定的雪花形状和固定的花瓣角度,所提出的生成方法具有保留PCCDP固有模式的优势。因此,合成样本可以成为网络理解中自信且逼真的PCCDP图像。

为了增加物理空间中有标签样本的数量,将跨空间生成方法扩展为空间内样本生成。对于每一个物理空间中的有标签样本,随机选取另一个同类别的有标签样本,并按照上述第一式进行线性插值,在此过程中不再采用上述第二式中的系数约束。然后,将跨空间生成的样本与空间内生成的样本结合,用于后续的模型训练。

4.4 知识迁移

图8 知识迁移网络的结构

设计了一种深度残差网络,用于将诊断知识从虚拟空间迁移到物理空间。该网络结构如图 8 所示,基于残差学习并结合了域自适应技术。网络输入为来自虚拟空间和物理空间的尺寸为 128×128×1 的灰度 PCCDP 图像。骨干网络由预处理层、一个空间注意力块以及一系列堆叠的残差块组成。在故障分类器中输出电机故障标签,其中结合了熵正则化损失和交叉熵损失。采用域判别器和分布差异模块进行域自适应。

4.4.1 空间注意力

输入的 PCCDP 图像  ,经过一系列预处理层以获得浅层特征。首先,使用一个具有 16 个 7×7 内核的卷积层,接着是一个带有校正线性单元(Rectified Linear Unit, ReLU)激活函数的批量归一化层(Batch Normalization, BN)。然后,将这些特征输入到一个最大池化层,以获得下采样特征  

空间注意力块以预处理后的特征为输入,学习聚焦于提取的 PCCDP 特征图  的重要区域。首先通过跨通道的最大池化操作和平均池化操作生成两个特征图,然后将这两个特征图连接起来,并通过7×7 内核的卷积层进行处理,得到注意力图,其表达式如下:

 

其中,  表示Sigmoid函数,  和  是该卷积层的可训练参数。最后,通过注意力图与输入特征图的逐元素相乘得到输出,即细化后的特征图:  

4.4.2 残差块

采用四个堆叠的残差块(Residual Blocks, RBs),其结构与 ResNet34 类似,用于处理由空间注意力块细化后的特征图。每  个残差网络中使用两个内核大小为 3×3 的卷积层。第个残差网络的输出可以计算如下:

 
 

其中,  表示 ReLU 函数,  和  分别是两个卷积层的函数。  和  分别表示第  个和第  个残差网络的输出。之后,将最后一个 RB 的输出展平为一维向量,作为高级特征表示。

4.4.3 故障分类器

故障分类器  使用一个全连接层(Fully Connected, FC))来获得预测的故障状态。采用交叉熵损失来计算来自虚拟空间的样本、来自物理空间的有标签样本以及生成样本的分类损失,公式如下:

 

其中, 示生成样本的数量。

为了使虚拟空间样本的特征紧密聚集在真实类别的中心,在分类损失中添加了熵正则化损失。通过最小化这个损失,模型可以为虚拟空间样本给出更可靠的预测结果。熵正则化项的表达式如下:

 

4.4.4 域判别器

域判别器模块用于使特征提取器学习无法被识别属于哪个域的域不变特征,通过域对抗学习实现。它由三个全连接层组成,输出是一个一维标量,表示输入样本  来自虚拟空间的预测概率。域对抗损失通过二元交叉熵损失函数来衡量,如下所示:

 

其中,如果  则  ,如果  ,则  ,  是域判别器模块的映射函数。为了进行对抗学习,在第一个全连接层之前添加了一个梯度反转层 。在反向传播优化骨干特征提取器网络时,梯度的符号将被反转。

4.4.5 分布差异

为训练使两个域之间的特征分布差异最小化,引入多核 MMD 来衡量由堆叠残差块提取的特征表示的分布差异。这个损失项的表达式为:

 

其中,  和  分别是一批虚拟空间样本和物理空间样本,  表示骨干特征提取器的映射函数,  表示多核 MMD 函数。

知识迁移网络的总损失变为:

 

其中,  、  和  都是权衡参数。通过梯度下降算法最小化这个损失来训练网络,网络参数更新如下:

 

4.5 基于聚类的度量学习

在知识迁移网络训练完成后,在后续阶段进行基于聚类的度量学习,以减少结构类内方差。通过聚类算法,物理空间的未有标签样本可以根据其空间结构分布被聚类成几个组。这个阶段的度量学习旨在使它们紧密聚集到组质心,以便不同类别的特征可以更清晰地映射,减少误分类。 首先,通过 PCA 算法对物理空间中所有样本的特征表示进行降维。通过计算第k类所有特征表示的平均向量,得到第  类的质心  总共得到  个质心,这些质心可以很好地代表每个类别的位置。然而,在本文中,旨在处理有标签样本极少的半监督学习问题。因此,当有标签样本非常稀缺时,由于高随机性和低代表性,它们的平均向量可能无法很好地代表每个类。在这种情况下,从虚拟空间数据集中随机选取几个样本,使其数量达到预定义的数量(本文中为 10 个),并将这些样本组合起来计算类质心。然后,将这些K个质心作为 K-means 聚类算法的初始质心,如文献所述。对物理空间中未有标签样本的所有特征进行 K-means 聚类,每个样本  被分组到一个类  ,结构类内变异通过每个未有标签样本与其相应类质心之间的平均 L1 范数距离来衡量,定义为:

 

其中,  是第  类的初始质心。在基于聚类的度量学习阶段,通过最小化总损失  来训练网络,其中  是度量学习损失的权衡参数。

5 半监督诊断实验及结果

5.1 实验设置

使用来自实际电机实验和DT模型仿真的数据集对方法进行验证。将收集到的实际电机信号分割成长度为 1024(即 0.2 秒)的片段,形成一个包含 2000 个样本的数据集,每个健康状态有 500 个样本。只有一小部分样本(不超过 10%)被分配标签,其余样本未标记。我们的目标是预测它们的故障类别。在实验中,测试了 7 个具有不同有标签样本数量的半监督学习任务,每个类别的有标签样本数量分别为 1、5、10、15、20、30 和 50。

DT仿真信号用于知识迁移。对每个健康状态进行 9 秒的仿真,并丢弃电机启动过程的前 0.5 秒信号。由于输出频率为 10240Hz,是实际电机实验频率的两倍,因此对仿真信号进行下采样,得到两个长度相同的 5120Hz 信号。这些信号也被分割成长度为 1024 点的片段,相邻样本之间有 50% 的重叠以增加样本数量。然后每个健康状态下获得 168 个样本。向每个样本添加标准差为 0.1 的高斯白噪声,以模拟实际工作场景中的背景噪声。
表2 本文中的训练参数

将物理空间和虚拟空间数据集中的所有样本转换为 PCCDP 图像。由于虚拟空间数据集中的样本比物理空间中的少得多,在生成小批量样本时,将虚拟空间中的每个样本复 制 5 次并打乱。每个小批量包含来自物理空间数据集的 64 个样本和来自虚拟空间数据集的 64 个样本。使用 Adam 优化器训练网络,一些主要的训练参数列于表2中。此外,在知识迁移阶段,根据文献建议,域对抗损失  和  分布差异损失的权衡参数随着训练过程逐渐增加,

其中,  在知识迁移阶段的训练过程中从 0 线性增加到 1,在度量学习阶段  ,所有实验重复 5 次以减少随机性。

5.2 与近期提出的方法比较

为了验证所提出的DT增强半监督学习框架的优越性,实现了三种近期提出的半监督学习方法进行性能比较。其中两种是在半监督图像识别任务中取得巨大成功的前沿半监督学习方法。第一种是无监督数据增强(Unsupervised Data Augmentation, UDA),它通过为多次增强引入无监督一致性损失来处理未有标签样本。另一种是MixMatch,它是一种整体的半监督学习方法,通过猜测未有标签样本的低熵标签,并使用Mixup对标记和未有标签样本进行混合增强。需要注意的是,MixMatch中采用了知识迁移,因为它在每个小批量中使用相同数量的标记和未有标签样本,在标签稀缺的任务中训练样本太少,无法训练模型。UDA 在每个小批量中使用 256 个未有标签样本,且不进行知识迁移。这两种方法的网络结构与我们提出的方法中的骨干网络相同。此外,还引入了一种基于混合分类自动编码器(Hybrid Classification Autoencoder, HCAE)的用于机械故障诊断的新型半监督学习方法。通过添加一个softmax分类器并修改自动编码器的损失函数,同时使用标记和未标记数据训练模型。自动编码器采用文献中设计的堆叠卷积自动编码器结构。所有这些方法都使用 PCCDP 图像作为输入,并且在将PCCDP图像输入到HCAE方法之前,将其归一化到0到1的范围。由于传统的图像变换方法不适合PCCDP图像,会破坏其固有特征,因此在 UDA 和 MixMatch 中使用随机 60° 倍数的旋转来增强数据,以保持PCCDP的雪花形状和花瓣角度。

图9 所提出的方法和对比方法的诊断精度

图 9 展示了这三种对比方法和我们提出的方法在不同半监督学习任务中的诊断准确率。可以看出,我们提出的方法在所有七个任务中都取得了最佳性能。两种基于数据增强的方法在有标签样本极其稀缺时表现不佳。在这种情况下,增强信息可能无法帮助模型学习通用知识,反而可能引入较大干扰,导致模型性能下降。当有标签样本相对充足时,这两种方法取得了有竞争力的性能,尽管UDA的结果在不同任务中的稳定性不是很好。HCAE 的准确率随着有标签样本的增加而提高,并且与我们提出的方法接近,但由于缺乏DT模型的辅助,仍然较差。比较结果验证了所提方法的优越性。

5.3 消融研究

为了验证所提方法中每个部分的有效性,设计了一系列基线方法进行比较。这些方法的描述如下:

1.基础方法(Basic):DT增强半监督学习的基本方法。仅进行知识迁移,不进行样本生成和基于聚类的度量学习。

2.无空间内生成(NoIntraGen):不进行空间内样本生成。

3.无空间间生成(NoInterGen):不进行空间间样本生成。

4.无样本生成(NoGen):既不进行空间内也不进行空间间样本生成。

5.无基于聚类的度量学习(NoCML):不进行基于聚类的度量学习(Clustering-based metric learning, CML)。在进行空间内和空间间样本生成的同时进行知识迁移,并去除度量学习阶段。

表3 不同标记样本数的SSL任务中消融研究的测试准确率(%)

这些方法的其他设置和网络结构与所提方法完全相同。所有这些方法都以灰度 PCCDP 图像为输入。7个半监督学习任务的实验结果如表3所示。可以看出,几乎所有方法的诊断准确率都随着有标签样本数量的增加而提高。所提方法在大多数半监督学习任务中优于其他对比方法,并在七个任务中取得了最高的平均准确率。这些实验结果表明了所提方法的有效性。

5.4 结果分析

从表 4 中可以注意到,在每个类只有1个有标签样本的标签极其稀缺的情况下,其他方法的结果不稳定,标准差相对较大。这是合理的,因为仅从一个有标签样本中学习物理数据集的类别信息存在很大的不确定性。而且,如果分类准确率不够高,许多不同类别的未有标签样本就无法很好地分离,因此聚类可能无法为度量学习提供太多结构类别信息。因此,三种基于聚类的度量学习的基线方法仍然具有不理想的结果和较大的方差。在这种情况下,通过基础方法和无基于聚类的度量学习方法的结果比较,样本生成方法显著提高了诊断准确率和稳定性。这表明在标签信息极其稀缺时,合成样本生成可以带来显著的改善。此外,去除空间间样本生成导致平均准确率下降最大,这表明通过空间间样本生成提出的连续特征流形学习起着重要作用。

图10 不同任务中的混淆矩阵(a)-(d)基本方法;(e)-(h)所提出方法

为了进一步检查不同任务中的诊断结果,我们计算了所提方法和基础方法在不同任务中的混淆矩阵。每个类有1、10、20 和50个有标签样本的任务中第一次试验的混淆矩阵如图10所示。可以观察到,无论有标签样本是稀缺还是相对充足,所提方法和基础方法都能很好地识别定子绕组故障和转子不对中故障。这是可以解释的,因为如图 7 所示,定子绕组故障和转子不对中故障的 PCCDP 图像与正常状态有明显差异。定子绕组故障样本几乎能被准确识别,并且所提方法对转子不对中故障的识别准确率更高。然而,当有标签样本量非常小时,两种模型都无法令人满意地区分断条故障和正常状态。

图11 基于聚类的度量学习前后通过t-SNE实现的特征表示可视化

(a)-(b)在每个类具有10个标记样本的任务中;

(c)-(d)在每个类有20个标记样本的任务中

为了探究特征学习的结果,并直观展示基于聚类的度量学习的有效性,我们通过t分布随机邻域嵌入技术对学习到的特征表示进行可视化。我们对每个类别有10个和20个有标签样本的两个任务,在基于聚类的度量学习前后对特征图进行可视化,结果如图11所示。可以看出,源数据集不同类别的样本被很好地分离,并且大多数目标数据集样本被分配到源数据集相同标签的簇中,尤其是对于定子绕组故障和转子不对中故障状态。至于正常状态(N)和断条故障状态,目标数据集样本存在一些重叠。值得注意的是,在基于聚类的度量学习阶段之后,这两种状态的重叠减少了。并且属于同一类别的样本变得更加集中,不同类别的簇之间的距离也更远。这些结果验证了基于聚类的度量学习的有效性,即减少了类内变异,使不同类别在映射时更加分离,从而实现更好的分类。

5.5 PCCDP的有效性

图12 PCCDP转换方法之间的消融实验。
(a)在任务中的虚拟空间数据集上训练精度曲线,每个类有20个标记样本;
(b)测试不同任务的准确性(误差条表示95%置信区间)
图13 不同任务下不使用PCCDP方法的混淆矩阵

图14 使用Grad-CAM实现不同健康状态下

PCCDP图像的重要性可视化图  

为了验证所提PCCDP在电机故障诊断任务中的有效性,我们设计了一种不使用PCCDP的方法,该方法以原始三相电流信号为输入进行比较。与许多端到端故障诊断方法一样,三通道顺序电流信号由一维卷积网络进行处理。我们将所提知识迁移网络中的所有二维卷积和池化操作修改为一维操作,空间注意力变为一维时间注意力,旨在聚焦重要的序列片段。由于最后一个残差块的输出形状为32×128,展平后的向量维度过高,因此添加一个全连接层将其维度降至256维。其他参数与所提方法保持相同。由于本文提出的样本生成方法是为二维图像设计的,为了进行公平比较,我们采用不进行样本生成和基于聚类的度量学习的基础方法,为了直观理解,将其记为使用PCCDP的方法。 图12(a)展示了两种方法在虚拟空间数据集上训练过程中的训练准确率曲线。可以注意到,以PCCDP图像为输入的方法收敛更快,振荡更少,而未进行PCCDP转换的方法在训练后期无法保持完全稳定的训练结果。这表明PCCDP能够更有效、更高效地辅助模型捕捉故障特征。图12(b)中不同任务的诊断准确率也显示,所提PCCDP在电机故障诊断任务中具有显著的提升和更高的结果稳定性。图13给出了未进行PCCDP转换的方法的混淆矩阵。当有标签样本非常有限时,所有故障状态都无法被很好地识别,即使是使用PCCDP方法仅用一个有标签样本就能几乎准确区分的定子绕组故障样本。随着使用的有标签样本增多,正常状态和定子绕组故障的诊断准确率有所提高,但其他状态的性能仍然不理想,尤其是断条故障。因此,所提的PCCDP表示法能够有效地辅助模型区分那些从原始三相电流信号中难以识别的故障。

我们试图研究深度模型如何从PCCDP图像中捕捉判别部分并识别不同的故障状态。这里,引入了一种先进的可视化方法Grad-CAM,它通过网络梯度计算不同空间区域的重要性,用于分析不同故障条件下PCCDP图像的空间重要性。图14展示了使用Grad-CAM对每个健康状态的示例进行重要性可视化的结果。可以清楚地看到,不同健康状态下的图像具有非常不同的重要性分布。对于正常状态的图像,高重要性集中在上部瓣的外端和左下部瓣,而网络关注断条故障图像中下部和右下部瓣的内部部分。这表明网络捕捉到了这些区域的一些差异,如尖端的形状和瓣内部的宽度,以区分这两种状态。对于定子绕组故障状态,高重要性分布在从中心到外端的下半平面,这与我们在4.2节中观察到的瓣长度差异相符。对于转子不对中故障状态,模型更关注多个瓣的内部部分,这也与观察到的瓣曲率差异和一些从中心开始的瓣长度差异相符。可视化结果验证了网络能够捕捉到明显的判别特征以及其他用肉眼难以观察到的特征,从而完成故障状态识别。

电机的故障诊断结果可以为主动维护决策提供指导,以确保系统可靠性。首先,准确且早期的诊断结果可以帮助维护人员有效且及时地发现和定位故障部件。因此,在有标签样本仍然有限的情况下给出尽可能准确的诊断结果对于维护决策至关重要。从图9中可以明显看出,使用所提框架,每个类别仅用1个有标签样本就能实现超过76%的准确率,而UDA和MixMatch方法的结果甚至低于50%。这意味着在仅收集1个有标签样本时,借助所提框架可以做出准确率高得多的决策。其次,结果的稳定性对于方法的可靠性至关重要。如图12(b)所示,与未进行PCCDP转换的方法相比,所提方法的准确率方差较低,结果稳定性明显更高。这意味着所提方法单次试验的诊断结果在决策中更可靠、更值得信赖。此外,所提的PCCDP图像可以帮助决策者从图像的几何形状判断诊断结果的可靠性。这些直观的图像和模型的智能诊断结果相结合,有助于做出更可靠、更有效的维护决策,以确保系统的可靠性。

6 结论

本文提出了一种DT增强的半监督框架,用于有标签样本较少情况下的电机故障诊断。首先,基于多物理场仿真建立了精确的感应电机DT模型。通过基于DDA的知识迁移,利用DT模型的电机状态数据扩充了来自物理实体的标签稀缺数据集。其次,为了更有效地处理电机电流信号,提出了一种新颖的PCCDP方法,将三相电流信号转换为有序排列的灰度图像,以便在紧密区域对比三相特征。此外,提出了空间间样本生成方法来引导连续特征流形学习,并引入了空间内样本生成和基于聚类的度量学习,以提高诊断性能。

本文开展了感应电机故障实验,并构建了相应的DT模型进行实验验证。结果表明,所提方法能够在有标签样本不超过10%的标签稀缺情况下有效识别电机的健康状况。对比研究表明,所提方法在不同任务中优于一些近期提出的半监督学习方法,验证了所提DT增强方法的优越性。消融研究验证了所提样本生成和基于聚类的度量学习的有效性,特别是在标签极度稀缺的条件下,并且PCCDP转换能够使电机故障诊断更加有效和高效。在未来的工作中,可以对更多电机故障模式进行实验和DT仿真,以进一步验证所提框架,并缩小与实际应用之间的差距。


编辑:曹希铭

校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、Tina、陈宇航、海洋、陈莹洁、王金、赵诚、肖鑫鑫

该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除



来源:故障诊断与python学习
MechanicalSystemComsol振动断裂旋转机械电源电路通用UG通信海洋UM理论电机材料传动数字孪生
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-05-31
最近编辑:1天前
故障诊断与python学习
硕士 签名征集中
获赞 79粉丝 111文章 200课程 0
点赞
收藏
作者推荐

综述 | 基于物理信息的机器学习:在异常检测和状态监测中的应用综述(下)

接综述 | 基于物理信息的机器学习:在异常检测和状态监测中的应用综述(上),本期给大家推荐Gadsden教授的基于物理信息的机器学习:在异常检测和状态监测中的应用综述(下)。状态监测对保障工程系统可靠性至关重要,但传统方法在处理复杂系统以及面对精确物理模型可用性有限的情况时,往往面临挑战。物理信息机器学习(PIML)通过物理约束与数据驱动的融合,成为解决该问题的有效途径。本文系统梳理PIML在状态监测中的技术路径:归纳物理知识嵌入机器学习模型的方法及适用场景,对比分析计算效率、可解释性等性能差异;结合典型应用案例验证PIML在故障检测精度与跨系统泛化能力的优势;论证其在维护策略优化中的潜力。研究表明,PIML通过物理机理与数据特征的协同建模,为复杂系统状态监测提供了创新解决方案。论文链接:通过点击本文左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目:Physics-informed machine learning: A comprehensive review on applications in anomaly detection and condition monitoring论文期刊:Expert Systems With Applications论文日期:2024年论文链接:https://doi.org/10.1016/j.eswa.2024.124678作者:Yuandi Wu, Brett Sicard, Stephen Andrew Gadsden*机构:McMaster University, 1280 Main Street West, Hamilton, ON L8S 4L8, Canada通讯作者邮箱: gadsden@mcmaster.ca作者简介:Stephen Andrew Gadsden(Senior Member, IEEE),加拿大安大略省汉密尔顿市麦克马斯特大学机械工程系的副教授、智能和认知工程实验室主任。在加拿大汉密尔顿的麦克马斯特大学获得机械工程和管理(商业)学士学位和机械工程博士学位。曾在加拿大安大略省汉密尔顿市的机电一体化和混合技术中心做了近三年的博士后研究工作。研究方向包括控制和估计理论、人工智能和机器学习以及认知系统。他与NASA、美国陆军研究实验室、美国农业部和美国国家标准与技术研究所的多位学者保持着合作关系。Gadsden博士是ASME的Fellow、安大略省的专业工程师、经过认证的项目管理专家,担任多个ASME和IEEE期刊和国际会议的审稿人。目录1 摘要2 引言3 文献综述方法4 基于物理信息的机器学习4.1 物理嵌入特征空间4.2 数据增强的物理模型优化4.3 物理信息正则化4.4 物理引导的架构设计 4.4.1 前馈神经网络 4.4.2 卷积神经网络 4.4.3 循环神经网络 4.4.4 图神经网络 4.4.5 生成式深度学习神经网络5 讨论5.1 阐释与展望5.2 本综述的局限6 结束语(以上标记章节为本文内容)1 摘要状态监测在确保各种工程系统的可靠性和最佳性能方面起着至关重要的作用。传统的状态监测方法依赖于基于物理的模型和统计分析技术。然而,这些方法在处理复杂系统以及面对精确物理模型可用性有限的情况时,往往面临挑战。近年来,基于物理信息的机器学习(PIML)作为一种有前景的状态监测方法应运而生,它结合了基于物理的建模和数据驱动的机器学习的优势。本研究全面概述了PIML技术在状态监测中的应用。推动PIML发展的核心概念是将已知的物理定律和约束条件融入机器学习算法中,使算法能够在从现有数据中学习的同时,保持与物理原理的一致性。通过将领域知识与数据驱动的学习相融合,与纯粹的数据驱动方法相比,PIML方法在准确性和可解释性方面都有显著提升。在这项综述中,我们详细研究了将已知物理原理整合到机器学习框架中的方法,以及这些方法在状态监测特定任务中的适用性。将物理知识融入机器学习模型可以通过多种方法实现,每种方法都有其独特的优缺点。本文详细探讨了在数据驱动模型中整合物理知识的各种方法的独特优势和局限性,考虑因素包括计算效率、模型可解释性,以及在状态监测和故障检测中对不同系统的通用性。我们还介绍了一些利用这一新兴概念的案例研究和文献,以展示 PIML在状态监测应用中的有效性。从综述的文献中,可以证明PIML在状态监测中的多功能性和潜力。新颖的PIML方法为解决状态监测的复杂性和相关挑战提供了创新的解决方案。这项综述为该领域未来的研究奠定了基础。随着技术的不断进步,PIML有望在优化维护策略、提高系统可靠性以及提升工程系统的整体运行效率方面发挥关键作用。关键词:机器学习;深度学习;基于物理信息的机器学习;状态监测;异常检测4 基于物理信息的机器学习4.4 物理引导的架构设计除了损失函数之外,ML算法本身的架构可以设计为包含基于物理的约束。从文献来看,该领域的发展主要集中在设计能够高效编码偏置并学习系统底层物理特性的神经网络架构。为了解决工程应用中的独特挑战,研究者提出了多种专用神经网络架构。其中一种方法是通过给隐藏层数值赋予物理意义,在“黑箱”结构中编码物理信息。特别是在深度学习架构中,可为中间节点或输出分配物理意义,从而促进网络内基于物理引导且可解释的信息流动。根据具体应用,通过专用操作和/或对网络层间保留数据进行的变换,中间节点的物理相关性可在网络中传递。另一种常用方法是对节点间的连接赋予物理意义。通过这种节点连接方式,可在网络层间指定固定的物理操作或变换,以不同方法实现信息流中物理原理的保持。后续小节将详细阐述上述架构设计在主流深度学习框架中的具体应用。此外,本节还将解析传统深度学习架构在物理信息架构设计框架中的工作机制,包括其架构细节及对特定数据类型物理特性的适用性分析。 4.4.1 前馈神经网络文献中存在多种此类架构调整的案例。由于前馈神经网络架构已在第4.3.1节“基于物理信息的神经网络”中讨论,本节不再赘述其结构描述。尽管近期架构创新不断,前馈神经网络依然因其简单性、相对高效的计算能力及连续函数通用逼近特性被广泛采用。其自身结构使前馈网络更便于分析与物理相关性编码,因此诸多研究者以该框架为基础开发可解释的物理信息架构。表5简要汇总了在前馈架构中嵌入物理知识的现有研究工作:表5 以前馈神经网络架构创新性改进为核心的物理信息架构设计的文献总结该领域的大部分文献试图通过约束前馈网络的传播过程提升模型可解释性。Chen和Liu(2021)的研究是典型案例,他们将物理参数作为网络节点以确保信息流符合底层物理规律。该团队提出概率方法,采用前馈模型学习应力与疲劳寿命分布关系的均值和标准差。通过约束优化过程将先验知识植入网络:将疲劳应力、疲劳寿命及样本试验完成度等物理参数设置为输入节点,输出节点则定义疲劳寿命概率分布的均值与标准差参数。网络权重和偏置根据参数间已知物理关系进行约束,强制中间值符号一致性。Yan等(2022)结合物理信号处理技术与正则化方法开发了全架构可解释神经网络。所设计的三隐藏层前馈网络对应希尔伯特变换、平方包络和傅里叶变换的信号处理数学表达。通过混合损失函数优化健康指标敏感性等特性,成功应用于机械振动信号的退化建模。与上述研究类似,Wang等(2022)通过为网络各层赋予适当的物理意义,开发了一个可解释框架。研究者将其提出的极限学习机框架应用于机械健康监测。极限学习机可定义为传统神经网络的一个子集,其强调使用简化模型实现高效可扩展的学习。该框架最初由Huang等(2006)提出,与传统神经网络的多隐藏层不同,极限学习机通常由单一隐藏层构成,基于固定权重实现输入到输出的映射。相较于标准神经网络,此类模型更易训练,且所需数据量和计算资源显著减少。为弥补模型简化带来的不足,极限学习机强调采用先进的特征提取、数据预处理和数据融合技术,使模型能够学习数据中的复杂模式。在本研究中,作者通过额外的前馈层对采样输入特征实施小波变换、平方包络和傅里叶变换(如图12所示),这一设计与Yan等(2022)的研究具有相似性。传统上,极限学习机的隐藏节点采用随机初始化方式生成随机输入权重和偏置。基于此结构,极限学习机模型仅需精确学习输出层参数,从而直接规避传统反向传播优化方法所需的大量时间和计算资源。Wang等(2022)对此架构进行了创新改进:引入特定稀疏性度量替代随机初始化的隐藏层,显著提升网络可解释性。采用的创新性变换与评估指标包括基尼指数、峭度、平滑度指数和负熵。图12 将具有物理可解释性的特征提取与极限学习机的结合使用相比之下,Chen等(2023)在疲劳寿命预测中提出了一种基于架构整合物理知识的替代方法。研究者采用多保真度模型,通过数据驱动神经元与新型物理信息神经元的组合,将控制疲劳寿命的物理规律嵌入系统。值得注意的是,作者基于纯物理模型(如Walker平均应力模型和Basquin关系模型),为模型中 特定节点应用了物理驱动的激活函数。最终模型结构(如图13所示)包含与数据驱动神经元协同工作的物理神经元,通过网络节点间的关联关系强制节点本身的物理相关性。图13 神经网络中基于物理的sigmoid激活函数与传统sigmoid激活函数的结合由于结构简单,该特定架构已在众多研究中得到广泛应用。如前文所述案例所示,前馈神经网络通过多种创新改进展现出显著效能。近年来,该领域大量研究持续优化基础神经网络结构,使其更适配特定数据类型与结构特性——此内容将在后续章节详述。4.4.2 卷积神经网络 除了直接的前馈模型,CNNs在学术界也广受欢迎。通过其与生俱来的架构,卷积神经网络有能力对其训练的数据中固有的某些不变性或对称性进行编码,使其能够根据先验知识对某些偏差进行编码。通过设计,CNN通过使用卷积层和池化层先天地考虑了空间不变性。CNN独特的卷积层为中提取物理意义提供了高效且自动化的方法:这些层从输入数据中提取空间特征,并与施加物理约束的物理信息层协同工作。具体到卷积层的运作机制:在卷积层内部,网络通过一组滤波器作用于输入数据。每个滤波器负责检测输入中的特定特征或模式,使得网络能够识别输入数据不同区域的局部模式,不受其空间位置影响。在每个卷积层中,滤波器根据步长在输入数据范围内滑动卷积运算。此过程的输出称为特征图——即由局部加权和形成的张量。二维卷积运算可表示为: 通过将输入数据I与滤波器核K进行卷积运算,CNN能够实现局部连接,从而具备位置不变特征检测能力(LeCun等,2015,1998)。卷积运算后通常施加非线性激活函数以引入系统非线性。池化层通常插入卷积层之间,通过降低维度同时保留特征描述信息。在池化层中,对特征图各区域进行子采样操作,取代卷积层输出的精确特征位置信息,后续处理基于池化层汇总的特征进行,增强网络对特征位置变化的鲁棒性。池化层还通过降低输入空间分辨率(通常采用局部区域最大值或平均值)引入空间不变性,使网络对输入数据的微小变化(如平移或形变)更具鲁棒性。根据具体应用场景,网络还可编码旋转不变性、尺度不变性或排列不变性。这一特性使CNN在故障特征多变的设备CM任务中具有重要价值。表6汇总了采用物理信息CNN框架的研究案例。表6 以CNN架构创新性改进为核心的物理信息架构设计的文献总结通过设计专用层或架构,网络能在保持深度学习预测精度的同时捕捉底层物理规律。当前文献中常见方法是将针对特定物理问题设计的傅里叶特征层等物理启发层整合到CNN架构中(Jing等,2017)。其核心设计理念是在网络层内集成基于物理的信号处理技术,可视化与物理相关的故障特征,并为决策过程提供物理解释视角。在Kim等(2022b)、Li等(2021)、Lu等(2023,2019)的研究中,物理信息CNN的特定层被专门设计用于提取目标故障类型的相关特征。这些层生成的物理相关特征图可在CNN架构内通过多级抽象传递,使得后续层专注于更复杂的特征提取与分类,提升监测系统的精度与鲁棒性(Wang等,2022b;Li等,2019b)。 得益于固有结构与编码的对称性/不变性,物理信息CNN在时频数据分析中表现突出。此类应用常通过振动信号评估设备状态:对一维振动信号采用一维时频域映射图像采用二维CNN。Sadoughi和Hu(2019)通过改进卷积滤波器(即核函数)在CNN中表征物理过程,开发了滚动轴承故障诊断框架(见图14(A))。该框架针对频域信号处理改进传统CNN分类方案,新增谱峭度层、包络分析层等预处理层,并采用快速傅里叶变换层对预测特征图进行后处理。滤波器核根据轴转速与轴承特征频率生成,其物理驱动特性降低了对超参数的依赖,故障检测精度显著优于传统深度学习方法。Li等(2021)提出的小波核网络(见图14(B))引入连续小波卷积层,提升轴承故障振动信号脉冲特征提取能力。Kim等(2022b)开发了健康自适应时标表示模型,将时频域故障特征物理信息嵌入CNN进行时频图像分析。该框架采用与上述研究类似结构,通过健康自适应时标表征模块生成指标。 图14 CNN网络的物理信息层设计,源自:(A)Sadoughi和Hu(2019)基于物理的核生成方案,通过物理驱动生成卷积滤波器实现物理信息卷积。(B)Li等(2021)使用卷积层处理连续小波变换的示例架构。(C)Lu等(2023)采用物理信息的特征选择层。 Lu等(2019)在Sadoughi和Hu(2019)基础上提出物理特征加权机制(见图14(C)),利用轴承特征故障频率先验知识对振动特征加权。Lu等(2023)进一步改进该模型,在CNN分类前增设特征加权层与信号处理层,强化与轴承故障特征频率匹配度高的特征。相较于Sadoughi和Hu(2019)的时域处理,该框架直接在频域构建CNN输入空间,显著降低计算复杂度且保持同等精度。Perez-Sanjines等(2023)提出基于循环平稳分析的振动信号处理方法。通过二维循环谱相干图提取物理信息,结合机器学习进行异常检测。健康状态数据训练的卷积自编码器重构循环谱相干图,评估旋转部件异常时产生的非稳态信号。Deng等(2022)开发物理信息时序CNN评估轴承刚度退化,集成物理增强输入特征空间、物理信息损失函数与物理驱动网络架构。特别设计的物理信息层模拟振动特征与剩余使用寿命间的物理映射关系,确保网络计算符合先验物理知识。 Ni等(2022)针对桥梁挠度监测提出多分支CNN架构(见图15),融合基于应变与加速度的位移重构方法。针对加速度法在准静态位移重构的不足与应变法在动态的误差,双分支CNN独立学习准静态与动态位移分量特征。各分支特征图相互独立,避免交叉干扰,结合残差编-解码块增强信息传递,并通过基于加速度残差最小化的物理信息损失函数监督训练。Rahimi等(2021)提出融合物理振动分析与CNN谱特征的铣削颤振监测框架。该混合框架结合基于能量的颤振检测模型与CNN实时训练,动态更新颤振概率,有效抑制动态工况下瞬态振动引发的误报警。 图15 对位移形式的应变和加速度测量进行单独建模的多分支CNN。源自Ni等(2022) 4.4.3 循环神经网络另一种在学术界广受欢迎的深度学习架构是RNN。自诞生以来,RNN因其处理序列数据的能力而备受青睐:其能够考虑先前输入的上下文信息。通过将前一时间步的信息(即隐藏状态)与当前输入数据共同解析为新时间步的输入,网络得以将历史输入信息融入当前处理过程。因此,RNN本质上被设计用于编码时间不变性,并已被证明在涉及理解时间动态与关系的任务中具有不可替代的价值。RNN的架构如图16(A)所示。图16 (A)RNN的一般结构,(B)每个RNN单元内部的计算过程传统RNN通过整合输入空间 和前一隐藏状态 ,将时间𝑡的输入 映射至输出 。给定输入 和前一隐藏状态 ,单个RNN单元的隐藏状态可表示为: 其中, 和 分别表示与先前时间步隐藏状态和当前输入状态相关联的权重矩阵, 表示当前隐藏状态的偏置项。通过逐元素应用非线性激活函数𝑔(·) ,生成当前时间步的隐藏状态: 随后,时间步𝑡的输出 可表示为: 其中 和 分别代表相关联的权重和偏置项。激活函数𝑔(·)(通常为softmax或sigmoid函数)被应用于隐藏单元状态的线性变换,以生成最终的输出。上述计算过程的可视化表示见图16(B)。通过其反馈连接,RNN能够维持捕获先前时间步信息的隐藏单元状态,从而获得处理序列数据并捕捉时序的能力。此外,与CNN等其他结构不同,RNN及其变体具有处理和输出可变长度序列的灵活性,使其可应用于涉及动态长度数据的过程(这是现实监测应用中的常见特性)。LSTM和GRU是为解决传统RNN训练过程中普遍存在的梯度消失问题而开发的两种流行的RNN变体。LSTM和GRU都使用门控机制来选择性地存储或丢弃内部记忆信息。这些机制使LSTM和GRU能够捕捉数据中的长期依赖关系,同时缓解梯度消失问题。LSTM由Hochreiter和Schmidhuber(1997)提出,现已成为使用最广泛的RNN变体之一。LSTM通过额外的内部单元状态表示长期记忆,并采用三个门控机制来调节信息流:输入门选择性地用单元网络输入的新信息更新记忆单元,同时阻止无关信息添加到现有记忆状态;遗忘门选择性地从记忆单元中移除无关信息;输出门选择性地将相关信息从记忆传递到下一个隐藏状态和输出,有效控制整个网络的信息流动。GRU是Chung等(2014)提出的较新RNN变体,作为LSTM的简化版本,它使用两个门控机制:更新门决定新输入应在记忆单元中存储多少,遗忘门决定应遗忘多少先前的记忆。 除这些变体外,双向RNN架构也得到深入研究——以增加计算资源为代价,将前向时间步处理信息的两个RNN隐藏状态相结合,使网络能同时捕获过去和未来的上下文信息。尽管很受欢迎,RNN及其变体在计算效率方面存在重大局限。这种局限源于RNN计算的顺序特性(Kolen & Kremer, 2001)。对于序列数据处理任务,RNN并行计算的低效性可能成为主要限制,特别是在处理大规模数据集时。由于其计算涉及顺序依赖和隐藏状态,RNN需要大量时间和计算资源来处理每个数据点(尤其是长序列或深层架构)。这种顺序依赖性也使得跨时间步的计算并行化具有挑战性,因为隐藏状态需要按顺序计算,严重限制了RNN利用GPU或TPU等并行处理架构的能力,导致监测过程出现进一步延迟和低效。 表7(受篇幅限制,可参看原文)展示了所综述的文献。文献中普遍采用的方法是将基于物理的约束直接整合到RNN架构中,即设计将物理模型作为架构内在组成部分的神经网络架构。这可以通过在神经网络中加入物理方程或约束作为附加层(与传统神经网络层一起训练)来实现。例如Yu等(2020b)通过在特定RNN单元中嵌入物理信息残差块来增强RNN结构,用于结构动力学仿真。残差值表示预测与已知物理规律的偏差。在他们的工作中,残差块旨在精确建模动态系统各时间步间的不一致性,并通过所提出的RNN进行迭代最小化(如图17所示)。Chen等(2022a)提出了一种涉及LSTM的轴承故障检测和预测架构,该方法被称为退化一致性RNN。该网络通过整合机械部件的单调退化行为实现物理信息嵌入。作者通过在网络中引入表示时间退化量的中间变量(嵌入LSTM单元内)来强化轴承退化行为的不可逆性。他们还实现了物理信息损失函数,在训练阶段根据标记数据评估性能,并通过物理信息项(基于中间退化变量)预测任意状态的观测退化量,进一步强化LSTM表征的底层物理规律。图17 通过将物理信息融入到RNN单元中的深度残差RNN,源自Yu等(2020b) 近期流行的方法是基于RNN的累积损伤建模。Nascimento和Viana(2019)首次采用RNN模型来捕捉机群的时间动态特性。作者通过将基于物理的模型元素(称之为欧拉积分单元,如图18所示)直接整合到RNN架构中,将相关机器的物理领域知识融入模型。采用欧拉前向方法,作者将离散化的系统状态表述为先前系统状态和输入向量的函数。在这个特定实例中,基于控制裂纹扩展的帕里斯定律,在传统RNN架构的单元内加入了物理信息层,以建模影响裂纹扩展的机械因素。与传统数据驱动模型协同工作,物理模型估计应力强度因子范围。这两种模型与RNN单元的结合,实现了对样本时间动态和累积损伤的精确预测。在发表该成果后,作者还采用相同模型在有限观测条件下预测飞机的疲劳裂纹扩展长度(Nascimento & Viana, 2020)。 图18 通过欧拉积分将物理特性融合到RNN单元中,源自Viana等(2021) 后续其他作者的工作对该框架进行修改以用于不同场景。例如,Yucesan和Viana(2019, 2021a, 2022)的研究应用该框架的修改版来建模风力涡轮机轴承的疲劳,其中数据驱动模型与已知物理规律结合,用于预测润滑对失效的未知影响。通过在单元内结合数据驱动元素以及Palmgren-Miner准则等基于物理的层,作者试图通过组合网络来表征轴承疲劳与润滑退化之间的关系。为此,网络结构设计考虑了两种退化行为的参数,并准确表征了每种退化形式相对于另一种形式的特点。作者进一步创新该模型,将其应用扩展到润滑退化过程引入不确定性的案例(Yucesan和Viana, 2020a, 2020b, 2021b)。 Viana等(2021)提出了一种利用该模型估计缺失物理量的方法,其中采用数据驱动层来近似物理模型的不确定行为。值得注意的是,Viana等(2021)选择将RNN架构作为常微分方程的纯物理解决方案,并增加一个数据驱动节点来量化已知物理与观测结果之间的差异。作者通过多个案例研究验证了该方法,包括基于既定物理模型的疲劳建模:用于疲劳裂纹扩展的帕里斯定律、用于疲劳裂纹扩展的Walker方程以及用于疲劳寿命预测的Palmgren-Miner准则。 Dourado和Viana(2019)探索了这种混合RNN架构应用的另一个方向,他们采用类似框架来预测腐蚀效应的系统累积损伤。在他们的工作中,RNN的结构设计用于表示帕里斯方程,其中应力强度因子由物理方法确定,其余参数由单元内的数据驱动前馈模块确定。作者后来扩展了他们的工作,引入数据驱动补偿器来修正Walker裂纹扩展模型,其中采用数据驱动层来建模由于腐蚀导致的损伤累积偏差(Dourado & Viana, 2020)。累积损伤模型也被广泛应用于锂离子电池的退化行为建模。例如,基于他们之前的工作,Nascimento等(2021a)修改了现有框架以符合Nernst和Butler-Volmer方程,并在单元内加入多层感知器模块来表征模型形式的不确定性。该方法侧重于基于Nernst和Butler-Volmer方程构建降阶模型。与Viana等(2021)类似的想法,作者在他们修改的RNN单元结构中采用了多个数据驱动模块,以补偿已知物理与观测到的设备退化之间的偏差。作者进一步扩展了他们的工作以扩大应用范围。在Nascimento等(2021b)的工作中,将其应用于全机群数据集,从而识别偏离已建立机群标准的设备。而在Giorgiani do Nascimento等(2023)的研究中,作者通过基于新证据或信息修正假设或信念概率的贝叶斯更新策略,进一步扩展了该模型以处理设备历史使用数据不完整的情况。Kim等(2022c)将累积损伤框架应用于锂离子电池状态预测,在他们称为知识融合RNN的模型中实现。在他们的模型中,通过基于电池容量双指数模型的物理信息模块进一步修改了循环单元。此外,作者还在嵌入RNN单元的数据驱动前馈网络中引入了蒙特卡洛丢弃,以确保性能估计的鲁棒性和可靠性。4.4.4 图神经网络物理信息架构的另一个例子来自于图神经网络(GNNs)的结构组成。GNNs是一类能够处理图结构数据的深度学习模型,最初由Scarselli等(2008)提出这个概念。GNNs由节点和边组成。在这种表示中,网络内部的节点表示实体,边表示实体之间的连接或关系。该结构的示意图如图19。图19 GNN架构及其关键组件与信息流的示意图:GNN基于图结构数据运行,使其能够在复杂关系型数据集中实现高效的分析、推理和学习任务。对于图 ,其中 表示节点(亦称顶点), 表示边,每个节点可表示为 ,并具有特征向量 。GNNs的操作可定义为通过聚合邻节点信息来迭代更新节点特征向量表示,并利用这些更新后的表示进行预测或分类的过程。采用信息传递机制,节点与邻居节点交换信息,使其能够根据接收到的信息更新特征向量。该操作与CNN中应用的卷积操作类似,因为这两种操作都有效地聚合和处理相邻的实体,以更新该实体的值。每个节点使用一个可学习的函数来聚合来自其邻居的信息,该函数同时考虑了节点特征和边权重。然后将这些信息传递给每个节点的邻居。这可以理解为:对于每个节点 ,通过使用一个可学习的函数 聚合来自其邻居 的信息来计算信息向量 : 其中 是节点 和 之间的边特征向量, 是可学习函数,它将第 层输入的特征映射到第 层的结果信息。随后,每个节点通过在前一过程中从邻居节点接收到的信息与自己的原始表示相结合来更新自己的表示。这可以表示为通过将前面的特征向量与聚合信息相结合,计算每个节点 的新特征向量 : 上述信息传递和更新步骤会在固定数量的层中重复执行,直至为图中的每个节点获得最终表征。最终节点特征随后可用于下游任务(例如节点分类或链接预测)。函数 和 可以是任何可微分函数,并随具体应用而变化。在GNN中,通常使用深度学习结构(如前馈神经网络或GNN)来近似这些函数,并可通过训练期间的反向传播进行学习。通过这种连接架构,GNN能够捕获图中实体间的复杂关系(例如图的局部和全局结构),从而实现对图结构数据的精准预测及多样化任务处理。表8汇总了相关文献。GNN的固有结构使其能够处理图结构数据,因此特别适用于现实系统中的应用场景——这些系统的行为由各组件间复杂相互作用且可自然表征为图结构。表8 基于物理信息的GNN架构的应用的文献总结 GNN的固有结构使其能够处理图结构数据,这使其适用于各种现实系统中的应用场景,这些系统的行为由各组件间的复杂相互作用决定,并能自然地表示为图。特别是,GNN已成为电力系统建模中的一种强大方法,适用于电力系统状态估计、负荷预测、故障检测与诊断以及最优潮流估计等应用(Gao等, 2020; Liao等, 2021; Yu等, 2022; Zhu等, 2022b)。GNN在电力系统建模中的普及性可归因于电力系统本身也具有内在的图状结构,由互连的节点(如发电机、变压器和负荷)和边(如代表功率与信息流动的输电线路和电缆)组成。例如,de Jongh等(2022)通过物理信息GNN在其研究中监测并进行了状态估计。电力系统以电网拓扑的形式展现出底层的不规则结构,这种结构可以用数学方法表示为图。由于这种结构,GNN等几何深度学习方法因其固有结构而适用。de Jongh等(2022)提出了一个通用框架,该框架使用几何深度学习技术和物理信息损失函数来解决电力系统中的潮流计算和状态估计任务。该框架在具有不同传感器渗透率的模拟中压电网拓扑中表现良好。Li和Deka(2021b)进一步提出了一种物理保持图网络,用于估计电网系统中的故障位置。该两阶段框架在有限数据条件下提供了节点故障位置的精确估计。通过一种新型可调邻接矩阵(稀疏故障电流通过该矩阵聚合),框架的第一阶段近似结构的拓扑;而框架的第二阶段则学习可观测数据与不可观测数据样本之间的相关性。Xing等(2022)调整了物理信息GNN框架以改进输电线路中的故障定位。作者通过建立已知故障类型的图结构,将故障类型与位置之间的固有关系整合到测量的模电压和模电流中。4.4.5 生成式深度学习网络 生成对抗网络(GANs)是一类ML模型,旨在自动发现并学习训练数据中的规律,使得模型能够生成可能属于所提供数据集的逼真数据样本。GANs由两个在竞争环境中共同训练的神经网络组成:生成器网络主要学习生成与所提供训练数据相似的样本, 判别器网络学习区分生成的样本与真实训练数据(Wang等, 2017)。生成器网络以随机噪声或隐向量作为输入并生成合成数据样本。随着训练过程的推进,生成器网络逐渐学会生成越来越接近训练数据分布的逼真样本。判别器是二元分类器,其输入来自训练集的真实数据样本和生成器的合成样本,旨在区分真实样本与合成样本。随着生成器学会生成更逼真的样本,判别器网络也变得更擅长区分生成数据与真实数据,从而为生成器网络提供更具信息量的反馈。GANs的训练目标可被框架化为生成器与判别器之间的极小极大博弈:生成器旨在最小化判别器区分真假样本的能力,判别器则旨在最大化其判别准确率。该目标通常表述为最小化真实数据分布与生成数据分布之间的 JensenSh度或Wasserstein距离。该迭代过程持续进行,直至生成器网络能产生与真实训练数据无法区分的样本(Goodfellow等, 2020)。表9汇总了相关文献。表9 基于物理信息的GAN架构的应用的文献总结通过利用系统的底层物理规律,物理信息GANs已被用于生成可补充现有观测或测量数据的合成数据,从而实现更精确的建模与预测。其功能核心在于通过应用物理定律约束生成样本。Xu和Noh(2021) 提出了名为物理信息多源域对抗网络的框架,用于建筑物结构损伤的无监督识别。该方法采用多源域适应框架,从多个源域提取域不变特征。作者提出新型损失函数,额外考虑源域与目标域间的相似性,并优先从相似源域进行知识迁移。Sun等(2022) 提出循环GAN模型 ,在网络中嵌入滞回行为的物理规律以增强可用数据。具体地,作者旨在捕捉多轴加载下试件半寿命循环的滞回环与相应疲劳寿命的关系。通过傅里叶变换和半经验方程约束,生成符合真实疲劳行为分布特征的合成数据。利用动态时间规整算法及表征疲劳寿命与加载、应变加载、应力响应关系的半经验方程,剔除违背物理原理的样本。通过数据增强,使用试件的多轴疲劳寿命数据训练多个知名ML模型(包括前馈网络、随机森林、支持向量机和极限梯度提升算法),证明精度显著提升。 Zhou等(2023a) 针对齿轮故障诊断中 特定故障模式标记数据的高成本限制,提出卷积GAN模型扩展训练数据。该框架利用大量未标记训练数据中的故障特征生成代表新故障数据的样本,有效扩展深度卷积GAN的预测空间,从而推导已知与未知故障间的物理关联。 该框架也被广泛用于不确定性量化(UQ),典型方法是在已知不确定性的数据上训练网络,使GANs生成具有关联不确定性的合成数据样本。生成样本可用于估计和量化ML模型预测的不确定性,并通过生成覆盖所有可能具有不确定性的多样化数据样本以提升UQ方法的鲁棒性与可靠性。 Yang和Perdikaris(2019)将GAN架构用于PINNs中PDEs相关不确定性的量化与传播。受限于数据获取,作者提出基于先验知识(通过控制微分方程)的不确定性传播方法,利用隐变量模型获取系统状态的概率表示。在隐变量模型中,观测变量受一个或多个隐变量影响(这些隐变量未被直接观测但被假定为观测变量间关系的基础)。通过对抗推断过程训练模型,在深度GAN络的优化阶段以物理信息损失函数形式融入物理约束,使得小数据集训练成为可能。通过最小化反向Kullback–Leibler散度的误差近似解,确保预测结果与已知物理规律一致。作者利用物理信息约束作为正则化机制,训练深度生成模型生成物理系统代理,有效规避数据获取问题并通过表征物理系统输出的不确定性验证方法有效性。Zhou等(2022)将物理信息GAN整合至系统可靠性分析框架中。基于系统状态概率对网络结构进行建模,并对可靠性演化模型的控制方程进行编码。作者通过前向Kolmogorov方程的推导逐时间步表征系统性能,并将系统可靠性视为功能状态概率的集 合。进一步提出用于可靠性评估UQ的GAN网络:生成器基于系统状态概率导数或定义的状态转移生成合成数据,并受初始条件或系统持续运行观测数据约束;判别器生成数据置信度估计。两者通过竞争性损失函数正则化并在对抗环境中训练。特别地,生成器根据领域知识加入基于物理的正则化损失项。通过数值算例验证方法有效性,结果显示该方法与传统Runge–Kutta和蒙特卡洛模拟结果相似。5 讨论以上综述了107项研究,其总体目标是讨论和总结流行的PIML学习框架,并将其应用于异常行为和或工况的设备监测。在文献调研的工作中,基于物理的方法和数据驱动模型之间的集成方法被细分为四个不同的类别,如第4节所讨论。 5.1 阐释与展望 如图20(受篇幅限制,可参看原文)所示,展示了本综述所调研文献的分布情况。饼状图阐明了PIML在CM领域内不同研究方向的出版物分布。在调查的文献中,大量研究(36篇)采用基于物理的技术修改机器学习模型的输入特征空间,通过观测偏差引入物理知识。对输入空间的修改间接允许模型通过限制不符合物理原理的映射来学习物理一致性关系。此类实现因其简单性和易操作性广受欢迎。 文献显示,这类集成主要涉及两种方式。第一种是物理模型驱动的输入数据生成或特征空间增强:21项研究旨在生成合成数据或使用基于物理的方法创建新物理特征;5项研究使用基于物理的方法筛选判别性特征。尽管方法多种多样,但与上述方法的一个共同点是定制了特征空间,以便与传统的ML和深度学习模型一起使用。第二种是迁移学习框架下的物理知识集成。10项研究利用迁移学习理念,在已知源域预训练模型后针对目标域微调。绝大多数研究将源域定义为已知物理域,并通过知识迁移捕获可复用的物理规律;Guc和Chen(2021, 2022)的研究是个例外,他们依赖源域的预训练特征,并在微调阶段融入物理知识。许多学者使用该框架来补充可用的数据和增强ML学习空间,以提高性能和鲁棒性。 就该技术的局限性而言,尽管易于实现且效果明显,但这种实现方式在学习过程中并没有直接纳入任何物理约束,导致了一种幼稚的黑箱模型,可解释性极低。虽然特征工程可能会间接限制模型对物理违例的处理能力,但在学习过程中没有强制执行任何约束。此外,该方法对物理模型的完整性与可靠性存在依赖,需确保生成特征的真实性。基于物理的约束虽可优化学习空间,但也会引入对特定物理方程对齐模式的偏向,可能忽视偏离预设物理框架的有效解。这种观测偏差可能限制算法在物理规律变化或未知场景中的适应性与泛化能力,且可能延续物理模型中的固有偏差,限制对新颖现象或非常规数据模式的探索。因此,该方法不适用于底层物理机制不明确的复杂系统(因其难以通过预定义特征捕获现实现象的复杂性)。 另一集成物理知识的方法是将数据驱动模块与物理模型协同应用,使数据驱动模型作为校正机制补充纯物理决策。有3项研究采用此形式。虽然该技术在上述文献中已经证明了一些成功,但使用ML作为物理模型的校正机制的作用并不是没有限制的。与大多数纯粹的数据驱动模型一样,该策略的一个主要局限是它无法捕获在它们所训练的领域中不存在的行为。在这种模式下,ML模型独立于基于物理的模型运行,直接导致在训练数据不能准确捕捉系统真实物理的情况下,作为物理系统误差的特征,ML算法可能会学习修正物理模型中的误差,但可能无法准确捕捉潜在的物理现象。关于物理与数据驱动模型的集成,另一个主要的限制来自ML模型的目标学习空间。由于ML模型学习的是系统的误差,而不是系统本身的误差,因此很难保证得到的修正量具有物理意义。在某些情况下,ML算法可能会识别数据中与底层物理无关的模式或关系,从而导致错误或虚假的修正。 近年来,通过多项开创性贡献,该系统的物理知识已与神经网络强大的逼近能力结合使用。训练神经网络的传统方法包含两个步骤:首先由神经网络生成初始预测,随后通过某种形式的距离评估(以损失函数形式衡量神经网络预测与先验知识的差异)进行优化。在监督学习方法中,优化过程始终围绕标记数据执行;该既定方法论自其诞生以来未发生改变。近期,部分研究者通过引入物理信息正则化对此过程进行创新。传统正则化方法(如L1或L2正则化)已被广泛应用于机器学习模型,作为解决过拟合问题并提升模型泛化能力的ML与统计建模方法。通过在损失函数中增加惩罚项,该方法有效权衡了模型对训练数据的拟合度与复杂度。 通过物理信息正则化,模型不再通过限制复杂度受惩罚,而是通过引入基于物理的损失项对其偏离物理原理的行为进行惩罚。38项研究采用这种正则化形式作为其方法论。正如Karniadakis等(2021)所述,基于物理的正则化通过学习偏差引入对底层物理系统的认知。深度学习架构的预测可通过多个优化周期内损失函数的迭代引导与已知物理规律保持一致。此外,有32项采用此方法论的研究利用基于物理的正则化求解控制常微分方程或偏微分方程。通过自变量输入,神经网络试图预测未知变量。利用自动微分,基础神经网络对变量的预测可用于重构微分方程及初始或边界条件。这些重构随后以损失函数形式评估,部分研究选择同时包含与标记数据相关的损失。Raissi等(2019)在该领域的早期研究使用传统前馈网络,但基于物理的正则化框架已迅速扩展至其他深度学习架构(6项研究)。CNN和RNN因其分别捕获空间与时不变特征的能力被采用,自编码器则因其无监督学习能力被应用。如上述研究所示,该方法的一些优势是显而易见的。 该形式的普及代表了一种在神经网络优化过程中融入物理原理先验知识的有效方法,且其相对于传统“朴素”方法的优越性已在多篇研究中得到验证(Haghighat等, 2021; Raissi等, 2019)。所构建模型对学习可用数据的依赖程度较低,使作者能减少训练深度学习架构的数据需求,并提升模型对噪声或不完整数据的鲁棒性。实际上,部分研究(8项)在优化过程中仅使用纯物理损失项。当可用数据有限时,以此形式训练模型可能具有优势。此外,由于不依赖数据,该方法降低了对噪声或不准确数据的敏感性。总体而言,数据驱动损失项还可通过训练期间的额外引导提升收敛性、稳定性及对未知数据的泛化能力。这类方法的局限性在于,PINNs的计算成本(尤其是采用深度学习结构的PINNs)可能因神经网络架构的复杂性和训练涉及的高维参数空间而显著增加。尽管具有潜力,PINNs在多数情况下可能无法超越传统数值分析方法(如有限元和时间推进算法),尤其是在这些传统方法已被深度优化的成熟问题上。维度灾难对PINNs构成另一挑战——在高维系统中,训练计算成本随输入维度数量呈指数级增长。此外,PINNs可能难以实现高数值精度(尤其在精确边界条件至关重要的场景中),部分归因于缺乏适当的正则化技术。在PDEs形式未知或存在性不确定的复杂系统中,PINNs可能引入数值分析偏差,导致错误结果与结论。尽管PINNs为从高保真模拟器(运行成本高昂)中快速学习动力学提供实用方法,但这种加速学习过程可能为计算效率牺牲精度。此外,PINNs在有效捕获模型不确定性方面可能面临挑战(尤其在数据有限或观测噪声较大的场景中)。尽管存在这些限制,当前研究正通过集成领域知识、探索新型正则化技术及与传统数值方法混合等手段应对挑战并提升PINNs的鲁棒性与可扩展性。 需注意的是,维度灾难对PINNs和GPs等传统ML算法均产生显著影响,严重制约其计算效率与精度。对PINNs而言,深度学习模型的复杂度随维度数量呈指数级增长,导致参数量激增,进而增加训练计算成本与数据需求。高维PDEs加剧了这些困难,因网络深度与架构复杂度需相应扩展,导致训练时间延长及过拟合/欠拟合风险上升。根据所求解问题,物理正则化器的加入可能整体增加损失函数的复杂度。当前优化方法主要依赖梯度下降及其变体(网络沿损失最小化方向逐步调整参数)。损失函数复杂度的增加(如局部极小值的出现)可能进一步阻碍优化过程。Krishnapriyan等(2021)的研究指出了基于物理正则化的这一特性——引入软正则化项会导致模型复杂度特征。该复杂性阻碍了PINNs在许多高维场景中的实际应用。Yang等(2020)的研究将物理信息生成对抗网络(PI-GANs)作为应对随机微分方程求解中高维挑战的有效方法。其研究证明该方法在30维问题中具备精度与有效性,表明此类创新可能缓解PINNs的维度灾难。该研究强调:传统PINNs虽在高维空间中表现不佳,但结合对抗训练方法可帮助管理复杂度与计算量,从而提升PINNs在高维问题中的可扩展性与适用性。类似地,GPs等经典ML算法在处理物理问题固有的高维复杂PDEs时也面临相同问题。对GPs而言,维度灾难主要表现为需对协方差矩阵求逆(该过程计算复杂度与数据点数量呈立方关系)。随着维度增加,计算成本与内存需求将变得不可行,使GPs无法大规模或高维场景。这种可扩展性问题是主要瓶颈,限制了GPs在常见高维输入的现实CM应用中的使用。此外,探索创新计算方法(如Zhou与Zhang(2021)在电力系统数据驱动暂态稳定预测中使用的量子TSA方法(2022))表明:创新型计算手段可为高维挑战提供可扩展的高效解决方案。尽管不直接相关,这表明了解决此类高维问题的潜在路径。 关于数值精度,尽管PINNs具备将物理定律直接融入学习过程的灵活性,但其对边界条件和PDEs解的逼近可能无法始终达到预期数值精度。在许多复杂系统中,PDEs的精确形式可能未知或不存在。在此情况下,PINNs可能在数值分析中引入显著偏差,影响预测精度。逼近质量高度依赖于网络架构、优化过程及边界条件施加方式,可能导致不准确性(尤其在边界或复杂边界条件处)。数值精度与边界条件施加带来额外挑战:对PINNs而言,尽管物理定律的集成具有优势,但其无法保证精确数值精度(尤其对复杂边界条件)。该限制系统建模与预测中的重大误差。对高斯过程而言,数值精度问题表现不同:GPs通常提供平滑连续预测,但难以处理精确边界条件与域内尖锐不连续或奇点。适当核函数与均值函数的选择可缓解部分问题,但实现复杂/非线性边界条件的精确拟合仍具挑战。该限制阻碍了GPs在需要高精度边界条件建模的领域中的应用。 此外,通过物理信息损失函数,基于物理的损失项在网络违反物理规律时充当惩罚机制,但其未被强制为刚性约束。这在涉及标记数据惩罚项的混合损失函数中可能成为问题(因数据不准确性可能导致相应损失项在混合损失函数中占主导地位)。就基于物理的正则化及PINNs总体而言,由于物理损失未被严格强制,网络仍可能产生物理违规或偏离预期物理行为。在探索PINNs与随机投影结合的案例中,尽管对结合这两种方法以提升计算效率存在显著热情,但近期文献中明确强调PINNs与随机投影集成的直接案例稀少。然而,随机投影本身在降维领域已确立地位,并被认为具有提升高维数据处理计算效率的潜力。集成随机投影与PINNs的基础原理在于随机投影可提供的理论与实际计算复杂度降低。该理念根植于利用随机投影的效率管理PINNs常处理的高维数据。这对由PDEs建模的复杂物理系统(常见高维输入空间)尤为重要。Li等(2006)的研究中讨论的稀疏随机投影技术展示了随机投影在处理高维数据时显著的计算效率与最小信息损失潜力。该概念与PINNs的结合为未来研究指明方向(整合两者优势)。Fabiani等(2023)在该领域的研究提出一种用于求解非线性常微分方程(ODEs)和一阶微分代数方程初值问题的PIML方案。该方法利用随机投影,重点通过牛顿迭代估计从隐层到输出层的权重。为解决最小二乘问题的不适定性,该方案对低维系统采用奇异值分解,对高维系统(如PDEs空间离散化产生的问题)采用带正则化的稀疏QR分解。超参数选择(包括高斯核形状参数均匀分布边界和积分区间)受偏差-方差权衡概念指导,并辅以基于局部误差控制算法的变步长方案。该方案有效性已通过七项基准问题评估。与传统MATLAB求解器的对比分析表明该方案可作为可行替代方案(Fabiani等, 2023)。 另一个应对复杂性的有前景路径(尤其当控制PDEs的形式与存在性存在不确定性时)可能在于无方程方法所概述的原理。无方程建模是复杂系统分析中的一种计算方法,用于传统描述系统行为的方程难以推导或无法推导的场景。该方法不依赖显式数学方程,而是利用仿真数据和数值算法研究系统动力学。其核心思想是:通过短时详细仿真收集系统状态信息,并应用该信息指导整体分析与预测。该方法允许对基于细尺度相互作用构建的模型进行直接宏观干预,有效绕过详细宏观描述的推导(Kevrekidis等, 2004; Kevrekidis & Samaey, 2009)。它通过计算实验和无矩阵数值分析在宏观尺度探索系统行为,适用于控制动力学未被充分理解或过于复杂而无法用传统PDE公式描述的系统。 流形学习技术与多尺度分析结合,为理解超越经典PDE模型能力的系统动力学提供了新方向。这些技术专注于识别高维数据中的底层几何结构,将复杂动力学简化为更易处理的低维表示(如多篇研究所讨论)。例如:关于潜在空间特征发现,多位学者尝试整合流形学习。与传统方法假设线性或强加特定结构不同,流形学习是用于理解复杂高维数据底层结构,旨在捕获数据固有几何(通常表示为高维空间中的低维流形)。通过揭示该流形,流形学习技术实现可视化、降维与特征提取(对模式识别、聚类和数据探索至关重要)。Galaris等(2022)在晶格玻尔兹曼模型PDEs仿真中将PIML与流形学习结合,采用 简约扩散映射和留一法交叉验证识别流形本征维度,为参数空间特征选择提供高效方法(用于分析晶格玻尔兹曼仿真的数值分岔)。该方法展示了结合先进机器学习技术与计算物理以增强复杂系统理解和分析的潜力。Burbulla(2023)通过引入微分同胚在PINNs中集成几何变换,实现包括阿基米德螺线上Eikonal方程求解、表面流形泊松问题、变形管中不可压缩斯托克斯流模拟及拉普拉斯算子形状优化等应用的鲁棒几何适应。Vaquero等(2024)将Hamilton-Jacobi PDE视为优化问题,利用ML技术近似解,提出在可积泊松流形上构建保持泊松几何的泊松积分器设计方法(基于泊松微分同胚与拉格朗日双截面对应关系)。Gracyk(2024)提出基于里奇流(Ricci flow)的流形自编码器方法,在物理信息框架下学习非线性动态(尤其是PDEs)。Krishnanunni与Bui-Thanh(2022)提出流形正则化的分层稀疏训练方法,展示其在神经架构适应中的有效性。 流形学习与多尺度数值分析方法的融合为传统PDEs失效的系统建模提供了潜在框架。Roberts等(2022)的无方程分块策略通过在小尺度分块上的计算实现大规模仿真(如异质弹性梁仿真),展示了无需详细宏观方程的高效多尺度仿真潜力。这些方法的应用标志着复杂系统分析范式的转变,为传统PDE模型不适用或不可用的系统提供了强大工具。 另一方面,学者们也尝试通过设计神经网络架构整合刚性约束。34项研究提供了将物理原理作为深度学习计算过程组成部分的创新方案。该方法通过将计算过程嵌入深度学习框架提升了可解释性——网络参数与输出可直接量,便于理解与验证预测。创新涵盖以下架构:传统的前馈神经网络(4项研究),CNN(9项研究),RNN(17项研究),GNN(3项研究)和(5项研究)。架构设计方面,多数研究通过中间节点/层赋予物理意义或采用约束优化(Chen & Liu, 2021)。除物理信息层外,许多研究还采用物理信息正则化为优化过程提供额外指导。部分研究(如Chen等, 2023)采用特定激活函数。前馈网络中,学者提出可解释层以阐明数据驱动模型的计算过程(物理意义赋权)。这种方法代表了一种基于物理的特征提取的替代形式。在结构健康监测振动数据应用中,传统信号处理技术(如傅里叶变换、包络分析和小波变换)被嵌入NN层作为物理信息特征提取手段。类似地,CNNs执行符合已知物理的计算过程进行特征选择或提取。 尽管上述框架与第3.1节讨论的单纯调整输入特征空间存在诸多相似性,但将预处理阶段整合至网络内部具有多项关键优势。首先,该框架本质上是一个端到端学习范式,整个网络(包括预处理阶段)均被整合至学习过程中。该设计的优势在于:网络能够同时适应并优化预处理与后续特征提取过程,从而消除手动特征工程的需求。此外,所得网络架构嵌入了物理知识,由于网络行为被强制与已知物理原理对齐,因此更具可解释性。通过显式建模和考虑特征提取过程中可物理建模的因素,网络能够学习提取更可靠且不变的特征,从而在富有挑战性的情况下实现性能提升。 网络架构设计也已被探索,如Ni等(2022)的研究所述——其引入分支网络以独立求解多个预定的物理关系。如Ni等(2022)和Haghighat等(2021)所述,尽管技术上可通过足够宽的网络层求解多个物理变量,但在关系可独立建模的情况下,分支网络分别建模各变量通常计算效率更高、精度更优。多项研究聚焦于RNN结构,将物理信息主要嵌入RNN单元的计算过程中。该领域的主要贡献者包括Nascimento和Viana(2019)率先使用欧拉积分单元在RNN单元中嵌入裂纹扩展物理机制,作为累积损伤建模的表征。该模型后被扩展至损伤时域传播建模及模型形式不确定性分析(Viana等, 2021; Yucesan与Viana, 2020b, 2021b)。在所调研的研究中,有14篇采用了此类整合形式。其他工作,如Yu等(2020b)的研究通过引入深度残差RNN进行了改进,这最初是由Kani和Elsheikh(2017)提出的。利用系统的嵌入式物理动力学更好地捕获依赖关系,并提高模型在更长的时间范围内做出准确预测的能力。3项研究采用GNN,利用其固有结构更好地建模和处理图结构数据(尤其在电力系统中广泛应用)。与传统神经网络不同,GNN通过图表示处理非欧几里得数据——图中节点代表实体,边代表实体间关系。GNN的独特结构不假设空间局部性(该假设常用于CNN,设计用于网格数据如图像)。此特性使GNN可处理任意尺寸和复杂拓扑的数据结构。5项研究主要涉及GANs的优化,其中,2项研究将GAN作为自动框架生成物理合理合成数据,而其余3项利用GAN表征和量化ML模型预测的不确定性。 通过将物理模型嵌入网络架构,物理原理得到了实行,从而通过架构本身实现理论的一致性。然而,与所有学习算法一样,模型解释细节的精细度与模型计算量之间存在权衡。除了所需的领域知识外,将物理原理整合到深度学习模型中会增加其复杂性。根据具体实现,物理信息架构可能比传统深度学习模型需要更多计算资源,这在需要计算速度的应用中可能成为限制因素。Viana等(2021)在其研究中已指出该限制——嵌入的物理模型复杂性可能变得难以驾驭。延伸而言,潜在进一步研究的路径可能是通过引导性简化或降阶模型来调整此类复杂模型。通过此形式引入的归纳偏置也可能限制学习模型,因其对数据和学习过程施加了强假设。尽管通过偏置施加的刚性约束可能通过显式指导提升效率,但也可能限制模型捕捉数据底层复杂性的灵活性和泛化能力。因此,必须仔细评估架构相对于其应用的适用性设计,以确保算法的有效性。 通过刚性约束和柔性约束的结合,研究人员已经能够定制当前的ML算法,以适应一些现实世界的CM应用的需求。目前的研究已经在准确性、对数据的依赖性、对噪声和/或不完整数据的鲁棒性等评价指标方面显示出巨大潜力。随着计算能力的持续进步,研究者能够应对更复杂、更现实的物理问题。增强的计算资源使更大规模、更全面的数据集探索成为可能,促进对原本隐藏的复杂关系与模式的发现。此外,更高的计算能力支持更精细的建模技术,使得准确捕捉以往难以处理的复杂物理现象和非线性动力学成为可能。 5.2 本综述的局限 本综述研究的局限性在于所调研文献的样本量。尽管PIML自诞生以来迅速扩展,但与其他技术领域相比,将PIML应用于CM系统的文献实例仍相对较少。本综述所概述的技术趋势与文献可能偏向某些作者或方法论,就CM应用而言,可能无法准确捕捉该技术的内在发展趋势。6 结束语 物理信息机器学习(PIML)方法为提升物理系统的预测建模提供了前景广阔的路径——其可通过利用底层基于物理的约束进一步增强传统数据驱动方法。通过将物理控制定律整合至学习算法中,PIML能够有效确定系统的非朴素且物理一致的表示,从而实现在训练数据之外的精确预测与外推。此外,PIML方法通过引导学习算法优先关注感兴趣区域并减少对大训练数据集的需求,促进了数据高效学习。物理定律的整合还增强了泛化能力,因为模型能自然处理外推并捕获不同条件或扰动下的行为。这项工作对这些方法进行了概述,重点是将物理知识集成到传统的机器朴素学习框架中的方法,以构建对系统底层物理原理具有更高理解深度与复杂性的预测模型。共计综述107篇文献,涵盖PIML在多个工程领域状态监测CM中的应用。在CM与故障检测的背景下,PIML方法利用已知物理原理与领域知识开发模型,以精确预测系统行为、检测异常并评估关键部件健康状态。通过这种整合,模型能更有效捕获系统变量间的复杂相互作用,从而以高灵敏度与特异性识别早期故障与异常。本研究详细探讨了当前将已知物理与ML方法整合的方法论,并根据系统物理知识的整合方式进行类别。此外,本研究综述了部分最流行的深度学习算法,简要解释其工作原理、固有优势及局限性。基于初步理解,本文详述了各学者研究中物理知识整合的最新创新。总的来说,确定了几个研究方向,包括物理引导的增强或特征空间,数据驱动的优化机制,物理指导的正则化,最后是物理引导的深度学习架构的设计。对每种研究途径的各种优势、缺点和局限性进行了解释,并就PIML范式与设备管理应用相结合的研究领域提出了建议。编辑:陈宇航校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、Tina、陈莹洁、王金、赵诚,肖鑫鑫该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈