论文题目:
Towards efficient structural inverse an alysis based on AI-driven differentiable optimization method
论文期刊:Mechanical Systems and Signal Processing
论文日期:2025年
论文链接:
https://doi.org/10.1016/j.ymssp.2025.112618
作者:Chen Wang (a), Chong Zhang (a), Chen Yang (a*), Jian-sheng Fan (a,b)
机构:
a. Department of Civil Engineering, Tsinghua University, Beijing 100084, PR China;
b. Key Laboratory of Civil Engineering Safety and Durability, Ministry of Education, Department of Civil Engineering, Tsinghua University, Beijing 100084, PR China
第一作者简介:王琛老师,现任北京清华大学土木工程系助理教授。王琛老师长期从事结构计算力学与人工智能的交叉研究,主要研究方向包括数据与物理混合驱动的结构智能仿真、工程智能设计与优化、工程结构数字孪生等,致力于推动智能计算方法在重大工程结构安全与性能提升中的创新应用。在科研项目方面,他参与了多项国家级重要课题,包括国家重点研发计划子课题“重要历史建筑安全评估和全寿命期性能提升关键技术与应用示范”,以及国家自然科学基金项目“数据与理论混合驱动的工程结构体系智能计算方法研究”。相关研究成果已在《Mechanical Systems and Signal Processing》、《Advanced Engineering Informatics》等国际高水平期刊上发表多篇学术论文。(来源:https://www.civil.tsinghua.edu.cn/ce/info/1134/2436.htm)
1 摘要
2 引言
3 方法论
3.1 问题阐述
3.2 可微分反演分析框架
4 验证
4.1 案例概述
4.2 有限元模型仿真
4.3 代理模型实现
4.4 反演分析结果
5 讨论
5.1 模型参数分析
5.2 与传统算法的效率对比
6 结论
由材料疲劳和环境因素引起的结构劣化对工程结构的安全性与性能构成重大威胁。反演分析在从已观测的结构响应中识别内部状态参数方面发挥着关键作用,从而支持有效的维护与性能评估。然而,主流有限元模型更新(FEMU)方法在大规模或复杂系统中的应用面临显著挑战,主要体现在计算成本高昂与时间消耗过大。为克服这些局限,本文提出了一种基于人工智能驱动的可微优化结构反演分析框架。该框架集成了深度学习代理模型以替代有限元计算,大幅提升了计算效率;并结合基于梯度的优化方法以最小化资源需求。不同于依赖确定性端到端映射的传统人工智能方法,本框架将正向计算与反演分析解耦,能够对状态参数的概率分布进行估计,并适应多种潜在解。在一项关于受损钢筋混凝土(reinforced concrete, RC)框架-剪力墙结构的验证实验中,结果证明了该框架的有效性。单次迭代的损伤参数估计精度达 83.0%,通过迭代更新进一步提升至 88.2%,其空间分布与真实值高度吻合。与 FEMU 方法相比,该框架的全链条耗时缩短至原来的十分之一,部署后可在数秒内完成反演分析。其在状态参数与结构响应选择上的灵活性,确保了在多样化结构体系和监测策略中的适应性。
关键词:反演分析,可微分优化,基于人工智能的代理模型,损伤识别,结构健康监测
近几十年来,许多国家快速的城市化进程推动了大量建筑和基础设施项目的建设。然而,材料疲劳和环境因素导致许多结构出现损伤,损害了其力学性能和功能,为运营和维护带来了重大挑战。及时识别结构损伤对确保可靠性至关重要。除先进的损伤检测设备外,基于采集数据的结构状态反演分析在性能评估和预测性维护中发挥着关键作用。
目前,有限元模型修正(FEMU)是反演分析的主要方法。该技术通过迭代调整有限元模型(finite element model, FEM)的参数,使其力学响应与通过传感器测量的结构实际响应相匹配。当响应之间的残差低于指定阈值时,该模型即被视为真实结构的准确表征,从而可实现可靠的损伤评估。FEMU是典型反演分析过程的范例。灵敏度分析和启发式算法是修正有限元模型参数的两种主要方法。灵敏度分析通过评估输入参数变化对模型输出的影响,有助于识别过程中最关键的影响因素。基于灵敏度的FEMU方法建立在可测量输出与需要调整的结构模型参数之间的线性化基础上。然而,推导大规模复杂结构的灵敏度矩阵面临重大挑战,且有限差分等数值方法需要大量计算资源。
为克服这些局限性,研究人员在FEMU过程中引入了代理模型(如响应面法RS),显著加速了目标函数的评估并简化了其灵敏度计算。Zhou 等研究人员应用基于径向基函数的响应面法建立斜拉桥等大型结构的输入-输出关系模型,通过缩尺模型试验验证了该修正方法。另一种常用的FEMU方法是启发式算法。这类算法依靠经验法则、实践经验或合理推测来探索搜索空间,快速找到近似最优解,典型代表包括遗传算法(GA)、模拟退火算法(SA)和粒子群优化算法(PSO)。FEMU方法面临若干重大挑战,特别是在应用于大型复杂工程结构时。首先,大规模非线性有限元模型的计算既耗时又占用大量资源。根据结构复杂性和模型非线性程度,单次仿真可能需要数小时甚至数天才能完成,这使得实时应用和快速决策几乎不可能实现。其次,现有反演分析方法往往难以满足实际工程应用的需求。灵敏度分析技术通常仅限于小型线性结构,在处理复杂系统或非线性问题时效果会大打折扣。虽然启发式算法具有更强的灵活性并能处理非线性问题,但它们通常需要大量迭代才能收敛。每次迭代都需要运行有限元模型,消耗大量计算资源,导致这些方法计算成本高昂且耗时过长。
近年来人工智能(AI)方法特别是机器学习的进步,使得结构状态反演分析效率显著提升。与传统有限元方法相比,深度学习(DL)方法具有更快的计算速度,大幅提高了反演分析的整体效率。尽管这些基于AI的方法比FEMU更快,但它们存在一个显著局限:试图直接将结构响应映射至状态参数。这种端到端的方法虽然提高了分析效率并有利于大规模数据处理,但实测结构响应往往缺乏足够信息,导致结构响应与状态参数之间存在一对多的映射关系。机器学习模型具有确定性——对于给定输入(结构响应),模型只会产生单一输出(状态参数)。这种特性使得这些方法难以处理多个潜在解,降低了其在实际工程问题中的适用性。对于更复杂的结构形式,这些模型在训练过程中还可能面临收敛困难。
为解决这些挑战,本文提出了一种基于DL代理模型和梯度优化方法的可微分反演分析框架。该框架使用 DL 代理模型替代有限元模型进行正向计算,从而实现计算速度的数量级提升。同时,将反演分析任务构建为优化问题,利用神经网络的可微分特性,通过基于梯度的算法最小化时间和资源消耗。与现有基于DL的反演分析方法不同,本框架仅将DL用于正向计算,而反演过程则通过优化算法处理。这种方法使框架能够容纳结构损伤状态的多个潜在解,并提供状态参数的概率分布估计,而非固定数值解。
3.1 问题阐述
结构反演分析可理解为优化问题,其核心目标在于基于已知结构响应(如位移、应力或形变)估计未知状态参数(例如刚度折减或裂缝深度)。在此背景下,反演分析的目标是最小化模型生成的结构预测响应与从结构实际测得的响应之间的差异。这类似于典型的优化问题:通过调整未知状态参数(记为 )来最小化目标函数 ,该函数用于量化预测响应与实测响应之间的误差。令 表示预测结构响应, 表示实测响应,则目标函数可表述为:
其中‖・‖₂表示欧几里得范数,用于计算预测值与观测值之间残差的大小。优化过程的目标是找到使该损失函数最小化的最优参数集 :
通过迭代调整未知参数 ,反演分析寻求收敛于使误差最小化的解,从而有效地使模型"拟合"真实结构行为。这种基于优化的方法能够准确推断未知结构特性,对于理解复杂工程结构的行为与健康状态至关重要。
3.2 可微分反演分析框架
图 1 展示了本文提出的可微分反演分析框架。首先,为给定结构随机生成初始状态参数;随后将这些参数代入代理模型并施加外部激励(如地震作用);通过对比预测响应与实测响应,根据计算损失函数;最后基于损失函数进行梯度下降来更新状态参数。该过程迭代执行直至收敛。
图 1 可微分逆向分析框架的工作机制
基于深度学习的代理模型与基于梯度的优化方法是本框架的两大核心组件。然而方法部分暂不引入具体DL算法或梯度下降方法,因为本框架可适配任意DL算法与梯度优化方法,重点在于突出其解决反演问题的创新思路。当前主流反演分析方法(如基于灵敏度分析的FEMU方法或启发式算法)通过批量调整状态参数并进行有限元计算来获取对应结构响应,继而通过这些映射"观察"输入与输出间的可能关系并调整状态参数。这种优化过程是间接的——因其计算过程中不存在真正的从输出到输入的反向过程,导致计算资源浪费。由于有限元计算过程的梯度难以获取,无法通过有限元结合梯度下降来求解该优化问题。此外,直接将结构响应映射至状态参数的方法颠倒了因果关系,导致精度与泛化能力较差。基于研究现状,本框架的创新性与优势可归纳如下:
在前向计算方面,开发了深度学习代理模型以替代有限元法,大幅加速了正分析计算过程。与传统代理模型相比,深度学习技术能更精准地处理非线性结构分析问题。
在逆向计算方面,与有限元法不同,深度学习模型的梯度可便捷求解,使得梯度下降算法能够替代灵敏度分析或启发式算法,以更具针对性和直接性的方式优化状态参数,同时提升处理高维问题的能力。
该框架中深度学习代理模型显著减少了单次正分析所需时间,而梯度下降算法进一步降低了正分析次数,从而全面提升逆向分析过程的整体效率。
与现有将结构响应直接映射至状态参数的深度学习方法不同,本框架将深度学习严格限定于正计算环节。这种设计保持了分析过程的因果逻辑,能够输出多重潜在解并提供状态参数的概率分布估计。
3.2.1 基于深度学习的代理模型
精确的正向计算对逆向过程中模型更新时获取可靠状态参数估计至关重要,因此代理模型具有关键作用。代理模型不仅需精确模拟正向过程,还必须捕捉状态参数的影响。在所提出的可微分逆向分析框架中,代理模型不限于特定类型,其核心要求是模型计算过程必须可微分,而深度学习模型是最常见的选择。
神经网络构成深度学习的基础组成部分。通过层级之间的连接处理和学习信息,模拟人脑的工作机制。标准神经网络由 层组成,每层承担向量空间之间的映射任务。网络输入记作 ,通过全部层级转换后输出为 。第 层的输出表达式为:
其中, 是第 层的权重矩阵, 是偏置向量, 是激活函数(通常采用 ReLU、Sigmoid 或 Tanh 等非线性函数)。这些激活函数具有可微性,即存在 ,确保整个网络输出相对于输入是可微的。神经网络的最终输出为:
神经网络训练依赖于可微分性,采用反向传播算法计算损失函数 对每个参数 和 的梯度。该过程运用链式法则:
由于每层输出 具有可微性,因此可通过计算各层局部梯度来传播误差,并迭代更新权重与偏置。具体而言,对于任意激活函数 ,其梯度 被用于调节权重 和偏置 ,从而最小化损失函数 。
3.2.2 基于梯度的优化方法
在逆向分析的优化过程中,利用代理模型的可微特性。状态参数 通过基于梯度的优化方法进行更新,其核心原理是通过计算目标函数的梯度迭代调整参数,直至找到使目标函数最小化的最优解。
梯度表示函数值最速上升的方向,其计算公式如下:
其中, 可通过链式法则计算。唯一区别在于待优化参数现为状态参数而非权重参数。
实际应用中采用自动微分计算梯度。该方法在前向传播过程中记录运算操作,并在反向传播阶段应用链式法则计算各参数梯度,这种机制能高效处理复合函数。优化算法利用梯度信息确定最速下降方向,通过参数更新实现目标函数最小化。梯度下降法作为经典优化方法,其参数更新规则可表示为:
其中, 表示第 次迭代时的状态参数, 为步长(用于控制每次参数更新的幅度)。梯度下降法存在多种变体,例如随机梯度下降(SGD)、均方根传播(RMSProp)和自适应矩估计(Adam),可根据所解决问题的具体需求与特性选择适用算法。
4.1 案例概述
在先前研究中,对三层RC框架-剪力墙结构进行了振动台试验,采集加速度与位移时程数据。通过计算机视觉方法获取客观损伤参数,为本研究模型验证提供参考依据。试件共3层,每层高2300 mm,平面尺寸为4700 mm × 3000 mm。每层四角布置立柱,沿x轴方向设置剪力墙。楼板厚度80 mm,y轴方向次梁传递重力荷载。
图 2(a)-(c) 展示了72个损伤位置编号(不考虑次梁损伤)。如图 2(d) 所示,采用常用于非线性分析的MSC Marc软件建立结构有限元模型。模型中梁柱采用纤维梁单元模拟,剪力墙采用分层壳单元建模。两类单元均为三维单元,每个节点具有六个自由度。楼板通过刚体单元(RBE2)约束实现平面内刚性假定,无需明确定义楼板单元。基于刚性楼板假定,这种简化对常规结构带来的误差可忽略不计。荷载与楼板质量通过梁的传递密度施加。梁柱构件离散为100 mm单元段,损伤参数施加于端部相邻两个单元段。剪力墙在x方向按130 mm间距、z方向按100 mm间距划分单元。
图 2 试件基本信息及其有限元模型
本案例中,逆向分析的优化问题可表述为:状态参数 定义为损伤参数 ,其包含所有柱端、梁端及剪力墙的刚度折减系数 与强度折减系数 。这是由于梁柱的宏观损伤通常发生在构件端部。混凝土主要贡献抗弯刚度,钢筋则提供强度。因此,在对应有限元模型中,刚度折减 应用于混凝土强度参数,强度折减 应用于钢筋屈服强度参数。通过堆叠所有构件的损伤参数,形成损伤参数向量:
结构响应定义为各层加速度响应时程( )与结构固有频率( )。相较于频域特征,时域特征更能有效描述大规模非线性结构,因此选择 作为目标参数之一。若每层楼均安装加速度传感器,可通过收集震后加速度时程快速识别地震损伤。选择 是因为固有频率可通过多种结构检测方法获取,为结构健康状态提供额外重要信息。优化目标表述为:
其中, 表示在损伤参数为 时输出地震激励 作用下加速度响应的模型, 表示在损伤参数为 时输出固有频率的模型。 用于控制这两项的相对权重。
4.2 有限元模型仿真
虽然有限元模型未直接集成到所提出的逆向分析框架中,但其用于生成训练深度学习代理模型所需数据。在建立有限元模型后,采用实测加速度时程数据验证模型有效性。图3对比了x方向 JMA Kobe NS 波激励下顶层加速度响应的实测值与有限元计算结果。图3(a)中峰值地面加速度(PGA)为700 mm/s²,属于常遇地震水平。由于结构在此荷载下预期基本无损伤,模型中未考虑损伤效应。在12秒至15秒之间存在偏差,这可能是实际结构中未在模型内考虑的轻微损伤所致。总体而言,计算加速度响应与实测数据基本吻合。
图 3 有限元结果与实测结果的对比
图3(b)所示地震激励的峰值地面加速度(PGA)达到6200 mm/s²,这属于罕遇地震等级。在此之前,结构已承受2000 mm/s²和4000 mm/s²的地震激励作用,导致明显损伤。通过绿色曲线(未考虑损伤的有限元结果)与蓝色曲线(实测值)的对比可见:若不考虑损伤影响,计算结果呈现基频过高、振幅过低的特征,说明模型刚度估计偏大,对损伤单元材料强度作如下调整:
其中, 与 分别表示损伤前与损伤后的混凝土抗压强度, 与 分别表示损伤前与损伤后的钢材屈服强度。红色曲线(有限元结果,考虑损伤)表明,在引入损伤效应后,计算得到的频率与相位与实测数据吻合良好,尽管在幅值上仍存在一定差异。这些差异可能源于实验与有限元模型中损伤施加方式的不同,以及模型无法反映损伤随时间演化的局限性。尽管如此,引入损伤后得到的精度提升验证了所采用损伤机理的合理性,并为进一步数据生成、代理模型训练以及损伤识别提供了支持。
共抽取了1000组损伤参数,并分批用于建立有限元模型。有限元模型输出地震作用下的加速度响应与自振频率。采用了拉丁超立方采样(LHS)方法确定损伤参数,该方法具有良好的参数覆盖性。参数上下限由试验过程确定,如表 1 所示。这定义了损伤参数的先验分布,而损伤识别的任务即是利用实测数据推断后验分布。
表 1 损伤参数的上下限
图 4 展示了损伤参数的抽样分布,特别给出了ID为0、24和60的情况。在图4(a)中,各参数的边缘分布近似均匀;而图4(b)表明三个参数的联合分布在上下限范围内均匀覆盖整个参数空间。这表明LHS能够在有限的采样点数下有效覆盖参数空间。其他损伤参数的边缘分布也呈现类似特征。
图 4 抽样损伤参数的分布:(a) 损伤参数分布图; (b) 损伤参数散点图
图 5 给出了1000组样本对应的前三阶自振频率分布。本研究中 特别关注第二阶模态频率,因为其代表了结构在x方向上的主要水平振动模态,而该方向亦为地震作用方向。第二阶模态频率范围为1.82 Hz至2.05 Hz,中位值为1.95 Hz。
图 5 前三阶自振频率的分布
图 6 展示了各层归一化加速度响应时程的分布。加速度通过对输入地震动的PGA进行缩放并减去平均加速度以消除趋势实现归一化。横轴为时间步,纵轴为归一化加速度,亮色 区域表示数据点集中度较高。该分布呈现均匀且离散的特征,适合作为代理模型的训练数据。
图 6 归一化加速度响应时程的分布
4.3 代理模型实现
本节实现了两类代理模型:加速度响应代理模型 与自振频率代理模型 。这些模型的结构及实现过程将在后续小节中详细介绍。
4.3.1 代理模型的结构
模型 的输入包括地震激励加速度 与损伤参数 ,序列 的维度为 ,其中 为总时间步数,离散时间步从 到 , 为总时长。损伤参数向量 的维度为 ,其中 为构件总数。模型的输出为加速度响应 ,其维度为 ,其中 为结构的层数。换言之, 表示所有楼层加速度响应序列的拼接结果。
结构的加速度响应属于非线性动力系统。理想的代理模型应采用自回归方式生成响应,即基于地震激励与先前的输出逐步预测每一时间步。这与有限元中的非线性时程分析类似,通过本构关系与牛顿第二定律更新状态变量(如塑性应变与应力)。然而,自回归模型对误差极为敏感,每一步预测均依赖于前一步结果,微小误差会逐渐累积,最终导致显著偏差。在损伤识别之前,完整的实测加速度响应序列已知。因而在预测每一时间步时,模型可以将前一时间步的实测响应作为输入。因此,加速度响应代理模型可表示为:
其中, 表示在时间步 的预测加速度响应。加速度响应代理模型基于 Transformer 架构构建,如图 7 所示。该架构是序列预测领域表现突出的深度学习模型。
图 7 加速度响应代理模型的结构
输入到 Transformer 模型的地震加速度激励需要进行线性维度变换与特征增强,如图 8 所示。地震激励 首先由一维线性变换至模型维度 。同样,损伤参数 也被线性变换至 ,并复 制 次。二者随后逐元素相加,以确保每个时间步都包含完整的损伤参数信息。
图 8 输入序列的特征增强
模型 的结构较为简洁,因为其预测损伤结构的自振频率,不涉及序列处理。 的输入为损伤参数向量 ,输出为自振频率 ,其维度为 ,表示前 阶频率。该模型采用多层感知机(MLP)实现,如下所示:
其中,MLP 由全连接层构成,每一层的神经元与下一层的所有神经元相连。在每个隐藏层之后引入非线性激活函数,以增强模型的表达能力。
4.3.2 代理模型的训练
由于自振频率代理模型实现简单且精度较高,本文主要关注加速度响应代理模型的训练过程。本文训练了两类加速度响应模型:一阶模型与二阶模型。一阶模型基于时间步 至 的输入数据预测 时刻的加速度响应,而二阶模型则在相同输入条件下预测 时刻的响应。由于地震反应分析的时间步较小(0.012 s),加速度的变化幅度有限,因此模型仅通过将当前响应平移至下一步即可达到较高精度。但这种方式可能导致模型忽略损伤参数,从而降低反演精度。为解决这一问题,同时训练了二阶模型以提升准确性。表2列出了两类代理模型的主要结构参数。模型参数总数为364,227。
表 2 代理模型架构参数
两类模型的训练曲线如图 9 所示。经过20,000次训练后,一阶模型在测试集上的精度达到97.16%,二阶模型则为94.26%。训练集与测试集精度接近,表明模型不存在过拟合。对比而言,一阶模型的训练确实比二阶模型更为容易。
图 9 加速度响应代理模型训练曲线:(a) 一阶模型训练曲线; (b) 二阶模型训练曲线
表 3 将两类代理模型的精度与朴素模型进行了比较。朴素模型仅通过复 制当前加速度来预测下一步响应,作为基线模型,任何有效的代理模型都应优于其表现。结果显示,一阶与二阶模型的精度均显著提升,能够有效捕捉损伤参数的影响。
表 3 代理模型精度对比
4.4 反演分析结果
采用二阶加速度响应代理模型与自振频率代理模型对结构损伤参数进行更新。图 10 展示了随着迭代步数增加,模型更新精度的变化情况。在过程初期,为避免过早收敛而设置的较大优化步长,导致代理模型精度与损伤参数精度均出现明显振荡。约10步之后,随着迭代的继续,代理模型精度逐渐提高。与此同时,损伤参数的精度也随之提升,并与代理模型的改进趋势高度一致。
图 10 精度随更新步数的变化曲线
图11给出了结构损伤参数的空间分布。为简明起见,主要展示了结构朝南面的真实值与预测值。颜色越深的圆点表示损伤参数越接近1,即损伤越轻。整体来看,刚度与强度削减系数均被合理估计。但在部分构件中,尽管整体损伤程度估计准确,构件两端的相对大小却出现反转。
图 11 损伤参数的空间分布
这说明该方法在构件层面具有较高精度,但在构件端部层面尚存在不足。有关预测与真实损伤参数的详细对比见表4。
表 4 真实与预测损伤参数对比
对于刚度削减系数,三层梁及二层剪力墙左侧梁的估计较为准确。尽管二层右侧梁两端的损伤系数出现反转,但整体数值与真实值接近。同样,一层左侧梁的估计准确,而右侧梁右端存在一定误差。柱类构件的估计精度相对较低。二层柱与一层、三层右侧柱的估计与真实值吻合,但一层与三层的左侧柱系数出现反转。二、三层剪力墙的刚度削减系数预测准确,但一层剪力墙上下端存在反转。对于强度削减系数,大多数构件损伤较轻,仅在三层剪力墙右梁左端、一层剪力墙左梁左端、三层右柱两端、二层左柱上端以及一层左柱两端存在较大损伤。所提方法在7处显著损伤中成功预测了6处。
如前所述,单次模型更新的精度可能因随机性而存在差异。由于本研究采用基于梯度的优化算法,损伤参数的初始值会影响结果。为此,进行了多次模型更新,以估计损伤参数的近似概率分布。图 12 展示了在100次更新后,4处损伤位置的初始与最终概率分布,利用高斯核的核密度估计(KDE)获得。
图 12 损伤参数的初始与最终概率分布
为更清晰展示更新前后的变化,对分布进行了对称化处理,并根据表1中的上下限对分布区间进行了截断。纵轴表示对应损伤参数值的概率密度。浅蓝色分布为初始状态,浅橙色为更新后的状态,绿色线为真实值,蓝色与橙色线分别为初始与最终分布的中位数。更新后,概率分布由均匀状态逐渐集中于真实值附近,中位数也更接近真实值。这表明多次模型更新能够降低损伤参数估计的不确定性。
虽然近似概率分布能全面反映损伤参数的分布情况,但在实际应用中通常需要一组具体的参数估计值,例如作为有限元模型输入进行剩余承载力分析。概率分布常用的统计量包括均值、中位数与众数,不同分布类型下各有优势。表 5 给出了这些统计量的精度,单次试验的精度按所有试验的平均值计算。结果表明,统计量的精度均优于单次试验,其中均值提升了5.2%,为最高增幅。因此,在实际应用中,可通过对多次模型更新结果取平均来获得损伤参数的估计值。
表 5 多次模型更新后损伤参数估计精度对比
在完成损伤参数估计后,将其输入有限元模型进行完整的时程分析,以验证代理模型更新参数的有效性。结果如图 13 所示,修正后的结构加速度响应(橙色虚线)与基于真实损伤参数的响应高度一致,仅在二层与三层少数峰值点存在微小差异。
图 13 使用真实与预测损伤参数的有限元结果对比
5.1 模型参数分析
本节通过分析关键模型参数,评估其对损伤参数识别精度的影响。对比参数包括:
模型阶数:指预测加速度响应与当前时间步之间的时间步距离。本文对比了一阶、二阶和三阶模型的性能表现。
特征增强方法:采用加法特征增强,另一种可选方案是拼接法——将加速度激励与损伤参数经线性维度变换后沿特征维度拼接。为保持维度大小为 ,需先将加速度激励和损伤参数的特征维度降至 再拼接。
模型维度( ):考察64(原始)和128两种维度设置对精度的影响。
表 6 展示了不同模型配置对损伤参数估计精度的对比结果。在一阶、二阶和三阶模型中,二阶模型的损伤参数估计精度最高,三阶次之,一阶最低。这可能是因为一阶模型虽易于训练,但从损伤参数中获取的信息增益有限。尽管三阶模型信息增益更大,但其估计精度仅略高于一阶模型且低于二阶模型。这可能源于其对加速度响应的预测精度较低,限制了目标函数的最小化进程,从而制约了最终估计精度。因此,要实现准确的损伤参数估计,既需要结构响应的高预测精度,也需要损伤参数带来的显著信息增益,二者对模型更新均至关重要。
表 6 不同模型参数对损伤参数估计精度的影响
在特征增强方法方面,加法优于拼接法。对于相同二阶模型,加法最高精度达88.2%,而拼接法为87.4%。就模型维度而言,128维和64维的最高精度持平,表明维度大小对精度影响甚微。但需注意:128维模型参数量达1,424,771个,是64维模型(364,227个参数)的3.9倍。为节约计算资源,实际应用中建议将模型维度设置为64。
5.2 与传统算法的效率对比
表 7 给出了本文提出的反演分析框架与采用启发式算法的有限元模型更新(FEMU)方法的效率对比。假定两种方法均需进行相同迭代次数,且每次有限元时程分析耗时40分钟。本文框架需要数据生成与训练阶段——生成1000组数据耗时40000分钟,代理模型训练额外增加55分钟。FEMU方法无需这两个步骤,节省了相应资源。在模型更新阶段,本文框架每次评估仅需0.03秒,而FEMU方法依赖时程分析,每次评估需40分钟。当种群规模为50时,FEMU方法每轮迭代需2000分钟,200次迭代总耗时达400000分钟;相比之下本文框架仅需6秒。
表 7 反演分析所需时间资源对比
有限元并行计算可加速两种方法:本文框架通过缩短数据生成时间实现加速,而FEMU方法则通过减少每轮迭代中的模型评估时间实现加速。在50进程并行条件下,本文框架数据生成时间降至800分钟,总时间缩短至855分钟;FEMU方法则需8000分钟。若采用无限并行方案,本文框架总时间可进一步压缩至95分钟,但FEMU方法仍保持8000分钟(因每轮迭代仅需50次评估,并行度受限)。对比结果表明:相较于采用启发式算法的FEMU方法,本文提出的框架具有显著的时间效率优势。
本文提出了一种可微分的反演分析框架,将基于深度学习的代理模型与梯度优化方法相结合。通过对受损钢筋混凝土(RC)框架-剪力墙结构的结构状态预测验证了该框架的有效性,证明其具备准确执行反演分析的能力。主要结论如下:
(1) 基于 Transformer 的加速度响应代理模型实现了超过 94.26% 的预测精度,成为一种可靠工具,可在模型更新过程中快速评估结构响应。该能力显著加速了损伤识别与模型修正的迭代过程。
(2) 在单次模型更新中,损伤参数估计精度达到 83.0%,其空间分布在构件层面与真实值高度吻合;多次更新后,精度进一步提升至 88.2%。此外,该框架可提供状态参数的概率分布,而非固定取值,从而增强结果的稳健性。
(3) 损伤参数估计精度取决于代理模型的预测精度与损伤参数所提供的信息增益。较高的预测精度可确保结构响应评估的可靠性,而更大的信息增益则使框架更好地捕捉损伤参数的影响。两者之间的平衡至关重要。
(4) 所提框架具备极高效率,部署后在处理时程数据时仅需数秒即可完成反演分析。即使在全链条实现(包含数据生成与训练)的情况下,其所需时间资源也仅为依赖启发式算法的有限元模型更新方法的十分之一。
(5) 该框架在状态参数与结构响应的选择上具备高度灵活性,可适应多种结构体系与监测策略,从而拓展了其应用前景。