首页/文章/ 详情

两分钟“跑完”建筑疏散仿真 | 新论文:基于生成式AI的建筑疏散模拟和安全设计

4小时前浏览25
 


论文:Han, J., Zheng, Z., Gu, Y., Lin, J. R., & Lu, X. Z. (2025). Generative Model-Based Building Evacuation Simulation for Safety Design. Journal of Building Engineering, 116, 114644.

DOI: https://doi.org/10.1016/j.jobe.2025.114644

转自公众 号:智能土木ABC


00

太长不看版    

       在人群高密度的大型建筑中,疏散效率往往决定生命安全,但传统基于Pathfinder等软件的疏散仿真高度依赖精细三维建模与大量参数设定,一次完整仿真往往需要十几到几十分钟,难以支撑方案阶段对“多开一扇门”“挪一段走廊”等设计改动的高频试错。为此,本文提出了一种基于扩散模型的建筑疏散代理仿真方法DiffEvac,让AI直接“从平面图读出疏散风险”,在仅输入平面功能分区和人群密度的前提下,快速生成接近高精度仿真的疏散热力图。

       在数据层面,研究团队收集了81份真实办公建筑平面,并通过功能置换与规范化人群密度标定扩展为399组“功能平面–疏散热图”样本。与以往直接使用彩色图像不同,DiffEvac 将平面信息拆解为“障碍-人群密度-出口位置”三通道特征张量,显式编码与疏散行为高度相关的几何与功能信息,显著降低了模型从原始图像中“自己猜语义”的难度。

       在方法层面,本文系统对比了U-Net、pix2pix、pix2pixHD等典型生成模型与扩散模型在疏散热图生成任务上的表现。结果表明,基于特征张量表示的扩散模型DiffEvac明显优于现有方法,对复杂、不规则平面具有更好的泛化能力。且DiffEvac对单个新平面的推理时间约为2分钟,相比传统Pathfinder建模与仿真的20分钟左右提升约一个数量级,在不同复杂度样本上均保持稳定的时间优势。

       更重要的是,DiffEvac使设计师在只有平面方案和人流预估时,就能快速获得疏散拥堵分布,并通过多轮“假如开一扇门”“假如改变房间功能”的测试修改,直观比较不同方案的安全性差异。该研究展示了生成式模型作为工程仿真代理的可行路径,为智能建造场景下的快速安全评估与人机协同设计提供了新的技术方案。


01

研究背景    

       在人口高度集聚的现代城市中,大型办公楼、综合体和公共建筑越来越复杂,一旦发生火灾、爆炸等突发事件,人群疏散效率往往直接关系到伤亡规模。因此,利用计算机仿真手段在设计阶段提前识别拥堵瓶颈、评估出口与通道布置,已经成为建筑安全设计的重要技术路径。目前工程界常用的Pathfinder等疏散仿真软件,多采用基于个体的精细化模型,能够较真实地再现行走速度差异、路径选择和局部拥挤等现象,为规范校核和专项评估提供了可靠依据。

       然而,这类高精度仿真工具高度依赖完整的三维建筑模型和详尽的人群参数设定,建模与参数标定工作量大,一次完整计算往往耗时十几到几十分钟。这种高成本特征,使其难以支撑概念方案和初步设计阶段对多轮备选布局的快速比较,导致“前期不算、后期返工”的现象在实际工程中仍然普遍存在。

       在此背景下,以扩散模型为代表的生成式人工智能展现出新的可能性。它们善于从大规模样本中自动学习高维输入与复杂输出之间的映射关系,有望学习到平面布局和疏散拥堵之间的隐含关联,从而作为传统仿真的代理模型。为此,本研究提出了基于扩散模型的疏散代理仿真框架DiffEvac,通过构建“障碍-密度-出口位置”的解耦特征表示,并在大量真实办公楼平面及其Pathfinder仿真结果上进行训练,实现从二维平面功能布局快速预测疏散拥堵分布,为建筑早期方案阶段嵌入安全性评估提供了一种轻量、高效的新路径。


 

图1 流程图


02

研究方法    

2.1 图纸处理与数据集构建

       疏散数据集的构建主要包含建筑平面草图处理、疏散模型仿真模拟及疏散数据集对齐三个子步骤。图2直观地展示了每个子步骤处理前后的图片数据。


 

图2 疏散图纸模型处理与数据集建立流程


2.1.1 建筑平面草图处理

       数据准备阶段,团队首先要解决的是“用什么楼来教会模型看疏散”。不同建筑类型人群差异很大(学校是未成年人、养老院是老年人、医院是行动不便人群),疏散速度和行为参数既难精确获取,也会显著影响仿真可信度。相比之下,办公楼主要由身体状况相对稳定的成年人使用,参数更集中可控。因此本研究选取真实办公建筑作为样本来源,收集了81份平面图,覆盖矩形、L形、T形、U形及不规则等多种布局,如图3所示,使模型从一开始就面对“工程里的复杂长相”,而不是理想化方盒子平面。


 

图3房间布局图概览


       基于这些CAD图纸,团队先剔除结构、施工等无关图层,仅保留墙体、门窗洞口并转为RGB图像。同时依据《办公建筑设计标准》和《图书馆建筑设计规范》为不同功能房间分配人员密度,并为每一类房间指定颜色,将“房间功能 + 占用密度”嵌入到同一张平面图中,如表1所示。


表1 不同用途的房间的人员密度

 


       最后,为扩充样本,在保持走廊、楼梯、出口不变的前提下,通过随机调整部分房间功能、重新标注密度的方式进行数据增强,使一张原始图纸可衍生出4–5张不同功能布局图,最终构建出399份带功能与密度标注的平面样本。


2.1.2 疏散模型仿真模拟

       本研究使用Pathfinder针对上述构建的399份功能分区平面逐一建立模型并进行疏散分析,得到模型训练目标的疏散云图。具体而言,参考SFPE《消防工程手册》等资料,将成年人最大行走速度设为1.19 m/s,并在各房间内随机布置人员,其余参数如表2所示。


表2 Pathfinder建模参数

 


       最终通过后处理,将仿真结果转为单通道疏散云图,并对每张图做归一化:灰度值 255 代表人群累计停留时间最长、最易拥堵的位置,0 代表最顺畅区域。这样,每一张功能分区平面都对应一张标准化的疏散云图,作为后续深度学习模型学习的真值标签。


2.1.3 数据集对齐

       由于功能分区平面图和疏散热力图来自不同软件,二者在像素和位置上存在轻微错位。为此,团队基于OpenCV和Pillow做了自动对齐。最后,将对齐后的图像统一缩放到256×256像素,图纸居中放置、四周预留至少5像素空白,在不拉伸变形的前提下尽量放大有效区域,形成标准化的训练数据集。


2.2 基于特征空间的数据集表示方法

       既有研究通常是把CAD图“涂成一张彩色图”:不同构件用不同RGB颜色编码,但墙体、人群密度、出口位置等物理信息都混在颜色里,模型既看不清重点,学习也更吃力。为此,本研究提出了一种“解耦特征表示”方法,把原本混在一张图里的关键信息拆成三层输入:障碍层(墙体等不可通行区域标记为1,其余为0),人群密度层(根据房间功能填入对应占用密度),出口位置层(楼梯、外门像素标记为1,其余为0)。三层与原始RGB图保持相同分辨率和尺度,但各自专注一类物理含义,既降低了学习难度,又让模型聚焦在真正与疏散相关的要素上。


 

图4 基于特征空间的数据集表示案例


2.3 DiffEvac: 基于扩散模型的疏散仿真模型

       本研究选取了近年在图像生成领域表现突出的扩散模型:先把一张真实图片一步步“加噪声”直至完全变成噪声,再训练一个深度神经网络学会如何把这团噪声一点点“洗干净”,最终还原出目标图像。具体实现上,本文采用U-Net作为去噪网络,并加入注意力机制。通过学习Pathfinder大量仿真得到的疏散热力图,最终实现用扩散模型代替传统仿真软件,从功能分区平面直接生成高质量疏散热力图。


 

图5 U-Net网络架构


       此外,本研究进一步纳入了GAN系列中的pix2pix和pix2pixHD模型进行对比:GAN由生成器和判别器组成,前者“画图”,后者“挑错”,双方在对抗训练中一起变强,如图6所示。


 

图6 GAN网络架构


03

实验设置与结果   

3.1 实验设置

       为系统比较不同模型与特征表示方案的优劣,研究共设计了10组对照实验,分别组合了不同的生成模型(U-Net、pix2pix、pix2pixHD、扩散模型)、两种输入形式(RGB三通道图像与特征空间表示),以及是否引入注意力机制。例如“D-F-Att”表示采用扩散模型(D)、解耦特征表示(F),并加入注意力机制(Att),便于对比分析不同配置对疏散热力图生成性能的影响。


表3 实验ID及对应参数

 


       最终,所有实验均采用NRMSE、SSIM和PSNR进行综合评估。


3.2 实验结果

       实验结果如表4所示,本研究设计的1–10组模型配置,全部在指标上优于现有工作,同时可以得出如下结论:

       (1)使用扩散模型并结合解耦特征表示的 “D-F”(即 DiffEvac)在三项指标上均表现最优。相较既有方法,SSIM最高提升约37.6%,PSNR提升可达约142%。

       (2)从整体架构比较来看,性能排序大致为:扩散模型> U-Net > pix2pix > pix2pixHD,这也说明在本研究这个确定性任务中,强调多样性生成的GAN并不占优。

       (3)对比“D-R”与“D-R-Att”、以及“D-F”与“D-F-Att”可以发现,引入注意力机制带来的收益并不明显,这与其在较低分辨率特征图上工作、难以捕捉墙体与出口等细节有关,也与疏散热力图更依赖全局格局而非局部纹理相关。

       (4)比较“D-R”与“D-F”、以及“D-R-Att”与“D-F-Att”可以看出,对于扩散模型而言,采用解耦特征表示明显优于直接用RGB图像作为输入。但在U-Net、pix2pix、pix2pixHD 等架构中,这种优势并不明显,说明解耦表示与扩散模型的组合更匹配。

       (5)“D-F”的领先还与输出采用单通道灰度疏散热力图有关。相比RGB输出,单通道大幅减少了模型参数与学习负担,让网络可以在相同数据量下更专注于学习空间拥堵分布,从而获得更高的预测精度。


表4 实验结果

 


       不同模型针对典型案例生成的疏散云图如图7所示。U-Net、pix2pix和pix2pixHD往往高估拥堵,尤其是在中部走廊等瓶颈区,预测的人群密度比真实结果偏高约 50%。而DiffEvac生成的热力图在拥堵位置与强度上都更接近Pathfinder仿真,只存在少量轻微偏差。


 

图7 不同模型生成的典型疏散云图


       研究还比较了DiffEvac在不同平面复杂度下的表现,并与pix2pix模型作对比。结果发现:随着房间和出口数量增多、布局愈加复杂,pix2pix的预测精度明显下滑,而DiffEvac在简单到复杂的各类平面上表现都比较稳定。这说明本方法在应对复杂真实建筑时泛化能力更强,用作疏散仿真代理更可靠。


 

图8 不同复杂度布局图的预测结果


04

案例验证    

       本研究针对一栋三层、总建筑面积约2500 m²、耐火等级一级的办公楼开展案例研究。首先将原始平面(图9(a))输入DiffEvac中,74秒内生成对应的疏散云图(图9(c))。可以明显看到,大量人流集中从下侧唯一的出口疏散,必须挤过一段狭长走廊,形成明显拥堵。

       因此,在会议厅右侧增设了一扇出口(图9(d)),再次用DiffEvac进行预测,得到新的疏散云图(图9(f))。结果显示,右侧人群开始就近从新增出口撤离,原本走廊上的高压区域明显“降温”,疏散压力得到有效分流。更重要的是,在这个案例中,DiffEvac的预测在全图范围内没有出现“偏差超过50%的像素”,与Pathfinder的真值热力图高度吻合(大约需要20分钟左右),进一步说明了模型的稳定性和可靠性,且效率提升接近16倍。


 

图9 基于DiffEvac实现案例评估与优化


       另外,研究还对比了不同复杂度平面下,DiffEvac 与Pathfinder仿真的耗时(如图11所示)。可以看到,随着房间和出口越来越多、布局愈加复杂,Pathfinder 的建模与仿真时间明显增长;而DiffEvac的预测时间几乎不随复杂度变化,始终保持稳定,并且在所有场景下都比Pathfinder快约 20 倍。这意味着在需要频繁调方案、做多轮对比的复杂建筑中,DiffEvac更适合用作实时疏散评估工具,兼具高效与可用性。


 

图10 不同复杂度平面图的模拟用时


05

研究结论    

       结果表明,DiffEvac在SSIM、PSNR等指标上相较已有方法最高提升约37.6%和142%,是目前同类任务中表现最好的方案;一张平面生成疏散热力图只需约2分钟,比传统仿真快约16倍,非常适合方案阶段做多轮快速试算。

       当然,当前模型主要在办公建筑上验证,尚未显式考虑老人儿童、响应时间差异以及火灾演化等因素。未来可以拓展到更多建筑类型和地区,引入更丰富的行为与灾害场景,甚至直接在三维模型上做扩散式疏散预测,更全面地服务复杂建筑的安全设计。


---End---



来源:陆新征课题组
振动非线性化学建筑消防BIM理论爆炸Opensees材料科普数字孪生控制
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-11-29
最近编辑:4小时前
地震那些事
博士 抗震防灾数值模拟仿真
获赞 83粉丝 67文章 633课程 0
点赞
收藏
作者推荐

新论文 | BIGNet:融合BIM语义、空间、拓扑多维表征的预训练图神经网络

转载自公众 号:智能土木ABC论文:Han, J., Lu, X. Z., & Lin, J. R. (2025). Pretrained graph neural network for embedding semantic, spatial, and topological data in building information models. Computer‐Aided Civil and Infrastructure Engineering.DOI: https://doi.org/10.1111/mice.7007300太长不看版 BIM作为建设工程的完整数字模型,它不仅包括工程实体的三维形体,还囊括了丰富的语义、空间、材料等多维信息,是工程师知识与智慧的结晶。因此,如何高效挖掘、提炼并复用BIM蕴含的丰富工程知识,已成为行业和学界的关注焦点。近年来,大模型等先进AI技术的发展为解决类似难题带来了新思路。其基本思路是利用复杂的深度神经网络学习海量文本、图像等数据中的复杂规律,并将其应用于系列文本对话、图像处理识别等任务。然而,如何让大模型高效地学习和处理BIM模型丰富而又高度关联的语义、空间、拓扑特征仍是领域面临的基础性难题之一。 因此,本研究提出了首个面向BIM模型的大规模图神经网络——BIGNet,旨在学习并复用多维度的BIM设计特征。首先,研究构建了一种可扩展的图表示方法,将BIM构件的“语义-空间-拓扑”特征进行编码,并建立了包含近百万节点和350万边的超大规模数据集。随后,基于GraphMAE2模型,引入新的消息传递机制与节点掩码训练策略,提出并构建了BIGNet模型。 多项BIM相关设计任务测试显示,BIGNet表现出显著优势。 BIGNet相比未预训练模型在平均F1分数上提升了72.7%,充分证明了其在学习与迁移BIM设计知识方面的有效性。研究同时揭示了不同网络特征对其性能的影响:1)同构图比异构图在设计特征学习上效果更佳;2)在30厘米半径内引入局部空间关系能进一步提升性能;3)基于图注意力网络(GAT)的特征提取方案取得最佳迁移效果。有关研究为智能设计带来了新思路,也为未来BIM全生命周期的智能化管理奠定了基础。01研究背景 近年来,建筑信息模型(Building Information Modeling,BIM)在可视化、人机协同设计、全生命期评估等方面取得了广泛应用,为工程设计和施工带来极大的便利。BIM的价值在于,它不仅仅是一个三维模型,更是一个融合了语义、空间、材料等多维信息的完整数据模型。在大量历史BIM模型中,蕴藏着建筑门窗的常见取值范围、构件之间的空间布局和连接方式等“设计规律”。这些规律源于无数工程师的实践经验,凝结着宝贵的工程智慧。因此,如何从海量BIM数据中挖掘、提炼并复用这些知识,已经成为行业和学界共同关注的焦点。 与此同时,人工智能的发展为这一难题带来了新的契机。AI在处理非线性和模糊问题方面展现出强大能力,能够帮助我们从复杂的工程数据中学习规律。但BIM模型的数据结构复杂,既包含三维几何信息,也包含大量非几何信息,而机器学习通常需要结构化的数据作为输入。这就带来一个新的挑战:如何把庞杂的BIM数据表征(“翻译”)为便于机器理解的形式,成为智能建造迈向下一步的关键。 除了BIM模型本身数据表征复杂这一难题外,缺乏足够的标注数据也是制约深度学习在BIM领域应用的一大瓶颈。毕竟,人工标注往往耗时耗力,而建筑工程的专业性又使得标注成本更高。近几年兴起的大模型及预训练、迁移学习相结合的范式为这一问题提供了新的思路。该范式能够利用海量无标注数据进行自监督学习,从中提炼出复杂的设计规律和工程经验,而这些通用知识又可以迁移到不同任务中去使用。受此启发,本研究将探索通过预训练GNN大模型的方法实现从BIM模型中学习并复用多维度的设计特征,并支持多种下游任务。从而,利用BIGNet让隐藏在复杂BIM模型里的设计知识真正“活”起来,为智能化的建筑设计与施工提供了强有力的支撑。 图1 流程图02研究方法 2.1 面向BIM的可扩展图表示方法 针对三维模型表征难题,提出了BIM“语义-空间-拓扑”多维特征的图表征方法。具体而言,基于Revit软件的API 接口开发BIM数据特征提取算法,提取模型中不同专业构件的属性及其相互间的拓扑关系,并将其以图节点和节点属性的形式表征为网络图结构形式,从而为后续学习和迁移模型中的设计规律奠定数据集基础。具体的属性提取方法如表1所示,图构造方法如图2、3所示:表1 构件语义、拓扑与空间特征的统一嵌入 图2 BIM模型的图表征方法 图3 BIM图表征示例 需要注意的是,图结构可以分为同构图(homogeneous graph)和异构图(heterogeneous graph)。在同构图中,所有节点都代表同一类型的实体,所有边也都是同一类型的关系;而在异构图中,节点和边的类型可以不同。不同的图结构会影响神经网络在训练时的消息传递机制,从而显著影响模型的学习效果。因此,在后续实验中,我们将比较两种图结构对模型性能的影响。 此外,本研究提出的表征方法可以将BIM模型中的错误检测转换为节点分类问题,从而显著简化模型审查任务。同时本方法也具有良好的可扩展性,可以根据实际应用中的下游任务增加或减少图节点和节点属性。2.2 BIGNet架构 本研究借鉴了部分GraphMAE2图神经网络预训练的架构学习构件的隐式空间排布规律,并进行改进扩大了应用范围,使其同时适用于同构图和异构图。通过遮蔽输入图中部分节点的方法,将网络预训练问题转化为节点特征解码重构的问题,促使模型自监督学习从局部信息恢复整个图形结构,如图4所示。 图4 GraphMAE2架构 在BIM数据中,两个语义节点之间往往夹着一个拓扑或空间节点。为了让模型在学习时不仅关注单个构件,还能理解周边构件的属性,我们在编码器和解码器中都采用了两层GAT网络。这样既能保证信息传递的完整性,又能控制计算成本。相比之下,已有的GraphMAE2方法只适用于同构图,而本研究则进一步探索了同构图和异构图对模型表现的影响。考虑到构件之间真实的物理关系,我们还对消息传递机制进行了改进,如图5所示。 图5 两层GAT网络消息传递机制 BIGNet让模型在编码时不仅能看见单个构件,还能理解它与周围构件的空间与拓扑关系。这样一来,模型就能捕捉到BIM数据中更深层次的空间排布规律,同时具备更强的全局特征表达能力。得益于此,BIGNet在小样本条件下也能顺利完成迁移学习任务。需要说明的是,在下游应用中,我们只保留encoder,用它来生成特征嵌入或进行微调,decoder和projector则会被舍弃。2.3 BIGNet在不同场景迁移学习中的表现 为了全面验证 BIGNet 的表现,我们挑选了工程中常见的三类错误场景:1)语义错误:构件的类别或属性设置不当,比如把墙体错误地建成了梁族,后续造价和维护就会出问题;2)取值范围错误:构件参数不符合行业规范,比如门的高度低于 200 cm 或高于 240 cm;3)拓扑关联错误:构件之间的连接关系出错或丢失,比如机电(MEP)构件与其连接件在修改或移动后出现缝隙,或者几何上虽相连,但属性关系却消失。需要注意的是本研究提出的方法可以实现将BIM模型中的错误检测转换为节点分类问题,如图6所示。 图6 将BIM审查问题转换为节点分类问题 BIGNet的迁移学习有两种方式:特征提取和微调。前者只用encoder提特征,后者会更新参数以适应新任务。分类器上,我们测试了MLP和GAT两种选择,最终形成三种方案:1)特征提取+MLP;2)特征提取+GAT;3)微调+MLP(如图7所示)。 图7 三种迁移学习策略03实验设置与结果 3.1 实验设置 本研究重点考察两组影响因素:1)图表征方法(参数见表2);2)迁移学习方法(参数见表3)。由于图表征与预训练、迁移学习属于相对独立的过程,本文不考虑二者的耦合效应。同时,为验证 BIGNet 的有效性,设置未预训练模型作为对照组。表2 图表征方法探讨 表3 迁移学习方法探讨 3.2 实验结果1) 不同图结构对模型性能的影响 实验结果表明:同构图比异构图更准、更快。虽然异构图能捕捉更多细节,但它太复杂、训练成本高,本研究里耗时甚至是同构图的5倍。反而是结构更简单的同构图,在小样本和有限资源条件下表现更好,也证明它足以让模型学到有效的节点关系。 图8 不同图结构的F1分数2) 空间关系取值范围对模型性能的影响 从图8可知,0.3 米的空间范围比 0.6 米更合适。虽然更大的范围能带来更多位置信息,但也让节点数暴增,增加了错误与正确节点的不平衡;而范围太小又会信息不足,导致判断失准。最终结果表明,0.3 米是最佳平衡点:既保证了信息充足,又避免了过度复杂。在后续研究中,我们也将空间关系的取值范围固定为 0.3 米。3) 不同迁移学习方法对模型性能的影响 从图9可知,在异构图中,微调(Fine-tuning)是效果最好的方法,原因在于数据量有限,直接从头训练难以奏效,微调现有参数更合适。但整体来看,异构图的表现还是不如同构图,这和之前的分析一致。因此,我们后续重点关注同构图的结果。 图9 不同迁移学习方法的F1分数 此外,和传统方法比,我们的方法在F1-score上提升了59.5%(MLP)和72.7%(GAT)。这说明它不仅能学到构件的属性,还能理解构件间的拓扑和空间关系,从而大幅提升模型对隐含设计规律的捕捉能力。换句话说,我们提出的BIM专属图数据集和预训练模型,让错误检测更准、更快,也能适用于多种BIM模型校核任务。04研究结论 本研究探索提出了基于大模型从既有BIM模型中提取、学习与复用设计经验的方法。首先,提出了一种针对BIM模型“语义-空间-拓扑”多维特征的图表征方法,并构建了相应的大规模预训练图神经网络BIGNet。据我们所知,这是直接面向多维BIM图数据构建大型预训练网络的初始探索。随后,通过基于迁移学习的多项BIM模型审查任务验证了所提方法的有效性,得到以下结论: (1) 当重点考虑构件 0.3 m 临近区域的空间关系,并将BIM表征为同构图进行预训练后,采用Feature extraction + GAT的迁移方式在审查任务中取得了最佳性能; (2) 与未预训练的模型相比,本文方法在BIM模型审查任务中的平均F1分数提升了59.5%(MLP分类器)和72.7%(GAT分类器),能够在建筑全生命周期中提供更精准、全面的信息支持; (3) 本方法适用于多类BIM模型审查任务,并在错误样本识别上更加严格,仅有极少数错误节点被误判为正确,进一步体现了方法的可靠性。 本研究突破了BIM数据复杂设计知识表征与提取的瓶颈,为未来迁移学习在BIM数据利用中的应用奠定了基础。引用本文: Han, J., Lu, X.Z., Lin, J.R.* (2025). Pretrained Graph Neural Network for Embedding Semantic, Spatial, and Topological Data in Building Information Models. Computer-Aided Civil and Infrastructure Engineering, 1-25. doi: 10.1111/mice.70073---End---来源:陆新征课题组

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈