论文:Han, J., Zheng, Z., Gu, Y., Lin, J. R., & Lu, X. Z. (2025). Generative Model-Based Building Evacuation Simulation for Safety Design. Journal of Building Engineering, 116, 114644.
DOI: https://doi.org/10.1016/j.jobe.2025.114644
转自公众 号:智能土木ABC
00
太长不看版
在人群高密度的大型建筑中,疏散效率往往决定生命安全,但传统基于Pathfinder等软件的疏散仿真高度依赖精细三维建模与大量参数设定,一次完整仿真往往需要十几到几十分钟,难以支撑方案阶段对“多开一扇门”“挪一段走廊”等设计改动的高频试错。为此,本文提出了一种基于扩散模型的建筑疏散代理仿真方法DiffEvac,让AI直接“从平面图读出疏散风险”,在仅输入平面功能分区和人群密度的前提下,快速生成接近高精度仿真的疏散热力图。
在数据层面,研究团队收集了81份真实办公建筑平面,并通过功能置换与规范化人群密度标定扩展为399组“功能平面–疏散热图”样本。与以往直接使用彩色图像不同,DiffEvac 将平面信息拆解为“障碍-人群密度-出口位置”三通道特征张量,显式编码与疏散行为高度相关的几何与功能信息,显著降低了模型从原始图像中“自己猜语义”的难度。
在方法层面,本文系统对比了U-Net、pix2pix、pix2pixHD等典型生成模型与扩散模型在疏散热图生成任务上的表现。结果表明,基于特征张量表示的扩散模型DiffEvac明显优于现有方法,对复杂、不规则平面具有更好的泛化能力。且DiffEvac对单个新平面的推理时间约为2分钟,相比传统Pathfinder建模与仿真的20分钟左右提升约一个数量级,在不同复杂度样本上均保持稳定的时间优势。
更重要的是,DiffEvac使设计师在只有平面方案和人流预估时,就能快速获得疏散拥堵分布,并通过多轮“假如开一扇门”“假如改变房间功能”的测试修改,直观比较不同方案的安全性差异。该研究展示了生成式模型作为工程仿真代理的可行路径,为智能建造场景下的快速安全评估与人机协同设计提供了新的技术方案。
01
研究背景
在人口高度集聚的现代城市中,大型办公楼、综合体和公共建筑越来越复杂,一旦发生火灾、爆炸等突发事件,人群疏散效率往往直接关系到伤亡规模。因此,利用计算机仿真手段在设计阶段提前识别拥堵瓶颈、评估出口与通道布置,已经成为建筑安全设计的重要技术路径。目前工程界常用的Pathfinder等疏散仿真软件,多采用基于个体的精细化模型,能够较真实地再现行走速度差异、路径选择和局部拥挤等现象,为规范校核和专项评估提供了可靠依据。
然而,这类高精度仿真工具高度依赖完整的三维建筑模型和详尽的人群参数设定,建模与参数标定工作量大,一次完整计算往往耗时十几到几十分钟。这种高成本特征,使其难以支撑概念方案和初步设计阶段对多轮备选布局的快速比较,导致“前期不算、后期返工”的现象在实际工程中仍然普遍存在。
在此背景下,以扩散模型为代表的生成式人工智能展现出新的可能性。它们善于从大规模样本中自动学习高维输入与复杂输出之间的映射关系,有望学习到平面布局和疏散拥堵之间的隐含关联,从而作为传统仿真的代理模型。为此,本研究提出了基于扩散模型的疏散代理仿真框架DiffEvac,通过构建“障碍-密度-出口位置”的解耦特征表示,并在大量真实办公楼平面及其Pathfinder仿真结果上进行训练,实现从二维平面功能布局快速预测疏散拥堵分布,为建筑早期方案阶段嵌入安全性评估提供了一种轻量、高效的新路径。
图1 流程图
02
研究方法
2.1 图纸处理与数据集构建
疏散数据集的构建主要包含建筑平面草图处理、疏散模型仿真模拟及疏散数据集对齐三个子步骤。图2直观地展示了每个子步骤处理前后的图片数据。
图2 疏散图纸模型处理与数据集建立流程
2.1.1 建筑平面草图处理
数据准备阶段,团队首先要解决的是“用什么楼来教会模型看疏散”。不同建筑类型人群差异很大(学校是未成年人、养老院是老年人、医院是行动不便人群),疏散速度和行为参数既难精确获取,也会显著影响仿真可信度。相比之下,办公楼主要由身体状况相对稳定的成年人使用,参数更集中可控。因此本研究选取真实办公建筑作为样本来源,收集了81份平面图,覆盖矩形、L形、T形、U形及不规则等多种布局,如图3所示,使模型从一开始就面对“工程里的复杂长相”,而不是理想化方盒子平面。
图3房间布局图概览
基于这些CAD图纸,团队先剔除结构、施工等无关图层,仅保留墙体、门窗洞口并转为RGB图像。同时依据《办公建筑设计标准》和《图书馆建筑设计规范》为不同功能房间分配人员密度,并为每一类房间指定颜色,将“房间功能 + 占用密度”嵌入到同一张平面图中,如表1所示。
表1 不同用途的房间的人员密度
最后,为扩充样本,在保持走廊、楼梯、出口不变的前提下,通过随机调整部分房间功能、重新标注密度的方式进行数据增强,使一张原始图纸可衍生出4–5张不同功能布局图,最终构建出399份带功能与密度标注的平面样本。
2.1.2 疏散模型仿真模拟
本研究使用Pathfinder针对上述构建的399份功能分区平面逐一建立模型并进行疏散分析,得到模型训练目标的疏散云图。具体而言,参考SFPE《消防工程手册》等资料,将成年人最大行走速度设为1.19 m/s,并在各房间内随机布置人员,其余参数如表2所示。
表2 Pathfinder建模参数
最终通过后处理,将仿真结果转为单通道疏散云图,并对每张图做归一化:灰度值 255 代表人群累计停留时间最长、最易拥堵的位置,0 代表最顺畅区域。这样,每一张功能分区平面都对应一张标准化的疏散云图,作为后续深度学习模型学习的真值标签。
2.1.3 数据集对齐
由于功能分区平面图和疏散热力图来自不同软件,二者在像素和位置上存在轻微错位。为此,团队基于OpenCV和Pillow做了自动对齐。最后,将对齐后的图像统一缩放到256×256像素,图纸居中放置、四周预留至少5像素空白,在不拉伸变形的前提下尽量放大有效区域,形成标准化的训练数据集。
2.2 基于特征空间的数据集表示方法
既有研究通常是把CAD图“涂成一张彩色图”:不同构件用不同RGB颜色编码,但墙体、人群密度、出口位置等物理信息都混在颜色里,模型既看不清重点,学习也更吃力。为此,本研究提出了一种“解耦特征表示”方法,把原本混在一张图里的关键信息拆成三层输入:障碍层(墙体等不可通行区域标记为1,其余为0),人群密度层(根据房间功能填入对应占用密度),出口位置层(楼梯、外门像素标记为1,其余为0)。三层与原始RGB图保持相同分辨率和尺度,但各自专注一类物理含义,既降低了学习难度,又让模型聚焦在真正与疏散相关的要素上。
图4 基于特征空间的数据集表示案例
2.3 DiffEvac: 基于扩散模型的疏散仿真模型
本研究选取了近年在图像生成领域表现突出的扩散模型:先把一张真实图片一步步“加噪声”直至完全变成噪声,再训练一个深度神经网络学会如何把这团噪声一点点“洗干净”,最终还原出目标图像。具体实现上,本文采用U-Net作为去噪网络,并加入注意力机制。通过学习Pathfinder大量仿真得到的疏散热力图,最终实现用扩散模型代替传统仿真软件,从功能分区平面直接生成高质量疏散热力图。
图5 U-Net网络架构
此外,本研究进一步纳入了GAN系列中的pix2pix和pix2pixHD模型进行对比:GAN由生成器和判别器组成,前者“画图”,后者“挑错”,双方在对抗训练中一起变强,如图6所示。
图6 GAN网络架构
03
实验设置与结果
3.1 实验设置
为系统比较不同模型与特征表示方案的优劣,研究共设计了10组对照实验,分别组合了不同的生成模型(U-Net、pix2pix、pix2pixHD、扩散模型)、两种输入形式(RGB三通道图像与特征空间表示),以及是否引入注意力机制。例如“D-F-Att”表示采用扩散模型(D)、解耦特征表示(F),并加入注意力机制(Att),便于对比分析不同配置对疏散热力图生成性能的影响。
表3 实验ID及对应参数
最终,所有实验均采用NRMSE、SSIM和PSNR进行综合评估。
3.2 实验结果
实验结果如表4所示,本研究设计的1–10组模型配置,全部在指标上优于现有工作,同时可以得出如下结论:
(1)使用扩散模型并结合解耦特征表示的 “D-F”(即 DiffEvac)在三项指标上均表现最优。相较既有方法,SSIM最高提升约37.6%,PSNR提升可达约142%。
(2)从整体架构比较来看,性能排序大致为:扩散模型> U-Net > pix2pix > pix2pixHD,这也说明在本研究这个确定性任务中,强调多样性生成的GAN并不占优。
(3)对比“D-R”与“D-R-Att”、以及“D-F”与“D-F-Att”可以发现,引入注意力机制带来的收益并不明显,这与其在较低分辨率特征图上工作、难以捕捉墙体与出口等细节有关,也与疏散热力图更依赖全局格局而非局部纹理相关。
(4)比较“D-R”与“D-F”、以及“D-R-Att”与“D-F-Att”可以看出,对于扩散模型而言,采用解耦特征表示明显优于直接用RGB图像作为输入。但在U-Net、pix2pix、pix2pixHD 等架构中,这种优势并不明显,说明解耦表示与扩散模型的组合更匹配。
(5)“D-F”的领先还与输出采用单通道灰度疏散热力图有关。相比RGB输出,单通道大幅减少了模型参数与学习负担,让网络可以在相同数据量下更专注于学习空间拥堵分布,从而获得更高的预测精度。
表4 实验结果
不同模型针对典型案例生成的疏散云图如图7所示。U-Net、pix2pix和pix2pixHD往往高估拥堵,尤其是在中部走廊等瓶颈区,预测的人群密度比真实结果偏高约 50%。而DiffEvac生成的热力图在拥堵位置与强度上都更接近Pathfinder仿真,只存在少量轻微偏差。
图7 不同模型生成的典型疏散云图
研究还比较了DiffEvac在不同平面复杂度下的表现,并与pix2pix模型作对比。结果发现:随着房间和出口数量增多、布局愈加复杂,pix2pix的预测精度明显下滑,而DiffEvac在简单到复杂的各类平面上表现都比较稳定。这说明本方法在应对复杂真实建筑时泛化能力更强,用作疏散仿真代理更可靠。
图8 不同复杂度布局图的预测结果
04
案例验证
本研究针对一栋三层、总建筑面积约2500 m²、耐火等级一级的办公楼开展案例研究。首先将原始平面(图9(a))输入DiffEvac中,74秒内生成对应的疏散云图(图9(c))。可以明显看到,大量人流集中从下侧唯一的出口疏散,必须挤过一段狭长走廊,形成明显拥堵。
因此,在会议厅右侧增设了一扇出口(图9(d)),再次用DiffEvac进行预测,得到新的疏散云图(图9(f))。结果显示,右侧人群开始就近从新增出口撤离,原本走廊上的高压区域明显“降温”,疏散压力得到有效分流。更重要的是,在这个案例中,DiffEvac的预测在全图范围内没有出现“偏差超过50%的像素”,与Pathfinder的真值热力图高度吻合(大约需要20分钟左右),进一步说明了模型的稳定性和可靠性,且效率提升接近16倍。
图9 基于DiffEvac实现案例评估与优化
另外,研究还对比了不同复杂度平面下,DiffEvac 与Pathfinder仿真的耗时(如图11所示)。可以看到,随着房间和出口越来越多、布局愈加复杂,Pathfinder 的建模与仿真时间明显增长;而DiffEvac的预测时间几乎不随复杂度变化,始终保持稳定,并且在所有场景下都比Pathfinder快约 20 倍。这意味着在需要频繁调方案、做多轮对比的复杂建筑中,DiffEvac更适合用作实时疏散评估工具,兼具高效与可用性。
图10 不同复杂度平面图的模拟用时
05
研究结论
结果表明,DiffEvac在SSIM、PSNR等指标上相较已有方法最高提升约37.6%和142%,是目前同类任务中表现最好的方案;一张平面生成疏散热力图只需约2分钟,比传统仿真快约16倍,非常适合方案阶段做多轮快速试算。
当然,当前模型主要在办公建筑上验证,尚未显式考虑老人儿童、响应时间差异以及火灾演化等因素。未来可以拓展到更多建筑类型和地区,引入更丰富的行为与灾害场景,甚至直接在三维模型上做扩散式疏散预测,更全面地服务复杂建筑的安全设计。
---End---