性能测试｜告别卡顿！云端解锁ParaView并行渲染，千万级网格模型可视化

4月前浏览524

ParaView是一款开源的通用数据分析和可视化工具，用于处理各种类型的科学和工程数据集。它可读取多种数据格式，常见的如VTK、CSV、XDMF等。同时，ParaView也是一个跨平台的工具，不仅支持Windows、Linux和Mac OS等操作系统，还可以在多种计算机架构上运行，如x86、POWER、ARM等。支持这些并行架构意味着ParaView可以并行处理庞大的数据集，收集各进程上的结果，并将其可视化。在可视化方面，ParaView提供了许多通用的可视化技术用于显示和分析工程数据集，如切片、等值面、流线、轮廓、高级渲染等。

本文主要介绍 ParaView在SimForge™高性能仿真云平台上的使用，通过对算例热点函数的性能加速分析，发现增加GPU数量对数据I/O、数据生成和数据提取操作的并行加速效果非常可观。

01 什么是可视化

可视化过程是指将原始数据转为一种可以直接显示并且易于理解的形式。这个过程可以帮助用户更好地理解数据，从而揭示数据背后的隐藏关系。在ParaView中，可视化过程通常包括三个步骤，分别是读取数据，过滤数据和渲染数据。

读取数据即是从数据源文件中获取数据，存储在ParaView支持的数据类型中。

过滤数据即是根据不同需求对数据进行预处理，常见有以下操作：

1、切片（Slice）

是通过在数据集上切割平面，选择切割平面的位置和方向，并调整可见的切片厚度来显示沿着该平面的数据分布。如下图所示，图中为某平面上速度的数据分布。

在神工坊ParaView上体验并行渲染可视化的图1

2、等值面（Isosurface）

是将数据集中的特定数值的表面提取出来，以显示数据的连续性或离散性。根据需求，设置不同的等值面数值。如下图所示。

在神工坊ParaView上体验并行渲染可视化的图2

3、流线（Streamlines）

是根据数据集中的矢量场信息，绘制流线以显示流体或气体的流动路径和速度。可以根据需要调整流线的密度和长度。如下图所示。

在神工坊ParaView上体验并行渲染可视化的图3

4、高级渲染（Advanced Rendering）

即是提供各种高级的渲染技术，如体绘制、体积渲染、阴影、反射等，以增强可视化效果和表达能力。

02 如何在神工坊平台上使用ParaView进行并行渲染？

首先，用户需要在神工坊平台上运行ParaView实例，具体操作如下图。神工坊目前已经为用户完成并行运行模式的配置，用户只需要选择适合的CPU和GPU数量即可开始体验。

在神工坊ParaView上体验并行渲染可视化的图4

在渲染上，ParaView实际是调用了IceT库实现其并行渲染算法。IceT是一个开源的并行图像合成库，主要用于在大规模并行计算环境中可视化和渲染应用程序。IceT库提供了高效的并行渲染方法，适用于需要处理大规模数据集的可视化应用程序。ParaView通过库中sort-last算法进行并行渲染，算法将图像分割成多个小块，每个处理器都独立地渲染它所负责的块，并生成局部图像。然后，利用通信库（MPI）将这些局部图像组合起来，形成最终的合成图像。

在神工坊ParaView上体验并行渲染可视化的图5

03 GPU性能加速对比分析

本文通过展示水下机器人算例流场的可视化过程，对GPU性能加速效果进行对比。该算例描绘的是水下机器人在静水域中，上方四个螺旋桨旋转引起的流场演化过程。源数据为某时间步，整个流场的速度场。我们对速度场在某一平面进行切片并且叠加上四个螺旋桨的涡量等值面。可视化结果如下图所示。

在神工坊ParaView上体验并行渲染可视化的图6

上述可视化过程可被抽象为四个部分：数据I/O、数据生成、数据提取和数据渲染。

在神工坊ParaView上体验并行渲染可视化的图7

图注：以1个GPU为例，展示切片过程中每个步骤的耗时。

其中， Execute Slice为数据生成过程，用于计算并存储在某平面上的数据。 RenderView::Update为数据提取过程，负责提取在这个平面上的数据，提供用于渲染。 Still Render为全分辨率渲染过程。

在神工坊ParaView上体验并行渲染可视化的图8

图注：在每个处理器上，等值面绘制过程中每个步骤的耗时。

下面将展示不同资源配置下，切片和等值面绘制在数据I/O、生成、提取、渲染上的耗时，从而说明增加GPU对上述四个部分的加速效果。

1、数据I/O

源数据数据大致为 6000万网格，大小约2.75G。

下表记录了 ParaView读取数据操作耗时，括号内为增加GPU数量的加速比。

GPU数量操作

X3R::RD

69.23s

31.60s （119%）

22.64s（205%）

12.44s (456%)

在神工坊ParaView上体验并行渲染可视化的图9

2、数据生成

下表记录了切片和等值面绘制的数据生成操作耗时，括号内为随着GPU数量增多，效率的加速比。

GPU数量操作

Execute Slice

17.39s

8.66s(101%)

4.42s(293%)

2.17s(701%)

Execute Contour

38.42s

20.23s(89.9%)

10.15s(377%)

6.5s(491%)

在神工坊ParaView上体验并行渲染可视化的图10

3、数据提取

下表记录了切片和等值面绘制的数据生成操作耗时，括号内为随着GPU数量增多，效率的加速比。

GPU数量操作

Slice Update

0.661s

0.363s(82%)

0.332s(99%)

0.147s(350%)

Contour Update

2.935s

1.619s(81%)

1.221s(140%)

0.843s(248%)

在神工坊ParaView上体验并行渲染可视化的图11

4、数据渲染

下表记录了数据提取完成后，切片和等值面绘制过程中数据渲染操作耗时。

GPU数量操作

Slice Still Render

0.22s

0.28s

0.25s

0.34s

Contour Still Render

1.05s

0.88s

0.9s

0.98s

04 结论

综上所述，通过对这些热点函数的性能分析，可以看到增加GPU数量对数据I/O、数据生成和数据提取操作的并行加速效果非常可观。考虑到本次展示的数据集较小，仅为6000万网格，可以推断，选用更为精细的数据集则加速效果更为明显。

仿真科普｜弥合市场需求断层，高性能仿真，“性能”与“安全”如何兼得？

2025年3月，塔塔科技（TataTechnologies）确认曾在去年遭受勒索软件组织“猎手国际”（HuntersInternational）的攻击，1.4TB工程数据被窃取，涉及航空发动机热障涂层工艺参数等超过73万份文件。X-PHY首席执行官兼联合创始人CamelliaChan对此事发表评论称：“2024年，工业领域成为受攻击最严重的行业之一。”[1]此类事件并非偶发，据IBM发布的2024年《数据泄露成本报告》显示，全球企业应对数据泄露的平均成本已从2023年的445万美元增加至488万美元，增长幅度达10%。图片来源：网络工业仿真涉及国防、航空航天、汽车等关键领域，其数据关乎产品研发等核心商业机密。云计算虽可提供弹性算力，但虚拟化架构的网络通信瓶颈等，难以满足高保密场景需求。在此背景下，“安全超算”应运而生，通过物理隔离、全链路加密与多重管控，构建起高性能仿真的“数字护城河”。01安全超算仿真的定义：从“可用”到“可控”的跃迁安全超算仿真指通过物理隔离、全流程数据管控、人员管控及合规资质体系，为高价值工程仿真任务提供“计算-存储-传输”三位一体的可信环境。安全超算并非简单的“加密+算力”组合，而是通过物理隔离、全流程数据管控、人员管控和高性能硬件适配，构建从数据生成到销毁的闭环防护体系。其核心目标是在释放超大规模算力的同时，确保数据的0延迟、0残留、0泄露、0篡改，及非授权人员等外部环境0接触。图片来源：网络02安全超算在工程仿真中的应用：效率与安全的博弈1商业机密与数据安全工业仿真数据涵盖材料参数、设计图纸等核心信息，一旦泄露可能引发技术抄袭或供应链威胁。以某航天研究所为例，通过在物理层面实现隔离，为其工程仿真数据提供了独立的存储和处理环境，防止数据在传输和存储过程中被窃取或泄露。同时，严格的门禁管理和监控系统，可确保仅授权人员能够接触到核心数据和设备，进一步增强了数据安全防护能力。2超大规模仿真算力刚需在工业仿真领域中，超大规模仿真成为了众多行业的刚需。从航空航天到汽车制造，从风电能源到工程机械，各行各业面临着越来越多的复杂仿真任务，如飞机的空气动力学分析、汽车的碰撞模拟、多域多物理耦合等。以某航发企业为例，安全超算凭借其强大的计算能力，为其10亿级网格求解，100万核心并行提供了坚实的支持。安全超算弹性调度算力资源，并通过先进的并行计算技术，将大规模仿真任务分解为多个子任务，分配到不同的计算核心上同时进行处理，从而大大提高了仿真效率。然而，当前工业仿真市场正陷入两难困境：主流公有云平台虽能提供弹性算力调度，却普遍缺乏军工级保密能力——数据加密仅依赖软件配置，硬件架构沿用通用服务器。而另一侧，少数具备物理隔离能力的保密方案，又受限于算力规模与协同效率。这种“算力与安全不可兼得”的割裂现状，使得企业不得不在研发效率与数据安全之间做出妥协。03困境破局：「神工坊」安全超算服务框架面对工业仿真市场“效率”与“安全”二律背反的困局，神工坊®安全超算服务以独特的服务框架优势填补了这一空白。1物理隔离：构筑数据“保险箱”硬件层面，指客户独立上机环境——独享从CPU、硬盘到网络交换机的全套设备，彻底杜绝共享资源池的交叉污染风险；网络层面，网络资源配置由专线连接，外部网络无法访问计算节点，同时具备高带宽、低延迟、高稳定性的特点，能够满足稳定快速传输需求。2存储安全：全流程数据管控图片来源：网络介质携带与寄送：存储介质（如硬盘、光盘等）的携带与寄送需遵循严格的安全规范。对于涉密或敏感数据，介质在运输前需进行密封处理，使用防篡改封条或专用安全箱包装，并选择具备资质的物流公司或专人传递。[2]运输过程中全程记录，确保介质不受物理损坏或非法访问。[3]可导入导出审计：存储安全审计是对存储系统的安全性进行评估和监督的过程。具体指数据导入导出操作，需通过审计机制实现全流程监控。系统会记录操作时间、操作用户、数据内容、存储介质标识等关键信息，并结合自动化工具检测异常行为（如超量导出或非授权访问）。[4]可数据覆写擦除：数据覆写是指通过技术手段覆盖存储介质原有信息，确保其不可恢复。神工坊®采用Gutmann法，对硬盘等存储介质进行35次覆写。可硬件物理销毁：物理销毁是通过破坏存储介质的物理结构彻底消除数据。常见方法包括：机械粉碎、消磁处理、高温熔毁。销毁工作应授权人员全程监督，视频监控存档，以备后续查证并确保销毁过程的合法性和合规性。最后进行验证，使用取证工具尝试恢复数据，确认无有效残留。可溯源操作日志：操作日志是存储安全的核心追溯工具，需记录用户身份、操作时间、动作类型（如读取、修改、删除）、目标对象及IP地址等详细信息。例如，所有数据访问需通过多因素认证，日志实时同步至独立审计服务器，防止篡改，并为合规审查提供证据链。3合规保障：保密资质背书国家三级等保资质，全称“国家信息安全等级保护第三级认证”，是我国对非银行机构信息系统的最高级别安全认证，由公安机关依据《信息安全等级保护基本要》等法规进行评定，旨在对涉及国家安全、社会公共利益及重要行业领域的信息系统实施分级保护。4人员与环境管控：门禁监控的闭环防护神工坊®通过生物识别、权限分级（按岗位划分可访问区域）和动态权限管理（临时通行证时效控制）等技术手段，对人员物理出入进行精准控制，并对物理环境、设备运行状态及人员行为，进行全天候监控与记录。5超大规模算力：超算并行突破在工业仿真领域，算力规模往往决定着研发效率的“天花板”。神工坊®集成GPU/国产超算/X86平台，可实现10亿级网格求解，支持100万核心并行计算，实现典型算法加速30+倍，大大压缩了仿真所需时间。04总结在全球化竞争与技术封锁并行的今天，工业仿真的安全防线早已超越了技术范畴——它关乎企业核心资产存亡，更关乎产业安全的命脉。神工坊®通过物理隔离、全流程数据及人员管控与高性能硬件适配的三重保障，为您的工业数据安全保驾护航。参考资料：[1]gltian.印度塔塔科技遭勒索攻击，1.4TB数据被泄露[EB/OL].[2025-03-10].[2]数据库安全.《数据安全能力成熟度模型》实践指南07：存储介质安全[EB/OL].[2021-02-23].[3]计算机与网络安全.构建网络安全运维管理体系[EB/OL].[2021-02-23].[4]存储安全审计[EB/OL].[2024-11-25].

性能测试｜告别卡顿！云端解锁ParaView并行渲染，千万级网格模型可视化

01 什么是可视化

1、切片（Slice）

2、等值面（Isosurface）

3、流线（Streamlines）

4、高级渲染（Advanced Rendering）

02 如何在神工坊平台上使用ParaView进行并行渲染？

03 GPU性能加速对比分析

1、 数据I/O

2、数据生成

3、 数据提取

4、 数据渲染

04 结论

仿真科普｜弥合市场需求断层，高性能仿真，“性能”与“安全”如何兼得？

1、数据I/O

3、数据提取

4、数据渲染