汽车设计是一个多学科的复杂过程,需要在工程性能和美学吸引力之间取得平衡。传统设计流程存在效率低、耗时长等问题。例如,从概念草图到最终设计的实现往往需要数周甚至数月时间。与飞机设计(主要关注功能性能和安全性)不同,汽车设计深受造型和品牌身份的影响,是一个兼具工程性和艺术性的过程。
来自MIT的这篇论文提出一种新的方法,将AI设计代理(AI Design Agents)集成到概念设计阶段,利用人工智能、机器学习和自动化技术来自动化关键任务,从而加快从初始草图到完全模拟的气动评估的过渡。
在汽车设计的最初阶段,概念草图是设计师们表达创意的重要方式。然而,手工绘制草图不仅速度慢,而且很难快速探索多种不同的设计风格。设计智能体利用最先进的视觉 - 语言模型(VLMs)和大型语言模型(LLMs),能够理解设计师用语言描述的设计意图。
设计师在概念设计阶段提供了一个旅行车的草图,并希望探索不同的风格选项。他们要求生成高质量的渲染图,基于以下风格提示:
AI设计智能体中的样式智能体根据这些提示生成了高质量的渲染图,准确地展现了指定的美学风格。
当概念草图确定后,下一步就是将二维的草图转化为三维的汽车模型。这个过程在传统设计中非常复杂且耗时,需要专业的建模软件和大量的手动操作。但设计智能体通过几何深度学习技术,可以从庞大的数据库中快速检索出与目标草图相似的3D形状,并以此为基础进行生成建模。
它们能够自动调整模型的细节,确保最终的3D模型不仅外观美观,而且在结构上也符合工程要求,大大减少了人工建模的时间和工作量。
空气动力学性能对于汽车的燃油效率、行驶稳定性和噪音控制等方面至关重要。在传统的设计流程中,进行计算流体动力学(CFD)模拟需要先对汽车模型进行复杂的网格划分,这是一个技术难度高且耗时的环节。设计智能体能够自动完成高质量的CFD网格划分,确保模拟的准确性。
而且,它们还能快速预测不同设计方案在空气动力学方面的表现,比如风阻系数、气流分布等。这意味着工程师和设计师可以在设计早期就对汽车的空气动力学性能进行优化,而不是等到模型制作完成后再进行漫长的测试和修改,从而节省了大量的时间和成本。
MIT团队提出的多智能体框架整合了四种专业设计智能体:
这些智能体基于最先进的视觉语言模型(VLMs)、大语言模型(LLMs)和几何深度学习技术,通过AutoGen框架进行协调,实现了设计流程的全面自动化。系统整合了多种强大的AI技术,包括大型语言模型(LLMs)、视觉 - 语言模型(如Stable Diffusion XL和ControlNet),以及几何深度学习模型(如DeepSDF、PointNet、RegDGCNN和TripNet)。
设计师们常常从一张简单的草图开始,但如何快速将这些草图变成令人眼前一亮的设计呢?这时候,造型智能体就登场了。
为了训练这个智能体,我们遇到了一个挑战:没有现成的汽车草图数据集。于是,我们采用了两种自动化方法来生成草图。一种是传统的计算机视觉方法,使用Canny边缘检测;另一种是利用预训练的生成式AI模型CLIPasso。
当设计师有了初步的设计概念后,下一步就是将这些二维草图转化为三维模型。这时候,CAD智能体就派上用场了。它就像是一个3D设计的宝藏猎人,能够在DrivAerNet++数据库中快速检索出与草图相似的3D设计,或者直接生成新的形状。
在汽车设计中,空气动力学性能至关重要。为了评估设计的空气动力学性能,需要进行计算流体动力学(CFD)模拟。但传统的CFD模拟需要复杂的网格划分,这是一个技术难度高且耗时的环节。网格生成智能体就像是CFD模拟的铺路者,它能够自动为3D模型生成高质量的CFD网格,并评估网格质量。
为了生成高质量的汽车设计,我们使用了Stable Diffusion XL(SDXL),这是一种能够根据文本提示生成逼真且富有艺术感的图像的潜扩散模型。
SDXL采用双阶段架构,基础模型用于粗略生成,而细化模型则用于高细节增强。通过ControlNet的引导,我们可以用Canny边缘图来指导生成过程,确保输出图像保持原始汽车设计的结构完整性。
从流程上看,我们从一个旅行车的二维草图开始,造型智能体(Styling Agent)生成了高分辨率的渲染图像。
接下来,CAD智能体从DrivAerNet++数据库中检索出最相似的设计,并进一步通过插值生成新的3D汽车形状。网格生成智能体(Meshing Agent)处理了生成的3D模型,生成了适合空气动力学模拟的高质量CFD网格。
最后,仿真智能体(Simulation Agent)通过从DrivAerNet++数据库中检索最相似的设计并获取相应的空气动力学性能数据,完成了实时空气动力学分析。