首页/文章/ 详情

CAE与超算中心的那些事儿

3年前浏览8302

● 序1《火星救援》是由美国二十世纪福斯电影公司出品的科幻冒险片,该片根据安迪·威尔的同名小说改编,讲述了由于一场沙尘暴,马克与他的团队失联,孤身一人置身于火星面临着飞船损毁,想方设法回地球的故事。中间有一个场景令人印象深刻:这里面里奇.帕内儿在进行天体动力学仿真计算时候使用的就是超算中心。超算中心那个巨大的机房和超强计算力展示出强大的魅力。

● 序2CAE(Computer Aided Engineering)是用计算机辅助求解复杂工程和产品结构强度、刚度、屈曲稳定性、动力响应、热传导、三维多体接触、弹塑性等力学性能的分析计算以及结构性能的优化设计等问题的一种近似数值分析方法。CAE从60年代初在工程上开始应用到今天,已经历了50多年的发展历史,其理论和算法都经历了从蓬勃发展到日趋成熟的过程,现已成为工程和产品结构分析中(如航空、航天、机械、土木结构等领域)必不可少的数值计算工具,同时也是分析连续力学各类问题的一种重要手段。随着计算机技术的普及和不断提高,CAE系统的功能和计算精度都有很大提高,各种基于产品数字建模的CAE系统应运而生,并已成为结构分析和结构优化的重要工具。为了求解这些问题,我们在不断的提示我们计算机的性能,主要是CPU的性能。最新的CPU已经可以实现多核多线程的计算。

例如上图中的铂金系列CPU,单CPU已经可以实现28核,56线程的计算能力。如果组成双路或者4路,这个算力不可谓不强啊。但是需要毛爷爷的数量也是一笔可观的数字。如下面的截图来源于京东商城。亮晃晃的6位数直接闪瞎了我的眼睛。

对于普通的CAE工程技术人员,往往只需要计算个结果,投资这么个大家伙,成本实在太高。序1中的超算中心能不能供我们使用呢?这正是笔者结合最近的一些工作经验和经历想和大家分享的内容。限于水平问题,如有不足或者错误,欢迎大家指出,必虚心接受。

01 什么是超算中心

简单来说,超级计算机是指由数千甚至更多处理器组成、能计算普通计算机和服务器不能完成的大型复杂课题的计算机,被称为“计算机中的珠穆朗玛峰”。超级计算机是1929年《纽约世界报》中最先报道出的一个名词,它是将大量的处理器集中在一起以处理庞大的数据量,同时运算速度比常规计算机快许多倍。但是从结构上看,超级计算机和普通计算机都是大同小异的,而这种并行化处理使得人们可以对庞大数据进行处理,进而影响到各个行业运行,其意义十分重大。

02 超算中心有多快

日本“富岳”(Fugaku)超算,宣称它的浮点运算速度峰值可达每秒41.5亿亿次。是目前最快的计算机。接下来的排第三的是中国的“神威太湖之光”,它的浮点运算速度峰值是每秒12.5亿亿次。都达到了10亿亿次以上,这是个什么概念呢?

超级计算机为什么算得那么快,能够比个人电脑快成千上万倍?是因为超算用了一个比个人电脑的芯片快成千上万倍的芯片吗?当然不是,世界上没有这样的芯片。

实际的办法是,超算用了很多个芯片,让它们同时执行任务,而单个芯片的性能跟个人电脑的芯片是差不多的。用科学术语来说,这叫做“并行计算”,这是高性能计算的基本思路。用日常生活来比喻,就是“三个臭皮匠,顶个诸葛亮”!有人指出,这里的“皮匠”其实不是处理毛皮的工匠,而应该是“裨将”,即主将身边的副将。无论如何,超算用的远不止是三个裨将,而是三千、三万以至更多个裨将。

中国古代有位大将军韩信,“韩信点兵,多多益善”说的就是他。所以核心数的多少并不直接代表计算能力,就像兵多还要看将军的水平一样。在超算中,就是构架。构架才是超算的核心,一个好的构架才能有效组织起这么多的核心有效的进行计算。这里面的水深的一塌糊涂,有兴趣的可以自行研究吧。

03 超算中心排名

目前超算绝对是国之重器。在2020年最新排名中,日本超级计算机“富岳”(Fugaku)跃居第一。“富岳”的运算能力是每秒415��兆次浮点运��,比第二名的美国IBM超级电脑“高峰”(Summit)的148千兆次高出两倍。Fugaku采用了Arm架构为基础的富士通48核心A64FX SoC,共有158976个节点,尖峰性能可达到1 exaflops(等于每秒10京(=1018)次的浮点运算),这也是全球500大超算中首次由Arm架构系统夺下第一名。

美国位于第二和第三,中国这次位于第四和第五。具体配置和性能信息如下。(注意,其中性能指标采用TFLOP/s,即teraFlos/s,相当于每秒1兆(=1012)次的浮点运算个数)

图 2020年最新全球超算排名(图片来源:崔哥看世界)

事实上,这个“全球最快计算机”的排名一直在中、日、美三国之间“风水轮流转”,从下表可以看到,从2013年中到2018年中,榜首一直由中国独占鳌头。

图 自1993年以来排名第一的计算机(图片来源:崔哥看世界)

在今年的第四届世界智能大会的“云智能科技展”中,国家超级计算天津中心首次以3D模型展示超级算力百亿亿次“天河三号”原型机,吸引了众多参与者的目光。相信下次更新超算排名时,又会有新的变化

目前国内排名第一的神威太湖之光

04 超算中心能干什么

这个问题绝对是典型的**决定脑袋的问题。当你的位置越高,你会越来越发现超级计算机的优势。目前,在诸如天气预报、生命科学的基因分析、核业、军事、航天等高科技领域大展身手,常用于需要大量运算的工作,譬如数值天气预报、运算化学、分子模型、天体物理模拟、汽车设计模拟、密码分析等。

举个例子,中国的商用客机C919的高精确度外流场空气动力参数运算,在天河二号计算六天宣告完成,而在普通计算平台上至少需要大约两年才能完成。“天宫一号”的顺利回家也靠超级计算机提供精确预测。

05 CAE与超算

截至2019年五月底,中国共建成或正在建设7座超算中心,分别为国家超级计算天津中心、国家超级计算长沙中心、国家超级计算济南中心、国家超级计算广州中心、国家超级计算深圳中心、国家超级计算无锡中心、国家超级计算郑州中心。未来还会更多。目前已经有众多科技公司开展了超算对接服务,内置了众多软件和license。

内置CAE应用

在超算的使用上,超算都是使用linux系统进行并行计算,所以要求使用者具有一定的linux系统使用经验。不过一些超算服务商已经开发了可视化的界面,使得用户可以实现基于界面的任务提交,再也不用担心语言的问题。

类windows的操作界面

06 超算中心的核心数和计算力

超算的算力是和核数有关的。但如果你用了n个芯片,你的计算速度就是单个芯片的n倍吗?你立刻就可以发现,不是。实际上,你要让多个芯片同时干事,就必须首先给它们划分好任务,这个任务划分是要消耗时间的。然后,当各个芯片开始计算之后,还不时地要和其他芯片交换数据,这个通信也是要消耗时间的。因此,计算速度的增长,总是低于芯片数的增长。超算的速度与单个芯片速度的比值,称为加速比。现在我们明白了,加速比总是低于芯片数的。当芯片比较少的时候,加速比上升得比较快。随着芯片数的增加,加速比上升得越来越平缓。当芯片很多的时候,任务划分和数据通信会变成瓶颈因素,这些负担的增加会抵消芯片增加的好处,因此加速比会达到饱和,不再上升。由此可见,芯片并不是越多越好的,这也和软件的并行算法有关,一般来说,64核已经可以满足需要了,对于大多数工程应用而言,已经够用。

图:核数与加速比关系(图片来源:知乎-袁岚峰)

07   超算中心服务商的发展与计费

目前,超算��心服务商现在��有一些,计费方式基本一致,按核数/时收费。如果涉及到一些软件的license,还包含license的费用。这就大大的保证你的计算结果是可以放到网上发表的。

在这里推荐北京并行科技股份有限公司的并行®超算云服务

北京并行科技股份有限公司(股票代码839493)是中国超算/人工智能行业软件服务的龙头企业,作为中国国家网格服务公司聚合中国各大超算中心的计算资源,提供高性能计算和人工智能的超算公有云计算服务和混合云平台建设,形成了集计算资源、应用资源、服务资源和人才资源于一体的"中国超算电网",真正使中国科技和科研用户像用电一样方便地使用计算服务。

并行®超算云服务面向非自建数据中心或自身计算资源不足、租用系统、软件、服务的用户,将中国各大超算中心计算资源整合为统一云计算资源池,通过统一账号、统一入口帮助用户便捷、高效地使用云计算资源。可提供并行超算云服务工具、应用SaaS服务、移动作业管理器、应用运行特征分析等工具,通过建立专属**群提供7×24小时应用专家一对一在线支持。

通用HPC上云求解技术科普云计算
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2020-09-05
最近编辑:3年前
幻想飞翔
硕士 | 高级工艺仿真... 每次归零重启,都是下次辉煌开始
获赞 313粉丝 3278文章 53课程 12
点赞
收藏

作者推荐

未登录
还没有评论

课程
培训
服务
行家

VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈