首页/文章/ 详情

在曙光超级计算机上对第一性原理计算软件LS3DF进行1000万个硅原子模拟

11天前浏览655

本文摘要:(由ai生成)

JCST期刊发表了一篇关于国产超级计算机上实现大规模第一性原理计算的研究论文。该研究由中国科学院多个研究所和华为技术有限公司合作完成,提出了一种线性标度三维分块算法(LS3DF),成功处理了高达1000万个硅原子的系统,实现了高峰值性能。该算法通过算法和系统层面的优化,显著提高了计算效率和可扩展性,为未来更大规模超级计算机上的电子结构模拟提供了技术基础。论文作者来自高性能计算、大规模并行计算、第一性原理计算等多个领域,展示了跨学科合作的成果。

JCST于2024年第1期出版一篇关于在国产超算上实现大规模第一性原理计算的研究论文。该论文提出了一种可大规模扩展且高效的第一性原理计算软件LS3DF的实现,使其能够在曙光超级计算机上处理高达1000万个硅原子的系统,并达到34.8 PFLOPS的峰值性能。本篇论文由来自中国科学院计算技术研究所、中国科学院大学、中国科学院半导体研究所、盐城工学院和华为技术有限公司多位作者共同撰写。    

研究动机

 
随着摩尔定律的推进,半导体器件的尺寸缩小至纳米级别。在这种尺度下,量子效应对半导体器件仿真中的影响变得至关重要,因此带来了大规模电子结构计算的挑战。当前电子结构计算主要依赖密度泛函理论,但该方法在处理大规模系统时面临着高昂的计算成本。    
为应对这一问题,本研究在国产曙光超级计算机上实现了一种大规模、高效的线性标度三维分块算法(LS3DF)。该文通过对算法和系统层面的优化,成功在一千万原子体系的模拟中表现出极佳的可扩展性和良好的计算效率,为仿真模拟下一代半导体器件提供关键支持。    
 
 

研究方法

 
本研究通过一系列算法级和系统级优化方法,成功实现了LS3DF方法的高效率和大规模应用。    
算法层面,对原有的共轭梯度迭代算法进行了优化,改进了迭代方向,从而加快了算法的收敛速度。此外,还采纳了混合精度的计算策略以缩短计算时间,同时通过理论分析保证了算法准确性的不受影响。    
系统层面,引入粗粒度并行处理方法,针对原先算法的细粒度划分导致大量通信代价的问题,如图1所示,通过改变算法的划分粒度以减少数据传输所需的时间。如图2所展示的,本文通过实施多流三维快速傅里叶变换方法,可更充分利用曙光深度计算单元的计算资源。此外,本文还采取了其它系统优化措施,例如核融合和冗余计算移除,进一步提高异构计算机的计算效率。    
通过以上两个层面的优化策略,LS3DF方法能够有效处理高达1000万个硅原子的复杂系统,并在峰值性能上取得显著提升。这项工作对于未来在更大规模超级计算机上实现整个半导体器件的电子结构模拟工作具有深远的意义。    
   

图1. LS3DF方法的细粒度并行与粗粒度并行

   

图2. 多流三维快速傅里叶变换方法

 
   
 

实验和结果

 
本研究首先对LS3DF算法在小规模体系上的效率进行了测试,并在图3中展示了结果。经过优化的LS3DF算法在效率上比原始异构版本累计提高了3.1倍。    
同时,本文在大规模体系上进行了算法的扩展性测试。图4展示强扩展性结果:当计算一百万原子体系的节点从400个增加到3200个时,并行效率仍能维持在81%。图5则展示了弱扩展性结果:当计算原子体系规模从8000增至1000万(计算节点相应从3增加至3800)时,算法的扩展效率达到了98.72%,并实现了峰值性能的21.2%(34.8 PFLOPS)。    
   
   
图3. 8000个硅原子系统的逐步优化及其相应的加速效果    
   
   
图4. 一百万硅原子系统的强扩展性    
   
   
图5. AB_CG算法的弱扩展性结果    
 
 

结论和展望

 
本文专注于大规模线性标度三维分块算法LS3DF的高效实现,成功将电子结构计算的规模扩展至千万原子级别,与当前半导体器件的规模相匹配。文章中提出的优化策略同样适用于未来的E级计算机,这为未来半导体器件的全面模拟计算提供了重要的技术基础。    

作者简介

 
 

严昱瑾中国科学院计算技术研究所,博士生,研究方向包括高性能计算、大规模并行计算和第一性原理计算        
       

李海波华为技术有限公司与中国科学院计算技术研究所联合培养博士后,研究方向包括数值线性代数、计算逆问题和机器学习

     

赵曈中国科学院计算技术研究所,特别助理研究员,研究方向包括人工智能基础理论、高性能计算和博弈论

     

汪林望中国科学院半导体研究所,首席科学家,研究方向包括开发“ab initio”电子结构计算方法,并将其应用于材料设计和发现

     

石林盐城工学院,副教授,研究方向包括第一原理计算和 III-V 半导体

     

刘涛中国科学院计算技术研究所,工程师,研究方向包括高性能计算、机器 学习和人工智能的科学应用

     

谭光明中国科学院计算技术研究所,研究员,研究方向包括并行算法设计与分析、并行编程与优化、计算机体系结构、生物信息学和大数据

     

贾伟乐中国科学院计算技术研究所,研究员,研究方向包括高性能计算、人工智能和大规模并行计算

     

孙凝晖中国科学院计算技术研究所,研究员,中国工程院院士,研究方向包括并行处理架构、分布式操作系统、性能评估和文件系统

/   END  /

来源:龙讯旷腾
半导体电子UG通信UM理论CST材料分子动力学人工智能
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2024-04-27
最近编辑:11天前
龙讯旷腾
Q-CAD材料研发软件领跑者
获赞 58粉丝 19文章 53课程 6
点赞
收藏

作者推荐

未登录
还没有评论

课程
培训
服务
行家

VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈