超级计算机+AI:NVIDIA Ampere架构开辟百万兆级时代
目前,全球有6座超级计算机中心率先采用 NVIDIA Ampere架构,将从天体物理学到病毒微生物学等多个科学领域带入百万兆级时代。
这些位于美国和德国的高性能计算中心(HPC)将共计使用近13,000个A100 GPU。
这些GPU的总峰值性能超过250 petaflops,将被用于使用64位浮点数学运算的模拟。而对于使用混合精度数学和利用A100 GPU对稀疏性支持的AI推理工作,它们可提供惊人的8.07 exaflops性能。
研究人员将运用这一强大性能从多个维度推动科学发展。他们计划模拟更大型的模型、训练和部署更深入的网络,并开拓运用AI来辅助模拟的新兴混合领域。
Argonne国家实验室是首批NVIDIA DGX-A100系统的使用者之一。图片由Argonne国家实验室提供
Argonne国家实验室(Argonne National Laboratory)的研究人员将通过模拟冠状病毒(由多达150万个原子组成)刺突蛋白的关键部分来研发新冠病毒疫苗。
Argonne国家实验室计算生物学家Arvind Ramanathan表示,刺突蛋白分子很难模拟,但A100可以加快对这些子系统的模拟,让我们了解这种病毒如何感染人类。”Argonne国家实验室将采用一个由24个NVIDIA DGX A100系统组成的集群。
他还表示,在其他项目中,“由于一次可以扫描数不计其数的药物,我们的新药研发能力明显增强。我们可能会了解之前所无法了解的知识,比如两种蛋白质如何相互结合等。”
A100为科学研究引入AI
Ramanathan表示:“许多工作难以在计算机上模拟,因此我们可以运用AI来智能指导下一步的采样地点和时间。”
而这只是科学家使用AI引导模拟这一新兴趋势的冰山一角。Ramanathan还告诉我们,GPU将把生物样品的处理时间缩短“至少两个数量级”。
国家能源研究科学计算中心(NERSC)有望成为全美第一批A100使用者中,规模最大的使用者。这座位于加利福尼亚州伯克利(Berkeley, Calif.)的计算中心正在与惠普(Hewlett Packard)合作,在其预制的百万兆级系统Perlmutter中部署6200个GPU。
NERSC主任Sudip Dosanjh表示:“在NERSC科学和算法领域,一个V100 GPU的性能比我们当前一代Cori系统上的KNL CPU节点高出5倍,我们期待着Perlmutter上的A100性能会更加强大。”
百万兆级计算团队使用AI进行模拟
NERSC的百万兆级计算专用团队已为Perlmutter确认了近30个项目,这些项目采用了大规模模拟、数据分析或深度学习技术。一些项目将高性能计算与AI相结合,比如使用强化学习控制光源实验的项目、使用生成模型在高能物理探测器上重现成本昂贵的模拟等。
NERSC的2个高性能计算应用程序,已经原型化了A100 GPU双精度Tensor核心的使用。相比上一代Volta GPU,它们的性能显著提高。
NERSC的高性能计算性能工程师Christopher Daley,在GTC 线上大会的一次演讲中表示,未来的百万兆级系统将使用专为10000路并行Perlmutter GPU产品而优化的软件。NERSC支持天体物理学、地球科学、聚变能和基因组学等领域的近千种科学应用。
NERSC的首席架构师Nicholas Wright表示:“在Perlmutter上,我们需要支持用户所需和期望的所有编程模型的编译器,包括MPI、OpenMP、OpenACC、CUDA和经过优化的数学库。而这些在NVIDIA HPC SDK上都有。”
德国努力绘制大脑图谱
AI将成为全新70 petaflops系统首批A100应用的重点技术,该系统由法国Atos专为德国西部尤利西超级计算中心(Jülich Supercomputing Center)设计。
比如能够作出快速短期天气预报的Deep Rain将对传统系统(进行大规模,但速度慢的大气模拟)进行补充。另一个项目计划构建人脑纤维图集,并结合数千张高分辨率2D脑图像进行深度学习。
尤利西采用的新型A100系统还将帮助研究人员,进一步理解结合夸克(物质的亚原子构造模块)所具有的强大力量。气候科学项目将可以建立地球地表和地下水流的宏观模型。
理论物理学家Dirk Pleiter目前管理尤利西应用技术研发团队。他表示:“许多应用程序都受到存储的限制。因此,我们最感兴趣的是A100存储占用量和带宽的增加情况。”
全新GPU能够将双精度数学运算速度提高多达2.5倍,而这也是一项研究人员迫切需要的功能。他表示:“我认为一旦人们发现有机会提高计算性能,他们会非常希望使用GPU。”
NVLink助跑数据密集型工作
卡尔斯鲁厄技术学院(Karlsruhe Institute of Technology, KIT)在尤利西以南约230英里处,与联想合作建立了一部全新的17 petaflops系统。该系统将在NVIDIA Mellanox 200 Gbit/s InfiniBand网络上集成740个A100 GPU,从而解决多项重大挑战,包括:
用于气候科学的千米级大气模拟
针对新冠病毒的研究,包括对Folding@home的支持
大型强子对撞机对希格斯玻色子以外粒子物理学的探索
可能取代锂离子电池的新一代材料研究
AI在机器人技术、语言处理和可再生能源中的应用
KIT超级计算中心主任、计算科学与数学教授Martin Frank表示:“我们的主要工作是数据密集型模拟和AI工作流,因此我们非常需要能够连接新GPU的第三代NVLink。”
他补充说:“我们也十分期待多实例GPU功能。该功能可以让每个节点最多拥有28个GPU,而不是原来的只有4个节点,这将使我们的许多应用都大大受益。”
在慕尼黑郊外,马克斯·普朗克研究所(Max Planck Institute)的计算机中心正在与联想合作创建一个名为Raven-GPU的系统。该系统集成了768个NVIDIA A100 GPU,将支持天体物理学、生物学、理论化学和新材料科学等领域的工作。该研究所的目标是在今年年底之前安装Raven-GPU,并且现在正在接受将应用程序移植到A100方面的请求。
印第安纳大学系统应对网络安全威胁
印第安纳大学(Indiana University)正在建造Big Red 200(6 petaflops系统)。该系统将使用256个A100 GPU,有望成为美国大学中速度最快的超级计算机。
该项目于6月发布,是最早采用惠普公司Cray Shasta技术的学术中心之一。其他学术中心也将在未来的百万兆级系统中使用这项技术。
Big Red 200将运用AI应对网络安全威胁。它还将解决遗传学方面的巨大挑战,帮助实现个性化医疗,为气候建模、物理学和天文学方面的工作提供支持。
-
NVIDIA
+关注
关注
14文章
5496浏览量
109090 -
超级计算机
+关注
关注
2文章
479浏览量
43151
原文标题:性能跃升:A100 GPU助力高性能计算中心加速科学发展
文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
NVIDIA推出NVQLink高速互连架构
NVIDIA助力AI超级计算机Isambard-AI投入使用
NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展
Blue Lion超级计算机将在NVIDIA Vera Rubin上运行
NVIDIA技术赋能欧洲最快超级计算机JUPITER
NVIDIA助力全球最大量子研究超级计算机
NVIDIA GTC2025 亮点 NVIDIA推出 DGX Spark个人AI计算机
NVIDIA 宣布推出 DGX Spark 个人 AI 计算机
MediaTek与NVIDIA携手设计GB10 Grace Blackwell超级芯片
NVIDIA推出个人AI超级计算机Project DIGITS
联发科与NVIDIA合作 为NVIDIA 个人AI超级计算机设计NVIDIA GB10超级芯片
NVIDIA发布高性价比生成式AI超级计算机
NVIDIA 推出高性价比的生成式 AI 超级计算机

超级计算机+AI:NVIDIA Ampere架构开辟百万兆级时代
评论