0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超级计算机+AI:NVIDIA Ampere架构开辟百万兆级时代

NVIDIA英伟达 来源:英伟达NVIDIA中国 2020-06-02 17:00 次阅读

超级计算机+AI:NVIDIA Ampere架构开辟百万兆级时代

目前,全球有6座超级计算机中心率先采用 NVIDIA Ampere架构,将从天体物理学到病毒微生物学等多个科学领域带入百万兆级时代。

这些位于美国和德国的高性能计算中心(HPC)将共计使用近13,000个A100 GPU

这些GPU的总峰值性能超过250 petaflops,将被用于使用64位浮点数学运算的模拟。而对于使用混合精度数学和利用A100 GPU对稀疏性支持的AI推理工作,它们可提供惊人的8.07 exaflops性能。

研究人员将运用这一强大性能从多个维度推动科学发展。他们计划模拟更大型的模型、训练和部署更深入的网络,并开拓运用AI来辅助模拟的新兴混合领域。

Argonne国家实验室是首批NVIDIA DGX-A100系统的使用者之一。图片由Argonne国家实验室提供

Argonne国家实验室(Argonne National Laboratory)的研究人员将通过模拟冠状病毒(由多达150万个原子组成)刺突蛋白的关键部分来研发新冠病毒疫苗。

Argonne国家实验室计算生物学家Arvind Ramanathan表示,刺突蛋白分子很难模拟,但A100可以加快对这些子系统的模拟,让我们了解这种病毒如何感染人类。”Argonne国家实验室将采用一个由24个NVIDIA DGX A100系统组成的集群。

他还表示,在其他项目中,“由于一次可以扫描数不计其数的药物,我们的新药研发能力明显增强。我们可能会了解之前所无法了解的知识,比如两种蛋白质如何相互结合等。”

A100为科学研究引入AI

Ramanathan表示:“许多工作难以在计算机上模拟,因此我们可以运用AI来智能指导下一步的采样地点和时间。”

而这只是科学家使用AI引导模拟这一新兴趋势的冰山一角。Ramanathan还告诉我们,GPU将把生物样品的处理时间缩短“至少两个数量级”。

国家能源研究科学计算中心(NERSC)有望成为全美第一批A100使用者中,规模最大的使用者。这座位于加利福尼亚州伯克利(Berkeley, Calif.)的计算中心正在与惠普(Hewlett Packard)合作,在其预制的百万兆级系统Perlmutter中部署6200个GPU。

NERSC主任Sudip Dosanjh表示:“在NERSC科学和算法领域,一个V100 GPU的性能比我们当前一代Cori系统上的KNL CPU节点高出5倍,我们期待着Perlmutter上的A100性能会更加强大。”

百万兆级计算团队使用AI进行模拟

NERSC的百万兆级计算专用团队已为Perlmutter确认了近30个项目,这些项目采用了大规模模拟、数据分析或深度学习技术。一些项目将高性能计算与AI相结合,比如使用强化学习控制光源实验的项目、使用生成模型在高能物理探测器上重现成本昂贵的模拟等。

NERSC的2个高性能计算应用程序,已经原型化了A100 GPU双精度Tensor核心的使用。相比上一代Volta GPU,它们的性能显著提高。

NERSC的高性能计算性能工程师Christopher Daley,在GTC 线上大会的一次演讲中表示,未来的百万兆级系统将使用专为10000路并行Perlmutter GPU产品而优化的软件。NERSC支持天体物理学、地球科学、聚变能和基因组学等领域的近千种科学应用。

NERSC的首席架构师Nicholas Wright表示:“在Perlmutter上,我们需要支持用户所需和期望的所有编程模型的编译器,包括MPI、OpenMP、OpenACC、CUDA和经过优化的数学库。而这些在NVIDIA HPC SDK上都有。”

德国努力绘制大脑图谱

AI将成为全新70 petaflops系统首批A100应用的重点技术,该系统由法国Atos专为德国西部尤利西超级计算中心(Jülich Supercomputing Center)设计。

比如能够作出快速短期天气预报的Deep Rain将对传统系统(进行大规模,但速度慢的大气模拟)进行补充。另一个项目计划构建人脑纤维图集,并结合数千张高分辨率2D脑图像进行深度学习。

尤利西采用的新型A100系统还将帮助研究人员,进一步理解结合夸克(物质的亚原子构造模块)所具有的强大力量。气候科学项目将可以建立地球地表和地下水流的宏观模型。

理论物理学家Dirk Pleiter目前管理尤利西应用技术研发团队。他表示:“许多应用程序都受到存储的限制。因此,我们最感兴趣的是A100存储占用量和带宽的增加情况。”

全新GPU能够将双精度数学运算速度提高多达2.5倍,而这也是一项研究人员迫切需要的功能。他表示:“我认为一旦人们发现有机会提高计算性能,他们会非常希望使用GPU。”

NVLink助跑数据密集型工作

卡尔斯鲁厄技术学院(Karlsruhe Institute of Technology, KIT)在尤利西以南约230英里处,与联想合作建立了一部全新的17 petaflops系统。该系统将在NVIDIA Mellanox 200 Gbit/s InfiniBand网络上集成740个A100 GPU,从而解决多项重大挑战,包括:

用于气候科学的千米级大气模拟

针对新冠病毒的研究,包括对Folding@home的支持

大型强子对撞机对希格斯玻色子以外粒子物理学的探索

可能取代锂离子电池的新一代材料研究

AI在机器人技术、语言处理和可再生能源中的应用

KIT超级计算中心主任、计算科学与数学教授Martin Frank表示:“我们的主要工作是数据密集型模拟和AI工作流,因此我们非常需要能够连接新GPU的第三代NVLink。”

他补充说:“我们也十分期待多实例GPU功能。该功能可以让每个节点最多拥有28个GPU,而不是原来的只有4个节点,这将使我们的许多应用都大大受益。”

在慕尼黑郊外,马克斯·普朗克研究所(Max Planck Institute)的计算机中心正在与联想合作创建一个名为Raven-GPU的系统。该系统集成了768个NVIDIA A100 GPU,将支持天体物理学、生物学、理论化学和新材料科学等领域的工作。该研究所的目标是在今年年底之前安装Raven-GPU,并且现在正在接受将应用程序移植到A100方面的请求。

印第安纳大学系统应对网络安全威胁

印第安纳大学(Indiana University)正在建造Big Red 200(6 petaflops系统)。该系统将使用256个A100 GPU,有望成为美国大学中速度最快的超级计算机。

该项目于6月发布,是最早采用惠普公司Cray Shasta技术的学术中心之一。其他学术中心也将在未来的百万兆级系统中使用这项技术。

Big Red 200将运用AI应对网络安全威胁。它还将解决遗传学方面的巨大挑战,帮助实现个性化医疗,为气候建模、物理学和天文学方面的工作提供支持。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4592

    浏览量

    101706
  • 超级计算机
    +关注

    关注

    2

    文章

    434

    浏览量

    41609

原文标题:性能跃升:A100 GPU助力高性能计算中心加速科学发展

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA推出两款基于NVIDIA Ampere架构的全新台式机GPU

    两款 NVIDIA Ampere 架构 GPU 为工作站带来实时光线追踪功能和生成式 AI 工具支持。
    的头像 发表于 04-26 11:25 129次阅读

    诺和诺德基金会将联手英伟达打造丹麦AI超级计算机

    诺和诺德基金会携手英伟达,共同宣布在丹麦打造一台领先的AI超级计算机。这台超级计算机将致力于推动医疗保健、生命科学以及绿色转型等领域的科研与
    的头像 发表于 03-21 13:43 160次阅读

    NVIDIA推出搭载GB200 Grace Blackwell超级芯片的NVIDIA DGX SuperPOD™

    NVIDIA 于太平洋时间 3 月 18 日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwel
    的头像 发表于 03-21 09:49 330次阅读

    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算

    日 ——  NVIDIA 于今日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwell
    发表于 03-19 10:56 106次阅读
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell <b class='flag-5'>架构</b> DGX SuperPOD,适用于万亿参数级的生成式 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算</b>

    Tesla 计划斥资 5 亿美元建造一台由 NVIDIAAI GPU 提供支持的 Dojo 超级计算机

    ABSTRACT摘要Tesla计划斥资5亿美元建造一台由NVIDIA的AIGPU提供支持的Dojo超级计算机,因此该公司正在加大基于AI的开发力度。JAEALOT2024年1月27日T
    的头像 发表于 02-19 12:45 309次阅读
    Tesla 计划斥资 5 亿美元建造一台由 <b class='flag-5'>NVIDIA</b> 的 <b class='flag-5'>AI</b> GPU 提供支持的 Dojo <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    亚马逊云科技与 NVIDIA 宣布开展战略合作,为生成式 AI 提供全新超级计算基础架构、软件和服务

    亚马逊云科技将提供首款搭载 NVIDIA Grace Hopper 超级芯片 和亚马逊云科技可扩展性 UltraCluster 的云  AI 超级
    的头像 发表于 11-29 21:00 385次阅读
    亚马逊云科技与 <b class='flag-5'>NVIDIA</b> 宣布开展战略合作,为生成式 <b class='flag-5'>AI</b> 提供全新<b class='flag-5'>超级</b><b class='flag-5'>计算</b>基础<b class='flag-5'>架构</b>、软件和服务

    SC23 | 新型加速节能 AI 系统开创超级计算的新时代

    大会发表的特别演讲中提到:“NVIDIA 的硬件和软件创新正在创造一种新型 AI 超级计算机。” 其中一些超级
    的头像 发表于 11-15 18:45 333次阅读
    SC23 | 新型加速节能 <b class='flag-5'>AI</b> 系统开创<b class='flag-5'>超级</b><b class='flag-5'>计算</b>的新<b class='flag-5'>时代</b>

    Blackwell GB100能否在超级计算机AI市场保持领先优势?

    NVIDIA 下一代 Blackwell GB100 传将采用芯片堆栈设计提升效能和效率,但也面临工艺和封装的挑战,能否在超级计算机AI 市场保持领先优势?
    的头像 发表于 10-24 17:43 594次阅读

    NVIDIA 与 Hugging Face 将连接数百万开发者与生成式 AI 超级计算

    年 8 月 8 日 — NVIDIA 与 Hugging Face 宣布建立合作伙伴关系,为数百万开发者提供生成式 AI 超级计算服务,帮
    发表于 08-09 11:41 108次阅读
    <b class='flag-5'>NVIDIA</b> 与 Hugging Face 将连接数<b class='flag-5'>百万</b>开发者与生成式 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算</b>

    NVIDIA Ampere 架构的结构化稀疏功能及其在搜索引擎中的应用

    NVIDIA Ampere 架构的结构化稀疏功能 及其在搜索引擎中的应用 深度学习彻底改变了我们分析、理解和处理数据的方式,而且在各个领域的应用中都取得了巨大的成功,其在计算机视觉、自
    的头像 发表于 07-18 17:45 307次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Ampere</b> <b class='flag-5'>架构</b>的结构化稀疏功能及其在搜索引擎中的应用

    NVIDIA Cambridge-1 AI 超级计算机通过云让更多研究人员能够访问

    进行开创性的药物研究、探索替代能源还是寻找预防金融欺诈的新方法,访问先进的 AI 计算资源都是推动创新的关键。这种新的计算模式可以解决生成式 AI 所带来的挑战,并推动下一轮创新。 C
    的头像 发表于 06-19 19:05 299次阅读

    英特尔公布1万亿参数AI模型,比ChatGPT大570%

    拥有这么大的规模,那么驱动 Aurora genAI 模型背后的算力肯定也不容小觑。英特尔透露,他们使用的是名为 Aurora(欧若拉)的超级计算机,这是英特尔与阿贡国家实验室和 HPE 合作开发的百万兆
    的头像 发表于 05-30 15:51 468次阅读
    英特尔公布1万亿参数<b class='flag-5'>AI</b>模型,比ChatGPT大570%

    NVIDIA推出DGX GH200 AI超级计算机

    ——2023年5月29日—— NVIDIA今天宣布推出一款新型大内存AI超级计算机——由NVIDIA® GH200 Grace Hoppe
    发表于 05-30 14:15 448次阅读
    <b class='flag-5'>NVIDIA</b>推出DGX GH200 <b class='flag-5'>AI</b><b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超级计算机

    —2023 年 5 月 29 日— NVIDIA 今天宣布推出一款新型大内存 AI 超级计算机——由 NVIDIA GH200 Grace
    的头像 发表于 05-30 01:40 1516次阅读
    COMPUTEX2023 | <b class='flag-5'>NVIDIA</b> 推出 DGX GH200 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    NVIDIA Grace 掀起新型节能 Arm 超级计算机的新浪潮

    英国科研联盟 GW4 打造能效提升 6 倍的超级计算机,用于气候科学、医学研究等领域 德国汉堡 - 国际超算大会(ISC)- 2023 年 5 月 21 日 - NVIDIA 今天
    的头像 发表于 05-23 07:10 380次阅读