0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于云的AI超级计算机正世界上最强大的计算机的榜单上蓄势待发

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2021-06-29 09:44 次阅读

基于云的 AI 超级计算机(包括 Microsoft Azure 和剑桥大学的新系统)正在世界上最强大的计算机的最新榜单上蓄势待发

ISC 高性能计算大会 (ISC High Performance) 发布的 TOP500 榜单中,有 342 个系统采用了 NVIDIA 技术提供加速,其中包括70%的新系统,与排名前10的8个。

最新的全球最强系统榜单显示出越来越多的高性能计算中心在使用 AI,也体现出用户们在继续拥抱NVIDIA AI与加速计算、网络技术的组合来运行他们的科学和商业工作负载。

例如,榜单上使用 InfiniBand 的系统数量比去年增加了20%。随着AI,HPC和模拟数据对于低延迟和加速的需求日益增加,InfiniBand已成为首选网络。

此外,名单上的两个新系统便是我们所称的超级云 —— 一种新兴的共享超级计算机,能够同时满足人工智能、高性能计算和云端的需求。

超级云的到来

Microsoft Azure 利用集群将公有云服务提升到一个新的水平,在 TOP500 榜单上连续占据第 26 位到第 29 位。它们是超级云的一部分,是一台全球的人工智能超级计算机,如今地球上的任何用户都可以按需使用。

在HPL基准测试(也成为了Linpack),四个 Azure 系统中的每一个都实现了 16.59 Petaflop 的计算性能。Linpack 是衡量 64 位浮点数学运算的高性能计算性能的传统标准,也是 TOP500 榜单的参考依据。

迈入行业高性能计算时代

Azure 系统便是 NVIDIA 首席执行官黄仁勋所述“行业高性能计算革命”的一例,即 AI 与高性能计算和加速计算融合,正在推动科研和行业各个领域的发展。

在幕后,有 8 个 NVIDIA A100 Tensor Core GPU 为 Azure 系统的各个虚拟实例提供动力支持。每个芯片都有自己的 HDR 200G InfiniBand 通信接口,可以与 Azure 云中的数千个 GPU 建立快速连接。

英国研究人员采用云原生技术

剑桥大学首次成为英国最快的学术系统,其超级计算机在 Green500 世界上最节能的系统名单中排名第三,这是另一种超级云。它被称为 Wilkes-3,是世界上第一台云原生超级计算机,其使研究人员可以在不影响性能的情况下,共享具有隐私和安全性的虚拟资源。这要归功于 经过优化的NVIDIA BlueField DPU可以执行安全、虚拟化和其他数据处理任务。

该系统使用 320 个连接在 HDR 200G Infiniband 网络上的 A100 GPU,为学术研究以及探索科学和医学前沿的商业合作伙伴加速模拟、人工智能和数据分析。

TOP500 榜单新秀采用 AI

榜单上许多由 NVIDIA 提供动力支持的新系统,凸显了 AI 对于科研和商业用户的高性能计算应用的重要性不断提升。

国家能源研究科学计算中心 (NERSC) 的 Perlmutter 以 64.59 Linpack petaflops 在 TOP500 中排名第 5,部分归功于其 6,144 个 A100 GPU。

该系统在最新版本的 HPL-AI 上提供了超过一半的 exaflops 性能。它是融合 HPC 和 AI 工作负载的新兴基准,它使用混合精度数学——深度学习和许多科学和商业工作的基础——同时仍然提供双精度数学的完全准确性。

AI 性能变得越来越重要,因为 AI 是 “美国能源部的一个增长领域,其可行性已被验证,正在计划投入生产,” NERSC 数据和分析服务组代理负责人 Wahid Bhimji 表示。

HiPerGator AI 以 17.20 petaflops 排名第 22 位,在 Green500 榜单中排名第 2,使其成为世界上最节能的学术超级计算机。它与 Green500 的榜首位置相差甚远——仅为 0.18 Gflops/Watt。

与最新名单上的其他 12 款系统一样,该系统采用了 NVIDIA DGX SuperPOD 的模块化架构,这一配置让佛罗里达大学能够快速部署世界上最强大的学术 AI 超级计算机之一。该系统还使其成为领先的AI大学,其既定目标是 在2030 年前有 30,000 名AI相关专业的毕业生。

卢森堡的 MeluXina 在 HPL-AI 上以 10.5 Linpack petaflops排名第 37 位。该系统是首批在欧洲国家超级计算机网络中亮相的首个系统,,将用于在科研和商业应用中运用 AI 和数据分析。

Cambridge-1 在 500 强中排名第 42 位,达到 9.68 Linpack petaflops,成为英国最强大的系统,将为包括阿斯利康(AstraZeneca)、葛兰素史克(GSK)和Oxford Nanopore在内的学术和商业组织的英国医疗保健研究人员提供服务。

BerzeLiUs 以 5.25 petaflops 排名第 83,成为瑞典最快的系统。BerzeLiUs在 200G 的 InfiniBand 网络上连接了 60 个 NVIDIA DGX 系统,将HPC、AI 和数据分析用于学术和商业研究。是榜单上15个基于NVIDIA DGX的其中一个。

10 大系统助推 HPL-AI 采用

另一个迹象表明,AI 工作负载的重要性日益增加,榜单上有 10 个系统报告其 HPL-AI 得分是去年 6 月的 5 倍。大多数系统采用了 3 月发布的针对代码的重大优化,这是自田纳西大学的研究人员在 2018 年底发布该基准以来的首次升级。

新软件简化了通信,实现了 GPU 间链路,从而消除了等待主机 CPU 的时间。它还以 16 位代码的形式实现通信,而不是在Linpack 上默认使用的较慢的 32 位代码。

Azzam Haidar Ahmad 称:“我们将芯片间通信的时间减少了一半,并使其他一些工作负载能够并行运行,因此新代码相较于原代码平均改进了约 2.7 倍”。他帮助定义了该基准,现在是 NVIDIA 的高级工程师

该基准测试虽然专注于混合精度数学计算,但仍然提供与 Linpack 相同的 64 位精度,这要归功于 HPL-AI 的一种循环方法,它能迅速优化一些计算。

Summit 的 HPL-AI 得分超过 1 Exaflop

经过优化后,与去年使用早期版本的代码所报告的得分相比,现在的得分大大高于基准线。

例如,橡树岭国家实验室(Oak Ridge National Lab,ORNL)的 Summit 超级计算机是第一台采用 HPL-AI 基准的超级计算机,其在 2019 年宣布使用第一版代码的得分为 445 Petaflop。今年峰会上的测试使用最新版本的 HPL-AI 测试,得分达到 1.15 Exaflops。

采用该基准的其他超级计算机包括日本的 Fugaku(世界上最快的系统)、NVIDIA 的 Selene(世界上最快的商业系统)和德国的最强超级计算机 Juwels。

于利希超算中心 (Jülich Supercomputing Center) 主任 Thomas Lippert 称:“我们使用 HPL-AI 基准,因为它能很好地衡量我们日益增多的 AI 和科研工作负载中的混合精度作业,而且能反映准确的 64 位浮点运算结果。”

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4415

    浏览量

    126652
  • 超级计算机
    +关注

    关注

    2

    文章

    434

    浏览量

    41609
  • AI
    AI
    +关注

    关注

    87

    文章

    26424

    浏览量

    264029
  • HPC
    HPC
    +关注

    关注

    0

    文章

    279

    浏览量

    23418

原文标题:ISC2021 | 超级云:AI、云原生超级计算机跻身 TOP500 榜单

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    诺和诺德基金会将联手英伟达打造丹麦AI超级计算机

    在丹麦打造一台领先的AI超级计算机。这台超级计算机将致力于推动医疗保健、生命科学以及绿色转型等领域的科研与创新,为丹麦乃至全球的研究人员提供
    的头像 发表于 03-21 13:43 159次阅读

    【量子计算机重构未来 | 阅读体验】 跟我一起漫步量子计算

    首先感谢发烧友提供的试读机会。 略读一周,感触颇深。首先量子计算机作为一种前沿技术,逐步展现出其巨大的潜力,预示着未来社会和技术领域的深刻变革。下面,我将从几个方面探讨量子计算机如何重构我们
    发表于 03-13 19:28

    【量子计算机重构未来 | 阅读体验】+ 了解量子叠加原理

    作为零基础初学级的量子小白,对神秘诡异的量子世界充满了好奇。说起量子计算机,我有许多问号,量子计算机的工作原理是什么?它和电子计算机有什么区别?量子
    发表于 03-13 17:19

    【量子计算机重构未来 | 阅读体验】+量子计算机的原理究竟是什么以及有哪些应用

    本书内容从目录可以看出本书主要是两部分内容,一部分介绍量子计算机原理,一部分介绍其应用。 其实个人也是抱着对这两个问题的兴趣来看的。 究竟什么是量子计算机相信很多读者都是抱着这个疑问
    发表于 03-11 12:50

    【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

    : 现在到哪里可以买到量子计算机? 1、购买实物的量子计算机: Rigetti和D-Wave公司,当前价格非常昂贵。 2、购买量子计算机服务:IBM、Google、Amazon、Mi
    发表于 03-05 17:37

    量子计算机的未来

    了解量子计算机对于工业生产和产品研发的使用
    发表于 02-01 15:30

    量子计算机的作用有哪些

    量子计算机是一种基于量子力学原理的新型计算机,它利用量子比特(qubit)进行信息处理,具有传统计算机无法比拟的计算能力和潜力。量子计算机
    的头像 发表于 12-30 14:32 661次阅读

    工业计算机的应用

    工业计算机在半导体设备的应用,具体在哪一方面。比如说图像处理使用什么样的计算机,工业控制使用哪一方面的计算机
    发表于 09-12 14:19

    计算机组成与设计

    计算机组成与设计 计算机组成与设计是计算机科学中最基础的课程之一,它主要阐述了计算机的组成原理和设计方法。随着计算机技术的快速发展,
    的头像 发表于 08-17 12:37 929次阅读

    gh200和超级计算机哪个牛

    gh200和超级计算机哪个牛 随着科技的不断发展,计算机已经成为人类生活不可或缺的一部分。计算机的崛起极大地改变了世界和每个人的生活。过去几
    的头像 发表于 08-17 10:51 321次阅读

    gh200和超级计算机哪个牛

    gh200和超级计算机哪个牛  随着科技的不断发展,计算机已经成为人类生活不可或缺的一部分。计算机的崛起极大地改变了世界和每个人的生活。过去
    的头像 发表于 08-16 17:34 330次阅读

    量子计算机可以用来破解世界上一些最常见的加密算法?

    现代计算机从根本上改变了日常生活,而且它们每天都在变得更加强大。你现在用来读这篇文章所使用的智能手机,相比较几十年前的超级计算机来说,也更加强大
    的头像 发表于 07-06 15:44 636次阅读

    计算机是如何理解世界

    电子发烧友网站提供《计算机是如何理解世界的.zip》资料免费下载
    发表于 06-13 15:48 0次下载
    <b class='flag-5'>计算机</b>是如何理解<b class='flag-5'>世界</b>的

    计算机视觉相关概念总结

    为了帮助同事和客户了解更多有关计算机视觉和AI的更多信息,我们言简意赅介绍一些计算机视觉和AI术语,希望能帮助到大家。
    的头像 发表于 05-31 10:11 516次阅读

    计算机通信的规则

    计算机通信的规则主要是网络协议,它定义了计算机如何在通信中进行数据交换和通信的规范和格式。现代计算机通信中使用最广泛的协议是TCP/IP协议。
    发表于 05-09 16:51 1443次阅读