0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

SC23 | 新型加速节能 AI 系统开创超级计算的新时代

NVIDIA英伟达 来源:未知 2023-11-15 18:45 次阅读

世界各地的研究人员将在配备最新 NVIDIA Hopper GPU 和 NVIDIA Grace Hopper 超级芯片的系统上,借助生成式 AI 和 HPC 来应对科学和工业领域的重大挑战。

11 月 13 日,NVIDIA 在 SC23 上发布了一系列新技术,将全球各地的科学和工业研究中心推向性能和能效新高。

NVIDIA 高性能计算和超大规模数据中心业务副总裁 Ian Buck 在 SC 大会发表的特别演讲中提到:“NVIDIA 的硬件和软件创新正在创造一种新型 AI 超级计算机。”

其中一些超级计算机将配备内存增强的 NVIDIA Hopper 加速器,另一些则采用全新 NVIDIA Grace Hopper 系统架构。它们都将使用扩展的并行结构来运行面向生成式 AI 、HPC 和混合量子计算的全栈加速软件。

Buck 将全新 NVIDIA HGX H200 称为“世界领先的 AI 计算平台”。

它配备高达 141 GB 的 HBM3e,是首款使用这项超快技术的 AI 加速器。在运行 GPT-3 等模型时,NVIDIA H200 Tensor Core GPU 的性能比上一代加速器高出 18 倍。

wKgZomVUolyAb7tRAAF9ECI1Zks126.png

NVIDIA H200 Tensor Core GPU 配备HBM3e 内存,

可运行不断增长的生成式 AI 模型

在其他生成式AI基准测试中,它们在一个 Llama2-13B 大语言模型(LLM)上每秒可快速通过 12,000 个 token 。

Buck 还展示了一个服务器平台,该平台在一个 NVIDIA NVLink 互联下连接了四个 NVIDIA GH200 Grace Hopper 超级芯片。这一四组芯片的配置使得在一个计算节点内有高达 288 个 Arm Neoverse 核心,以及 2.3 TB 的高速内存 ,实现了 16 petaflops 的 AI 性能。

wKgZomVUolyAYUweAAFdB4NWpNE304.png

基于四个 GH200 超级芯片的服务器节点,提供 16 petaflops 的 AI 性能

采用 NVIDIA TensorRT-LLM 开源库的单个 GH200 超级芯片比一个双插槽 x86 CPU 系统快 100 倍,比一台 x86 + H100 GPU 服务器节能近 2 倍,展现了卓越的节能效果。

Buck 说:“加速计算是可持续的计算。通过充分利用加速计算和生成式 AI,我们可以推动各行各业的创新,同时减少对环境的影响。”

新上榜 TOP500 的 49 个系统中

有 38 个采用了 NVIDIA 技术

最新发布的全球最快的超级计算机 TOP500 榜单显示,人们正在转向加速、节能的超级计算。

由于诸多新建超级计算机采用了 NVIDIA H100 Tensor Core GPU,NVIDIA 目前在这些世界领先的系统中提供超过 2.5 exaflops 的 HPC 性能,相较此前 5 月榜单中的 1.6 exaflops 有了不少提升。仅在全球超级计算机 Top 10 中,NVIDIA 就提供近 1 exaflop 的 HPC 性能和 72 exaflops 的 AI 性能。

在新榜单中,采用 NVIDIA 技术的超级计算机数量再创新高,从 5 月份的 372 个增加到 379 个,其中包括 49 个新上榜超级计算机中的 38 个。

部署在 Microsoft Azure 中的 Eagle 系统是算力最高的新上榜超级计算机,其采用 H100 GPU,在 NDv5 实例中以 561 petaflops 的算力在总榜中排名第三。巴塞罗那的 Mare Nostrum5 排名第 8 ,而最近在 MLPerf 基准测试中创下 AI 训练新纪录的 NVIDIA Eos 排名第 9 。

在 Green500 的前 30 名中有 23 个采用了 NVIDIA GPU ,彰显了它们的节能优势。配备 H100 GPU 的 Henri 系统蝉联第一,它位于纽约 Flatiron 研究所,能效为每瓦 65.09 gigaflops 。

使用生成式 AI 探索新冠病毒

美国阿贡国家实验室展现了无限可能,它使用 NVIDIA BioNeMo(一个面向生物分子大语言模型的生成式 AI 平台)开发了 GenSLM 模型。这个模型可以生成与冠状病毒的现实变种非常相似的基因序列。使用 NVIDIA GPU 以及来自 150 万个新冠病毒基因组序列的数据,它还可以快速识别出新的病毒变种。

这项工作去年获得了戈登·贝尔特别奖,并在包括美国阿贡国家实验室的 Polaris 系统、美国能源部的 Perlmutter 和 NVIDIA 的 Selene 在内的超级计算机上进行了训练。

NVIDIA 医疗业务副总裁 Kimberly Powell 在此次特别演讲中提到:“这只是冰山一角。随着生成式 AI 不断重新定义科学探索,未来充满了无限可能。”

节约时间、金钱和能源

Buck 提到,使用最新技术为工作负载加速可以将系统的成本和能耗降低一个数量级。

例如,西门子与梅赛德斯合作为新其款 EQE 电动汽车分析空气动力学和相关声学。这类模拟此前在 CPU 集群上通常耗时数周时间,而借助最新的 NVIDIA H100 GPU ,其速度要快很多。此外,Hopper GPU 使成本降低了 3 倍,能耗降低了 4 倍(如下如所示)。

wKgZomVUolyAD4GCAADNSTe1028207.png

明年将开启 200 Exaflops 时代

在全球各地,部署这些最新系统将推动科学和工业领域不断取得进步。

Buck 说:“我们已经看到,2024 年将有基于 Grace Hopper 超级计算机的总计 200 exaflopsAI 算力投入生产。”

其中包括德国于希利研究中心的大型 JUPITER 超级计算机。它可以为 AI 训练提供 93 exaflops 的性能,为 HPC 应用提供 1 exaflop 的性能,而能耗仅为 18.2 兆瓦。

wKgZomVUolyAU-OZAACpjCa0koM282.png

GH200 为研究中心带来性能飙升

基于 Eviden 的 BullSequana XH3000 液冷系统,JUPITER 将使用 NVIDIA quad GH200 系统架构和 NVIDIA Quantum-2 InfiniBand 网络,用于进行气候和天气预测、药物发现、混合量子计算和数字孪生。JUPITER 所采用的 quad GH200 节点将配置 864 GB 的高速内存。

这是 NVIDIA 在 SC23 上宣布的数个使用 Grace Hopper 的新型超级计算机之一。

慧与(Hewlett Packard Enterprise)的 HPE Cray EX2500 系统将为明年投入使用的众多AI超级计算机配备 quad GH200。

例如,慧与建设的 OFP-II(一个由日本筑波大学和东京大学共享的先进 HPC 系统)以及 DeltaAI 系统(将使美国国家超级计算应用中心的算力提升三倍)均将采用 quad GH200。

HPE 正在为美国洛斯阿拉莫斯国家实验室建造 Venado 系统,这是在美国部署的首个 GH200,其还将在中东、瑞士和英国建设更多 GH200 超级计算机。

德克萨斯及更多地区采用 Grace Hopper

在德克萨斯高级计算中心(TACC),戴尔科技集团正在使用 NVIDIA Grace Hopper 和 Grace CPU 超级芯片建造 Vista 超级计算机。

Buck 表示,包括美国航空航天局艾姆斯研究中心(NASA Ames Research Center)和 Total Energies 在内的全球 100 多个企业和组织已经采购了 Grace Hopper 早期访问系统。

此前已宣布采用 GH200 的用户包括软银和布里斯托大学,以及配备 14000 个 NVIDIA A100 GPU 的大型 Leonardo 系统,后者为意大利 Cineca 联盟提供 10 exaflops 的 AI 性能。

超算中心的观点

来自世界各地超算中心的主管介绍了他们采用最新系统的计划及进展。

瑞士国家超级计算中心负责阿尔卑斯超级计算机的主任 Thomas Schultess 表示:“我们一直在与 MeteoWiss ECMWP 以及参与 ETH EXCLAIM 和 NVIDIA Earth-2 计划的科学家合作打造一个基础设施,以期在大数据分析和超大规模计算的各个方面取得突破。”

德克萨斯高级计算中心(TACC)的执行主任 Dan Stanzione 在谈到 Vista 时表示:“我们的各个堆栈都极大提升了能效。”

他说:“这真的是一块垫脚石,推动用户从过去使用的系统转向这种将 Grace Arm CPU 和 Hopper GPU 紧密配合的新系统,而且……我们希望在几年后部署 Horizon 时,其规模将是 Vista 的 10 或 15 倍。”

加速量子进程

研究人员们还在利用当今的加速系统开拓通往未来超级计算机的道路。

于利希研究中心量子信息处理研究小组负责人 Kristel Michelson 表示,在德国,JUPITER 超级计算机“将彻底改变气候、材料、药物发现和量子计算领域的科研工作”。

她说:“ JUPITER 的架构还允许量子算法与并行 HPC 算法无缝集成,这对于有效的量子 HPC 混合模拟来说是必需的。”

CUDA Quantum 推动进步

此次演讲还展示了 NVIDIA CUDA Quantum —— 一个用于编程 CPU、GPU 和 QPU(量子计算机)的平台,是如何推进量子计算研究的。

例如,全球最大的化工企业巴斯夫的研究人员开创了一种新的混合量子经典方法,用于模拟可以保护人类免受有害金属侵害的化合物。此外,美国布鲁克海文国家实验室和 HPE 的研究人员也分别在利用 CUDA Quantum 推动前沿科研工作。

NVIDIA 还宣布与量子编程工具开发商 Classiq 合作,在以色列最大的教学医院 Tel Aviv Sourasky Medical Center 创建一个生命科学研究中心。该中心将使用 Classiq 软件和运行于 NVIDIA DGX H100 系统之上的 CUDA Quantum 。

另外,Quantum Machines 公司将在以色列国家量子中心部署首个配备 Grace Hopper 超级芯片的 NVIDIA DGX Quantum ,旨在推动各个科学领域的进步。这个 DGX 系统将连接到一台 Quantware 的超导 QPU 和一台 ORCA Computing 的光子 QPU,两者均由 CUDA Quantum 驱动。

wKgZomVUolyAFsG0AAGZLj04AuI731.png

Buck 说:“在短短两年内,NVIDIA 的量子计算平台已经拥有 120 多个合作伙伴(如上图),这证明它是一个开放、创新的平台。”

总的来说,诸多科研领域的工作揭示了一种新趋势,那就是将数据中心规模的加速计算与 NVIDIA 的全栈创新相结合。

他总结道:“加速计算正在为可持续计算铺平道路,并且已经取得了诸多进步,不仅提供令人惊叹的技术,而且将开创更加可持续、更有影响力的未来。”

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击“阅读原文”扫描下方海报二维码,立即注册 GTC 大会


原文标题:SC23 | 新型加速节能 AI 系统开创超级计算的新时代

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3332

    浏览量

    87806

原文标题:SC23 | 新型加速节能 AI 系统开创超级计算的新时代

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    华为提出业界首个L4级AI安全智能体,迈入智能防御新时代

    2024华为分析师大会期间,在“加速迈向网络智能化”论坛上,华为提出业界首个L4级AI安全智能体,该智能体架构为人工智能时代全球网络安全防御提供了新的思路和方向,引领网络安全迈入智能防御新时代
    的头像 发表于 04-19 09:23 167次阅读

    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算

    块 Blackwell GPU 连成一个整体,由NVIDIA 系统专家加速即时 AI 基础设施的部署       美国加利福尼亚州圣何塞 —— GTC —— 太平洋时间 2024 年 3 月 18
    发表于 03-19 10:56 106次阅读
    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算</b>

    荣耀引领端侧AI新时代

    在今年的MWC盛会上,荣耀宣布与高通、Meta携手,将70亿参数大模型引入端侧,这一创新举措预示着端侧AI新时代的到来。荣耀终端CEO赵明在发布会上详细介绍了荣耀魔法大模型,并通过现场演示展示了其强大的功能,包括任意门和一键成片等MagicOS 8.0中的全新
    的头像 发表于 03-01 10:28 178次阅读

    加速计算卡与AI显卡有什么区别?

    加速计算卡与AI显卡有什么区别? 加速计算卡与AI显卡是两种不同的硬件设备,它们在设计和功能上有
    的头像 发表于 01-09 14:10 514次阅读

    超级电容能给汽车加速吗?

    加速吗?让我们看看超级电容器能否在汽车领域发挥它的超级之处。我们先从燃料汽车和新能源汽车两方面看看超级电容能起到什么作用?一,超级电容器在燃
    发表于 01-06 16:31

    光宝科技在Super Computing盛会(SC23)首度实机展示「浸没式液冷技术」

    光宝科技革命性液冷解决方案「COOLITE」 2023年11月14日美国丹佛Super Computing盛会(SC23) 首度实机展示划时代变革的「浸没式液冷技术」 丹佛2023年11月17
    的头像 发表于 11-17 09:51 414次阅读
    光宝科技在Super Computing盛会(<b class='flag-5'>SC23</b>)首度实机展示「浸没式液冷技术」

    SC23 | NVIDIA 为全球领先的 AI 计算平台 Hopper 再添新动力

    世界顶级服务器制造商和云服务提供商即将推出 HGX H200 系统与云实例。 11月13日,NVIDIA 宣布推出 NVIDIA HGX H200 ,为 Hopper 这一全球领先的 AI 计算平台
    的头像 发表于 11-14 20:05 288次阅读
    <b class='flag-5'>SC23</b> | NVIDIA 为全球领先的 <b class='flag-5'>AI</b> <b class='flag-5'>计算</b>平台 Hopper 再添新动力

    NVIDIA 为全球领先的 AI 计算平台 Hopper 再添新动力

    世界顶级服务器制造商和云服务提供商即将推出 HGX H200 系统与云实例     丹佛 - SC23 - 太平洋 时间 2023 年 11 月 13 日 - NVIDIA 于今日宣布推出
    发表于 11-14 14:30 113次阅读
    NVIDIA 为全球领先的 <b class='flag-5'>AI</b> <b class='flag-5'>计算</b>平台 Hopper 再添新动力

    京微齐力采用Imagination AI加速器打造新型智能芯片

    京微齐力的新型加速芯片是将FPGA、CPU、AI等多种异构计算单元集成在同一个芯片上,采用了领域自适应与逻辑可重构的计算模式,具有“软件可编
    的头像 发表于 07-12 09:56 492次阅读

    NVIDIA Cambridge-1 AI 超级计算机通过云让更多研究人员能够访问

    进行开创性的药物研究、探索替代能源还是寻找预防金融欺诈的新方法,访问先进的 AI 计算资源都是推动创新的关键。这种新的计算模式可以解决生成式 AI
    的头像 发表于 06-19 19:05 301次阅读

    华为李鹏:5G+AI持续创新, 拥抱数智经济新时代

    [中国,北京,2023年6月4日] 今日,在第31届中国国际信息通信展开幕论坛上,华为高级副总裁、运营商BG总裁李鹏发表《5G+AI持续创新,拥抱数智经济新时代》的演讲。他提到,在5G+AI
    的头像 发表于 06-06 10:55 396次阅读
    华为李鹏:5G+<b class='flag-5'>AI</b>持续创新, 拥抱数智经济<b class='flag-5'>新时代</b>

    NVIDIA推出DGX GH200 AI超级计算

    新型AI超级计算机将256个Grace Hopper超级芯片连接为巨大的、1-Exaflop、144TB GPU,用于支持生成式
    发表于 05-30 14:15 450次阅读
    NVIDIA推出DGX GH200 <b class='flag-5'>AI</b><b class='flag-5'>超级</b><b class='flag-5'>计算</b>机

    COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超级计算

    新型 AI 超级计算机将 256 个 Grace Hopper 超级芯片连接为巨大的、1-Exaflop、144TB GPU,用于支持生成式
    的头像 发表于 05-30 01:40 1517次阅读
    COMPUTEX2023 | NVIDIA 推出 DGX GH200 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算</b>机

    NVIDIA 携手微软,在生成式 AI新时代推动 Windows PC 创新

    )等游戏渲染技术为代表,正在迅速为生产力、内容创作、游戏等开创计算新时代。 在 微软 Build 开发者大会 上,NVIDIA 和微软展示了一系列搭载 NVIDIA RTX GPU 的 Windows 11 PC 和工作站
    的头像 发表于 05-25 09:15 531次阅读
    NVIDIA 携手微软,在生成式 <b class='flag-5'>AI</b> 的<b class='flag-5'>新时代</b>推动 Windows PC 创新

    NVIDIA Grace 掀起新型节能 Arm 超级计算机的新浪潮

    公布了一个基于 NVIDIA Grace CPU 超级芯片 的超级计算机,为基于 Arm Neoverse 平台的新型节能
    的头像 发表于 05-23 07:10 383次阅读