0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AWS成为第一个提供NVIDIA GH200 Grace Hopper超级芯片的提供商

汽车电子设计 来源:芝能汽车 2023-11-30 09:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2023年的AWS re:Invent大会上,AWS和NVIDIA宣布AWS将成为第一个提供NVIDIA GH200 Grace Hopper超级芯片的云服务提供商。这一超级芯片通过NVIDIA DGX Cloud与NVIDIA NVLink技术相连,将在Amazon Elastic Compute Cloud(Amazon EC2)上运行,为云计算带来了一场技术革命。

一)大杀器NVIDIA GH200 NVL32

NVIDIA GH200 NVL32 是针对 NVIDIA GH200 Grace Hopper 超级芯片的机架级参考设计,通过 NVLink 连接,面向超大规模数据中心。支持 16 个与 NVIDIA MGX 机箱设计兼容的双 NVIDIA Grace Hopper 服务器节点,并且可以采用液体冷却,以最大限度地提高计算密度和效率。

NVIDIA GH200 NVL32 的主要特点如下:

拥有 32 个 GPU NVLink 域,每个 GPU NVLink 域包含一个 GH200 Grace Hopper 超级芯片,可以访问网络中任何其他 Grace Hopper 超级芯片的内存,从而提供 19.5 TB 的 NVLink 可寻址内存。这意味着它可以突破单个系统的内存限制,实现更大的并行性和可扩展性。

使用 9 个 NVLink 交换机,每个交换机包含一个第三代 NVSwitch 芯片,将 32 个 GH200 GPU 连接在一起,形成一个完全连接的胖树网络。这意味着它可以实现高速的通信和低延迟的同步,提高人工智能的性能和效率。

由 NVIDIA HPC SDK 以及全套 CUDA、NVIDIA CUDA-X 和 NVIDIA Magnum IO 库支持,可加速超过 3,000个 GPU 应用程序。这意味着它可以提供丰富的软件生态系统,让开发者和研究者可以轻松地开发和部署人工智能应用程序。

二)NVIDIAGH200 NVL32的应用场景

NVIDIA GH200 NVL32 非常适合以下几种人工智能应用场景:

1)AI推理和训练:生成式人工智能模型可以根据给定的文本或上下文生成自然语言,广泛应用于聊天机器人、文本摘要、文本生成、机器翻译等领域,为用户提供智能的交互和服务。法学硕士需要大规模、多 GPU 训练,参数数量非常庞大,例如 GPT-3 有 1750 亿个参数,GPT-4 有 1.5 万亿个参数。NVIDIA GH200 NVL32 专为推理和训练下一代法学硕士而构建。该系统利用 32 个 NVLink 连接的 GH200 Grace Hopper 超级芯片突破了内存、通信和计算瓶颈,训练万亿参数模型的速度比 NVIDIA HGX H100 快 1.7 倍 以上。在 GPT-530B 推理模型上,NVIDIA GH200 NVL32 系统的性能比四个 H100 NVL8 系统高出 2 倍。

a5470a3c-8f16-11ee-939d-92fbcf53809c.png

2)推荐系统:人工智能模型可以根据用户的偏好和行为,向用户推荐最相关和最感兴趣的内容或产品。它们广泛用于电子商务和零售、媒体和社交媒体、数字广告等领域,以实现内容个性化。

a55a6cc6-8f16-11ee-939d-92fbcf53809c.png

这推动了收入和商业价值。推荐器使用代表用户、产品、类别和上下文的嵌入,大小可达数十 TB。高度准确的推荐器将提供更具吸引力的用户体验,但也需要更大的嵌入和更精确的推荐器。嵌入对于人工智能模型具有独特的特征,需要大量内存、高带宽和闪电般快速的网络。NVIDIA GH200 NVL32 可提供 7 倍 的快速访问内存,并且与基于 x86 的传统设计中与 GPU 的 PCIe Gen5 连接相比,可提供 7 倍 的带宽。与采用 x86 的 H100 相比,它可以实现 7 倍 详细的嵌入。NVIDIA GH200 NVL32 还可以为具有大量嵌入表的模型提供高达 7.9 倍 的训练性能。

3)图神经网络图神经网络是一种人工智能模型,可以将深度学习的预测能力应用于丰富的数据结构,这些数据结构将对象及其关系描述为图中由线连接的点。科学和工业的许多分支已经将有价值的数据存储在图数据库中。深度学习用于训练预测模型,从图表中挖掘新的见解。

a572e738-8f16-11ee-939d-92fbcf53809c.png

总结:

Amazon和NVIDIA推动NVIDIA DGX Cloud即将在AWS上推出,将成为首家在DGX云中提供NVIDIA GH200 NVL32,并将其作为EC2实例的云服务提供商。NVIDIA GH200 NVL32解决方案包含32个GPU NVLink域和19.5 TB的大容量统一内存。在GPT-3的训练和LLM推理方面明显优于先前的模型。NVIDIA GH200 NVL32的CPU-GPU内存互连速度非常快,提高了应用程序的内存可用性。该技术是超大规模数据中心可扩展设计的一部分,由NVIDIA软件和库提供支持,可加速数千个GPU应用程序。NVIDIA GH200 NVL32特别适用于LLM训练和推理、推荐系统、GNN等任务,为人工智能和计算应用程序带来显著的性能改进。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5685

    浏览量

    110111
  • GPT
    GPT
    +关注

    关注

    0

    文章

    371

    浏览量

    16959
  • 超级芯片
    +关注

    关注

    0

    文章

    39

    浏览量

    9339
  • AWS
    AWS
    +关注

    关注

    0

    文章

    444

    浏览量

    26631
  • GPU芯片
    +关注

    关注

    1

    文章

    307

    浏览量

    6553

原文标题:NVIDIA GH200 NVL32在AWS里落地

文章出处:【微信号:QCDZSJ,微信公众号:汽车电子设计】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    SmartDV首次以“全栈IP解决方案提供商”身份亮相Embedded World 2026

    中国北京,2026年3月——领先的定制化半导体知识产权(硅IP)和验证IP(VIP)提供商SmartDV宣布,公司计划在2026年推出并持续扩展全新的模拟IP产品组合,进步完善其产品版图,成为能够
    的头像 发表于 03-06 09:05 449次阅读
    SmartDV首次以“全栈IP解决方案<b class='flag-5'>提供商</b>”身份亮相Embedded World 2026

    NVIDIA 收购开源工作负载管理提供商 SchedMD

    软件的主要开发,Slurm 是款用于 HPC 和 AI 的开源工作负载管理系统。此次收购旨在帮助强化开源软件生态系统,并推动研究人员、开发者和企业的 AI 创新。 NVIDIA 将继续开发并
    的头像 发表于 12-16 18:24 1470次阅读

    NVIDIAAWS扩展全栈合作伙伴关系

    亚马逊云科技(AWS)将 NVIDIA NVLink Fusion 集成到其定制芯片中,包括新代 Tranium4 芯片、Graviton
    的头像 发表于 12-13 09:20 1107次阅读

    NVIDIA DGX Spark助力构建自己的AI模型

    作为个人 AI 超级计算机,为世界各地的 AI 研究人员、数据科学家和学生提供 NVIDIA Grace Blackwell 平台的强大功能。
    的头像 发表于 11-21 09:25 1521次阅读
    <b class='flag-5'>NVIDIA</b> DGX Spark助力构建自己的AI模型

    MediaTek携手NVIDIA开启个人AI算力新纪元

    即将上市的 NVIDIA DGX Spark 个人 AI 超级计算机,搭载 MediaTek 与 NVIDIA 合作设计的 GB10 Grace Blackwell
    的头像 发表于 10-16 11:26 929次阅读

    Smart Eye的AIS系统获得全球车队管理解决方案提供商Optix订单

    全球人类洞察AI与驾驶员监测系统(DMS)领域的领先者Smart Eye今日宣布,其AIS系统获得全球车队管理解决方案提供商Optix的里程碑式订单。2025年,将有4000辆商用车辆率先集成Smart Eye的技术,这标志着全球范围内的首次大规模部署。
    的头像 发表于 09-12 10:38 1360次阅读

    飞音科技成为普华基础软件开源小满认证服务提供商

    的深厚积累与专业能力,荣获普华基础软件授予的“开源小满认证服务提供商” 称号,成为开源小满EasyXMen 生态体系的核心合作伙伴之。同期,普华基础软件正式为飞音科技三位首批认证工程师颁发证书,标志着飞音科技与普华基础软件在生
    的头像 发表于 09-02 11:23 1038次阅读

    NVIDIA助力AI超级计算机Isambard-AI投入使用

    英国布里斯托大学的超级计算机 Isambard-AI 采用 NVIDIA Grace Hopper 超级
    的头像 发表于 07-28 15:07 1421次阅读

    如何将 CCG6/8 CFP 与外部提供商路径 FET 起使用?

    CCG 8 和 CCG 6 的 CFP 版本的硬件和固件堆栈是否支持使用外部提供商路径 FET?
    发表于 07-16 07:23

    GB10超级芯片开卖!正式杀入AI PC

    上,英伟达就正式发布了首款个人超级电脑Project DIGITS,其搭载了由英伟达与联发科合作开发的NVIDIA GB10 Grace Blackwell Superchip 芯片
    的头像 发表于 07-09 01:21 4338次阅读

    极海半导体荣获2025年度创新车规级芯片提供商

    近日,匠歆汽车联合上海汽车芯片工程中心、上海汽检举办的「The 3rd AutoSEMI 2025智能汽车芯片产业大会」在上海顺利召开。极海凭借领先的芯片技术创新能力与量产产品实力,荣膺“2025年度创新车规级
    的头像 发表于 07-04 15:27 1469次阅读

    航芯荣获「2025年度芯片安全性能优秀提供商」奖项

    ,航芯凭借其车规级安全芯片优异的市场表现,荣获「2025年度芯片安全性能优秀提供商」奖项。这不仅是对航芯技术实力、产品可靠性和市场影响力的肯定,更是对其为车联网安全
    的头像 发表于 06-24 18:21 949次阅读
    航芯荣获「2025年度<b class='flag-5'>芯片</b>安全性能优秀<b class='flag-5'>提供商</b>」奖项

    NVIDIA技术赋能欧洲最快超级计算机JUPITER

    NVIDIA 宣布,搭载 NVIDIA Grace Hopper 平台的 JUPITER 超级计算机成为
    的头像 发表于 06-12 15:33 1641次阅读

    借助NVIDIA技术加速半导体芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 网络架构和交换机,以及诸如 NVIDI
    的头像 发表于 05-27 13:59 1271次阅读

    NVIDIA Grace CPU C1获得广泛支持

    NVIDIA 在本周 COMPUTEX 上重点展示了其全新的 Grace CPU C1,并获得多家主要原始设计制造合作伙伴的大力支持。
    的头像 发表于 05-22 10:01 933次阅读