0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达与亚马逊联手打造了一台拥有16384个超级芯片的超级计算机

微云疏影 来源:EDN电子技术设计 作者:EDN电子技术设计 2023-12-06 16:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

英伟达亚马逊云科技宣布,将共同推出首款云AI超级计算机,将英伟达的H200 Grace Hopper超级芯片与亚马逊UltraCluster扩展功能融合。

据悉,该合作项目代号为Project Ceiba,共计搭载了16384颗英伟达H200超级芯片,能够处理65 exaflops速度等级的AI运算,这个超级计算机是配备了H200 NVL32与Amazon EFA互连技术的大规模系统,将部署在亚马逊云科技之上。

这一合作项目的重要性得到了双方高层的亲自站台,亚马逊云科技CEO Adam Selipsky和英伟达CEO黄仁勋纷纷表示,他们共同的目标是发展生成式AI,为各个领域提供成本效益和先进的生成式AI。

亚马逊云科技首席执行官Adam Selipsky 表示:“今天,我们为图形、游戏、高性能计算、机器学习以及现在的生成式人工智能等工作负载提供最广泛的英伟达GPU 解决方案。我们继续与英伟达合作创新,将下一代英伟达Grace Hopper Superchips 与亚马逊云科技的 EFA 强大网络、EC2 UltraClusters 的超大规模集群以及 Nitro 的高级虚拟化功能相结合,使亚马逊云科技成为运行 GPU 的最佳场所。”

Ceiba项目是此次合作的基石,旨在创建世界上最快的 GPU 驱动的 AI 超级计算机,由 亚马逊云科技 托管,并专门为英伟达提供。这个雄心勃勃的项目将集成 16,384 个英伟达GH200 超级芯片(使用 GH200 NVL32 解决方案,包含 32 个 GH200 GPU 和 19.5 TB 统一内存),这些芯片将提供惊人的 65 个“AI ExaFLOPS”处理能力。这台超级计算机用于英伟达的生成式人工智能研发项目。

亚马逊云科技上托管的英伟达DGX 云是此次合作的另一个主要组成部分。该人工智能培训即服务平台是第一个将 GH200 NVL32 机器与 19.5 TB 统一内存结合在一起的商用实例。该平台为开发人员提供了单个实例中可用的最大共享内存,显着加速了高级生成人工智能和大型语言模型的训练过程,可能超过 1 万亿个参数。

此外,亚马逊云科技将率先提供 基于Nvidia GH200 Grace Hopper Superchips的基于云的AI超级计算机。这种独特的配置将使用 NVLink 连接每个实例 32 个 Grace Hopper Superchip。它将扩展到数千个 GH200 Superchips(和 4.5 TB HBM3e 内存),与 Amazon 的 EFA 网络连接,并得到高级虚拟化(亚马逊云科技 Nitro System)和超大规模集群(Amazon EC2 UltraClusters)的支持。

此次合作还将推出 新的英伟达支持的Amazon EC2实例。这些实例将配备 H200 Tensor Core GPU,具有高达 141 GB 的 HBM3e 内存,适用于大规模生成式 AI 和高性能计算 (HPC) 工作负载。此外,G6 和 G6e 实例分别配备 NvidiaL4 和 L40S GPU,专为从 AI 微调到 3D 工作流程开发等广泛应用而设计,并利用英伟达Omniverse 创建支持 AI 的 3D 应用程序。

此次合作将引入英伟达的先进软件 ,以加速亚马逊云科技上的生成式 AI 开发。其中包括用于创建聊天机器人和摘要工具的 NeMo LLM 框架和 NeMo Retriever 以及用于加速药物发现流程的 BioNeMo。

英伟达创始人兼首席执行官黄仁勋表示:“生成式 AI 正在改变云工作负载,并将加速计算作为多样化内容生成的基础。”在向每位客户提供经济高效的最先进的生成式人工智能这一共同使命的推动下,Nvidia和亚马逊云科技正在整个计算堆栈上进行合作,涵盖人工智能基础设施、加速库、基础模型和生成式人工智能服务。 ”

此外,亚马逊云科技还宣布了自家芯片的大升级,发布了Graviton4通用AI芯片。与上一代Graviton3相比,Graviton4的计算性能提高了30%,核心数量增加了50%,内存带宽增加了75%。这一芯片将应用于内存优化型的Amazon EC2 R8g实例,提升高性能数据库、内存缓存和大数据分析工作的效率。

另外,Trainum2芯片也亮相,主要用于拥有超大参数模型的训练。相比于上一代Trainium1,Trainum2在速度上提升了4倍,在能效方面也有2倍的提升。这一芯片将支持新的服务,为客户提供大规模的模型构建和训练能力。

亚马逊云科技不仅在硬件方面进行了升级,还发布了生成式AI应用搭建平台Bedrock。亚马逊云科技的Keynote演讲中,还展示了一款名为Amazon Q的工作版ChatGPT,专为企业用户设计,帮助员工利用公司的数据和专业知识获取答案、解决问题。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136069
  • 英伟达
    +关注

    关注

    23

    文章

    4115

    浏览量

    99615
  • 亚马逊
    +关注

    关注

    8

    文章

    2736

    浏览量

    85889
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Vera rubin平台即将交付,英伟800VDC电源方案进展如何?

    电子发烧友网报道(文/梁浩斌)在刚刚结束的‌GTC 2026上,英伟推出了Vera Rubin POD,这是套极致的软硬件协同设计的多机架系统组成的集群,也是一台AI
    的头像 发表于 03-23 00:44 7745次阅读
    Vera rubin平台即将交付,<b class='flag-5'>英伟</b><b class='flag-5'>达</b>800VDC电源方案进展如何?

    GPU不是AI的唯解:英伟用Groq LPU证明,推理赛道需要“另条腿”

    大会上,英伟CEO黄仁勋正式发布Vera Rubin AI超级计算机平台。这
    的头像 发表于 03-24 11:27 6032次阅读
    GPU不是AI的唯<b class='flag-5'>一</b>解:<b class='flag-5'>英伟</b><b class='flag-5'>达</b>用Groq LPU证明,推理赛道需要“另<b class='flag-5'>一</b>条腿”

    使用NVIDIA技术驱动的超级计算机助力开放科学研究

    备受瞩目的 HPC 奖决赛入围项目凭借 Alps、JUPITER 和 Perlmutter 超级计算机的支持在气候建模、流体模拟等领域取得了重大突破。
    的头像 发表于 11-25 11:17 989次阅读

    快450000000倍!超导量子计算机“天衍-287”建成

    电子发烧友网综合报道 2025年11月14日,中国电信量子研究院正式宣布,搭载“祖冲之三号”同款芯片的超导量子计算机“天衍-287”完成搭建。这突破标志着我国首个具备“量子计算优越性
    的头像 发表于 11-18 08:40 8921次阅读
    快450000000倍!超导量子<b class='flag-5'>计算机</b>“天衍-287”建成

    英伟发布 NVQLink 开放系统架构;国内首个汽车芯片标准验证平台投入使用

    计算机相连接。   英伟首席执行官黄仁勋在主题演讲中表示,该系统有望奠定混合量子-经典计算系统的技术基础,并将其比作“量子时代的罗塞塔石碑”(Rosetta Stone)。   “在
    发表于 10-29 10:33 1336次阅读

    奥士康召开DGX Spark AI超级计算机项目表彰大会

    2025年9月22日,奥士康科技股份有限公司隆重召开DGXSparkAI超级计算机项目表彰大会,以表彰在客户开发、产品研发、工程设计和批量生产等方面作出突出贡献的核心团队。
    的头像 发表于 09-24 10:51 1054次阅读

    英伟:我们的芯片不存监控软件 NVIDIA官方发文 NVIDIA芯片不存在后门、终止开关和监控软件

    基础设施等行业。业界将 NVIDIA GPU 集成于众多系统中,包括 CT 扫描仪、MRI 机器、DNA 测序仪、空中交通雷达跟踪系统、城市交通管理系统、自动驾驶汽车、超级计算机、电视广播系统和游戏机等。 为了降低误用风险,
    的头像 发表于 08-06 12:13 2579次阅读

    NVIDIA助力AI超级计算机Isambard-AI投入使用

    英国布里斯托大学的超级计算机 Isambard-AI 采用 NVIDIA Grace Hopper 超级芯片,其 AI 算力达到了 21 ExaFLOPS,不仅是英国最快的系统,同时也
    的头像 发表于 07-28 15:07 1428次阅读

    GB10超级芯片开卖!正式杀入AI PC

    上,英伟就正式发布首款个人超级电脑Project DIGITS,其搭载英伟
    的头像 发表于 07-09 01:21 4343次阅读

    NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展

    现代高性能计算不仅使得更快的计算成为可能,它正驱动着 AI 系统解锁更多领域的科学突破。 高性能计算经历多次迭代,每次都源于对技术的创造
    的头像 发表于 06-26 19:39 1428次阅读
    NVIDIA驱动的现代<b class='flag-5'>超级</b><b class='flag-5'>计算机</b>如何突破速度极限并推动科学发展

    Blue Lion超级计算机将在NVIDIA Vera Rubin上运行

    德国莱布尼茨超算中心(LRZ)将迎来全新超级计算机 Blue Lion,其算力比该中心现有的 SuperMUC-NG 高性能计算机提升了约 30 倍。这台新的超级
    的头像 发表于 06-12 15:39 1351次阅读

    NVIDIA技术赋能欧洲最快超级计算机JUPITER

    NVIDIA 宣布,搭载 NVIDIA Grace Hopper 平台的 JUPITER 超级计算机成为欧洲最快超级计算机,其运行 HPC 和 AI 工作负载的速度是第二名的两倍以上。
    的头像 发表于 06-12 15:33 1650次阅读

    NVIDIA助力全球最大量子研究超级计算机

    NVIDIA 宣布将开设量子-AI 技术商业应用全球研发中心(G-QuAT),该中心部署全球最大量子计算研究专用超级计算机 ABCI-Q。
    的头像 发表于 05-22 09:44 1093次阅读

    LMFD格子多相流体力学仿真机:超级计算如何实现平民化?

    多相流体力学仿真直是工业设计与优化的核心环节。然而,传统仿真依赖高性能超级计算机,不仅硬件投入高昂,且计算资源占用巨大,导致中小企业难以承受。为解决这
    的头像 发表于 05-12 14:34 1051次阅读
    LMFD格子多相流体力学仿真机:<b class='flag-5'>超级</b><b class='flag-5'>计算</b>如何实现平民化?

    使用CY3014USB芯片组制作了一台相机,视频显示延迟怎么解决?

    我使用 CY3014USB 芯片组制作了一台相机,视频从相机流向计算机,显示屏上显示出精美的图像。 我注意到摄像机前发生的事情和信息在屏幕上更新/流动之间存在延迟。 延迟时间几乎持续 1 秒。 这
    发表于 05-06 09:11