0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

COMPUTEX2023 | NVIDIA 推出面向超大规模生成式 AI 的加速以太网平台

NVIDIA英伟达企业解决方案 来源:未知 2023-05-30 01:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

全新的 NVIDIA Spectrum-X 网络平台集 NVIDIA Spectrum-4、BlueField-3 DPU 和加速软件于一身;全球头部云服务提供商采用该平台来横向扩展其生成式 AI 服务

COMPUTEX—2023 年 5 月 29 日NVIDIA 于今日宣布推出 NVIDIA Spectrum-X 网络平台,该平台是一个加速网络平台,致力于提高基于以太网 AI 云的性能与效率。

NVIDIA Spectrum-X 是基于网络创新的新成果而构建 —— 将 NVIDIA Spectrum-4 以太网交换机NVIDIA BlueField-3 DPU 紧密结合,取得了 1.7 倍的整体 AI 性能和能效提升,同时可在多租户环境中提供一致、可预测的性能。Spectrum-X 还提供 NVIDIA 加速软件和软件开发套件(SDK),使开发人员能够构建软件定义的云原生 AI 应用。

这种端到端的功能交付,可以减少基于 transformer 的大规模生成式 AI 模型的运行时间,助力网络工程师、AI 数据科学家和云服务商及时取得更好的结果,并更快做出明智的决策。

全球头部超大规模云服务商正在采用 NVIDIA Spectrum-X,包括领先的云创新企业。

作为 NVIDIA Spectrum-X 参考设计的蓝图和测试平台,NVIDIA 正在构建一台超大规模生成式 AI 超级计算机,命名为 Israel-1。它将被部署在 NVIDIA 以色列数据中心,由基于 NVIDIA HGX 平台的戴尔 PowerEdge XE9680 服务器、BlueField-3 DPU 和 Spectrum-4 交换机等打造而成。

NVIDIA 网络高级副总裁 Gilad Shainer 表示:“诸如生成式 AI 等革命性技术正在推动各家企业提升数据中心性能的极限,从而获得更多竞争优势。作为新一代以太网络,NVIDIA Spectrum-X 为新一代 AI 工作负载扫清障碍,将会彻底改变整个行业。”

NVIDIA Spectrum-X 网络平台具有高度的通用性,可用于各种 AI 应用。它采用完全标准的以太网,与现有以太网的堆栈实现互通。

该平台起步于 Spectrum-4,这是全球首款专为 AI 网络打造的 51Tb/s 以太网交换机。先进的 RoCE 扩展功能可以跨 Spectrum-4 交换机、BlueField-3 DPU 和 NVIDIA LinkX 光纤相互协同,共同构建了一个专为 AI 云优化的端到端 400GbE 网络。

NVIDIA Spectrum-X 通过性能隔离增强了多租户环境,确保租户的 AI 工作负载能以最佳性能持续运行。NVIDIA Spectrum-X 还提供了更好的 AI 性能可见性,它可以识别性能瓶颈,而且具有全自动网络验证功能。

驱动 Spectrum-X 的加速软件包括 Cumulus Linux、纯 SONiC 和 NetQ 等性能强大的 NVIDIA SDK,共同助力该网络平台实现极致性能。另外,Spectrum-X 还包括 BlueField DPU 的核心软件—— NVIDIA DOCA 软件框架。

NVIDIA Spectrum-X 单台交换机即可实现突破性的 256 个 200Gb/s 端口的连接,使用两层叶脊拓扑可以连接 16,000 个端口,以支持 AI 云的增长和扩展,同时保持极高的性能和极低的网络延时。

生态采用情况

提供 NVIDIA Spectrum-X 方案的公司包括戴尔科技、联想和超微。

供货情况

NVIDIA Spectrum-X、Spectrum-4 交换机、BlueField-3 DPU 和 400G LinkX 光纤现已上市。

聆听 COMPUTEX 主题演讲,进一步了解 NVIDIA Spectrum-X。

47a3be26-fe47-11ed-90ce-dac502259ad0.png

点击 “阅读原文”,或扫描下方海报二维码,观看 NVIDIA 创始人兼 CEO 黄仁勋为 COMPUTEX 2023 带来的主题演讲直播回放,了解 AI、图形及其他领域的最新进展!


原文标题:COMPUTEX2023 | NVIDIA 推出面向超大规模生成式 AI 的加速以太网平台

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97665

原文标题:COMPUTEX2023 | NVIDIA 推出面向超大规模生成式 AI 的加速以太网平台

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助
    的头像 发表于 12-01 09:25 487次阅读

    新思科技VIP全面支持超以太网与UALink协议

    以太网针对横向扩展架构设计,是一种专为AI量身定制的开放、可互操作、高性能协议解决方案,得到了交换机、网络、半导体和系统供应等领域的知名企业及超大规模用户的支持。
    的头像 发表于 11-03 16:08 531次阅读
    新思科技VIP全面支持超<b class='flag-5'>以太网</b>与UALink协议

    NVIDIA Spectrum-X 以太网交换机助力 Meta 和 Oracle 加速网络性能

    超大规模企业广泛采用 NVIDIA 网络解决方案,驱动十亿瓦级(Giga-Scale)高性能 AI 数据中心 Meta 推出基于 NVIDIA
    的头像 发表于 10-14 10:26 1435次阅读
    <b class='flag-5'>NVIDIA</b> Spectrum-X <b class='flag-5'>以太网</b>交换机助力 Meta 和 Oracle <b class='flag-5'>加速</b>网络性能

    NVIDIA推出Spectrum-XGS以太网技术

    NVIDIA 今日宣布推出 NVIDIA Spectrum-XGS 以太网。这项跨区域扩展(scale-across)技术可将多个分布数据
    的头像 发表于 08-27 12:51 1120次阅读

    AI网络管理新范式:精要解读超以太网联盟(UEC)1.0 规范(2025Q2)

    随着AI与高性能计算(HPC)集群对网络带宽、时延和拥塞管理的要求日益严苛,传统以太网超大规模场景下面临瓶颈。为此,超以太网联盟(UEC) 在Linux联合开发基金会(JDF)下成立
    的头像 发表于 07-11 18:41 1931次阅读
    <b class='flag-5'>AI</b>网络管理新范式:精要解读超<b class='flag-5'>以太网</b>联盟(UEC)1.0 规范(2025Q2)

    伟创力高效电源模块在超大规模数据中心的应用

    受云端存储和数据处理需求持续增长的推动,数据中心正以前所未有的速度扩张。当前全球超大规模数据中心,即规模最大的那些数据中心,总容量在过去四年内翻了一番,并仍在不断增长。
    的头像 发表于 07-07 15:41 902次阅读

    超大规模芯片验证:基于AMD VP1902的S8-100原型验证系统实测性能翻倍

    引言随着AI、HPC及超大规模芯片设计需求呈指数级增长原型验证平台已成为芯片设计流程中验证复杂架构、缩短迭代周期的核心工具。然而,传统原型验证系统受限于单芯片容量(通常
    的头像 发表于 06-06 13:13 1093次阅读
    <b class='flag-5'>超大规模</b>芯片验证:基于AMD VP1902的S8-100原型验证系统实测性能翻倍

    纳微半导体推出12kW超大规模AI数据中心电源

    近日,纳微半导体宣布推出专为超大规模AI数据中心设计的最新12kW量产电源参考设计,可适配功率密度达120kW的高功率服务器机架。
    的头像 发表于 05-27 16:35 1150次阅读

    AI原生架构升级:RAKsmart服务器在超大规模模型训练中的算力突破

    近年来,随着千亿级参数模型的崛起,AI训练对算力的需求呈现指数级增长。传统服务器架构在应对分布训练、高并发计算和显存优化等场景时逐渐显露瓶颈。而RAKsmart为超大规模模型训练提供了全新的算力解决方案。
    的头像 发表于 04-24 09:27 612次阅读

    NVIDIA 与行业领先的存储企业共同推出面向 AI 时代的新型企业基础设施

    3 月 18 日 —— NVIDIA 今日推出NVIDIA AI 数据平台 —— 一项可自定义的参考设计,领先的存储提供商可用来构建全
    发表于 03-19 10:11 413次阅读
    <b class='flag-5'>NVIDIA</b> 与行业领先的存储企业共同<b class='flag-5'>推出面向</b> <b class='flag-5'>AI</b> 时代的新型企业基础设施

    NVIDIA发布Cosmos平台加速物理AI开发

    NVIDIA近日宣布了一项重大创新——推出NVIDIA Cosmos™平台。该平台集成了先进的生成
    的头像 发表于 01-13 11:06 1054次阅读

    NVIDIA Omniverse扩展至生成物理AI领域

    NVIDIA近日宣布,其Omniverse™平台再次实现重大突破,成功推出多个生成AI模型和蓝
    的头像 发表于 01-13 10:56 1056次阅读

    NVIDIA推出多个生成AI模型和蓝图

    NVIDIA 宣布推出多个生成 AI 模型和蓝图,将 NVIDIA Omniverse 一体化
    的头像 发表于 01-08 10:48 1023次阅读

    新思科技推出以太网与UALink IP解决方案

    高性能计算(HPC)和人工智能(AI)加速器对基于标准、高带宽和低延迟互连的迫切需求。 随着超大规模数据中心基础设施的迅猛发展,支持处理大型语言模型中数万亿个参数的能力成为关键。为实现这一目标,数据中心必须扩展到数十万个具有高效
    的头像 发表于 12-25 11:12 1070次阅读

    新思科技推出业界首款连接大规模AI加速器集群的超以太网和UALink IP 解决方案

    控制器、PHY 和验证 IP,以满足对基于标准、高带宽和低延迟 HPC 和 AI 加速器互连的需求。超大规模数据中心基础设施正在加速发展,必须扩展到数十万个具有高效快速连接的
    发表于 12-20 11:47 743次阅读