0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔、AMD等联手推出UALink,希望用它取代Nvidia NVLink接口

SDNLAB 来源:SDNLAB 2024-05-31 11:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

周四,英特尔AMD博通、思科、谷歌、HPE、Meta和微软宣布正在建立一个新的行业组织——Ultra Accelerator Link(UALink)推广组,以指导数据中心AI加速器芯片之间连接组件的发展。作为一项新的开放标准,他们希望用它来取代 Nvidia专有的 NVLink 接口

2859d140-1efd-11ef-91d2-92fbcf53809c.png  

去年七月,由英特尔、AMD、思科、Meta等公司支持的超以太网联盟 (UEC) 正式成立,旨在引领高性能网络的发展。现在,UALink横空出世,用于在同一系统或形成pod 的一组系统内连接 GPU/加速器。

如何“连接” GPU ?

Nvidia作为GPU技术的领航者,显著推动了GPU技术在高性能计算、通用人工智能(GenAI)等多个领域的应用发展。通过GPU间的互联,可以实现更复杂问题的处理及应用性能的飞跃。

GPU互连主要有三种基本方式:

1. PCI 总线:一般支持4至8个GPU通过PCI总线相连,而利用GigaIO FabreX内存架构等技术,这一数量可拓展至32个。CXL 技术也展现出了潜力,但是 Nvidia 对此的支持有限。对于多种应用场景,这些可重组的GPU架构作为GPU直接扩展的替代方案,具有吸引力。

2. 服务器间互连:以太网或 InfiniBand 可以连接包含 GPU 的服务器。这种连接级别通常称为横向扩展,其中较快的多 GPU 域通过较慢的网络连接以形成大型计算网络。其中,以太网长期担当计算机网络的核心,超以太网联盟的成立进一步推动其高性能发展。英特尔Gaudi -2 AI 处理器在芯片上拥有 24 个 100-Gigabit以太网连接,强化了在以太网领域的地位。Nvidia未加入Ultra Ethernet联盟,其在 2019 年 3 月收购 Mellanox 后,几乎独占了高性能 InfiniBand 互连市场。超以太网联盟旨在成为其他企业的“InfiniBand”。值得注意的是,英特尔过去曾是InfiniBand的主要推动者。

3. GPU 到 GPU 互连:鉴于快速且可扩展的GPU连接需求,Nvidia开发了NVLink,这是一种目前可在GPU间以每秒1.8TB 的速率传输数据的GPU间连接技术。还有NVLink机架级交换机,能够在无阻塞计算结构中支持多达576个全互联GPU。通过NVLink相连的GPU被称为“pod”,表明它们拥有独立的数据和计算域。

对于其他厂商来说,除了AMD用于连接MI300A APU的Infinity Fabric外,别无选择。如同InfiniBand与以太网的情况,需要一个由竞争对手组成的某种“Ultra”联盟来填补非Nvidia“pod”领域的空白。而UALink正是这一需求的响应。

UALink 剑指 NVLink !

与 NVLink 类似,构建一个强大、低延迟且高效的横向扩展网络至关重要,该网络可以轻松地将计算资源添加到单个实例(即将 GPU 和加速器视为一个大型系统或“pod”)。

在此背景下,UALink 和开放行业规范的出现对于标准化下一代硬件的 AI 和机器学习、HPC 和云应用接口至关重要。该小组将开发一种高速、低延迟的互连规范,旨在加速AI计算Pod中加速器与交换机间的扩展通信

UALink 1.0规范将支持在AI计算Pod内部连接多达1,024个加速器,并允许Pod内加速器(如GPU)所附着的内存之间进行直接加载与存储操作。UALink发起小组已组建UALink联盟,预计该联盟将于2024年第三季度正式成立。1.0规范预期同样在2024年第三季度面世,并向加入UALink联盟的公司开放。

28670c48-1efd-11ef-91d2-92fbcf53809c.png

UALink Scale Up Pod

UALink 的一大优势是,它为业内其他厂商提供了一个追赶Nvidia的机会。如今,Nvidia已有能力生产NVSwitch盒,并将这些NVSwitch托盘集成进诸如Nvidia DGX GB200 NVL72之类的高端产品中。相比之下,英特尔今年销售了价值数亿美元的 AI 加速器,AMD凭借MI300X预计将售出数十亿美元的产品,但尽管如此,其在AI领域的规模仍无法与Nvidia相提并论。

UALink的出现,使得像博通这样的企业能够制造UALink交换机,助力其他企业实现规模扩展,并且这些交换机能跨不同厂商的多种加速器使用。此前,博通就制定了Atlas交换机计划,即利用AMD Infinity Fabric作为与Nvidia NVLink竞争的规模化升级方案,并应用于PCIe Gen7的博通交换机中,这些交换机可能会实现 UALink V1.0。

超以太网将继续作为向更多节点扩展的关键技术。博通可能会在其 800Gbps Thor 产品系列的早期型号中集成超以太网 NIC,但考虑到规范标准化的当前进程,全面实现UEC标准的支持可能还需等待下一代产品的问世。

28722682-1efd-11ef-91d2-92fbcf53809c.png

UALink Ultra Ethernet

为了支持 UALink,超以太网联盟主席 J Metz 博士表达了其积极的支持态度:“在很短的时间内,科技行业已经接受了AI和HPC揭示的挑战。在追求效率与性能提升的过程中,加速器,尤其是GPU的互连,需要一个全面的视角。我们相信UALink所采取的针对Pod集群问题的扩展解决方案,与UEC的横向扩展协议相得益彰。我们满怀期待,未来能携手合作,共同打造一个既开放又利于生态系统建设、覆盖全行业的解决方案,以全面满足不同场景下的扩展需求。”

最后

如今,许多企业都在尝试采用标准 PCIe 交换机,并构建基于 PCIe 的架构以扩展到更多加速器。然而,行业巨头们似乎视其更多为权宜之计。相比之下,Nvidia的NVLink成为了业内公认的横向扩展技术标杆。现在,一个开放标准的阵营正崛起,旨在打破其专有技术壁垒。

对于 AMD 和英特尔等公司来说,这提供了一条复制 NVLink 和 NVSwitch 功能的道路,同时能够与其他企业共享开发成果。博通这样的公司很可能是最大的赢家,无论是在横向还是纵向扩展场景下,它都将成为非Nvidia系统连接解决方案的首选供应商。无论AMD或英特尔谁能领先,博通都将作为连接技术的供应商而受益。对于超大规模数据中心运营商来说,投资标准化架构极具意义,无论最终采用哪家的终端设备。

这一切都需要时间。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179325
  • 以太网
    +关注

    关注

    41

    文章

    5925

    浏览量

    179550
  • 交换机
    +关注

    关注

    23

    文章

    2870

    浏览量

    103931
  • GPU芯片
    +关注

    关注

    1

    文章

    306

    浏览量

    6399
  • AI加速器
    +关注

    关注

    1

    文章

    73

    浏览量

    9434

原文标题:“复仇者联盟”集结!英特尔、AMD等联手推出 UALink,剑指英伟达NVLink!

文章出处:【微信号:SDNLAB,微信公众号:SDNLAB】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用NVIDIA NVLink Fusion技术提升AI推理性能

    本文详细阐述了 NVIDIA NVLink Fusion 如何借助高效可扩展的 NVIDIA NVLink scale-up 架构技术,满足日益复杂的 AI 模型不断增长的需求。
    的头像 发表于 09-23 14:45 586次阅读
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>NVLink</b> Fusion技术提升AI推理性能

    NVIDIA英特尔合作推动产品组合创新

    NVIDIA英特尔今日宣布达成合作,将共同开发多代定制化的数据中心和个人计算产品,以加速超大规模计算、企业级及消费级市场的各类应用与工作负载的处理。
    的头像 发表于 09-23 14:29 542次阅读

    今日看点丨英伟达入股英特尔;寒武纪:网传订单信息不实

    NVLink 技术实现架构无缝互连 --融合 NVIDIA 在 AI 与加速计算领域的优势,以及英特尔先进的 CPU 技术与 x86 生态,为客户提供前沿解决方案。   在数据中心领域,英特
    发表于 09-19 10:21 917次阅读

    看点:AMD服务器CPU市场份额追上英特尔 华为Mate80主动散热专利曝光

    给大家带来一些业界资讯: AMD服务器CPU市场份额追上英特尔 根据市场研究机构PassMark的统计分析数据显示,AMD 公司在服务器CPU 市场取得重大进展,市占率首次达到50%,与竞争对手
    的头像 发表于 07-25 14:41 812次阅读
    看点:<b class='flag-5'>AMD</b>服务器CPU市场份额追上<b class='flag-5'>英特尔</b> 华为Mate80主动散热专利曝光

    NVIDIA推出NVLink Fusion技术

    NVIDIA 发布 NVIDIA NVLink Fusion,这款全新芯片将助力行业用户通过全球领先且广泛采用的计算互连架构 —— NVIDIA N
    的头像 发表于 05-22 09:59 707次阅读

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI加速器机架级和PCIe部署方案   2025 年 5 月 19 日,北京 ——今日
    发表于 05-20 11:03 1670次阅读

    NVIDIA NVLink 深度解析

    引言 NVIDIA NVLink 是一种关键的高速互连技术,专为加速计算而设计,尤其是在多 GPU 系统以及 GPU 和支持 CPU 之间 ^1^。NVLink 的出现标志着传统互连瓶颈的突破,凸显
    的头像 发表于 05-06 18:14 4109次阅读

    请问OpenVINO™工具套件英特尔®Distribution是否与Windows® 10物联网企业版兼容?

    无法在基于 Windows® 10 物联网企业版的目标系统上使用 英特尔® Distribution OpenVINO™ 2021* 版本推断模型。
    发表于 03-05 08:32

    英特尔®独立显卡与OpenVINO™工具套件结合使用时,无法运行推理怎么解决?

    使用英特尔®独立显卡与OpenVINO™工具套件时无法运行推理
    发表于 03-05 06:56

    博通台积电或联手瓜分英特尔

    近日,有消息称美国芯片制造大厂英特尔可能面临分拆,其芯片设计与营销业务及芯片制造部分或将分别由博通公司和台积电接手。目前,相关公司正在就这一潜在收购案进行评估。 据知情人士透露,博通一直在密切关注
    的头像 发表于 02-17 10:41 1415次阅读

    英特尔数据中心CPU销量降至14年最低

    近年来,英特尔在数据中心CPU市场的表现备受关注。据最新数据显示,由于来自AMD的竞争加剧,英特尔在2024年的数据中心CPU销量创下了十多年来的最低水平。
    的头像 发表于 02-08 14:48 887次阅读

    英特尔获欧盟5.1555亿欧元利息赔付

    欧元反垄断罚款。当时,欧盟委员会认定英特尔在2002年至2007年间存在反竞争行为,指控其通过提供回扣手段,阻止计算机制造商购买竞争对手AMD的芯片。 然而,经过长时间的法律较量,2022年欧盟普通法院发现欧盟委员会在经济分析
    的头像 发表于 02-06 11:30 730次阅读

    英特尔与扣子云平台合作推出AI PC Bot专区与端侧插件商店

    近日,在2024年火山引擎FORCE原动力大会的开发者论坛硬件终端专场上,英特尔携手扣子云平台共同推出了行业首个端云协同智能体开发平台——Coze-AIPC。这一合作标志着智能体技术应用发展的新突破
    的头像 发表于 12-27 14:11 1400次阅读

    英特尔与火山引擎合作,夯实AI应用智能底座

    在近期举办的火山引擎2024 FORCE原动力大会上,英特尔携手火山引擎及扣子Coze生态伙伴,共同展示了在智能计算领域的最新合作成果。 会上,英特尔与火山引擎联合发布了搭载英特尔®
    的头像 发表于 12-25 11:47 1271次阅读

    英特尔带您解锁云上智算新引擎

    在近日举办的2024火山引擎FORCE原动力大会上,英特尔与火山引擎联合发布基于英特尔 至强 6 性能核处理器的第四代服务器实例,以打造弹性算力底座的产品化实践。同时,英特尔也携手扣子共同推出
    的头像 发表于 12-23 14:05 1235次阅读