0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

单芯片性能不抵拓展性,数据中心的交换矩阵

842221752 来源:电子发烧友 作者:周凯扬 2024-04-04 00:51 次阅读

电子发烧友网报道(文/周凯扬)在现代数据中心架构中,网络和计算设备都部署在两层甚至三层的互联矩阵中,与传统的多层架构不同,数据中心的交换矩阵促成了服务器架构的扁平化,进一步缩短了数据中心内不同端点之间的距离,提高效率的同时,也降低了延迟。

可以说交换矩阵技术决定了数据中心的扩展性,相较传统的网络交换矩阵而言,如今的复杂计算交换矩阵,也就是我们所说的芯片外互联技术,更是提高算力的重要解决方案之一。

英伟达NVLink和NV Switch

与其他公司采用的通用交换矩阵技术不同,英伟达凭借其在互联交换技术上的积累,再结合收购Mellanox获得的技术,为其GPU产品打造并迭代了NVLink和NVSwitch技术。

以目前的英伟达GPU服务器集群为例,集群内的GPU通过NVSwitch交换机,以NVLink来实现互相通信。如今NVLink技术已经发展至第五代,NVSwitch也已经发展至第四代NVLink Switch。

随着GB200的出现,英伟达已经实现了单Blackwell GPU支持18个NVLink连接的可拓展性,也使得总带宽达到了1.8TB/s,是第四代NVLink技术的两倍,更是远超PCIe 5.0。

单个GB200 NVL72服务器更是可以集成72个GB200 GPU,依靠NVLink Switch实现130TB/s的总带宽,这样的可拓展性对于提高现在的大模型训练规模和速度来说尤为重要,NVL72就可以普遍用于训练万亿参数级别的大模型。

AMD Infinity Fabric

虽然很多AI加速器初创企业或英伟达的竞争对手,都会鼓吹单个GPU或加速器的性能本身,但如果不能从扩展性上缩短差距,也很难被云服务厂商和数据中心大规模商用。以英伟达的老对手AMD为例,他们的MI300系列在交换矩阵的支持上由128链路组成,其中64个支持PCIe 5.0和自研的Infinity Fabric,另外64个则仅支持Infinity Fabric。

在单芯片或单个服务器上的性能可能会更加优异,但一旦扩展至数百个服务器的规模下,就很难继续保持优势了。AMD也很清楚自己需要缩小这一差距,但仅仅依靠自身在Infinity Fabric交换矩阵上的积累,很难打通整个生态,所以AMD选择了合作开放一途。

早在去年AMD的Advancing AI大会上,AMD就宣布向生态合作伙伴开放自己的Infinity Fabric IP(XGMI),呼吁别的交换芯片厂商对Infinity Fabric加以支持。比如博通就表示,其下一代PCIe交换芯片,除了支持PCIe、CXL之外,也将支持AMD的Infinity Fabric。

然而这里指的并不是今年下半年才送样的PCIe 6.0交换芯片,Atlas 3系列,而是PCIe 7.0的Atlas 4系列。由此看来,要想真正见到第三方交换矩阵方案支持AMD的Infinity Fabric,还得等到PCIe 7.0正式面世。

写在最后

对于市面上其他的AI加速器而言,开放标准或已有的商用标准是他们的最好选择,比如PCIe、CXL等等。除此之外,据了解一些与缓存一致性相关的专利即将过期,或许对于一些初创公司来说,未来会有开源的高端交换互联方案供他们选择。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据中心
    +关注

    关注

    15

    文章

    4189

    浏览量

    70116
收藏 人收藏

    评论

    相关推荐

    #mpo极性 #数据中心mpo

    数据中心MPO
    jf_51241005
    发布于 :2024年04月07日 10:05:13

    #mpo光纤跳线 #数据中心光纤跳线

    光纤数据中心
    jf_51241005
    发布于 :2024年03月22日 10:18:31

    交换机分布缓存_述说数据中心交换机的重要性能指标——缓存

    交换机是数据中心不可缺少的网络设备,在数据中心里发挥着重要作用。在平时使用和采购时,大多数都关注交换机的背板带宽、端口密度、单端口速度、协议特性等方面的
    的头像 发表于 03-15 17:39 245次阅读

    #MPO预端接 #数据中心机房 #机房布线

    数据中心MPO
    jf_51241005
    发布于 :2024年03月01日 11:12:47

    #永久链路 #信道测试 #数据中心

    数据中心
    jf_51241005
    发布于 :2024年02月23日 10:17:58

    KVM矩阵数据中心虚拟化管理的关键组件

    随着信息技术的快速发展,数据中心已经成为企业IT基础设施的核心。在数据中心中,虚拟化技术是提高资源利用率、降低运营成本的关键。而KVM矩阵作为数据中心虚拟化管理的关键组件,发挥着至关重
    的头像 发表于 02-18 14:38 166次阅读

    KVM矩阵技术的未来趋势:融合新兴科技,引领数据中心管理新潮流

    随着信息技术的持续进步,KVM矩阵技术作为数据中心管理的核心组件,正不断融合新兴科技,以应对日益增长的数据中心复杂性和需求。本文将探讨KVM矩阵技术的未来趋势,以及它如何引领
    的头像 发表于 02-18 14:34 161次阅读
    KVM<b class='flag-5'>矩阵</b>技术的未来趋势:融合新兴科技,引领<b class='flag-5'>数据中心</b>管理新潮流

    #紧套光缆 #松套光缆 #数据中心

    数据中心光缆
    jf_51241005
    发布于 :2024年01月26日 09:44:11

    #光缆水峰 #综合布线光缆 #数据中心

    数据中心光缆
    jf_51241005
    发布于 :2024年01月15日 09:43:26

    #预端接光缆 #24芯光缆 #数据中心

    数据中心光缆
    jf_51241005
    发布于 :2023年12月08日 11:01:21

    大模型时代,数据中心将转向何方?

    数据中心大模型
    脑极体
    发布于 :2023年11月22日 09:01:41

    数据中心交换机的关键参数

    电子发烧友网站提供《数据中心交换机的关键参数.pdf》资料免费下载
    发表于 11-10 15:18 0次下载
    <b class='flag-5'>数据中心</b><b class='flag-5'>交换</b>机的关键参数

    如何构建更好的云:利用统一的虚拟化存储和数据中心交换矩阵

    电子发烧友网站提供《如何构建更好的云:利用统一的虚拟化存储和数据中心交换矩阵.pdf》资料免费下载
    发表于 08-28 10:19 0次下载
    如何构建更好的云:利用统一的虚拟化存储和<b class='flag-5'>数据中心</b><b class='flag-5'>交换</b><b class='flag-5'>矩阵</b>

    华为:数据中心交换机市场常胜将军!蝉联第一!

    近日,根据国际数据公司IDC《中国数据中心交换机市场跟踪报告,2023Q1》数据显示,华为CloudEngine系列数据中心
    的头像 发表于 06-30 20:15 342次阅读
    华为:<b class='flag-5'>数据中心</b><b class='flag-5'>交换</b>机市场常胜将军!蝉联第一!

    2023年数据中心交换机市场展望

    本文为Dell’Oro Group分析师Sameh Boujelbene关于2023年数据中心交换机的预测。
    的头像 发表于 06-15 15:18 588次阅读