0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

单芯片性能不抵拓展性,数据中心的交换矩阵

842221752 来源:电子发烧友 作者:周凯扬 2024-04-04 00:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)在现代数据中心架构中,网络和计算设备都部署在两层甚至三层的互联矩阵中,与传统的多层架构不同,数据中心的交换矩阵促成了服务器架构的扁平化,进一步缩短了数据中心内不同端点之间的距离,提高效率的同时,也降低了延迟。

可以说交换矩阵技术决定了数据中心的扩展性,相较传统的网络交换矩阵而言,如今的复杂计算交换矩阵,也就是我们所说的芯片外互联技术,更是提高算力的重要解决方案之一。

英伟达NVLink和NV Switch

与其他公司采用的通用交换矩阵技术不同,英伟达凭借其在互联交换技术上的积累,再结合收购Mellanox获得的技术,为其GPU产品打造并迭代了NVLink和NVSwitch技术。

以目前的英伟达GPU服务器集群为例,集群内的GPU通过NVSwitch交换机,以NVLink来实现互相通信。如今NVLink技术已经发展至第五代,NVSwitch也已经发展至第四代NVLink Switch。

随着GB200的出现,英伟达已经实现了单Blackwell GPU支持18个NVLink连接的可拓展性,也使得总带宽达到了1.8TB/s,是第四代NVLink技术的两倍,更是远超PCIe 5.0。

单个GB200 NVL72服务器更是可以集成72个GB200 GPU,依靠NVLink Switch实现130TB/s的总带宽,这样的可拓展性对于提高现在的大模型训练规模和速度来说尤为重要,NVL72就可以普遍用于训练万亿参数级别的大模型。

AMD Infinity Fabric

虽然很多AI加速器初创企业或英伟达的竞争对手,都会鼓吹单个GPU或加速器的性能本身,但如果不能从扩展性上缩短差距,也很难被云服务厂商和数据中心大规模商用。以英伟达的老对手AMD为例,他们的MI300系列在交换矩阵的支持上由128链路组成,其中64个支持PCIe 5.0和自研的Infinity Fabric,另外64个则仅支持Infinity Fabric。

在单芯片或单个服务器上的性能可能会更加优异,但一旦扩展至数百个服务器的规模下,就很难继续保持优势了。AMD也很清楚自己需要缩小这一差距,但仅仅依靠自身在Infinity Fabric交换矩阵上的积累,很难打通整个生态,所以AMD选择了合作开放一途。

早在去年AMD的Advancing AI大会上,AMD就宣布向生态合作伙伴开放自己的Infinity Fabric IP(XGMI),呼吁别的交换芯片厂商对Infinity Fabric加以支持。比如博通就表示,其下一代PCIe交换芯片,除了支持PCIe、CXL之外,也将支持AMD的Infinity Fabric。

然而这里指的并不是今年下半年才送样的PCIe 6.0交换芯片,Atlas 3系列,而是PCIe 7.0的Atlas 4系列。由此看来,要想真正见到第三方交换矩阵方案支持AMD的Infinity Fabric,还得等到PCIe 7.0正式面世。

写在最后

对于市面上其他的AI加速器而言,开放标准或已有的商用标准是他们的最好选择,比如PCIe、CXL等等。除此之外,据了解一些与缓存一致性相关的专利即将过期,或许对于一些初创公司来说,未来会有开源的高端交换互联方案供他们选择。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据中心
    +关注

    关注

    18

    文章

    5890

    浏览量

    75291
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    产品彩页-CX-N数据中心交换机-v1.5

    CX-N系列数据中心交换机面向AI/ML(人工智能/机器学习)智算中心和云计算数据中心提供一站式全开放网络解决方案,具备低时延、高性能、高密
    发表于 05-26 16:27 0次下载

    AMC16Z为数据中心

    数据中心
    安科瑞缪志澄
    发布于 :2026年05月08日 14:47:10

    数据中心交换机中导热界面材料的选型思路

    随着数据中心交换机持续向高带宽、高功率密度发展,设备内部的散热设计也变得越来越关键。交换芯片、CPU、电源模块以及光模块接口等核心部位,在长期高负载运行下,对导热路径的稳定性提出了更高
    的头像 发表于 04-28 09:19 537次阅读

    华为入选2026年Gartner数据中心交换机市场指南报告代表性厂商

    近日,全球商业和技术洞察公司Gartner发布了2026年数据中心交换机市场指南报告(《Market Guide for Data Center Switching》),华为成功入选代表性厂商。报告深度剖析AI时代数据中心
    的头像 发表于 03-30 14:17 761次阅读

    华为数据中心交换机2025年蝉联中国市场第一

    近日,全球领先的IT市场研究和咨询公司IDC发布了最新的《中国以太网交换机市场跟踪报告,2025Q4》。报告显示,华为(CloudEngine系列数据中心交换机)在2025年以34.3%的市场份额
    的头像 发表于 03-17 13:47 815次阅读

    1分钟带你了解数据中心供电架构 #电子元器件 #数据中心 #供电架构

    数据中心
    沛城芯动力
    发布于 :2026年02月03日 15:39:04

    数据中心UPS并机方案:公用电池组的优缺点深度分析

    数据中心
    上海优比施电子科技有限公司
    发布于 :2026年01月31日 09:32:34

    华为数据中心交换机获得黄鹤实验室首批安全公测最高等级

    近日,武汉云黄鹤实验室(以下简称“黄鹤实验室”)正式发布数据中心交换机产品安全等级公开测试结果。华为CloudEngine系列数据中心交换机凭借在安全功能与
    的头像 发表于 12-08 14:03 1025次阅读

    产品彩页-CX-N系列数据中心交换

    CX-N系列数据中心交换机面向AI/ML(人工智能/机器学习)智算中心和云计算数据中心提供一站式全开放网络解决方案,具备低时延、高性能、高密
    发表于 10-29 13:55 2次下载

    华为荣获2025年上半年数据中心交换机中国市场第一

    近日,全球领先的IT市场研究和咨询公司IDC发布了最新的《中国以太网交换机市场跟踪报告,2025Q2》。报告显示,华为(CloudEngine系列数据中心交换机)在2025年上半年以31.5%的份额
    的头像 发表于 09-16 15:13 3485次阅读
    华为荣获2025年上半年<b class='flag-5'>数据中心</b><b class='flag-5'>交换</b>机中国市场第一

    提升AI数据服务器交换性能与效率的关键:永铭电容的应用

    YMIN永铭电容应用AI数据中心服务器·交换机随着AI技术的快速发展,数据中心和服务器的性能需求不断增加。作为AI服务器基础架构中的重要组成部分,
    的头像 发表于 09-01 10:04 632次阅读
    提升AI<b class='flag-5'>数据</b>服务器<b class='flag-5'>交换</b>机<b class='flag-5'>性能</b>与效率的关键:永铭电容的应用

    PCIe协议分析仪在数据中心中有何作用?

    数据中心的整体可靠性。以下是其核心作用及具体应用场景的详细分析:一、性能优化:突破带宽瓶颈,提升计算效率 链路带宽利用率分析 场景:在AI训练集群中,GPU通过PCIe与CPU交换数据
    发表于 07-29 15:02

    中型数据中心中的差分晶体振荡器应用与匹配方案

    中型数据中心的定义与特点 中型数据中心通常服务于中大型企业、科研机构或地方行业节点,具备50至200个机柜,部署多台服务器、交换设备、存储系统与光通信链路等,强调高带宽、低延迟与高可用性。关键设备
    发表于 07-01 16:33

    华为连续9年稳居中国数据中心交换机市场第一

    近日,全球领先的IT市场研究和咨询公司IDC发布了最新的《中国以太网交换机市场跟踪报告,2025Q1》。报告显示,华为CloudEngine系列数据中心交换机在2025年第一季度以31.6%的份额
    的头像 发表于 06-26 11:32 2270次阅读

    小型数据中心晶振选型关键参数全解

    的准确传输。 芯片型号 Intel I350-AM4:适用于10GbE和1GbE的网络接口卡,广泛应用于数据中心和网络交换设备中。 Broadcom BCM57414:支持10GbE网络接口卡,适合
    发表于 06-11 13:37