0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智算中心网络交换机需要什么样的缓存架构

SDNLAB 来源:西贝吹风 2024-11-14 16:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

‍在交换机上,缓存就是数据交换的缓冲区,被交换机用来协调不同网络设备之间的速度匹配问题,突发数据可以存储在缓冲区内,直到被慢速设备处理为止。数据中心交换机应用在HPC/AI大模型训练、分布式存储等场景时,并非缓存越大越好,过大的缓存会导致更长的队列、更高的时延和抖动、更高的成本,所以不能简单地去扩大缓存,交换机避免丢包所需的缓存与此带宽延迟积BDP直接相关,借助于带宽时延积BDP可以确定合适的内存大小。

缓存架构分类

按照缓冲区的大小,以太网交换机通常分为深缓冲区交换机和浅缓冲区交换机,深缓冲区交换机缓冲区容量高达数GB,与浅缓冲区交换机的几十MB形成鲜明对比。这种设计上的差异源于应用场景的差异,深缓冲区交换机(或路由器)主要面向路由和广域网场景,RTT时间长,希望能够容纳更多的数据流量,对微突发流量不敏感,但也意味着更高的尾延迟和抖动,这一点与HPC/AI大模型训练、分布式存储等场景的低时延要求显然是相违背的,浅缓冲区交换机在这种场景下更适合,以目前最高端的51.2Tbps(64个800G)的交换机为例,如果RTT时间是3~5微秒,缓存仅需33MB左右,这是交换机中所需的总缓存,那么这个总的缓存能否被每一个端口充分利用吗?

这就取决于交换机(交换芯片)所采用缓存架构。交换芯片的缓存架构通常分为:完全共享缓存架构和分片报文缓存架构(也称分割缓冲区结构)。

完全共享缓存架构:设备中的所有缓存都可用于动态分配到任何端口,意味着在所有输入-输出端口之间共享缓存而没有任何限制,最大限度地提高了可用内存的效率。

分片报文缓存架构:由多片较小的缓存共同组成了芯片内部的缓存,所有的物理接口也被划分成了不同的组,同一组内的物理接口共享对应的缓存单元。

不同缓存架构影响

如下图所示,同样是16MB的缓存情况下,完全共享缓冲架构中的每个端口极限情况下(如多打一的Incast场景,)可以最大利用到16MB;如果是两个分片的分组端口缓存架构下,每个端口极限情况下仅可以最大利用到8MB;而如果是四个分片的分组端口缓存架构下,每个端口极限情况下仅可以最大利用到4MB。

2719230e-906c-11ef-a511-92fbcf53809c.jpg

思科之前的文档中也做过分析,分片报文缓存架构下,不同的流量模型对微突发流量吸收的影响或限制也不同,如下图所示:

273abf0a-906c-11ef-a511-92fbcf53809c.jpg

以图中右侧图示情况为例,4个分片的架构下,如果四个输出端口位于4个不同的分片上,最理想的情况可以达到100%的缓存利用,但是任意一个输出端口最多仅可以消耗总内存的25%。在复杂的流量模式下,这种限制可能会更加痛苦,如图中右侧图示为例,此情况下,一个输出端口的缓存被限制为总缓冲区的1/16(6.25%),这种限制使得Incast下的缓冲行为不可预测。 在完全共享缓存架构中,设备中的所有数据包缓冲区都可用于动态分配到任意一个端口,这意味着在所有输入输出端口之间共享缓存而没有任何限制,最大限度地提高了可用内存的效率,并且使微突发流量吸收能力可预测,与流量模型没有任何关系。

完全共享缓存的优势也体现在RoCEv2网络中,RoCEv2是TCP/IP协议中UDP层实现,因为使用不需要确认的UDP协议,此时RTT不是缓冲区需求的直接驱动因素,但是RDMA的无损特性往往要依靠PFC来实现,PFC逐级反压控制会导致拥塞蔓延,完全共享缓存通过在需要的时间和节点支持更多的缓存,有助于最大限度地减少触发PFC流量控制的需要。

主流厂商实现当前市场上,大多数数据中心交换机都是使用商用交换芯片ASIC构建的,这些ASIC针对传统的数据流量模式和数据包大小进行了成本优化,为了在实现带宽目标的同时保持低成本,芯片供应商更多使用了分片缓存架构,牺牲了公平性,同时面临不可预测性和微突发吸收的问题。

但是,当前几个主要厂商51.2Tbps最高容量的交换芯片,由于应对场景以HPC/AI大模型训练等为主,基本都采用完全共享缓存架构,相关的交换芯片或交换机如博通Tomahawk5、英伟达Spectrum-4、思科Silicon One G200都是宣传采用完全共享缓存架构。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 网络交换机
    +关注

    关注

    1

    文章

    75

    浏览量

    16887
  • 缓存
    +关注

    关注

    1

    文章

    248

    浏览量

    27818
  • 智算中心
    +关注

    关注

    0

    文章

    123

    浏览量

    2602

原文标题:智算中心网络交换机需要什么样的缓存架构?

文章出处:【微信号:SDNLAB,微信公众号:SDNLAB】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为数据中心交换机2025年蝉联中国市场第一

    ,再度斩获中国数据中心交换机市场份额第一,实现里程碑式的10连冠。自2016年起,华为已经连续十年稳居该领域榜首,以硬核实力筑牢行业领跑地位,持续引领数据中心网络产业高质量发展。
    的头像 发表于 03-17 13:47 597次阅读

    视频、工业、智慧交通,哪些网络真的需要三层交换机

    在很多人的认知里,网络设备无非就是交换机和路由器,功能分得很清楚。但在真实的工程场景中,随着网络规模变大、业务类型变多,这种“非此即彼”的划分其实并不够用。也正是在这样的背景下,三层交换机
    的头像 发表于 02-06 09:24 321次阅读
    视频、工业、智慧交通,哪些<b class='flag-5'>网络</b>真的<b class='flag-5'>需要</b>三层<b class='flag-5'>交换机</b>

    光模块与交换机网络中的黄金搭档

    数字经济时代,数据传输效率与稳定性决定网络核心竞争力。光模块与交换机作为网络核心硬件,形成“唇齿相依、协同共生”的紧密关联——光模块是交换机突破传输限制的“延伸臂膀”,
    的头像 发表于 02-03 09:26 633次阅读

    交换机五种组网方式,彻底了解清楚

    来看下交换机五种组网方式。 一、小型网络 接入的用户在100左右的为中小型企业网。这里面涉及到一个问题,很多朋友问到过,100路网络需要使用核心交换
    的头像 发表于 12-17 10:27 1209次阅读
    <b class='flag-5'>交换机</b>五种组网方式,彻底了解清楚

    产品彩页-CX-N系列数据中心交换机

    CX-N系列数据中心交换机面向AI/ML(人工智能/机器学习)智中心和云计算数据中心提供一站式全开放
    发表于 10-29 13:55 1次下载

    NVIDIA Spectrum-X 以太网交换机助力 Meta 和 Oracle 加速网络性能

    基于 NVIDIA Spectrum-X 以太网交换机的 AI 数据中心网络。 Meta 和 Oracle 正将 Spectrum-X 以太网交换机标准化为一种开放的加速
    的头像 发表于 10-14 10:26 2087次阅读
    NVIDIA Spectrum-X 以太网<b class='flag-5'>交换机</b>助力 Meta 和 Oracle 加速<b class='flag-5'>网络</b>性能

    交换机在现代网络中的多场景应用解析

    发现: 选不对交换机,再高端的设备也会 "卡脖子" 。 从企业的 VLAN 隔离到工业现场的抗干扰,从数据中心的微秒级延迟到智能家居的 PoE 供电,交换机其实是整个网络的 "神经中枢
    的头像 发表于 10-13 17:11 1491次阅读
    <b class='flag-5'>交换机</b>在现代<b class='flag-5'>网络</b>中的多场景应用解析

    交换机:纳秒速率、低时延与高密度端口重构AI网络

    速率(光电交换机可达纳秒级,光机械交换机达毫秒级)、低时延架构(时延低于10微秒)、高能效比(功耗较InfiniBand或以太网方案降低65%以上)。这种技术特性使其在AI
    的头像 发表于 09-26 09:11 7951次阅读

    工业以太网交换机与商用交换机的技术差异与应用场景分析

    在当今的工业自动化和网络通信领域,交换机作为网络基础设施的核心组件,扮演着至关重要的角色。然而,市场上存在两种主要类型的交换机:工业交换机
    的头像 发表于 09-23 14:33 1074次阅读

    工业网络的坚实力作:邮科交换机在全场景应用中的硬核解析

    在工业自动化、智能制造飞速发展的今天,稳定可靠的通信网络已成为确保生产系统高效运行的基石。面对高低温、电磁干扰、振动粉尘等复杂工业场景,普通商用交换机显然力不从心。究竟什么样网络设备
    的头像 发表于 08-26 16:28 592次阅读

    Is交换机组成的环形网络中,当位于主控节点的Ism网管交换机故障后,为什么环网中其他交换机不受影响?

    当位于主控节点的交换机故障断掉,环网中其他交换机是如何保持正常运行的?或者说什么原理让环网其他交换机不受影响?
    发表于 08-06 06:46

    普通交换机和车载交换机的区别有哪些?怎么选?

    你可能知道 交换机 是一种网络设备,用于在计算机网络中连接多个设备(如计算机、服务器、打印机等),并实现这些设备之间的数据交换。但是不同场景下交换机
    的头像 发表于 07-09 15:53 799次阅读
    普通<b class='flag-5'>交换机</b>和车载<b class='flag-5'>交换机</b>的区别有哪些?怎么选?

    什么是工业级交换机?工业交换机作用有哪些?

    重中之重!!!     工业级交换机 是专为工业环境设计的 网络设备 ,主要作用是实现以太网设备的互联,扩大网络覆盖范围。与普通的商业交换机相比,工业级
    的头像 发表于 07-07 16:25 1666次阅读

    网络交换机在CCC认证范围吗

    网络交换机(NetworkSwitch)通常不在中国强制性产品认证(CCC)目录范围内,也就是说:一般情况下,网络交换机需要做CCC认证。
    的头像 发表于 06-30 14:12 2337次阅读
    <b class='flag-5'>网络</b><b class='flag-5'>交换机</b>在CCC认证范围吗

    工业交换机与普通交换机的区别:为什么工厂网络宁贵不省?

    在工业4.0和智能制造的浪潮下,工厂的每一台设备、每一处传感器都成了网络中的“神经元”,而连接这些“神经元”的核心设备——工业交换机,却常被忽视。许多人会问:“工业交换机和普通交换机
    的头像 发表于 05-23 17:14 1626次阅读