0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于INT与Flowlet的自适应路由:提升数据中心性能的关键

星融元Asterfusion 2025-10-17 15:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

自适应路由交换是一种智能的网络数据转发技术。它能够让网络设备(如路由器、交换机)实时地根据当前网络的状况(如链路拥堵、故障),自动地、动态地为数据包选择一条最优的传输路径。

深入理解:与传统方式的对比

自适应路由交换也可以称为“动态路由交换”为了更好地理解“自适应”,我们先来了解一下什么是静态路由交换。

静态路由交换

工作方式:网络管理员手动配置好固定的路径。比如,命令数据从A到B必须经过路径C ( A -> C -> B)

  • 优点:不消耗设备计算资源。
  • 缺点:不灵活。如果路径中的C点发生故障或者严重拥堵,数据包依然会“固执地”试图走这条路径,导致通信中断或延迟,直到管理员手动修改配置。

它是构建中小型网络或特定网络区域的经典、可靠且低成本的方法。但在大型、动态的网络中,通常会被动态路由协议所取代或补充。

自适应路由交换

工作方式:网络设备之间会运行动态路由协议(如 OSPF, BGP 等)。这些协议会让设备互相通信,告知彼此自己所连接的链路状态、带宽、延迟等信息。每个设备都会根据这些信息,建立一个“网络地图”。

  • 优点:灵活、智能、高可靠性,容错率高当某条链路中断时,设备能立刻从“地图”上发现,并在毫秒级内自动将数据流转发到其他可用路径。可以同时利用多条路径来传输数据,避免单条链路拥堵,提升整体网络效率。
  • 缺点:配置相对复杂,设备需要消耗计算资源来运行路由算法和交换信息。

自适应路由交换的关键机制都有哪些?

网络状态感知

只有准确感知网络状态,才能实现自适应的路由选择。

  • 队列深度:交换机会持续监控其输出端口的队列长度。队列长度是衡量拥塞程度的最直接、最简单的指标。
  • 链路利用率:通过监控端口在特定时间窗口内的实际流量与理论带宽的比值来衡量。这有助于了解链路的负载情况,为路由决策提供依据。
  • 带内网络遥测(INT):这是一种先进的感知机制。数据包在传输过程中会“携带”路径上各节点的状态信息,如延迟、队列深度等。【链接】
  • 显式拥塞通知(ECN):当交换机队列超过设定的阈值时,它会在经过的数据包头部打上标记。这是一种间接的、端到端的感知机制,通过这种方式,发送端可以根据拥塞情况调整发送速率,避免进一步加重拥塞。【ECN:显式拥塞通知机制原理解析】

总的来说,网络状态感知通过以上几种方式,为自适应路由交换系统提供了全面、准确的网络状态信息。

路由决策

根据感知到的信息决定数据包的走向。

  • 集中式决策:一个中央控制器收集全网信息,计算最优路径,并将流表下发给交换机。
  • 分布式决策:每个交换机基于本地信息和来自邻居交换机的有限信息(如通过PFC暂停帧或特定信令传递的信息),自主地做出路由决策不需要依赖中央控制器。

负载均衡

它是决定如何将流量分配到不同路径上的关键部分,通常有以下几种方式:解锁AI数据中心潜力:网络利用率如何突破90%? - 星融元Asterfusion

  • 逐流负载均衡:传统的 ECMP 路由通常采用逐流负载分担机制,其核心是基于数据包的特征字段(例如 IP 五元组等信息)作为计算因子去进行哈希运算,根据哈希值选择转发链路。
  • 逐包负载均衡:逐包的负载均衡技术则是将数据包均匀地负载到各条链路上,又被形象地称为“数据包喷洒”(Packet Spray)。问题在于逐包负载均衡无法保证报文依照原有时序到达接收端。
  • Flowlet负载均衡:不同于传统负载均衡的逐流负载分担或逐包负载分担,基于子流的负载均衡不光是对数据流进行分割以实现更精细均匀的负载分担,而且保持了报文到达的时序性。是目前最主流的先进机制。

如何为每个Flowlet选择“最佳”路径?

?code=MDY1YTNmODYyYTJlMTg5MTlmNTNiNDkwMjU4MzQ5YWJfeGM0NVhaUkFqaXp0UldMajZoVTBjcEhVZ1luM2dRQk5fVG9rZW46UUVGM2J0WUo2bzM0RU94WUVTUmNkajlpbnFiXzE3NjA2ODQ3OTc6MTc2MDY4ODM5N19WNA

这就是INT发挥作用的地方了。

与传统通过SNMP轮询或NetFlow采样不同,INT直接将测量指令和数据嵌入到正在转发的数据包中。

  • 数据包在进入网络时被“植入”一个INT头部。
  • 当该数据包经过每个支持INT的网络设备(交换机)时,设备会将自己的信息(如入口/出口时间戳、队列深度、链路利用率等)写入到这个数据包的INT头部中。
  • 最终,接收端或网络边缘设备可以将这些信息收集起来,形成一个精确的、逐跳的路径状态视图。

工作流程示例

  1. 主机A开始向主机B发送一个TCP流。
  2. 第一个数据包被标记INT,它经过路径 Switch1 -> Switch2 -> Switch4,并在INT头中记录了这条路径上各交换机的队列深度。
  3. INT信息被发送到控制器。控制器发现Switch2到Switch4的链路队列很长。
  4. 此时,TCP流出现了一个短暂的间隙(Flowlet边界)。
  5. 当下一个数据包(属于第二个Flowlet)到达Switch1时,控制器已经计算出一条新的、不拥塞的路径:Switch1 -> Switch3 -> Switch4。
  6. Switch1将所有属于第二个Flowlet的数据包都转发到Switch3。
  7. 后续的Flowlet会重复此过程,始终选择当前最优的路径。
wKgZPGjx6zSASykiAAOsv6ZWK2s646.png

高效、无损的自适应路由:基于INT的Flowlet 负载均衡技术

技术优点缺点
自适应路由动态避障,高网络利用率容易导致数据包乱序,损害TCP性能
Flowlet细粒度负载均衡,天然避免乱序路由决策依赖准确、及时的网络状态信息
INT提供精确、实时、逐跳的网络状态信息增加数据包开销,需要硬件支持

CX-N系列RoCE交换机 支持基于INT的Flowlet非常先进的数据中心网络负载均衡技术,它巧妙地结合了三者的优势:

  • 利用 Flowlet 解决了自适应路由的乱序问题。
  • 利用 INT 为Flowlet路由提供了精准、及时的决策依据。

最终实现了高效、无损的自适应路由,显著提升了大规模数据中心网络的性能。

?code=ZjZlMzM4OGJiY2JmY2U3NTg1ZDQ3YTEzOTliYjcyNTVfZVp1M1VBZTA4Z0FETHUwb0hCRUY0UVA0ZGJIVmJxWXFfVG9rZW46TGlma2JVTmt3b0ZaUWJ4N3dJZ2M0MENvbkxnXzE3NjA2ODQ3OTc6MTc2MDY4ODM5N19WNA

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据中心
    +关注

    关注

    16

    文章

    5529

    浏览量

    74664
  • Int
    Int
    +关注

    关注

    0

    文章

    25

    浏览量

    16421
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    适用于数据中心和AI时代的800G网络

    提出了三大核心需求: 超低延迟和高带宽:确保大规模数据传输高效进行。 智能流量调度:采用自适应路由和负载均衡技术,减少网络拥塞。 性能隔离与稳定性:在多租户环境下保障
    发表于 03-25 17:35

    小型数据中心晶振选型关键参数全解

    的高精度时钟信号能够保证这些设备间的高效数据同步。 在小型数据中心中,差分晶体振荡器(DCO)通常用于交换机、路由器的时钟同步、网络接口卡(NIC)、存储设备(如NAS、SAN)等多个设备中。 小型
    发表于 06-11 13:37

    数据中心子系统的组成

    时间断电,燃料的及时供应或大量存储可以保持关键系统运转数天。(5)加热和冷却加热和冷却子系统为数据中心提供基本的工作环境。由于在大部分情况下计算机设备产生妁热量非常大,所以必须认真考虑冷却问题,尤其是在大量
    发表于 11-11 10:16

    如何在降低TCO的同时提高数据中心性能

    对于各种不同的数据中心工作负载,FPGA 可以显著提高性能,最大程度减少附加功耗并降低总体拥有成本 (TCO)。
    发表于 10-10 07:46

    未来数据中心与光模块发展假设

    数据中心网络成本的比重也在逐步提升,已达到6-7成左右,光模块的升级势必要跟随数据中心的发展共同演进。数据中心未来发展的四个假设高性能计算自
    发表于 08-07 10:27

    如何提高自适应均衡器的性能

    自适应电缆均衡器是什么?自适应均衡器设计面临哪些技术挑战?如何提高自适应均衡器的性能
    发表于 05-18 06:04

    数据中心是什么

    数据中心是什么:数据中心是全球协作的特定设备网络,用来在因特网络基础设施上传递、加速、展示、计算、存储数据信息。数据中心大部分电子元件都是由低直流电源驱动运行的。
    发表于 07-12 07:10

    什么是数据中心

    数据中心是企业用来容纳其关键业务应用程序和信息的物理设施。随着它们的发展,重要的是要长期考虑如何保持它们的可靠性和安全性。什么是数据中心数据中心通常被称为单个事物,但实际上它们由许多
    发表于 09-15 06:46

    添加热监控电路降低数据中心的能耗

    添加热监控电路降低数据中心的能耗 摘要:精确的自适应热管理功能对于数据中心以及其它温度敏感环境下高效的能耗管理非常关键。本文详细介
    发表于 07-18 08:39 749次阅读

    基于虚拟化的云中心性能分析

    基于虚拟化的云中心性能分析_刘晓东
    发表于 01-07 18:56 0次下载

    腾锐,数据中心性能监测系统的好帮手

    ,快速定位网络性能问题,并针对每个服务器或每笔交易获取响应时间、流量、点击次数、链接成功率等信息,实时翻译成数据中心整体或每个服务器的服务性能。 显而易见,NPM、APM的加入为数据中心
    发表于 03-13 20:39 598次阅读

    什么是数据中心?关于数据中心关键技术

    数据中心是企业用来容纳其关键业务应用程序和信息的物理设施。随着它们的发展,重要的是要长期考虑如何保持它们的可靠性和安全性。 什么是数据中心数据中心通常被称为单个事物,但实际上它们由
    的头像 发表于 11-17 17:17 7060次阅读

    通过NVIDIA Spectrum Ethernet的自适应路由加速网络

      将此技术与 NVIDIA ConnectX NIC 提供的 RoCE 无序支持相结合,应用程序对所使用的技术是透明的。这确保了 NVIDIA Spectrum Ethernet 平台提供了实现最大数据中心性能所需的加速以太网。
    的头像 发表于 08-15 16:00 1529次阅读
    通过NVIDIA Spectrum Ethernet的<b class='flag-5'>自适应</b><b class='flag-5'>路由</b>加速网络

    通过博通和希捷实现卓越的数据中心性能双执行器硬盘存储

    电子发烧友网站提供《通过博通和希捷实现卓越的数据中心性能双执行器硬盘存储.pdf》资料免费下载
    发表于 08-22 10:31 1次下载
    通过博通和希捷实现卓越的<b class='flag-5'>数据中心性能</b>双执行器硬盘存储

    赛灵思Alveo数据中心智能网卡自适应加速解决方案

    电子发烧友网站提供《赛灵思Alveo数据中心智能网卡自适应加速解决方案.pdf》资料免费下载
    发表于 09-15 15:03 1次下载
    赛灵思Alveo<b class='flag-5'>数据中心</b>智能网卡<b class='flag-5'>自适应</b>加速解决方案