0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

逐流、逐包、Flowlet:哪种负载均衡技术更适合未来网络?

星融元Asterfusion 2025-09-22 14:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当前主流的负载均衡技术主要包括三种类型:逐流的ECMP负载均衡、逐包负载均衡以及基于子流(Flowlet)的负载均衡。本文将从技术原理、优缺点及适用场景等方面对这三种技术进行系统对比与分析。

基于ECMP的逐流负载均衡

ECMP(Equal-Cost Multi-Path)采用逐流负载分担机制,其核心原理是基于数据包的特征信息(如IP五元组)进行哈希计算,依据哈希值选择转发路径。

该机制具备以下特点:

不同特征的数据流因哈希值不同而被分发至不同链路,实现全网负载均衡;

相同特征的数据流始终沿同一路径转发,保障报文顺序性。

然而,随着云计算与智算业务的发展,逐流负载均衡的局限性日益显著:

难以应对流大小不均的问题,大小流混合时负载均衡精度有限,带宽利用率下降;

属于静态负载均衡机制,无法实时感知链路负载。若出现大象流,仍按既定算法选路,易加剧拥塞与丢包;

在智算集合通信场景下,尤其在Clos网络的Leaf上行链路中,易出现哈希极化,引发网络拥塞。

注:可通过静态方式与自动化配置工具缓解该问题,详见:主动规划+自动化配置工具,简单应对AI智算网络ECMP负载不均。

逐包负载均衡技术

逐包负载均衡将数据包均匀分发至各链路,常被称为“Packet Spray”。其主要算法包括 Random(随机分发数据包)和Round Robin(按序轮询分发,理论上均衡效果最佳)。

然而,由于实际网络中链路负载与延迟存在差异,逐包负载均衡无法保证报文按序到达,其性能高度依赖终端设备的缓存能力乱序重组能力

基于子流(Flowlet)的自适应负载均衡

wKgZO2jQ6PKAXHp7AAFd7-Dk_2E804.png

基于子流的负载均衡不仅实现对数据流的精细划分与均衡分发,还能保持报文的时序性。RoCE交换机所支持的ARS(Adaptive Routing and Switching)技术即为典型代表,其利用ASIC硬件提供的ALB(Auto-Load-Balancing)能力,实时感知链路状态并动态调整路由,从而改善拥塞、提升带宽利用率。

为深入理解该机制,下文将从三个关键问题展开说明:

如何实现大流分割?

动态选路机制与链路测量指标是什么?

何时触发路径的主动分配与重分配?

术语解释

微观流(Micro Flow):五元组相同的一组数据包;

宏观流(Macro Flow):哈希值相同的微观流集合;

空闲时间(Idle Time):宏观流中无流量的时间间隔(可配置);

子流(Flowlet):宏观流中被空闲时间分割的连续数据包序列。

wKgZPGjQ6RCASLj4AAKNREgxIPU162.png基于Flowlet的路径分配概念图

流分割:从Flow到Flowlet

Flowlet是ARS进行负载均衡的基本单位。如下图所示,拥有相同五元组的微观流经哈希计算后归属同一宏观流。若宏观流中相邻微观流的时间间隔超过所配置的Idle Time,则触发流分割,形成不同的Flowlet。从业务层面来看,传统意义上的“大象流”会被打散,而小流则有可能合并到一个 Flowlet 里传输。

wKgZPGjQ6TCAAAUgAAA6f4pD4aI525.png

注:Idle Time的配置与全局路径时延密切相关,通常建议不小于1/2 RTT。配置过小可能导致Flowlet过细引发乱序;过大则无法有效分割宏观流,引发拥塞。

动态选路与链路测量机制

wKgZPGjQ6UGAB8laAACM30kgyNc317.png

ASIC维护宏观流表(Macro Flow Table),记录各宏观流及其对应出接口(或ECMP成员链路)。通过实时测量端口负载与延迟,ARS以Flowlet为粒度将流量路由至更优路径。

至于我们如何得知当前哪条链路更优呢?这里就涉及到链路质量指标的测量问题。

wKgZO2jQ6U-AHc5OAAB-pdFkqQk470.png

链路质量评估涉及以下指标

端口带宽:控制平面对端口线速进行归一化(以10G为基准),并下发至ASIC;

端口利用率:ASIC采样实时流量速率,与线速比较得出利用率及平均负载;

转发时延:通过端口队列深度反映链路延迟,ASIC采样后计算历史负载情况。

ECMP组实时更新各出接口的链路质量,并在路径分配时依据最新结果择优转发。

路径主动分配时机

路径主动分配发生于流分割过程末尾。例如,当Flowlet 1的最后一条微观流(Micro Flow 2)经路径D转发,且间隔时间T(T > Idle Time)后出现新微观流(Micro Flow 3),ASIC判定Flowlet 1结束,路径D映射失效。Micro Flow 3属于新子流且处于非活跃状态,此时触发主动路径分配。

典型应用场景举例

wKgZPGjQ6WeAaVWfAAFOUFtxsGo354.png

以32台8卡GPU服务器(共256个400G网卡)规模为例,AIDC承载网采用两层Clos架构,Spine与Leaf设备均采用CX864E-N交换机,下行与上行端口按 1:1 收敛比设计,确保高吞吐与高带宽,避免带宽不对称带来的性能问题。

在传统负载均衡机制下,Server1 的 GPU1 与 Server17 的 GPU1 通信时,流量可能集中至某一 Spine 设备,导致Leaf1上行端口拥塞。而启用ARS技术后,Leaf1与Spine设备的ASIC可依据实时延迟与负载动态调整出接口。

假设 Leaf1 通往 Spine8 的链路上发生拥塞,则 Leaf1 的 ASIC 会将更少的 Flowlet 路由到 Spine8 或跳过 Spine8,直至该链路上的拥塞情况缓解后,才会恢复选中该链路进行流量转发。

同样以 Spine1 为例,其 ASIC 也能将更少的 Flowlet 路由到 Leaf32 的链路上而更多地选取其他质量更好的链路。由此,Leaf 与 Spine 设备均能完成自治,从而达到降低整网链路拥塞情况并提高带宽利用率。

参考文档

[1] OCPSummit2022- Adaptive Routing in AI/ML Workloads https://www.youtube.com/watch?v=cgYOpp4xwQ8

[2] https://infohub.delltechnologies.com/zh-cn/l/dell-enterprise-sonic-quality-of-service-qos/adaptive-routing-and-switching/

[3]https://asterfusion.com/a20250528-flowlet-alb/

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 交换机
    +关注

    关注

    23

    文章

    2870

    浏览量

    103938
  • 负载均衡
    +关注

    关注

    0

    文章

    128

    浏览量

    12814
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    波限流和平均限流

    波限流和平均限流
    发表于 08-20 09:33

    电力猫和传统路由器哪种更适合于家庭办公组网呢?

    `有没有高手指点一下?京东商城上面热销的电力猫有普联、华为、腾达、GLEXER等,虽然有很多人用过电力猫但是最普及的还是路由器,那电力猫和路由器哪种更适合用来家庭和办公组网呢?电力猫是通过家里的电线来高速传输网络和扩展wifi的
    发表于 07-13 16:38

    DSP波限流(CBC)方案

    ,防止逆变过损坏 机器,特别是突加负载的情况下,逆变器的瞬间输出电流一般很大, 此时需要波限流功能来限流。 波限流在每个开关周期都进行动作,一旦输出电流大于比较 值,则产生 Tr
    发表于 04-12 19:36

    请问哪种ARM Cortex内核更适合应用?

    Cortex系列组合大体上有哪几种类型?请问哪种ARM Cortex内核更适合应用?
    发表于 10-12 10:53

    什么是服务器网络负载均衡

    什么是服务器网络负载均衡 什么是负载均衡
    发表于 01-11 10:58 1928次阅读

    基于小波包_神经网络的太阳时辐射预测_陈杰

    基于小波包_神经网络的太阳时辐射预测_陈杰
    发表于 12-31 14:45 1次下载

    网络负载过高中的均衡技术研究与仿真

    网络负载过高中的均衡技术研究与仿真_刘远超
    发表于 01-03 17:41 0次下载

    华为发布SD-WAN负载分担方案 提升带宽利用率

    华为SD-WAN负载分担方案,提升带宽利用率至90%,让您的广域网络更加高效。
    的头像 发表于 10-15 16:44 3299次阅读

    解密负载均衡技术负载均衡算法

    负载均衡器是一种软件或硬件设备,它起到了将网络流量分散到一组服务器的作用,可以防止任何一台服务器过载。负载均衡算法就是
    的头像 发表于 11-12 09:16 1819次阅读

    如何在OpenHarmony上实现帧动画?

    帧动画是常见的一种动画呈现形式,本例就为大家介绍如何通过 translate(),setInterval(),clearAllInterval() 等方法实现帧动画。
    的头像 发表于 06-18 15:14 1563次阅读
    如何在OpenHarmony上实现<b class='flag-5'>逐</b>帧动画?

    SLC VS. MLCC,哪种电容器更适合您的应用?

    SLC VS. MLCC,哪种电容器更适合您的应用?
    的头像 发表于 12-04 15:41 1638次阅读
    SLC VS. MLCC,<b class='flag-5'>哪种</b>电容器<b class='flag-5'>更适合</b>您的应用?

    哪种电阻更适合被用作为取样电阻?

    哪种电阻更适合被用作为取样电阻? 选择适合作为取样电阻的电阻器是电子电路设计中非常重要的一步。取样电阻被广泛应用于模拟电路中,用于测量电压、电流和功率等。一个合适的取样电阻对于电路的性能和精度
    的头像 发表于 11-29 16:29 1363次阅读

    如何确定适合负载均衡比例

    路由器的负载均衡是一种应用于网络中的技术,它可以平衡网络流量的分配,提高网络的性能和稳定性。在配
    的头像 发表于 12-15 10:36 2877次阅读

    如何利用traceroute命令发现网络中的负载均衡

    网络管理和故障排除中,了解数据的路径和识别负载均衡节点是非常重要的。traceroute 命令是一个用于跟踪数据包在网络中经过的路由路径
    的头像 发表于 08-07 15:13 1185次阅读
    如何利用traceroute命令发现<b class='flag-5'>网络</b>中的<b class='flag-5'>负载</b><b class='flag-5'>均衡</b>

    常见网络负载均衡的几种方式

    常见网络负载均衡的几种方式包括:DNS负载均衡、反向代理负载
    的头像 发表于 03-06 11:14 1091次阅读