0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

以太网存储网络的拥塞管理连载案例(七)

Linux阅码场 来源:Linux阅码场 2024-03-08 09:29 次阅读

本文节选自《DetectingTroubleshooting, and PreventingCongestion in Storage Networks 存储网络中拥塞处理》

MAC Address Learning

学习连接到远程VTEP 的设备的MAC 地址有两种常见方法。第一种方法使用基于组播的泛洪学习机制。第二种方法使用多协议边界网关协议(MPBGP)以太网VPN(EVPN)。无论VTEP 如何学习MAC 地址,数据路径保持不变,因此拥塞管理也保持不变。

Lossless Traffic over VXLAN

VXLAN 可根据IP 标头中的DSCP 字段对流量进行分类,并将其分配到无损队列,从而传输无损流量。前面有关第3 层PFC 的章节详细介绍了这一方案。

根据以太网CoS 字段对流量进行分类以实现第2 层PFC 的分类方案不足以通过VXLAN 传输无损流量,因为IEEE 802.1Q VLAN 标头不会在VXLAN 隧道中保留,因此会丢失CoS 值。

VXLAN Encapsulation

如图7-25 所示,入口VTEP 会将原始IP 报头中的DSCP 值复制到VXLAN 封装数据包的外部报头中。对于没有IP 报头的第2 层帧,外部数据包的DSCP 字段来自表7-1 中说明的CoS 到DSCP 映射。

VXLAN Decapsulation

如图7-25 所示,出口VTEP 会将外部VXLAN 数据包中的DSCP 值复制到解封装报头的IP 报头中。这被称为统一模式,是Cisco Nexus 9000 交换机的默认行为。如果需要,DSCP 字段值可以从内部IP 包头复制到解封装数据包。这称为管道模式。

2465df3c-dc8d-11ee-a297-92fbcf53809c.png

Figure 7-25DSCP and ECN values during VXLAN encapsulation and decapsulation

Congestion Notification over VXLAN

在入口VTEP,入口数据包的ECN 值被复制到VXLAN 封装数据包的外部报头。在出口VTEP,ECN 值总是从外部VXLAN 数据包复制到解封装报头的IP 报头,而不管是统一模式还是管道模式。

Flow Control and Congestion Notification with VXLAN

对于VXLAN 来说,无损流量有两个考虑因素。首先是实现无损网络功能的逐跳流量控制(PFC)。这是强制性的。第二个可选考虑因素是,当检测到入口和出口VTEP 之间出现拥塞时,通知终端设备(ECN)。

请参见图7-26。目标-1(源)向主机-1(目的)发送流量。通过将无损流量分类为CS3 的DSCP 值并将其分配到无损队列,使用PFC 启用了逐跳流量控制。由于入口VTEP-1 会将原始数据包中的DSCP 值复制到外层报头,因此将CS3 标记的流量分配到脊柱交换机上的无损队列可在流量被封装到VXLAN 隧道时实现无损行为。

在出口VTEP-6 上,外部报头中的DSCP 值会被复制到解封装数据包中。因此,将CS3 标记的流量分配到所有设备上的无损队列可实现无损行为。这与非VXLAN 环境或非路由第2 层网络的行为相同。与VXLAN 的唯一区别在于如何将流量分类以分配到无损队列。

24878b78-dc8d-11ee-a297-92fbcf53809c.png

Figure 7-26PFC and ECN with VXLAN

对于拥塞通知,入口VTEP-1 会将原始报头中的ECN 值保留到封装数据包中。如果骨干交换机(或VXLAN 隧道路径中的任何交换机)发生拥塞,它会在外报头中用CE 标志(b'11')标记有ECN 功能的数据包(b'01'或b'10')。骨干交换机可能不知道IP 数据包属于VXLAN 隧道,也不知道数据包中还有另一个IP 报头。

因此,它们只标记外部报头。出口VTEP 会将外部报头中的ECN 值复制到解封装数据包中。当目的地收到这个CE 标记的数据包时,它会根据上层协议(如RCM)的功能做出反应。

Congestion Management in VXLAN

如上一节所述,将流量分类并分配到无损队列可保持流量的无损行为。这种配置必须在所有设备上保持一致,以保持端到端的无损行为。

Note the following points:请注意以下几点:

1. 了解拥塞:启用PFC 后,拥塞会在VXLAN 中蔓延,如前几节所述。当出口VTEP(或叶子交换机)的队列开始填满时,它会通过发送"暂停"帧来减缓不丢弃类中的入口流量。因此,骨干交换机会减慢该流量类中的所有流量,无论其是否采用VXLAN 封装。回顾一下,对于PFC 来说,数据包中添加多少报头并不重要。它只是使用DSCP 字段对流量进行分类和流量控制。拥塞扩散的最终状态与图7-8 中的解释类似。

2. 检测拥塞:拥塞检测方法与前一节中的解释类似。检测命令应考虑到VTEP 上的DSCP-CoS 映射。

3. 拥塞故障排除:拥塞故障排除方法仍与前一节所述类似。在查找拥塞源的同时,要关注交换端口接口上的流量类别。特别是在骨干交换机上,不要被IP 地址误导,因为VXLAN 封装数据包的外层报头中包含入口和出口VTEP 的IP 地址。在同一VXLAN 隧道中传输多个流量(源IP 和目的IP)。因此,应重点监控无丢弃流量类的流量和暂停帧,而不是流量。

4. 拥塞预防:前面介绍的拥塞预防功能也适用于VXLAN。如果终端设备支持基于ECN 值的操作,那么无论VXLAN 底层网络如何,它都能发挥同样的作用。例如,RoCEv2 流量可通过VXLAN 传输,如果终端设备支持RCM,它也可与VXLAN 一起工作。

Summary

默认情况下,以太网通过丢弃帧(称为有损以太网)来处理拥塞,并依靠上层协议(如TCP)重传丢失的数据包。相反,无损以太网使用逐跳流量控制机制,通过发送暂停帧来减慢或停止传输。以太网链路上的所有流量都可以使用LLFC 进行流量控制。或者,PFC 可以选择性地只对特定流量类别进行流量控制。PFC 允许在同一链路上传输无损和有损流量,为融合以太网网络奠定了基础。

此外,ETS 为不同流量类别提供最低带宽保证,DCBX 简化了终端设备和交换机的配置。通过使用OSI 模型第2 层以太网VLAN 标头中的PCP/CoS 字段对流量进行分类,可以启用PFC。这种第2 层PFC 适用于FCoE 和RoCE。另外,对于RoCEv2(可路由RoCE),可在第3 层使用IP 标头中的DSCP 字段对流量进行分类,从而启用PFC。

无损以太网网络容易出现与光纤通道结构类似的拥塞,因为两者都使用逐跳流量控制。由于慢排空、链路利用率过高、比特错误或缺乏足够的缓冲区,拥塞也会在无损类中蔓延。同样的拥塞检测、故障排除和预防方法也适用于无损以太网网络。但无损以太网交换机可能不会报告所有相关指标。

值得注意的例子是TxWait 和RxWait 指标,在撰写本文时,Cisco Nexus 9000 交换机和UCS 服务器上还没有提供这些指标。下一个办法是使用暂停帧数来检测拥塞情况。但是,由于这些指标不会以时间和日期戳存储在交换机上,因此使用外部监控平台可以简化拥塞检测和故障排除。

在使用融合以太网网络时,有损类中的流量可能会影响无损类中的流量,这取决于问题是如何出现的。无论使用专用还是共享存储网络,都要监控每个端口级别和每个类别级别的流量利用率和拥塞指标。

利用暂停超时和PFC 看门狗可以实现无损以太网网络拥塞恢复。这些功能可在超时间隔后无法发送到目的地时丢弃帧,从而帮助释放缓冲区,使受害设备摆脱拥塞影响。

如果终端设备支持RoCEv2 拥塞管理,RoCEv2 网络还能通过向终端设备发出网络拥塞通知而获益,从而降低发送方的流量速率。无论采用哪种预防机制,都不应将这些机制作为长期解决方案。监控网络,找到根本原因,并尽快做出修正。

最后,请注意许多无损以太网网络相对较新。随着网络的发展和/或成熟,拥塞会变得更加严重。由于光纤通道Fabric 已大规模使用了几十年,因此必须从中吸取经验教训,并将这些知识应用到无损以太网网络中,以主动预防拥塞问题。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 以太网
    +关注

    关注

    40

    文章

    5076

    浏览量

    166235
  • 交换机
    +关注

    关注

    19

    文章

    2437

    浏览量

    95660
  • DSCP
    +关注

    关注

    0

    文章

    2

    浏览量

    1317
  • 存储网络
    +关注

    关注

    0

    文章

    31

    浏览量

    8030
  • VxLAN
    +关注

    关注

    0

    文章

    23

    浏览量

    3761

原文标题:以太网存储网络的拥塞管理连载(七)

文章出处:【微信号:LinuxDev,微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    以太网存储网络拥塞管理连载方案(一)

    链路级流量控制(LLFC):LLFC 可在直接连接的设备之间对链路上的所有流量进行流量控制。LLFC 是一项 IEEE 标准(IEEE 802.3x)。
    的头像 发表于 02-26 10:52 625次阅读
    <b class='flag-5'>以太网</b><b class='flag-5'>存储</b><b class='flag-5'>网络</b>的<b class='flag-5'>拥塞</b><b class='flag-5'>管理</b><b class='flag-5'>连载</b>方案(一)

    以太网存储网络拥塞管理连载方案(二)

    本节将从学术角度解释如何计算无损以太网链路的headroom大小。该解释基于 IEEE 802.1Qbb 优先级流量控制标准。
    的头像 发表于 02-27 09:12 383次阅读
    <b class='flag-5'>以太网</b><b class='flag-5'>存储</b><b class='flag-5'>网络</b>的<b class='flag-5'>拥塞</b><b class='flag-5'>管理</b><b class='flag-5'>连载</b>方案(二)

    以太网存储网络拥塞管理连载案例(五)

    解决无损以太网网络拥塞问题的方法与光纤通道结构相同。两者都使用逐跳流量控制机制,只是实现方式不同而已。
    的头像 发表于 03-04 11:17 406次阅读
    <b class='flag-5'>以太网</b><b class='flag-5'>存储</b><b class='flag-5'>网络</b>的<b class='flag-5'>拥塞</b><b class='flag-5'>管理</b><b class='flag-5'>连载</b>案例(五)

    以太网存储网络拥塞管理连载案例(六)

    消除或减少无损以太网网络拥塞的高级方法与光纤通道结构相同。几十年来,不同的传输类型都采用了类似的方法,只是略有不同。
    的头像 发表于 03-06 16:35 427次阅读
    <b class='flag-5'>以太网</b><b class='flag-5'>存储</b><b class='flag-5'>网络</b>的<b class='flag-5'>拥塞</b><b class='flag-5'>管理</b><b class='flag-5'>连载</b>案例(六)

    EtherCAT实时以太网分析仪应用场景#以太网

    以太网ethercat
    ZLG致远电子
    发布于 :2022年12月12日 10:02:50

    以太网是什么鬼?以太网基础知识详解

    以太网
    电子学习
    发布于 :2023年02月07日 21:05:57

    「无线工程师基础知识」以太网是什么鬼?以太网的使用注意事项

    以太网
    电子学习
    发布于 :2023年02月08日 09:29:33

    车载以太网快速入门#车载以太网

    车载以太网
    北汇信息POLELINK
    发布于 :2023年09月01日 17:54:31

    车载以太网测试系统测试实例介绍#车载以太网

    车载以太网
    北汇信息POLELINK
    发布于 :2023年09月12日 17:27:48

    车载以太网基础培训——车载以太网的链路层#车载以太网

    车载以太网
    北汇信息POLELINK
    发布于 :2023年09月19日 16:25:21

    车载以太网基础培训——网络层#车载以太网

    车载以太网
    北汇信息POLELINK
    发布于 :2023年09月20日 08:51:32

    车载以太网总线基础培训——传输层#车载以太网

    车载以太网
    北汇信息POLELINK
    发布于 :2023年09月21日 10:57:36

    车载以太网基础视频——应用层#车载以太网

    车载以太网
    北汇信息POLELINK
    发布于 :2023年09月22日 09:05:01

    以太网和工业以太网的不同

    以太网媒体访问控制的物理层和数据链路层。这些标准也说明子配置以太网网络的规则,以及各种网络元件如何彼此协作。以太网支持多台计算机通过一个网络
    发表于 10-23 14:20

    以太网和工业以太网的区别

    )标准,定义了有线以太网媒体访问控制的物理层和数据链路层。1 这些标准还描述了配置以太网网络的规则以及网络元素如何相互协作。以太网允许计算机通过一个
    发表于 10-24 10:41