0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高速率数据中心解决方案

维维为 来源:维维为 作者:维维为 2022-10-20 17:08 次阅读

随着业务转型发展带来的信息化系统建设,云应用程序正在快速发展。单体应用程序正在让位于分布式服务,推动了数据中心基础设施网络流量的增加,流量的持续增长也推动着数据中心网络往更快、更大带宽和更低延迟的高速网络方向发展。

Spine+Leaf网络架构

直到几年前,大多数的数据中心网络还都是基于传统的三层架构,对于大多数具有像园区网络这样的纵向(North-South)配置的流量模型来说是很实用的,而且三层网络结构应用广泛而且技术成熟稳定。一个标准的传统三层的网络结构如图1-1所示:

pYYBAGNREA6AD_4RAAEo1BCqjDg966.png

图1-1 传统三层网络架构

但随着云计算的发展,横向(East-West)流量在数据中心占据主导地位,涵盖几乎所有的云计算,虚拟化以及大数据横向网络在纵向设计的网络拓扑中传输数据会带有传输的瓶颈,因为数据经过了许多不必要的节点(如路由和交换机等设备)。主机互访需要通过层层的上行口,带来明显的性能衰减,而三层网络的原始设计更会加剧这种性能衰减。

由此,就有了IP Fabric概念,IP Fabric指的是在IP网络基础上建立起来的Overlay/隧道技术。如图1-2所示为基于胖树的Spine+Leaf拓扑结构的IP Fabric组网图。

poYBAGNREA-ABH9IAAEP9VUHgJ4305.png

图1-2 IP Fabric网络的两层架构

在这种组网方式中,任何两台服务器间的通信不超过3台设备,每个Spine和Leaf节点全互连,可以方便地通过扩展Spine节点来实现网络规模的弹性扩展。只要遍历一定数量的交换机,可以在几乎所有数据中心结构体系结构中的服务器节点之间传输流量。该架构由多条高带宽的直接路径组成,消除了网络瓶颈带来的潜在传输速度下降,从而实现极高的效率和低延迟。

pYYBAGNREBeAaFmEAAHktagH98Y179.png

图1-3 Spine-leaf架构

用盒式机代替传统框式机

在设计和建设一个数据中心的网络时,我们需要充分考虑到至少未来5年的技术、行业需求发展和运营成本开支,从而更优化地使用现有的数据中心资源服务于企业核心业务。

在网络交换机选型是整个数据中心网络设计的关键因素之一。传统的大型网络设计选择框式设备,以提高整个网络系统的容量上限,并提供的有限的可扩展性,但是相应的,存在如下的限制和风险:

框式设备总体容量有限,已经不能满足数据中心不断增长的网络规模需求。

核心框式设备采用双连接方式部署,故障半径高达50%,无法有效保障业务安全。

框式设备部署实施复杂,故障诊断和排除周期长,升级维护的业务中断时间长。

为保障后期业务扩容,框式设备预留插槽,使得前期的投资成本提升。

所以在网络设备选型方面,我们建议用整网盒式交换机组网,不同层级的交换机型号统一,便于维护团队快速熟悉,同时后期的网络架构调整,设备复用和维修替换提供可操作的空间。

建设初期的网络投资(拥有成本TCO)也大大缩小的同时,Spine-Leaf(CLOS)架构配合盒式交换机组网,提供了可横向扩展的能力。即便spine交换机故障离线,也仅仅影响小部分网络带宽,业务完全无感知。后续扩展方面,仅需要根据数据中心的规模需求,添加交换机数量和层级,相应的扩展网络的接入容量和骨干网络交换容量。整个网络按需采购和部署,一切服务与应用和业务需求。

Overlay网络

Overlay网络是建立在已有物理网络上的虚拟网络,具有独立的控制和转发平面,对于连接到Overlay的终端设备(例如服务器)来说,物理网络是透明的,从而可以实现承载网络和业务网络的分离,如图1-4所示:

pYYBAGNREBiARAsrAACfJjnhs7I094.jpg

图 1-4 Overlay/Underlay网络概念图

Overlay网络有着各种网络协议和标准,包括VXLAN、NVGRE、SST、GRE、NVO3、EVPN等。

VXLAN

VXLAN(Virtual eXtensible LAN,可扩展虚拟局域网络)是基于IP网络、采用“MAC in UDP”封装形式的二层VPN技术。VXLAN可以基于已有的服务提供商或企业IP网络,为分散的物理站点提供二层互联,并能够为不同的租户提供业务隔离。VXLAN 主要应用于数据中心网络和园区接入网络。

pYYBAGNREBqAGdHlAAHq2nhox0g964.png

图 1-5 VXLAN模型

初始的IET FVXLAN 标准 (RFC 7348) 定义了一个基于组播、不采用控制平面的“泛洪和学习”的VXLAN。它对远程 VXLAN 的VTEP(虚拟隧道末端点)发现和远程终端主机MAC学习依靠数据驱动式泛洪进行。重叠广播、未知单播和组播流量封装到组播VXLAN数据包并通过底层组播转发传输到远程VTEP交换机。此类部署中的泛洪可能给解决方案的可扩展性带来挑战。在底层网络中启用组播功能的要求也会带来挑战,因为某些组织不希望在其数据中心或广域网网络中启用组播。

poYBAGNREBuAapqgAAEvUOHOK3w302.png

图 1-6 flood-learn

如图1-6,假设最左侧虚机已经知道目的MAC了(VTEP中的L2 Table已经老化,虚机中的ARP cache还没老化)。当最左侧虚机想ping最右侧虚机,ping包送到VTEP,因为在VTEP中找不到对应的Remote VTEP,VTEP会做如下操作:

(1)原始的Ethernet Frame被封装成VXLAN格式,VXLAN包的外层目的IP地址为组播地址。

(2)VXLAN数据包被发送给组播内所有其他VTEP。

VXLAN-EVPN部署弹性网络

VXLAN由RFC7348定义,其中只定义了数据层的行为,并没有指定VXLAN控制层。在VXLAN技术早期,通过数据层的来获取转发信息,在实现上较为简单,相应的技术门槛较低,有利于厂商实现VXLAN。但是随着网络规模的发展,完全依赖数据层做控制会造成网络中广播组播风暴,因此VXLAN也需要有一个控制层。

VXLAN 重叠网络在“泛洪和学习”模式下运行,在此模式下,终端主机信息学习和 VTEP 发现均由数据平面驱动,在VTEP之间没有控制协议分发终端主机可达性信息,要克服此局限,可以将多协议边界网关协议以太网虚拟专用网络 (MP-BGP EVPN) 用作VXLAN控制平面。

有了控制层数据,数据层就简单多了。Server A想访问Server B,通过查找本地VTEP L2 Table找到VTEP2,再封装成VXLAN数据发送到VTEP2,VTEP2将VXLAN解封装,转发给本地的Server B。所以可以看出,从数据层面角度来看,有没有EVPN效果都是一样的。EVPN只负责VXLAN的控制层面,也就是MAC转发信息的传输,对VXLAN数据层面没有影响。

pYYBAGNREByAa7E_AACC8ucLX2U766.png

图 1-7 EVPN作为控制平面

VXLAN作为新型的网络隔离技术,在RFC 7348定义中有24比特,支持多达16M(约1600万)租户隔离,有效地解决了云计算中海量租户隔离的问题。在VTEP本地进行VLAN 隔离和跨越设备的VNI隔离(VLAN到VNI的映射),组成结合物理网络隔离和虚拟网络的Overlay网络。

采用EVPN作为VXLAN的控制平面具有以下优势:

可实现VTEP自动发现、VXLAN隧道自动建立,从而降低网络部署、扩展的难度。

EVPN可以同时发布二层MAC信息和三层路由信息。

可以减少网络中的泛洪流量。

我们的方案

在HPC、AI5G、云计算场景中的,数据中心网络需要满足带宽、时延、稳定性的高要求,同时支持网络虚拟化。纳多德NADDOD与NVIDIA推出支持25/100/200GbE到服务器、高密度100/200/400GbENvidiaOpen Ethernet Spectrum交换机和无控制器网络虚拟化的开放平台。可部署在第2层和第3层云设计中、基于覆盖的虚拟化网络中,或作为高性能、关键任务以太网存储结构的一部分。可跨各种应用领域(例如云计算、数据存储、人工智能等)提供行业领先的性能、可扩展性、可靠性和价值。由此,我们推出了如下两种方案:

针对25G接入100G骨干场景:

NVIDIA SN3700C+ SN3420组合方案:

SN3700C是高密度 32x100GbE SPINE Switch

SN3420 是具有原生 25GbE 端口的LEAF Switch,支持 48x25GbE 和 8x100GbE 端口

poYBAGNREB6AXqWJAAFCgYewmCY800.png

也可也选择NVIDIA SN2700(32x100GbE)+ SN2410( 48x25GbE 和 8x100GbE)组合方案,时延可低至300ns,满足更低时延需求。

针对100G接入400G骨干场景:

NVIDIA SN4700+ SN4410组合方案:

SN4700是高密度 32x400GbE SPINE Switch

SN4410 支持48x100GbE 和 8x400GbE 端口,QSFP28-DD接口可一分二QSFP28,提供100G的接入能力,用于连接主机100G接口,或者下一级100G上联口。

poYBAGNREB6AVqQMAADOu3O4rsI386.png

我们的优势

高性能100/200/400 GbE数据平面

网络是数据中心服务器流量的自然汇聚点。不同租户流量之间的网络性能和“公平性”至关重要。

NVIDIA Spectrum交换机具有完全共享的整体式数据包缓存架构,可实现公平带宽共享。支持所有数据包大小的 100/200/400 GbE 流量的无阻塞线速L3服务,且SN2000系列在直通模式下支持 300ns 的零抖动延迟支持。是高性能低延迟需求的理想选择。

RoCE over EVPN-VXLAN

数据中心网络部署方案和产品越来越成熟和标准化,有效的提升了业务部署的速度,并降低运维的成本。于此同时,业务需求推动数据中心应用也对基础设施提出更高的需求,包含算力,存储和网络资源。为了能匹配上层需求,算力/存储/网络资源的横向扩展,就网络设计而言,网络虚拟化需要在提升规模的同时,对于高性能的业务提供支持。网络虚拟化与RoCE的结合,使得大型高性能数据中心的方案更加完整。

pYYBAGNRECCAV5CBAALq3twLxDM740.png

WJH功能快速故障定位,提升运维效率

实时的网络故障可视化监控,是运维大规模网络比不可少的技术手段。现代数据中心的技术要求也证明了,简化组网协议,深度实时的网络可视化能力,是整体技术发展的趋势。NVIDIA Spectrum 交换机通过 NVIDIA What Just Happened(故障快照)支持详细的上下文遥测数据。故障快照可在问题发生后,以异常事件的形式上送给网管或者第三方监控平台,并提供报文抓取和芯片级的问题原因。无论是否为配置问题,运维人员可以直接看到故障影响的业务和原因,进而快速的采取措施,排除异常,从而大大缩短了解决问题的平均时间。

总结和展望

根据企业数据中心的发展趋势和技术预测,数据中心将逐步分布式化,多数据中心也正逐渐成为数据中心发展的趋势,网络技术作为数据中心基础设施的重要一环,也将持续打造超高速网络连接,提升系统访问效率和用户服务体验。

NVIDIA Spectrum 以太网交换机Cumulus Linux为业界带来了第一个开放且无控制器VXLAN 解决方案。它将高度可扩展的 BGP EVPN与VXLAN 解决方案相结合,在许多大型数据中心通过Spine-Leaf架构在整个网络中提供出色的弹性和低延迟,根据需要轻松进行水平扩展,推动数据中心网络的高质量发展。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 交换机
    +关注

    关注

    19

    文章

    2437

    浏览量

    95656
  • 数据中心
    +关注

    关注

    15

    文章

    4187

    浏览量

    70044
收藏 人收藏

    评论

    相关推荐

    #mpo极性 #数据中心mpo

    数据中心MPO
    jf_51241005
    发布于 :2024年04月07日 10:05:13

    数据中心交换机高速率发展,需要哪些电感与电容元件?

    了大功率数据机架和更高效的数据中心建设,云计算数据中心网络拓扑结构也在持续升级演进,市场对数据中心光互联技术提出了更高速率、更低功耗、更低成
    的头像 发表于 04-05 00:03 2671次阅读

    #mpo光纤跳线 #数据中心光纤跳线

    光纤数据中心
    jf_51241005
    发布于 :2024年03月22日 10:18:31

    数据中心市场的关键以太网解决方案

    了解数据中心市场动态的关键在于以太网解决方案。Synopsys负责产品管理和高性能计算IP的副总裁Michael Posner说:“以太网在数据中心中根深蒂固……虽然它并不广为人知,但60%的
    发表于 03-12 09:53 138次阅读
    <b class='flag-5'>数据中心</b>市场的关键以太网<b class='flag-5'>解决方案</b>

    #永久链路 #信道测试 #数据中心

    数据中心
    jf_51241005
    发布于 :2024年02月23日 10:17:58

    #光缆水峰 #综合布线光缆 #数据中心

    数据中心光缆
    jf_51241005
    发布于 :2024年01月15日 09:43:26

    #预端接光缆 #24芯光缆 #数据中心

    数据中心光缆
    jf_51241005
    发布于 :2023年12月08日 11:01:21

    大模型时代,数据中心将转向何方?

    数据中心大模型
    脑极体
    发布于 :2023年11月22日 09:01:41

    基于FPGA的数据中心Load Balancer加速解决方案

    电子发烧友网站提供《基于FPGA的数据中心Load Balancer加速解决方案.pdf》资料免费下载
    发表于 09-13 09:32 0次下载
    基于FPGA的<b class='flag-5'>数据中心</b>Load Balancer加速<b class='flag-5'>解决方案</b>

    融合数据中心解决方案

    电子发烧友网站提供《融合数据中心解决方案.pdf》资料免费下载
    发表于 08-29 09:52 0次下载
    融合<b class='flag-5'>数据中心</b><b class='flag-5'>解决方案</b>

    用于创新、转型和优化数据中心的网络解决方案

    电子发烧友网站提供《用于创新、转型和优化数据中心的网络解决方案.pdf》资料免费下载
    发表于 08-28 16:41 0次下载
    用于创新、转型和优化<b class='flag-5'>数据中心</b>的网络<b class='flag-5'>解决方案</b>

    易华录与华为联合打造的易简预制模块化数据中心解决方案在2023全球数据中心产业论坛发布

    的新机遇、新需求、新挑战。 易华录与华为联合打造的“易简预制模块化数据中心解决方案”,作为华为本次发布的三大解决方案之一——FusionDC生态解决方案,在本次论坛一起发布 基于202
    的头像 发表于 07-10 10:05 617次阅读

    GRANDMICRO有容微在数据中心方案应用

    GRANDMICRO有容微在数据中心方案应用
    的头像 发表于 05-30 14:11 433次阅读

    增强现实 AR:数据中心机房可视化运维#AR # #产品方案

    数据中心
    阿梨是苹果
    发布于 :2023年05月25日 10:32:50

    200G AOC有源光缆在数据中心的应用

    随着大数据时代对高速、高带宽的需求日益增长,人们迫切需要一种新型产品作为高性能计算和数据中心的主要传输介质。因此,光通信传输速率的发展也提高了。面对短距离
    的头像 发表于 05-15 14:24 814次阅读
    200G AOC有源光缆在<b class='flag-5'>数据中心</b>的应用