0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高速率数据中心解决方案

维维为 来源:维维为 作者:维维为 2022-10-20 17:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着业务转型发展带来的信息化系统建设,云应用程序正在快速发展。单体应用程序正在让位于分布式服务,推动了数据中心基础设施网络流量的增加,流量的持续增长也推动着数据中心网络往更快、更大带宽和更低延迟的高速网络方向发展。

Spine+Leaf网络架构

直到几年前,大多数的数据中心网络还都是基于传统的三层架构,对于大多数具有像园区网络这样的纵向(North-South)配置的流量模型来说是很实用的,而且三层网络结构应用广泛而且技术成熟稳定。一个标准的传统三层的网络结构如图1-1所示:

pYYBAGNREA6AD_4RAAEo1BCqjDg966.png

图1-1 传统三层网络架构

但随着云计算的发展,横向(East-West)流量在数据中心占据主导地位,涵盖几乎所有的云计算,虚拟化以及大数据横向网络在纵向设计的网络拓扑中传输数据会带有传输的瓶颈,因为数据经过了许多不必要的节点(如路由和交换机等设备)。主机互访需要通过层层的上行口,带来明显的性能衰减,而三层网络的原始设计更会加剧这种性能衰减。

由此,就有了IP Fabric概念,IP Fabric指的是在IP网络基础上建立起来的Overlay/隧道技术。如图1-2所示为基于胖树的Spine+Leaf拓扑结构的IP Fabric组网图。

poYBAGNREA-ABH9IAAEP9VUHgJ4305.png

图1-2 IP Fabric网络的两层架构

在这种组网方式中,任何两台服务器间的通信不超过3台设备,每个Spine和Leaf节点全互连,可以方便地通过扩展Spine节点来实现网络规模的弹性扩展。只要遍历一定数量的交换机,可以在几乎所有数据中心结构体系结构中的服务器节点之间传输流量。该架构由多条高带宽的直接路径组成,消除了网络瓶颈带来的潜在传输速度下降,从而实现极高的效率和低延迟。

pYYBAGNREBeAaFmEAAHktagH98Y179.png

图1-3 Spine-leaf架构

用盒式机代替传统框式机

在设计和建设一个数据中心的网络时,我们需要充分考虑到至少未来5年的技术、行业需求发展和运营成本开支,从而更优化地使用现有的数据中心资源服务于企业核心业务。

在网络交换机选型是整个数据中心网络设计的关键因素之一。传统的大型网络设计选择框式设备,以提高整个网络系统的容量上限,并提供的有限的可扩展性,但是相应的,存在如下的限制和风险:

框式设备总体容量有限,已经不能满足数据中心不断增长的网络规模需求。

核心框式设备采用双连接方式部署,故障半径高达50%,无法有效保障业务安全。

框式设备部署实施复杂,故障诊断和排除周期长,升级维护的业务中断时间长。

为保障后期业务扩容,框式设备预留插槽,使得前期的投资成本提升。

所以在网络设备选型方面,我们建议用整网盒式交换机组网,不同层级的交换机型号统一,便于维护团队快速熟悉,同时后期的网络架构调整,设备复用和维修替换提供可操作的空间。

建设初期的网络投资(拥有成本TCO)也大大缩小的同时,Spine-Leaf(CLOS)架构配合盒式交换机组网,提供了可横向扩展的能力。即便spine交换机故障离线,也仅仅影响小部分网络带宽,业务完全无感知。后续扩展方面,仅需要根据数据中心的规模需求,添加交换机数量和层级,相应的扩展网络的接入容量和骨干网络交换容量。整个网络按需采购和部署,一切服务与应用和业务需求。

Overlay网络

Overlay网络是建立在已有物理网络上的虚拟网络,具有独立的控制和转发平面,对于连接到Overlay的终端设备(例如服务器)来说,物理网络是透明的,从而可以实现承载网络和业务网络的分离,如图1-4所示:

pYYBAGNREBiARAsrAACfJjnhs7I094.jpg

图 1-4 Overlay/Underlay网络概念图

Overlay网络有着各种网络协议和标准,包括VXLAN、NVGRE、SST、GRE、NVO3、EVPN等。

VXLAN

VXLAN(Virtual eXtensible LAN,可扩展虚拟局域网络)是基于IP网络、采用“MAC in UDP”封装形式的二层VPN技术。VXLAN可以基于已有的服务提供商或企业IP网络,为分散的物理站点提供二层互联,并能够为不同的租户提供业务隔离。VXLAN 主要应用于数据中心网络和园区接入网络。

pYYBAGNREBqAGdHlAAHq2nhox0g964.png

图 1-5 VXLAN模型

初始的IET FVXLAN 标准 (RFC 7348) 定义了一个基于组播、不采用控制平面的“泛洪和学习”的VXLAN。它对远程 VXLAN 的VTEP(虚拟隧道末端点)发现和远程终端主机MAC学习依靠数据驱动式泛洪进行。重叠广播、未知单播和组播流量封装到组播VXLAN数据包并通过底层组播转发传输到远程VTEP交换机。此类部署中的泛洪可能给解决方案的可扩展性带来挑战。在底层网络中启用组播功能的要求也会带来挑战,因为某些组织不希望在其数据中心或广域网网络中启用组播。

poYBAGNREBuAapqgAAEvUOHOK3w302.png

图 1-6 flood-learn

如图1-6,假设最左侧虚机已经知道目的MAC了(VTEP中的L2 Table已经老化,虚机中的ARP cache还没老化)。当最左侧虚机想ping最右侧虚机,ping包送到VTEP,因为在VTEP中找不到对应的Remote VTEP,VTEP会做如下操作:

(1)原始的Ethernet Frame被封装成VXLAN格式,VXLAN包的外层目的IP地址为组播地址。

(2)VXLAN数据包被发送给组播内所有其他VTEP。

VXLAN-EVPN部署弹性网络

VXLAN由RFC7348定义,其中只定义了数据层的行为,并没有指定VXLAN控制层。在VXLAN技术早期,通过数据层的来获取转发信息,在实现上较为简单,相应的技术门槛较低,有利于厂商实现VXLAN。但是随着网络规模的发展,完全依赖数据层做控制会造成网络中广播组播风暴,因此VXLAN也需要有一个控制层。

VXLAN 重叠网络在“泛洪和学习”模式下运行,在此模式下,终端主机信息学习和 VTEP 发现均由数据平面驱动,在VTEP之间没有控制协议分发终端主机可达性信息,要克服此局限,可以将多协议边界网关协议以太网虚拟专用网络 (MP-BGP EVPN) 用作VXLAN控制平面。

有了控制层数据,数据层就简单多了。Server A想访问Server B,通过查找本地VTEP L2 Table找到VTEP2,再封装成VXLAN数据发送到VTEP2,VTEP2将VXLAN解封装,转发给本地的Server B。所以可以看出,从数据层面角度来看,有没有EVPN效果都是一样的。EVPN只负责VXLAN的控制层面,也就是MAC转发信息的传输,对VXLAN数据层面没有影响。

pYYBAGNREByAa7E_AACC8ucLX2U766.png

图 1-7 EVPN作为控制平面

VXLAN作为新型的网络隔离技术,在RFC 7348定义中有24比特,支持多达16M(约1600万)租户隔离,有效地解决了云计算中海量租户隔离的问题。在VTEP本地进行VLAN 隔离和跨越设备的VNI隔离(VLAN到VNI的映射),组成结合物理网络隔离和虚拟网络的Overlay网络。

采用EVPN作为VXLAN的控制平面具有以下优势:

可实现VTEP自动发现、VXLAN隧道自动建立,从而降低网络部署、扩展的难度。

EVPN可以同时发布二层MAC信息和三层路由信息。

可以减少网络中的泛洪流量。

我们的方案

在HPC、AI5G、云计算场景中的,数据中心网络需要满足带宽、时延、稳定性的高要求,同时支持网络虚拟化。纳多德NADDOD与NVIDIA推出支持25/100/200GbE到服务器、高密度100/200/400GbENvidiaOpen Ethernet Spectrum交换机和无控制器网络虚拟化的开放平台。可部署在第2层和第3层云设计中、基于覆盖的虚拟化网络中,或作为高性能、关键任务以太网存储结构的一部分。可跨各种应用领域(例如云计算、数据存储、人工智能等)提供行业领先的性能、可扩展性、可靠性和价值。由此,我们推出了如下两种方案:

针对25G接入100G骨干场景:

NVIDIA SN3700C+ SN3420组合方案:

SN3700C是高密度 32x100GbE SPINE Switch

SN3420 是具有原生 25GbE 端口的LEAF Switch,支持 48x25GbE 和 8x100GbE 端口

poYBAGNREB6AXqWJAAFCgYewmCY800.png

也可也选择NVIDIA SN2700(32x100GbE)+ SN2410( 48x25GbE 和 8x100GbE)组合方案,时延可低至300ns,满足更低时延需求。

针对100G接入400G骨干场景:

NVIDIA SN4700+ SN4410组合方案:

SN4700是高密度 32x400GbE SPINE Switch

SN4410 支持48x100GbE 和 8x400GbE 端口,QSFP28-DD接口可一分二QSFP28,提供100G的接入能力,用于连接主机100G接口,或者下一级100G上联口。

poYBAGNREB6AVqQMAADOu3O4rsI386.png

我们的优势

高性能100/200/400 GbE数据平面

网络是数据中心服务器流量的自然汇聚点。不同租户流量之间的网络性能和“公平性”至关重要。

NVIDIA Spectrum交换机具有完全共享的整体式数据包缓存架构,可实现公平带宽共享。支持所有数据包大小的 100/200/400 GbE 流量的无阻塞线速L3服务,且SN2000系列在直通模式下支持 300ns 的零抖动延迟支持。是高性能低延迟需求的理想选择。

RoCE over EVPN-VXLAN

数据中心网络部署方案和产品越来越成熟和标准化,有效的提升了业务部署的速度,并降低运维的成本。于此同时,业务需求推动数据中心应用也对基础设施提出更高的需求,包含算力,存储和网络资源。为了能匹配上层需求,算力/存储/网络资源的横向扩展,就网络设计而言,网络虚拟化需要在提升规模的同时,对于高性能的业务提供支持。网络虚拟化与RoCE的结合,使得大型高性能数据中心的方案更加完整。

pYYBAGNRECCAV5CBAALq3twLxDM740.png

WJH功能快速故障定位,提升运维效率

实时的网络故障可视化监控,是运维大规模网络比不可少的技术手段。现代数据中心的技术要求也证明了,简化组网协议,深度实时的网络可视化能力,是整体技术发展的趋势。NVIDIA Spectrum 交换机通过 NVIDIA What Just Happened(故障快照)支持详细的上下文遥测数据。故障快照可在问题发生后,以异常事件的形式上送给网管或者第三方监控平台,并提供报文抓取和芯片级的问题原因。无论是否为配置问题,运维人员可以直接看到故障影响的业务和原因,进而快速的采取措施,排除异常,从而大大缩短了解决问题的平均时间。

总结和展望

根据企业数据中心的发展趋势和技术预测,数据中心将逐步分布式化,多数据中心也正逐渐成为数据中心发展的趋势,网络技术作为数据中心基础设施的重要一环,也将持续打造超高速网络连接,提升系统访问效率和用户服务体验。

NVIDIA Spectrum 以太网交换机Cumulus Linux为业界带来了第一个开放且无控制器VXLAN 解决方案。它将高度可扩展的 BGP EVPN与VXLAN 解决方案相结合,在许多大型数据中心通过Spine-Leaf架构在整个网络中提供出色的弹性和低延迟,根据需要轻松进行水平扩展,推动数据中心网络的高质量发展。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 交换机
    +关注

    关注

    23

    文章

    2871

    浏览量

    103940
  • 数据中心
    +关注

    关注

    16

    文章

    5525

    浏览量

    74659
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Amphenol LTW:数据中心互连解决方案的创新先锋

    Amphenol LTW:数据中心互连解决方案的创新先锋 在当今数据驱动的时代,数据中心的高效运行至关重要。Amphenol LTW作为一家专注于为恶劣环境提供卓越互连
    的头像 发表于 12-10 09:30 71次阅读

    Amphenol LTW:数据中心互连解决方案的创新先锋

    在当今数据驱动的时代,数据中心的高效运行至关重要。Amphenol LTW(ALTW)作为一家专注于为恶劣环境提供卓越互连解决方案的企业,凭借其创新技术和丰富产品线,在数据中心领域展现
    的头像 发表于 12-09 16:11 364次阅读
    Amphenol LTW:<b class='flag-5'>数据中心</b>互连<b class='flag-5'>解决方案</b>的创新先锋

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    合作案例,成为AI数据中心升级的关键推动者。 一、技术实力:AI光模块的研发与量产先锋 睿海光电作为全球AI光模块的领先品牌,专注于为数据中心、超算中心及智算中心提供高性能网络互联
    发表于 08-13 19:01

    英威腾入选2024绿色低碳数据中心产品及解决方案推荐目录

    近日,工信部下属权威机构赛迪顾问(CCID)正式发布《2024绿色低碳数据中心产品及解决方案推荐目录》。凭借领先的技术实力及绿色低碳创新方案,英威腾三款数据中心基础设施
    的头像 发表于 07-09 11:25 913次阅读

    简单认识安森美AI数据中心电源解决方案

    面对AI算力需求爆发式增长,数据中心电力系统正面临前所未有的挑战。安森美(onsemi)推出的AI数据中心电源解决方案,直击能效、尺寸等痛点,助力客户把握数据中心的市场机遇。
    的头像 发表于 07-05 13:03 3131次阅读
    简单认识安森美AI<b class='flag-5'>数据中心</b>电源<b class='flag-5'>解决方案</b>

    中型数据中心中的差分晶体振荡器应用与匹配方案

    RAID计算,FCO-7L抗干扰能力强,适用于全天候数据中心负载。 线路布置建议: 近端AC耦合,使用专用时钟线层,避免穿越电源隔离区域。 4. 光模块(QSFP+/OSFP) 匹配方案: FCO-2L
    发表于 07-01 16:33

    小型数据中心晶振选型关键参数全解

    运行。FCom的差分晶体振荡器为小型数据中心提供了可靠的时钟同步解决方案,帮助各类设备实现最佳的性能和数据传输效果。
    发表于 06-11 13:37

    利用NVIDIA技术构建从数据中心到边缘的智慧医院解决方案

    全球领先的电子制造商正在利用 NVIDIA 技术,构建从数据中心到边缘的智慧医院解决方案
    的头像 发表于 05-22 09:50 739次阅读

    是德科技推出用于大规模AI数据中心的系列解决方案

    · 为AI基础设施提供商提供从物理层到应用层数据中心模拟和优化解决方案 · 验证和优化系统级性能,确保AI数据中心的无缝互操作性 · 主动识别可能导致AI数据中心性能降低的薄弱环节 是
    的头像 发表于 04-10 08:51 505次阅读
    是德科技推出用于大规模AI<b class='flag-5'>数据中心</b>的系列<b class='flag-5'>解决方案</b>

    康普发布面向数据中心的Propel XFrame解决方案

    紧凑型落地式ODF解决方案简化并优化高密度数据中心管理运维 中国上海,2025年3月25日 ——全球领先的网络连接解决方案提供商康普(纳斯达克股票代码:COMM)近日发布全新Propel
    的头像 发表于 03-26 16:55 874次阅读

    适用于数据中心和AI时代的800G网络

    )推出800G光模块解决方案,助力数据中心实现高速互联和高效计算。 速率提升 飞速(FS)800G光模块采用基于PAM4(四电平脉冲幅度调制)技术的QSFP-DD和OSFP封装
    发表于 03-25 17:35

    优化800G数据中心高速线缆、有源光缆和光纤跳线解决方案

    随着技术的飞速发展,数据中心正在从100G和400G演进到800G时代,对高速数据传输的需求与日俱增。因此,选择高效且可靠的布线解决方案对于800G
    发表于 03-24 14:20

    构建未来数据中心 发挥人工智能AI的力量

    为了满足性能需求,数据中心架构师必须扩展系统结构,通过 PAM4 调制方案支持 224 Gbps 数据传输速率。这给互连解决方案带来了巨大的
    的头像 发表于 02-08 15:35 807次阅读
    构建未来<b class='flag-5'>数据中心</b> 发挥人工智能AI的力量

    高速线缆在数据中心的应用和解决方案

    随着数据传输需求的不断增加,高速互连技术变得越来越重要。目前在业界引起广泛关注的超大规模AI数据中心就离不开各类高速线缆。数据中心400G和
    的头像 发表于 01-08 11:24 1906次阅读
    <b class='flag-5'>高速</b>线缆在<b class='flag-5'>数据中心</b>的应用和<b class='flag-5'>解决方案</b>