0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

理想数据中心网络设计和最佳解决方案

星星科技指导员 来源:NVIDIA 作者:Rama Darbha 2022-04-28 09:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

网络管理员的工作很辛苦。他们负责确保网络上所有用户、服务器和应用程序的连通性。他们的任务通常是在获得应用程序需求之前构建网络设计,这使得一个具有挑战性的项目更加困难。在这些场景中,网络管理员尝试找到一种理想的网络设计是合乎逻辑的,他们可以将其用于任何一组应用程序。

没有一种“一刀切”的网络解决方案每次都能奏效,每种设计都有优缺点。在本文中,我们分析了三种可以被视为理想的网络类型。然后,我们根据现实世界的因素,描述每种方法的不足之处。

候选人包括:

纯 3 层

仅限第二层

覆盖 VXLAN 和 EVPN

准备好的让我们开始吧。

纯 3 层设计

许多具有前瞻性思维的架构师认为纯第 3 层( L3 )是理想的设计,因为它简单且只依赖于一个协议栈。所有流量都在 L3 级别使用同等成本的多路径路由和平衡,端点冗余通过本机功能的选播地址解决方案实现。它既简单又优雅。

许多大型网络规模的 IT 公司选择它是因为其卓越的运营效率。它还为他们提供了对应用程序环境的鲁棒控制,以设计在此设计中工作的应用程序。

依赖网络覆盖或纯路由的应用程序针对 L3 体系结构进行了优化。无论是使用基于容器的解决方案,利用路由作为其机制来提供对环境的访问,还是使用容器网络接口来封装容器到容器的通信,这些解决方案在这种体系结构上都非常有效。

SmartNICs 和 DPUs 的出现,通过提供基于主机的解决方案来减轻资源密集型任务(如存储路由表、执行数据包封装和进行 NAT )的负担,使得 L3 更加用户友好。

L3 最大的缺点是它不允许第二层( L2 )邻接的任何分布。随着时间的推移,大多数企业必须引入需要 L2 邻接的应用程序,无论是机架内部还是机架之间。从历史上看,开发人员在编写应用程序以使用 L3 功能处理集群时一直不可靠。许多传统应用程序不使用 DNS 或其他 L3 发现过程,而是使用 L2 广播域来发现和检测加入集群的节点。纯 L3 解决方案很难为需要这种环境的软件提供服务,因为每个 L2 域仅限于一个节点或一台服务器。

仅限第二层设计

只有 L2 的解决方案与纯 L3 相反。 L2 主要利用 VLAN 隔离其连接,并依赖 MLAG 和生成树协议( STP )等传统功能来提供分布式解决方案。仅限 L2 的解决方案在网络环境中仍有一席之地,通常是在不需要扩展的简单静态环境中。

人们对 L2 感到满意,因为它使用了大多数人熟悉的经过验证的技术。它在协议栈中很简单,只基于 OSI 模型的前两层做出所有转发决策。此外,市场上大多数低成本网络设备都具备这些功能集。

然而,二语在规模和表现上存在差距。依靠三层 STP 来防止环路,会导致效率低下的冗余路径。为了绕过生成树收敛中的这个限制,可以尝试部署背靠背 MLAG 。然而, MLAG 在处理设备故障和同步控制平面方面不如纯第三层解决方案有效。 L2 网络倾向于限制广播和多播流量。这些只是一些限制,它们会在部署仅限 L2 的设计时产生隐藏的拥有成本。

覆盖设计: VXLAN 和 EVPN

企业数据中心最常见的设计是 VXLAN 作为传输层封装技术, EVPN 作为控制平面技术。这种体系结构提供了最大的灵活性,具有纯第 3 层解决方案的所有优点,并为网络管理员提供了支持需要 L2 功能的应用程序的适应性。

它在不引入 STP 和 MLAG 等低效协议的情况下提供了 L2 邻接的好处。利用 EVPN 作为 L2 控制平面和 multihoming 作为 MLAG 的最佳替代方案,覆盖解决方案解决了 L2 的许多低效问题。

像 VXLAN 和 EVPN 这样一刀切的解决方案可以被认为是理想的,但即使这样也有缺点。它的批评者指出,使其运行所需的多层协议。该解决方案基于启用 BGP 的参考底图,在隧道端点之间配置 EVPN 。 VXLAN 隧道配置在覆盖层之上,其复杂程度取决于租赁要求。这可能包括与 VRF 集成,引入用于子网间通信的 L3 VNI ,以及通过 VRF 路由泄漏依赖边界叶进行租户间通信。将所有这些技术结合起来,会产生一定程度的复杂性,使故障排除和操作变得困难。

结论

无论是为了网络的简单性而牺牲操作的复杂性,还是为了灵活性而牺牲应用程序的控制,一切都有权衡。接受没有完美的网络设计的好处是,你现在可以自由选择最适合你的网络的架构和工作流程。与应用程序和基础架构团队合作,确定服务器需求,优化工作流程,并为应用程序的需求选择最佳解决方案。

关于作者

Rama Darbha 是 NVIDIA 网络组的解决方案架构主管,主要负责数据中心、 NetDevOps 和以太网交换。他热衷于帮助客户和合作伙伴通过开放的网络策略,充分利用他们的人工智能和计算工作负载。 RAMA 有一个活跃的 CCONP 2019 :: 19 和 CCIE × 22804 ,拥有杜克大学工程与管理硕士学位。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109048
  • 数据中心
    +关注

    关注

    16

    文章

    5515

    浏览量

    74628
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261395
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为面向拉美地区发布全新星河AI数据中心网络方案

    在华为数据通信创新峰会2025拉美站期间,以“星河AI数据中心网络,赋AI时代新动能”为主题的分论坛上,华为面向拉美地区发布全新升级的星河AI数据中心
    的头像 发表于 08-11 10:42 1989次阅读

    英威腾入选2024绿色低碳数据中心产品及解决方案推荐目录

    近日,工信部下属权威机构赛迪顾问(CCID)正式发布《2024绿色低碳数据中心产品及解决方案推荐目录》。凭借领先的技术实力及绿色低碳创新方案,英威腾三款数据中心基础设施
    的头像 发表于 07-09 11:25 895次阅读

    简单认识安森美AI数据中心电源解决方案

    面对AI算力需求爆发式增长,数据中心电力系统正面临前所未有的挑战。安森美(onsemi)推出的AI数据中心电源解决方案,直击能效、尺寸等痛点,助力客户把握数据中心的市场机遇。
    的头像 发表于 07-05 13:03 3108次阅读
    简单认识安森美AI<b class='flag-5'>数据中心</b>电源<b class='flag-5'>解决方案</b>

    中型数据中心中的差分晶体振荡器应用与匹配方案

    RAID计算,FCO-7L抗干扰能力强,适用于全天候数据中心负载。 线路布置建议: 近端AC耦合,使用专用时钟线层,避免穿越电源隔离区域。 4. 光模块(QSFP+/OSFP) 匹配方案: FCO-2L
    发表于 07-01 16:33

    小型数据中心晶振选型关键参数全解

    运行。FCom的差分晶体振荡器为小型数据中心提供了可靠的时钟同步解决方案,帮助各类设备实现最佳的性能和数据传输效果。
    发表于 06-11 13:37

    华为面向亚太地区发布全新星河AI数据中心网络方案

    在华为数据通信创新峰会2025亚太站期间,以“星河AI数据中心网络,赋AI时代新动能”为主题的分论坛上,华为面向亚太地区发布全新升级的星河AI数据中心
    的头像 发表于 06-11 11:11 1065次阅读

    利用NVIDIA技术构建从数据中心到边缘的智慧医院解决方案

    全球领先的电子制造商正在利用 NVIDIA 技术,构建从数据中心到边缘的智慧医院解决方案
    的头像 发表于 05-22 09:50 726次阅读

    数据中心能源监测物联网解决方案

    的同时,也面临着严峻的能源挑战。 数据中心内的服务器、存储设备、网络设备以及制冷、照明系统等持续运行,能源消耗巨大。据统计,全球数据中心的耗电量已占总发电量的2%-3%,且这一比例仍在不断攀升。高昂的能源成本不仅加
    的头像 发表于 05-09 17:23 483次阅读
    <b class='flag-5'>数据中心</b>能源监测物联网<b class='flag-5'>解决方案</b>

    爱普生SG2520HHN晶振数据中心服务器的理想解决方案

    系统宕机。爱普生SG2520HHN差分晶振凭借低抖动、宽频段、高兼容性卓越性能,成为数据中心服务器的理想时钟解决方案。SG2520HHN差分晶振特性与优势:1.超
    的头像 发表于 04-29 17:32 456次阅读
    爱普生SG2520HHN晶振<b class='flag-5'>数据中心</b>服务器的<b class='flag-5'>理想</b><b class='flag-5'>解决方案</b>

    华为荣获数据中心自智网络基础能力解决方案检测证书

    2025年云网智联大会首日,中国信息通信研究院(简称“信通院”)向华为技术有限公司(以下简称“华为”)等首批获得《数据中心自智网络基础能力解决方案检测证书》的企业正式颁发证书。此项认证的获得充分验证了华为等公司在
    的头像 发表于 04-25 16:00 660次阅读

    康普发布面向数据中心的Propel XFrame解决方案

    紧凑型落地式ODF解决方案简化并优化高密度数据中心管理运维 中国上海,2025年3月25日 ——全球领先的网络连接解决方案提供商康普(纳斯达克股票代码:COMM)近日发布全新Prope
    的头像 发表于 03-26 16:55 839次阅读

    适用于数据中心和AI时代的800G网络

    持续优化800G网络解决方案,为下一代1.6T数据中心铺平道路,助力数据中心迎接更高性能、更智能化的时代挑战。 ​ *文章来源于飞速(FS)社区 ​
    发表于 03-25 17:35

    华为全新升级星河AI数据中心网络

    在华为中国合作伙伴大会2025期间,以 “星河AI数据中心网络,赋AI时代新动能”为主题的数据中心网络分论坛圆满落幕。本次论坛汇聚了来自全国的300多位客户和伙伴,共同探讨
    的头像 发表于 03-24 14:46 849次阅读

    优化800G数据中心:高速线缆、有源光缆和光纤跳线解决方案

    。通过综合考虑带宽、距离和成本等因素,可提高数据中心整体效率并实现未来网络基础设施的升级和扩展。如需了解更多定制化布线方案和专业建议,请访问飞速(FS),探索全面的布线产品和解决方案
    发表于 03-24 14:20

    “2025 IC风云榜”揭晓,思尔芯获“年度最佳解决方案奖”

    应用级创新解决方案,荣获“年度最佳解决方案奖”。该奖项专为能够为行业提供高品质、创新性解决方案,且其产品已获得行业客户广泛认可和好评的企业而设立的。思尔芯(S2C
    的头像 发表于 12-14 21:03 1539次阅读
    “2025 IC风云榜”揭晓,思尔芯获“年度<b class='flag-5'>最佳解决方案</b>奖”