0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据中心大规模并行化

易飞扬通信 来源:易飞扬通信 作者:易飞扬通信 2023-07-10 10:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

3月,光网络与通信研讨会及博览会OFC 2023在美国顺利举办,其中有个研讨话题:Slow and Wide versus Fast and Narrow: How do we make our Datacenters Green? 讨论在数据中心内,如果以功耗最优为目标,应该采用更高波特率方案?还是采用并行的低波特率方案?这些现象的背后,是带宽增长下,香农极限(Sharron Limit)的逼近和摩尔定律(Moore Law)的放缓,不得不采用类似计算领域的并行化思路。讨论这种并行化是否是一个发展方向?让我们就这个议题,来讨论下关于数据中心大规模并行化。

数据中心网络结构相对简单,且光纤数量不是主要问题。主要诉求是大带宽、低功耗以及低时延要求。大规模并行化方案应该可以有效解决带宽增长需求。大规模并行方案也可能通过省掉SERDES、CDR等功耗占比高的功能单元,获得功耗优势。

DCN网络条件下,传输距离一般在2km以内,仍然是以IMDD方案为主,受器件带宽和调制效率的约束。所谓的100G实际是4×25G或2×50G,而400G实际是16×25G、8×50G或4×100G。本质上已经是并行化思路,但是限于局部传输链路,且没有为功耗优化。

采用单LANE按功耗优化的大规模并行化的思路有一个好处,即网络可以利用光层开关特性,以较低粒度的单LANE速率进行调度,形成一个可重构的光层网络。

Google在SIGCOMM 2022上的介绍了Jupiter Evolving思路,该思路的核心是将SPINE用MEMS光交叉替代掉,以达到DCN整体容量可以持续扩容的目的。Jupiter采用的光模块是40G:4×10G NRZ, 100G:4×25G NRZ, 400G:8×50G PAM4,要求高速模块具有兼容低速模块的能力。该方案以端口为调度颗粒,但技术上应可以实现以单LANE速率为单位进行调度。

总的来说,在数据中心网络中,由于带宽需求增长仍然很快,功耗压力持续增大。与此同时,业界和学术界都在尝试将光开关技术应用于数据中心。两种趋势可能推动在数据中心网络中大规模并行方案的发展。


审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据中心
    +关注

    关注

    16

    文章

    5519

    浏览量

    74653
  • 光网络
    +关注

    关注

    1

    文章

    206

    浏览量

    23897
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能数据中心的光纤布线策略

    随着人工智能(AI)技术的飞速发展,数据中心的光纤布线策略正面临前所未有的挑战和机遇。AI的高带宽需求、低延迟要求以及大规模并行计算的特点,对数据中心的光纤布线提出了更高的要求。本文将
    的头像 发表于 11-21 10:21 83次阅读

    TensorRT-LLM的大规模专家并行架构设计

    之前文章已介绍引入大规模 EP 的初衷,本篇将继续深入介绍 TensorRT-LLM 的大规模专家并行架构设计与创新实现。
    的头像 发表于 09-23 14:42 702次阅读
    TensorRT-LLM的<b class='flag-5'>大规模</b>专家<b class='flag-5'>并行</b>架构设计

    物联网数据中心是什么?有什么功能?

    物联网数据中心是集成和管理物联网设备数据的核心平台,具备数据采集、处理、存储、分析、可视及安全管控等功能,其本质是通过技术融合实现物理世界与数字世界的双向交互与智能决策。以下从定义、
    的头像 发表于 09-22 17:14 694次阅读

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    引领AI时代网络变革:睿海光电的核心竞争力 在AI时代,数据中心正经历从传统架构向AI工厂与AI云的转型。AI工厂依赖超大规模GPU集群驱动大模型训练,要求网络具备超高带宽与超低延迟;AI云则为多
    发表于 08-13 19:01

    伟创力高效电源模块在超大规模数据中心的应用

    受云端存储和数据处理需求持续增长的推动,数据中心正以前所未有的速度扩张。当前全球超大规模数据中心,即规模最大的那些数据中心,总容量在过去四年
    的头像 发表于 07-07 15:41 910次阅读

    小型数据中心晶振选型关键参数全解

    小型数据中心的定义与应用 小型数据中心通常是为中小型企业、边缘计算、物联网(IoT)设备及其他特定业务需求提供计算、存储和网络服务的设施。与大型数据中心相比,小型数据中心的物理空间较小
    发表于 06-11 13:37

    纳微半导体推出12kW超大规模AI数据中心电源

    近日,纳微半导体宣布推出专为超大规模AI数据中心设计的最新12kW量产电源参考设计,可适配功率密度达120kW的高功率服务器机架。
    的头像 发表于 05-27 16:35 1153次阅读

    BDx成功融资助力香港超大规模数据中心扩建

     亚太地区发展势头迅猛的数据中心运营商BDx数据中心宣布,其香港首个专用超大规模数据中心开发项目融资已顺利完成。此次融资由Clifford Capital、大华银行(UOB)和三井住友银行(SMBC
    的头像 发表于 05-22 17:27 517次阅读

    是德科技推出用于大规模AI数据中心的系列解决方案

    · 为AI基础设施提供商提供从物理层到应用层数据中心模拟和优化解决方案 · 验证和优化系统级性能,确保AI数据中心的无缝互操作性 · 主动识别可能导致AI数据中心性能降低的薄弱环节 是德
    的头像 发表于 04-10 08:51 502次阅读
    是德科技推出用于<b class='flag-5'>大规模</b>AI<b class='flag-5'>数据中心</b>的系列解决方案

    适用于数据中心和AI时代的800G网络

    ,成为新一代AI数据中心的核心驱动力。 AI时代的两大数据中心:AI工厂与AI云 AI时代催生了两类数据中心架构: AI工厂:用于大规模模型训练和推理,如GPT-4和图像生
    发表于 03-25 17:35

    优化800G数据中心:高速线缆、有源光缆和光纤跳线解决方案

    广泛应用于网卡、交换机、服务器、超级计算机、云计算和数据中心的短距离互连。 800G高速线缆 随着大规模和超大规模数据中心的兴起,服务器机架的功耗显著增加,垂直布线距离减少。因此,800G
    发表于 03-24 14:20

    伟创力如何应对超大规模数据中心建设挑战

    在当今瞬息万变的数字世界中,数据中心正面临着前所未有的挑战。随着人工智能(AI)的迅速崛起,传统的数据中心设计与运营模式遭遇了巨大压力。伟创力通信、企业和云业务总裁Rob Campbell 指出,超大规模数据中心建设面临独特挑战
    的头像 发表于 03-06 13:58 756次阅读

    数据中心发展与改造

    全球多数数据中心基础设施已超六年,能耗高而效率低。随着AI的发展,企业正致力于整合与提升能效的现代改造。同时数据中心呈现规模化、高密、绿
    的头像 发表于 02-28 16:50 740次阅读
    <b class='flag-5'>数据中心</b>发展与改造

    精准监测,智能预警,安科瑞为数据中心安全保驾护航

    安科瑞的数据中心产品与解决方案,以其智能、模块、高可靠性及能效精细化管理的核心优势,全面覆盖了从超大规模数据中心到边缘节点的全场景需求。无论是新建项目还是老旧改造,均可通过定制
    的头像 发表于 02-19 17:05 710次阅读
    精准监测,智能预警,安科瑞为<b class='flag-5'>数据中心</b>安全保驾护航