0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

51.2T 800G AI智算交换机软硬件系统设计全揭秘

星融元Asterfusion 2025-04-21 17:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI、HPC 与云计算基础设施飞速演进的当下,性能瓶颈不再源于算力,而是网络系统中的每一个微秒延迟与每一瓦能耗。

为应对这一挑战,星融元推出了旗舰级产品:CX864E-N 64x800G 超低时延 RoCE 交换机

该产品具备业界领先的560ns端口转发时延和基于 SONiC 的开放网络架构,为下一代 AI 智算网络提供极致性能保障和灵活的方案集成空间。

近期国内外展会上,CX864E-N已吸引了大量客户与行业专家的关注。对此,我们决定不再“藏着掖着”,而是大方展示我们的技术实力与设计理念 —— 星融元将一直以坦诚、开放的态度与客户和同行共同推动开放网络的行业进步。

wKgZO2gGE3-AX7AnAAFC8r5PmvY972.png

CX864E-N 早在去年已实现量产并成功部署于多家头部互联网企业与云服务提供商的数据中心,并且交付周期已缩短至约2周,在性能、交期与成本的多维度比较中名列前茅。

CX864E-N 硬件外观概览

设备前面板

在2U高的前面板上,排布着64个800G OSPF 端口,其前后向兼容性可确保从现有的 100GE/200GE/400GE 网络无缝过渡到更高级的800GE,保护历史投资。

wKgZO2gGE5eAYGx8AAJLcDFmlh0104.png

在管理口方面,CX864E-N 提供RJ45 MGMT、USB2.0接口及RJ45 Console。

另外,CX864E-N 还提供两个额外的 10G SFP+ 端口,专门用于增强带内网络遥测 (INT) 等管理功能。这一考虑至关重要,因为 800G 交换机上的每个端口都承担着相当大的工作负载,如出现问题,影响会显著放大,因此需要更精准、实时的通信监控。(当然,客户也还可以根据其他网络需求灵活运用这两个端口)

wKgZO2gGE6uAUMzoAAGdJ8qIrVU496.png

面板右侧还有6个LED指示灯,其中靠近RJ45口的两个分别为:

  • LINK/ACT灯,指示 MGMT接口的link及数据通讯状态
  • SYS灯,指示整机系统的运行状态;

面板右侧竖排四个指示灯从上到下依次为:

  • BMC状态指示灯(BMC)
  • 电源指示灯(P)
  • 风扇状态指示灯(F)
  • 设备定位指示灯(L)

前面板分布着横、纵向排列的三排小型进风孔。外部冷空气正是通过这些气孔进入机箱内部,与风冷系统协同工作,有效提升整体散热效率。

设备背部

CX864E-N 设备背部配备了4个风扇模块以及2个电源模块,为系统提供稳定、高效的散热与供电保障。所有风扇与电源均支持热插拔,无需中断系统运行。电源模块集中布局于设备左侧,单个功率为 3200W。

wKgZPGgGE_GABawPAAFegkgswto265.pngwKgZO2gGE_WAAd8GAAFjGCtcPlQ840.png

您可能会问:市面上的800G交换机大多有6到8个风扇,而CX864E-N仅有4个,散热如何保证?关于这个问题我们会在下一个部分来解答。

CX864E-N 内部硬件

让我们揭开这台高性能交换机的盖版,从左至右,依次探索这款设备的核心构造,深入了解其内部硬件设计。

wKgZPGgGFA-AJqboAAK5PfJ4S0U503.png

散热板

首先看到的是大面积覆盖的散热板(已拆出放置),这是我们采用了 3D真空腔均热板技术的高效风冷散热模块。

wKgZPGgGFCSAZED7AAH9lxrl8Us943.png

相比部分厂商选择的水冷方案,该散热设计在整机满配功耗高达 2180W 的极限工况下,依然能够稳定满足系统运行需求,同时将整机功耗控制在业内较低水平,能效表现出色。在该负载条件下,风扇仅需以约 60% 转速运行便可维持散热系统的正常运作,有效控制噪音水平,避免对运行环境造成干扰。

ASIC 模块

wKgZO2gGFEqAQfljAANWwcxecyI051.png

散热板下即是 Marvell Teralynx 10 ASIC 模块(以下简称“TL10”), 安装在 OSFP 接口背后,是整机网络交换处理能力的核心。TL10是一颗基于 5nm 工艺、单芯片架构的可编程交换芯片,提供51.2 Tbps的吞吐能力。

TL10 的超低时延性能是其最大亮点之一,可将端到端时延控制在约 560 纳秒,在同类芯片中表现极为出色。对于 AI 模型训练、推理以及大规模并行计算任务,低延迟意味着更快的同步、更高的吞吐、更低的能耗浪费,从而提升整个集群效率。

大容量片上缓存(200+ MB):显著提升 RoCE 传输性能,能够有效缓解网络拥塞引发的数据排队与等待问题。相比竞品采用的外置 HBM 方案,片上缓存在功耗、访问延迟以及成本控制方面具备显著优势。

  • 先进的带内遥测(INT)功能
  • Flowlet 调度机制:通过引入 Flowlet 级别的负载均衡策略,TL10 在高吞吐场景下依然可保持稳定的数据分发效率。该机制显著降低了对缓存资源的依赖,仅需约 200MB,即可满足复杂网络环境下的调度与拥塞控制需求。
  • 高 Radix 架构(512×100GbE):支持网络大规模横向扩展,助力数据中心从传统三层架构向扁平化两层架构演进,显著减少网络设备数量与布线复杂度,提高整体网络效率与可靠性。
  • 领先的能效比:在面向大规模 AI 训练集群的实际部署中,TL10 相较于同类方案可节省超过 1MW 功耗,在每瓦带宽和计算密度方面处于业界领先水平,显著降低长期运营成本(TCO)。
wKgZPGgGFHSAWasSAAGXSe4Qmvs743.png


文末我们将展示基于 TL10 芯片设备的实际延迟测试结果。

电源模组

在ASIC上方是斜向排列的一组电源模组。它们为核心的 ASIC 芯片提供稳定电力支持。值得一提的是,这种非平行布局经过优化,可有效提升电源完整性,为高速数据传输保驾护航。

wKgZPGgGFJGAdTDjAAJd4So-c8I072.png


PTP模块

电源模组上方为 PTP(精确时间协议)模块,支持高达10ns 的PTP与SyncE精度。该模块为可选功能,采用可插拔设计,客户可按需定制,灵活部署。下图是PTP模块已安装与未安装状态的实物图对比。

wKgZO2gGFKSAHGA5AAQGE18qbZ4028.pngwKgZPGgGFJ6AVqlrAAMXOZKqaGg048.png

COMe 模块

长方体组件正是我们的 COMe 模块,基于 x86 架构,搭载 Intel Xeon 处理器,具备强大的计算性能,能够支持 INT-based Routing 等高级网络功能。上面运行我们自研的基于 SONiC -based AsterNOS 操作系统,为交换机提供稳定、高效的控制平面核心,确保整机在复杂网络环境下的灵活调度与可靠运行。

wKgZO2gGFLmAEXUnAAMF2JOCrms153.png

BMC 模块

COMe模块右侧是BMC模块,它同样采用可插拔设计,客户可根据需求升级BMC模块,解锁更高性能与更丰富的管理功能。

wKgZO2gGFM2AZ0OWAAPMSLdcMIE573.png

NVMe 插槽

COMe 模块左侧是两个全长 2280 的 NVMe 插槽,以及一个兼容 2280 和 2242 尺寸的 M.2 SATA 插槽,为用户提供灵活的本地存储扩展能力。

此外,两个 2280 NVMe 插槽还可选配最多两颗 Hailo-10 AI 加速引擎,支持实时、低延迟且高能效的边缘 AI 推理计算,满足多种智能和AI应用场景的部署需求。

wKgZO2gGFOGAfSeUAAO3CxT4VlI346.png

风扇

整机后部配备 4 个可热插拔风扇模块,构成高效简洁的风冷系统。这里也回答了之前的问题,在满负载运行(2180W)下,这套散热方案已完全能够稳定运行,无需塞入额外的风扇来控制温度,大大降低了功耗与系统复杂度。更少的组件,意味着更高的可靠性与更低的运营成本。

wKgZO2gGFLmAEXUnAAMF2JOCrms153.png

其他补充

CX864E-N 整机内部仅使用了一根线缆,其他连接均通过高性能连接器实现板间互联,避免了因复杂线缆引起的信号干扰和维护难题。相比一些友商使用多根线缆的做法,这种设计更可靠,也更利于长期稳定运行。

wKgZPGgGFQGALaW-AAQjjDHF-is849.png

CX864E-N的PCB采用全球领先的制造工艺,并选用业内已大规模量产的顶级高性能板材,结合Vippo、盲孔(Blind Hole)、背钻(Back Drill)等先进技术工艺,全面满足112G高速SerDes在信号完整性(Signal Integrity)、损耗(Loss)、串扰(Crosstalk)等方面的严苛技术要求。

CX864E-N 软件概述

星融元 CX864E-N交换机搭载企业级 SONiC 发行版 —— AsterNOS。我们致力于打造业界领先的企业版 SONiC,助力客户构建高性能、智能化的网络系统,从控制面到数据面构建起软硬一体的协同架构。

wKgZPGgGFSCAExPoAAUGxj9jcJI420.png

加速 AI 网络,释放超算潜能

作为超以太网联盟(UEC)的早期成员,Asterfusion 借助超级以太网技术,将网络利用率提升至 90% 甚至更高,全面加速 AI 网络部署与数据中心演进。

解锁AI数据中心潜力:网络利用率如何突破90%?

星融元 CX864E-N RoCE交换机通过 Flowlet 负载均衡、基于 INT 的智能路由与 WCMP 等先进技术,实现 AI 训练与推理网络超过 90% 的利用率。这不仅显著提升 AI 工作负载效率,同时有效降低数据中心建设与运营成本

  • 全功能交钥匙解决方案:AsterNOS 基于社区 SONiC 构建,强化了 EVPN 多归属、RoCEv2、Ansible 自动化 等企业特性,专为复杂部署环境而设计。与自研的开放网络硬件深度适配,提供真正即插即用的一体化解决方案。
  • 更快的版本发布节奏与响应机制:相比社区半年一版的发布频率AsterNOS 实现了季度新版本发布,确保客户需求与问题能被快速响应与解决。
  • 专业支持团队,灵活定制服务:超过 120 名SONiC软件研发工程师,为客户提供专业、灵活的服务支持,包括定制功能开发、问题定位优化以及全方位的技术咨询。
  • 双模式CLI风格,提升用户体验:除了 Linux 风格的 Bash CLI,AsterNOS 还基于 Klish 实现了 Cisco 风格的命令行界面,帮助网络工程师更轻松上手,降低学习曲线。
  • 560ns 超低转发时延、64×800G OSFP 高密度接口、TL10单芯片架构、超大片上缓存、板间无缆互联、定制级 PTP和AI 模块、每一行走线,每一个模块、都是星融元面向 AI 工作负载与低延迟网络的工程化答案。

附录:相关测试数据

wKgZO2gGFUeATPt7AAHKVfCeer8034.pngwKgZPGgGFUuAcJWPAAE3nMYN_P0001.pngwKgZO2gGFU2AIBwAAADq1UsUmPI106.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 交换机
    +关注

    关注

    23

    文章

    2870

    浏览量

    103938
  • AI
    AI
    +关注

    关注

    89

    文章

    38153

    浏览量

    296826
  • 硬件系统
    +关注

    关注

    0

    文章

    51

    浏览量

    11855
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    51.2T带宽、128×400G,国内最高密度盒式DCI交换机正式发布!

    Interconnect,跨数据中心互联)交换机正成为智时代的 “力高速公路”。   DCI 交换机是连接不同地域、不同集群数据中心的关键网络设备,其核心功能围绕
    的头像 发表于 11-11 09:27 2019次阅读
    <b class='flag-5'>51.2T</b>带宽、128×400<b class='flag-5'>G</b>,国内最高密度盒式DCI<b class='flag-5'>交换机</b>正式发布!

    交换机:纳秒速率、低时延与高密度端口重构AI力网络

    速率(光电交换机可达纳秒级,光机械交换机达毫秒级)、低时延架构(时延低于10微秒)、高能效比(功耗较InfiniBand或以太网方案降低65%以上)。这种技术特性使其在AI力网络中展
    的头像 发表于 09-26 09:11 6855次阅读

    800G OSFP DR8 光模块:100G PAM4 技术驱动的超高速数据中心互联核心

    、低功耗特性,支持NVIDIA Spectrum-4/Arista 7800R3交换机,是800G数据中心互联理想选择,助力力基础设施高效演进。
    的头像 发表于 09-01 12:29 645次阅读

    睿海光电800G光模块助力全球AI基建升级

    800G SR8模块在设计与兼容性上实现多重突破: 硬件兼容:支持QSFP-DD/OSFP封装,可适配思科、Arista等主流交换机;光口兼容单模PSM8与多模VCSEL方案(支持OM3/OM4光纤
    发表于 08-13 19:05

    睿海光电领航AI光模块:超快交付与全场景兼容赋能智时代——以创新实力助力全球客户构建高效力底座

    到全场景兼容,从800G量产突破到1.6T前瞻布局,睿海光电始终以客户需求为导向,以技术创新为引擎,为全球AI基础设施建设提供坚实底座。凭借智能制造实力与开放生态策略,睿海光电正携手合作伙伴,共同推动智能时代的
    发表于 08-13 19:03

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    NVIDIA Quantum-2交换机等主流设备。 平滑扩展:与现有400G/100G设备无缝互通,降低数据中心升级成本。 多场景覆盖:从AI训练集群的“大象流”到
    发表于 08-13 19:01

    加速AI未来,睿海光电800G OSFP光模块重构数据中心互联标准

    在人工智能力需求呈指数级增长的2025年,数据传输效率已成为制约AI发展的关键瓶颈。作为全球AI光模块领域的标杆企业,深圳市睿海光电凭借技术领先的800G OSFP光模块解决方案,正
    发表于 08-13 16:38

    揭秘星融元 800G AI交换机

    交换机
    星融元Asterfusion
    发布于 :2025年06月25日 15:08:20

    揭秘星融元 800G AI交换机

    交换机
    星融元Asterfusion
    发布于 :2025年05月27日 17:30:43

    工业交换机与普通交换机的区别:为什么工厂网络宁贵不省?

    的吗?价格差几倍有必要吗?” 今天,我们就从工业场景的血泪教训出发,揭秘这两者的本质区别。  有人白金工业级交换机 ISG 一、设计理念:工业交换机是“特种兵”,普通交换机是“白领”
    的头像 发表于 05-23 17:14 974次阅读

    适用于数据中心和AI时代的800G网络

    随着人工智能(AI)技术的迅猛发展,数据中心面临着前所未有的计算和网络压力。从大语言模型(LLM)训练到生成式AI应用,海量数据处理需求推动了网络带宽的快速增长。在此背景下,800G网络技术应运而生
    发表于 03-25 17:35

    DeepSeek推动AI力需求:800G光模块的关键作用

    的100G光模块已无法满足高效能AI训练和推理所需的大规模数据传输。为了应对这一挑战,400G800G乃至1.6T光模块的出现成为行业必然
    发表于 03-25 12:00

    优化800G数据中心:高速线缆、有源光缆和光纤跳线解决方案

    广泛应用于网卡、交换机、服务器、超级计算机、云计算和数据中心的短距离互连。 800G高速线缆 随着大规模和超大规模数据中心的兴起,服务器机架的功耗显著增加,垂直布线距离减少。因此,800G
    发表于 03-24 14:20

    为什么400G光模块和800G光模块如此火爆?

    力中心作为承载大量计算任务的核心设施,需要快速、稳定的网络环境,400G800G光模块应运而生,尤其是800G光模块的需求尤为旺盛。800G
    的头像 发表于 12-23 14:41 1063次阅读

    24口千兆交换机方案设计参考原理图资料(资料可直接使用)

    交换机设计领域,多数需要千兆交换机。本设计参考原理图旨在帮助工程师和技术人员在开发24口千兆交换机时更好地理解硬件架构和电路设计。它基于R
    发表于 12-10 10:22