0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

像IB一样好用的RoCE网络

星融元Asterfusion 2025-04-16 11:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一年一度的中国电子信息博览会(CITE)在深圳举办。

借着这个电子信息产业最新产品和技术的国家级平台,我们将自研的(也是业内最尖端的)800G 51.2T RoCE 交换机首次带进了展会现场,并与华南地区的上下游企业,区域集成商合作伙伴进行了高密度的面对面交流。

短短三天,六米见方的展台里,我们经历了一次次来访者的试探、不解,甚至当面挑战,直到与我们建立起技术信任、向我们发出高层交流甚至现场测试的邀约。

这些有着不同技术市场背景和工作经历的来访者,往往理解行业、了解客户、知道问题、渴望答案——他们或在星融元的展台上找到了答案,或为星融元的持续创新带来了启发。

wKgZO2f_J-mAZUakAAQqR1GKrgM553.png展会现场

“都没听说过你们公司,有案例吗”

此次展会多数都是AI服务器系统集成商,其中一位来访者之前都是将服务器直接配置IB交换机整体打包给客户。年初由于DeepSeek的爆火他们接触到不少小规模算力组网需求,而当前国际市场环境下,采购英伟达IB交换机总归有点风险(别说之前还遭遇过6个月交付周期+超预算的困境)。他见我们是做RoCE网络的,于是带着存疑的态度前来咨询。

“都没听过你们公司,你们的产品在DeepSeek推理网有案例吗?”

接待他的同事结合自己对DeepSeek开源模型理解,就着刚刚完成的基于星融元CX732Q-N(400G)的详细组网方案给这位集成商介绍起来——我们的组网方案比起其它RoCE友商64口400G和32口400G成本更优;又如我们此前为沐曦C500 DeepSeek做的组网方案,一台机器可以将训练网、存储网、业务网融合,简单到网络即插即用,完全可以替换IB,成本至少降低了三分之一;结合最近中美关税政策,能降低一半。

wKgZPGf_KBOAcCNBAAFPskUOjjc970.png

至于性能,我们直接向他展示CX-N系列交换机与IB在AI智算,HPC和分布式存储等场景的多个对比数据(–>测试报告参考)。一番沟通下来,这位项目经理直接与我们共享了之前给某运营商的DeepSeek AI硬件基础设施报价, 其中全套IB的网络价格直接与采购的AI服务器价格相近了,导致客户认为网络成本太高而没能顺利落单。

再细细核算一波,如果当时用我司设备组网,应该就能符合客户预期了。

“Hash不均你们怎么解决”

有位算力行业的客户来到我们展台,他虽非网络工程师,但对RoCE网络在算力场景下的IB替代趋势和面临的一些挑战已有不少了解。

与那位AI服务器系统集成商类似,他也问到了我们的RoCE网络相对其他的厂家优势所在,不过要更加具体。

“比如对于大模型中常见的hash不均,你们会怎么解决?”。他表示一般厂商会采用例如调整哈希因子之类的方式,但仅以他本人在项目中的感知,实际效果非常有限,不足以满足需求,想知道我们是否还有其他办法。

答案当然是肯定的,这几乎也是每个算力网络运维架构师都会问到我们的问题。具体来说,如果以软件方式实现,我们完全可以采用“主动规划”的思路为每条业务流提前规划路径,预先设置,生成脚本一键下发,就像提前给每辆车固定住了行驶的路线并且自动为客户设备加载路由条目,这便是开放网络的技术路线带给客户最直观的价值体现之一。

除了主动规划,还可以结合硬件能力的实现类似“自动驾驶”(动态哈希)方案,就好比让每辆车自动选择不堵车的线路和选择多种解决hash不均的实现以适应不同的使用场景。

可惜时间场地受限,我们没法在这个闹哄哄的展台长时间地交流。互相交换联系方式后我们推荐他关注微信公众号(与他谈到的产品动态和技术分享多少都能在日常更新里找到),之后再预约时间深度交流,探讨合作空间。

相关阅读:解锁AI数据中心潜力:网络利用率如何突破90%?

wKgZO2f_KMWAfDepAAJjWfqGxtc786.png展会现场

“像IB一样好用的RoCE网络,真的吗”

一位年轻的工程师站在展台的EasyRoCE展示屏前面看了又看,似有疑虑但不知如何开口。主动上前三言两语聊下来,我们大概了解到这位工程师是华南的一家规模很大的系统集成商的网络方案架构师,这家集成商在网络方面的主要业务之一是为客户提供基于IB的网络方案,应用场景主要是高性能计算和最近两年爆火的AL/ML网络。

吸引这位工程师流连在星融元展台的主要原因是EasyRoCE提供的简捷部署和整体监控方案。作为一位技术从业人员,这位工程师对RoCE技术、方案与产品已有很深入的理解,但是往往在考察了市面上现有的方案,考虑到的部署、实施、运维、监控等环节的挑战之后,就被劝退了。

“我们的很多现场工程师往往只具备最基础的运维能力,不能要求他们具备在现场去分析、定位交换机的队列、水线以及它们之间复杂关联的能力,他们更需要在问题发生的时候能够一眼就看到故障点在哪里、然后快速解决……”,这位年轻人如是说。

在了解了EasyRoCE的工具集的各项能力之后,他表示能够感觉到这些工具解决的问题真的是在很多方案中都遇到过的。

“你们这个方案是不是可以替换UFM了?”

的确,EasyRoCE工具集可以说就是星融元RoCE方案的“UFM”。我们将自己在过往两三年中,在AI/ML的RoCE网络部署中踩过的坑、碰到的问题,结合我们的技术能力,全部工具化了,通过这些工具将RoCE赋能给合作伙伴和最终用户。

像IB一样好用的RoCE网络,这一点,我们来真的。

wKgZPGf_KPqADO2BAAKUda00QPM356.png

“这对IT运维排障人员太友好了!”

还是有关EasyRoCE。

在给某华南地区数据中心IT负责人介绍EasyRoCE多个小工具的时候,他看到光模块地图立刻叫了暂停,跟我们确定地图上的不同颜色是否表示交换机的光模块的运行状态。在得到肯定答复后他忍不住感叹:再也不用收到网络故障通知后,不管三七二十一先挨个ssh到交换机上去show一下全局接口状态了。“通过光模块地图一眼就可以排除物理因素,并且直观定位故障模块,这个东西对IT运维排障人员太友好了!”

wKgZPGf_KR6AMIiIAAFggRrdkls428.pngEasyRoCE 光模块地图

“几百万的设备怕是还不如你们的SONiC交换机”

一位国内某量化交易公司的一线工程师在前台拿着彩页仔细看了好一会儿,才指着”高精度监控”向我们发问。算力系统经常出现毫秒级延迟波动,传统网管工具完全无法定位。于是我们引导他前往展示区,结合远程演示环境和数据,现场介绍如何捕捉由微突发引发的丢包。

“原来我们每年花几百万买的’高端设备’,精度还不如你们一台白盒交换机!” 虽不知他们到底买了什么高端设备,但得到这样的评价我们还是十分高兴的,也期待后续有机会在他们的新建网络中展示开放网络的更大潜力。

“这小盒子玩得挺花,说不定我能用上”

800G 交换机之外,我们还带了一台半宽的开放硬件平台:ET2500。这款设备我们尚未正式在国内市场发布,初步定位的场景是部署在企业出口,作为算网融合开放网关承担从路由器、防火墙到网络流量分析器的全部功能,替代原本用价格不菲的多台专用设备串联而成的出口架构。

不过,它的玩法绝不止于此——小小的盒子提供1G/2.5G/10G接口,内置了PoE模块、PTP模块、5G/LTE模块,还能选配AI 加速卡和WiFi7/6E模块和外置天线,加之上层运行的标准Linux和我们定制优化的DPDK/VPP软件包(已开源),给足了用户想象空间。

wKgZPGf_KVqADT5PAAJQRz_S9iI189.png

有位路过的客户转头一瞥就被我们的ET2500外观吸引住了,左右打量半天,开口问的第一个问题是,这个小盒子能帮我做算力调度吗?

接着就畅谈他们的业务场景:算力调度网络,把分布在全国的零散算力资源统一调度起来,分布式计算的场景和ET2500(以及此前发布的 CX102S-DPU)天然契合——小盒子里面的三颗芯片协同工作,可以帮他们极大减少边缘部署的设备数量和复杂度。经过一番业务场景的沟通和探讨之后,他对这款小盒子非常感兴趣,留下了联系方式并表示后续要再交流探讨。

电博会上与星融元偶遇的这些人,那些事,再一次坚定了我们用高效、实用的开放网络技术栈帮助各行业客户切实解决问题的信心,并将其作为星融元在这个充满着挑战和机遇的全球市场上不变的生存与发展之道。

wKgZO2f_KWuARgXBAATWmy-z1C8378.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 网络交换机
    +关注

    关注

    1

    文章

    75

    浏览量

    16885
  • 算力
    +关注

    关注

    2

    文章

    1673

    浏览量

    16833
  • 智算中心
    +关注

    关注

    0

    文章

    123

    浏览量

    2602
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    企业出海,网络先行!让全球业务本地一样流畅、安全

    的解决方案:提供站式“网络+云”服务能力,让您专注核心业务,全球化布局再无后顾之忧。网络服务能力——打通全球业务的“高速公路”加速网关&全球组网:为您的跨境业务访问
    的头像 发表于 03-24 10:22 396次阅读
    企业出海,<b class='flag-5'>网络</b>先行!让全球业务<b class='flag-5'>像</b>本地<b class='flag-5'>一样</b>流畅、安全

    RDMA设计37:RoCE v2 子系统模型设计

    仿真模型。在 RoCE v2 协议中,本地主机与远程主机之间往往需要进行复杂的指令、信息、数据交互,使得在进行仿真验证时如何模拟复杂网络环境成为个急需解决的问题。 因此,本IP设计了
    发表于 02-06 16:19

    RDMA设计29:RoCE v2 发送及接收模块设计2

    本博文主要交流设计思路,在本博客已给出相关博文约100篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。 (1)RoCE v2 发送模块 RoCE v2 发送模块
    发表于 01-26 16:47

    RDMA设计28:RoCE v2 发送及接收模块设计

    较慢、延迟相对较高。因此在RoCE v2 发送及接收模块中,SEND 单元只用于进行主机间的信息参数交换,不直接涉及大批量的数据传输操作,可以在定程度上降低传输延迟、增加数据吞吐量。而DMA 控制器在其
    发表于 01-25 10:45

    RDMA设计19:RoCE v2 发送及接收模块设计

    较慢、延迟相对较高。因此在RoCE v2 发送及接收模块中,SEND 单元只用于进行主机间的信息参数交换,不直接涉及大批量的数据传输操作,可以在定程度上降低传输延迟、增加数据吞吐量。而DMA 控制器在其
    发表于 01-06 08:08

    不只是工具,更是平台,易工(TQKIT)让系统功能调用写应用逻辑一样简单

    易工(TQKIT)展示了天嵌在 Android系统级能力封装上的深厚积累。通过自研系统封装库,易工(TQKIT)将复杂的系统控制能力以接口形式开放给开发者,让系统功能调用写应用逻辑一样简单。
    的头像 发表于 12-05 16:53 379次阅读
    不只是工具,更是平台,易工(TQKIT)让系统功能调用<b class='flag-5'>像</b>写应用逻辑<b class='flag-5'>一样</b>简单

    连载|开发工具,易安卓让系统功能调用写应用逻辑一样简单

    通过自研系统封装库,易安卓将复杂的系统控制能力以接口形式开放给开发者,让系统功能调用写应用逻辑一样简单。
    的头像 发表于 11-27 11:40 87次阅读
    连载|开发工具,易安卓让系统功能调用<b class='flag-5'>像</b>写应用逻辑<b class='flag-5'>一样</b>简单

    一样的展会,不一样的精彩 2025湾芯展圆满收官

    10月17日,2025湾区半导体产业生态博览会(2025湾芯展)在深圳会展中心(福田)圆满收官。全球600多家展商、超30场论坛,在6万平方米的展区内,打造场“不一样的展会”,呈现出“不一样的精彩
    的头像 发表于 10-29 16:56 1505次阅读
    不<b class='flag-5'>一样</b>的展会,不<b class='flag-5'>一样</b>的精彩 2025湾芯展圆满收官

    一样的展会,不一样的精彩:2025湾芯展顺利收官

    内,打造场"不一样的展会",呈现出"不一样的精彩"。本届展会人气火爆,展期三天累计接待总量达到11.23万人次。参展企业集中发布年度新品数约2500件,新品发布与商业合作收获颇丰。   不
    的头像 发表于 10-19 20:27 903次阅读
    不<b class='flag-5'>一样</b>的展会,不<b class='flag-5'>一样</b>的精彩:2025湾芯展顺利收官

    怎么kell一样设置rom下载起始地址?

    如题,怎么kell一样设置rom下载起始地址?
    发表于 10-10 07:21

    现场解决EMC电磁辐射干扰:“望闻问切”,中医一样

    南柯电子|现场解决EMC电磁辐射干扰:“望闻问切”,中医一样
    的头像 发表于 09-04 09:47 1038次阅读

    从哈希极化到零拥塞:主动路径规划在RoCE网络中的负载均衡实践

    智算集群对网络性能,特别是高吞吐、低延迟和无损特性有着严苛要求,RoCE因此被广泛应用。然而,在主流Clos组网架构下,传统的ECMP路由机制存在天然的局限性,容易引发哈希极化问题,成为制约
    的头像 发表于 07-21 17:27 2132次阅读
    从哈希极化到零拥塞:主动路径规划在<b class='flag-5'>RoCE</b><b class='flag-5'>网络</b>中的负载均衡实践

    在ModusToolbox2.3下,基于BTSDK3.1开发cyw20719b2程序,是否可以wiced studio一样设置?

    请问在ModusToolbox2.3下,基于BTSDK3.1开发cyw20719b2程序,是否可以wiced studio一样设置: APP_XIP=1 将程序中的函数从on-chip flash运行?如果可以,应该怎么设置?
    发表于 07-08 06:52

    RoCE网络规划还在手动算IP?这套工具让运维效率飙升

    随着AI算力集群规模指数级增长,网络架构复杂度陡增。传统网络规划依赖人工计算与经验判断,存在效率低、易出错、可视化弱三大痛点。尤其在RoCE(RDMA over Converged Ethernet
    的头像 发表于 06-30 14:33 2137次阅读
    <b class='flag-5'>RoCE</b><b class='flag-5'>网络</b>规划还在手动算IP?这套工具让运维效率飙升

    RDMA简介3之四种子协议对比

    RDMA协议共有四种子协议,分别为InfiniBand、iWARP、RoCE v1和RoCE v2协议。这四种协议使用统的RDMA API,但在具体的网络层级实现上有所不同,如图1所
    发表于 06-04 16:05