0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为、中国科学院计算技术研究所联合开发论文获USENIX收录

华为数据通信 来源:华为数据通信 2025-10-12 11:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,2025年USENIX年度技术会议(ATC'25,The 2025 USENIX Annual Technical Conference)在美国波士顿与OSDI联合召开。作为计算机系统领域顶级的CCF-A类会议,本届ATC共收到634篇论文投稿,仅100篇成功入选,中稿率低至15.8%。其中,华为数据中心网络技术实验室与中国科学院计算技术研究所合作完成的论文——基于Compute Express Link(CXL)的解耦式机架架构DRack,成功获收录。该论文提出在机柜规模内,通过以太网与CXL总线多模式互连构建网卡池-内存池架构DRack,为解决数据中心跨机柜网络通信带宽瓶颈提供了创新方案。

研究背景

跨机柜网络通信带宽逐渐成为
分布式计算的性能瓶颈

随着数据密集型应用的广泛部署,其计算规模已扩展至多主机、多机柜并行,并依托GPU、领域定制加速器等高性能计算单元实现高吞吐处理。这一趋势对网卡带宽及网络带宽提出更高要求,以满足机柜间数据同步的时效性需求。

但在传统柜顶交换机(Top of Rack,ToR)架构中,主机私有网卡与机柜间核心网络常因资源超额认购(over-subscription),成为跨机柜通信的性能瓶颈。研究通过实证发现:尽管跨机柜通信流量规模大,但单个机柜内主机网卡利用率普遍偏低,核心原因有两点:一是不同主机计算负载不均衡,数据访问量差异显著;二是部分主机仅运行非分布式任务,无数据同步需求。若能实现机柜内闲置网卡资源的动态共享与灵活调度,可有效提升跨机柜通信效率。

研究创新性提出DRack新型机柜架构,通过CXL总线与以太网融合,构建“网卡池-内存池”双池体系,核心设计包含三点:

网卡解耦与共享池构建:将机柜内所有网卡从主机解耦,形成集中式共享网卡池,可向单个主机提供短时聚合带宽,大幅提升网卡资源利用率

内存解耦与大带宽池构建:考虑到主机本地内存及PCIe链路带宽远低于网卡池总带宽,单一主机难以充分利用网卡资源,DRack进一步解耦主机内存,构建聚合读写带宽超越网卡池的机柜级内存池,支持网卡池向多内存设备并行读写数据。

内存语义直访优化:允许主机处理器或加速器在计算过程中,通过内存语义直接读写内存池数据,无需先经DMA将数据迁移至本地内存,减少数据传输环节,提升效率。

选择CXL互连实现DRack架构,核心在于其两大特性与设计需求高度契合:一是CXL2.0标准通过CXL交换机支持内存与IO设备池化,CXL3.0进一步实现机柜级内存共享;二是CXL支持CXL.mem协议(内存语义),可满足主机直访内存池的需求。

通过上述设计,DRack不仅有效缓解传统ToR架构的跨机柜通信瓶颈,其更优的通信效率还能为现有任务调度算法(如 Crux@Sigcomm24)提供有力补充。相较于现有方案,DRack采用静态架构设计,无需应对可重构性与流量预测的复杂性,也无需额外增置硬件;同时可通过向CXL互连架构接入更多内存、网卡设备,实现系统灵活扩展。

实验效果:多场景性能显著提升

鉴于目前尚无商业化CXL3.0产品,研究团队开发了原型验证系统,用于模拟四机柜DRack架构:每个机柜配备2个定制化 MPSoC FPGA(模拟计算主机,集成四核CPU、双通道内存、四个光纤端口),CPU通过HP/HPC端口将内存总线信号传至FPGA侧,并实现类CXL协议软IP;同一机柜的2个FPGA连接服务器双端口网卡,基于DPDK技术在服务器上仿真网卡池与CXL互连功能。

测试结果显示,在DNN训练、图计算(数据密集型)及键值存储(延迟敏感型)等典型应用场景中,DRack较传统ToR架构平均降低37.3%的数据同步时间。此外,网卡池带宽利用率表现优异:单个主机可充分利用带宽,两台主机同时通信时,能根据流量大小动态共享资源,总体带宽利用率接近1。

b7dbada8-a696-11f0-8c8f-92fbcf53809c.png

技术突破意义
获国际认可,夯实创新地位

DRack相关技术有望与业界scaleup方案形成深度协同,整体提升高性能计算与分布式系统能力。在面向大规模人工智能计算场景时,该架构能够显著增强基于万卡、千机柜的大语言模型训练与推理任务的执行效率,降低通信开销、提升资源利用率。同时,在传统分布式应用(如图计算、内存键值存储(如Memcached))等系统中,该技术也可有效优化通讯表现与资源利用率,进一步提升整体系统吞吐与响应性能,为下一代数据中心基础设施构建提供可扩展、高效率的架构支撑。

此次DRack相关论文获USENIX ATC收录,不仅意味着华为与中国科学院计算技术研究所在CXL技术与数据中心机柜架构融合领域的探索,得到国际顶级学术界的高度认可,更标志着华为在数据中心网络领域的又一重大突破。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20391

    浏览量

    255693
  • 华为
    +关注

    关注

    218

    文章

    36312

    浏览量

    263039
  • 带宽
    +关注

    关注

    3

    文章

    1058

    浏览量

    43693
  • 主机
    +关注

    关注

    0

    文章

    1077

    浏览量

    36908

原文标题:荣誉殿堂 | 由华为、中国科学院计算技术研究所联合开发基于CXL协议的解耦式机架架构DRack论文获USENIX收录

文章出处:【微信号:Huawei_Fixed,微信公众号:华为数据通信】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中国科学院长春光机所首次亮相SEMICON China 2026

    2026年3月25日,SEMICON China 2026(上海国际半导体展)在上海新国际博览中心隆重举行,会期三天。中国科学院长春光机所首次亮相该展会,另有2家长光企业以独立参展的形式参加本次展会。中国科学院长春光机所副所长李耀彬,副所长、党委副书记孙守红以及科研、管理
    的头像 发表于 03-30 10:13 647次阅读

    微电子科学家吴德馨院士逝世,在国内率先提出利用MEMS结构实现激光器和光纤的无源耦合

    3月24日,中国科学院微电子研究所官方账号发布讣告,中国科学院院士,我国杰出的微电子科学家,中国科学院微电子
    的头像 发表于 03-25 18:23 413次阅读
    微电子<b class='flag-5'>科学</b>家吴德馨院士逝世,在国内率先提出利用MEMS结构实现激光器和光纤的无源耦合

    合力泰到访中国科学院福建物质结构研究所调研交流

    2026年2月10日,合力泰科技股份有限公司(以下简称合力泰)党委书记、董事长邓佳威,公司党委委员、副总经理张长弘,携公司有关人员一行到访中国科学院福建物质结构研究所(以下简称福建物构)进行调研交流。福建物构
    的头像 发表于 02-25 15:56 719次阅读

    中国科学院自动化研究所一行莅临智行者考察调研

    近日,中国科学院自动化研究所专家团队一行莅临智行者,考察无人驾驶技术及商业化应用方面的创新突破与市场实践。作为领先的“特种无人驾驶解决方案提供商”,智行者向专家团系统展示了智行者如何凭借深厚
    的头像 发表于 12-26 17:22 1825次阅读

    润和软件与中国科学院广州生物医药与健康研究院达成战略合作

    近日,江苏润和软件股份有限公司(以下简称“润和软件”)与中国科学院广州生物医药与健康研究院正式签署战略合作协议。双方强强联合,将聚焦人类细胞谱系大科学研究设施场景,在国产操作系统、智能
    的头像 发表于 11-18 17:06 1134次阅读
    润和软件与<b class='flag-5'>中国科学院</b>广州生物医药与健康<b class='flag-5'>研究</b>院达成战略合作

    中国科学院院士王曦,递补为中央委员

    、韦韬、邓亦武、邓修明、卢红为中央委员会委员。   公开资料显示,王曦,男,汉族,1966年8月生,江苏南通人,2001年4月加入中国共产党,1990年6月参加工作,中国科学院上海冶金研究所材料物理专业毕业,
    的头像 发表于 11-17 18:16 1546次阅读
    <b class='flag-5'>中国科学院</b>院士王曦,递补为中央委员

    【精选直播】openDACS 2025 开源EDA与芯片大赛 赛题五 赛题七 直播宣讲会

    (中国科学院计算技术所研究员)、王翕(东南大学副教授)、常开颜(中国科学院计算技术研究所)、蔡思扬(中国
    的头像 发表于 11-11 08:08 1073次阅读
    【精选直播】openDACS 2025 开源EDA与芯片大赛 赛题五 赛题七 直播宣讲会

    【精选直播】openDACS 2025 开源EDA与芯片大赛 赛题二 赛题四 直播宣讲会

    (中国科学院计算技术研究所研究员)、穆嘉楠(中国科学院计算技术研究所助理研究员)特邀主持何均宏
    的头像 发表于 10-28 10:08 1246次阅读
    【精选直播】openDACS 2025 开源EDA与芯片大赛 赛题二 赛题四 直播宣讲会

    中国科学院自动化研究所携手中科曙光打造高性能工具链解决方案

    2019年起,中国科学院自动化研究所以语音、文本、图像等单模态大模型的研究与应用为基石,全力攻关全球首个千亿参数多模态大模型。如今,相关产品已突破跨模态任务泛化与混合模态同步理解的技术
    的头像 发表于 08-11 11:08 1230次阅读

    奇异摩尔出席第三届芯粒开发者大会AI芯片与系统分论坛

    近日,第三届芯粒开发者大会圆满落幕。大会在“集成芯片前沿技术科学基础”重大研究计划指导下,由中国科学院计算技术研究所
    的头像 发表于 07-22 11:34 1585次阅读

    中国科学院沈阳自动化研究所研究基于石墨烯/PDMS封装的医用胶带柔性传感器,用于水下机器人运动检测

    水下应用的需求仍是一项重大挑战。本文,中国科学院沈阳自动化研究所郭洪吉等研究人员在《ADVANCED MATERIALS TECHNOLOGIES》期刊发表名为“A Nanocrack-Based
    的头像 发表于 07-17 11:51 5108次阅读
    <b class='flag-5'>中国科学院</b>沈阳自动化<b class='flag-5'>研究所</b>:<b class='flag-5'>研究</b>基于石墨烯/PDMS封装的医用胶带柔性传感器,用于水下机器人运动检测

    奇异摩尔邀您相约第三届芯粒开发者大会AI芯片与系统论坛

    7月15日,由“集成芯片前沿技术科学基础”重大研究计划指导,中国科学院计算技术研究所中国电子科技集团公司第五十八
    的头像 发表于 07-01 17:14 1370次阅读

    恭贺 | 晟鹏创始人成会明院士当选欧洲科学院院士!

    近日,欧洲科学院(AcademiaEuropaea)陆续公布2025年院士入选名单,经同行推荐、评审,中国科学院深圳先进技术研究院碳中和技术研究所所长、广东晟鹏材料
    的头像 发表于 06-24 06:33 1542次阅读
    恭贺 | 晟鹏创始人成会明院士当选欧洲<b class='flag-5'>科学院</b>院士!

    中国科学院西安光机所在计算成像可解释性深度学习重建方法取得进展

    图1 MDFP-Net网络结构 近日,中国科学院西安光机所空间光学技术研究室在计算成像可解释性深度学习重建方法研究取得创新性进展。相关研究
    的头像 发表于 06-09 09:27 872次阅读
    <b class='flag-5'>中国科学院</b>西安光机所在<b class='flag-5'>计算</b>成像可解释性深度学习重建方法取得进展

    中国科学院上海微系统开发出高性能10mm大口径压电 MEMS 快反镜

     5 月 16 日消息,中国科学院宣布,上海微系统与信息技术研究所研究员武震宇、助理研究员王栎皓团队,开发了一种高性能的 10 毫米大口径压
    的头像 发表于 06-07 17:44 696次阅读
    <b class='flag-5'>中国科学院</b>上海微系统<b class='flag-5'>所</b><b class='flag-5'>开发</b>出高性能10mm大口径压电 MEMS 快反镜