0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为、中国科学院计算技术研究所联合开发论文获USENIX收录

华为数据通信 来源:华为数据通信 2025-10-12 11:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,2025年USENIX年度技术会议(ATC'25,The 2025 USENIX Annual Technical Conference)在美国波士顿与OSDI联合召开。作为计算机系统领域顶级的CCF-A类会议,本届ATC共收到634篇论文投稿,仅100篇成功入选,中稿率低至15.8%。其中,华为数据中心网络技术实验室与中国科学院计算技术研究所合作完成的论文——基于Compute Express Link(CXL)的解耦式机架架构DRack,成功获收录。该论文提出在机柜规模内,通过以太网与CXL总线多模式互连构建网卡池-内存池架构DRack,为解决数据中心跨机柜网络通信带宽瓶颈提供了创新方案。

研究背景

跨机柜网络通信带宽逐渐成为
分布式计算的性能瓶颈

随着数据密集型应用的广泛部署,其计算规模已扩展至多主机、多机柜并行,并依托GPU、领域定制加速器等高性能计算单元实现高吞吐处理。这一趋势对网卡带宽及网络带宽提出更高要求,以满足机柜间数据同步的时效性需求。

但在传统柜顶交换机(Top of Rack,ToR)架构中,主机私有网卡与机柜间核心网络常因资源超额认购(over-subscription),成为跨机柜通信的性能瓶颈。研究通过实证发现:尽管跨机柜通信流量规模大,但单个机柜内主机网卡利用率普遍偏低,核心原因有两点:一是不同主机计算负载不均衡,数据访问量差异显著;二是部分主机仅运行非分布式任务,无数据同步需求。若能实现机柜内闲置网卡资源的动态共享与灵活调度,可有效提升跨机柜通信效率。

研究创新性提出DRack新型机柜架构,通过CXL总线与以太网融合,构建“网卡池-内存池”双池体系,核心设计包含三点:

网卡解耦与共享池构建:将机柜内所有网卡从主机解耦,形成集中式共享网卡池,可向单个主机提供短时聚合带宽,大幅提升网卡资源利用率

内存解耦与大带宽池构建:考虑到主机本地内存及PCIe链路带宽远低于网卡池总带宽,单一主机难以充分利用网卡资源,DRack进一步解耦主机内存,构建聚合读写带宽超越网卡池的机柜级内存池,支持网卡池向多内存设备并行读写数据。

内存语义直访优化:允许主机处理器或加速器在计算过程中,通过内存语义直接读写内存池数据,无需先经DMA将数据迁移至本地内存,减少数据传输环节,提升效率。

选择CXL互连实现DRack架构,核心在于其两大特性与设计需求高度契合:一是CXL2.0标准通过CXL交换机支持内存与IO设备池化,CXL3.0进一步实现机柜级内存共享;二是CXL支持CXL.mem协议(内存语义),可满足主机直访内存池的需求。

通过上述设计,DRack不仅有效缓解传统ToR架构的跨机柜通信瓶颈,其更优的通信效率还能为现有任务调度算法(如 Crux@Sigcomm24)提供有力补充。相较于现有方案,DRack采用静态架构设计,无需应对可重构性与流量预测的复杂性,也无需额外增置硬件;同时可通过向CXL互连架构接入更多内存、网卡设备,实现系统灵活扩展。

实验效果:多场景性能显著提升

鉴于目前尚无商业化CXL3.0产品,研究团队开发了原型验证系统,用于模拟四机柜DRack架构:每个机柜配备2个定制化 MPSoC FPGA(模拟计算主机,集成四核CPU、双通道内存、四个光纤端口),CPU通过HP/HPC端口将内存总线信号传至FPGA侧,并实现类CXL协议软IP;同一机柜的2个FPGA连接服务器双端口网卡,基于DPDK技术在服务器上仿真网卡池与CXL互连功能。

测试结果显示,在DNN训练、图计算(数据密集型)及键值存储(延迟敏感型)等典型应用场景中,DRack较传统ToR架构平均降低37.3%的数据同步时间。此外,网卡池带宽利用率表现优异:单个主机可充分利用带宽,两台主机同时通信时,能根据流量大小动态共享资源,总体带宽利用率接近1。

b7dbada8-a696-11f0-8c8f-92fbcf53809c.png

技术突破意义
获国际认可,夯实创新地位

DRack相关技术有望与业界scaleup方案形成深度协同,整体提升高性能计算与分布式系统能力。在面向大规模人工智能计算场景时,该架构能够显著增强基于万卡、千机柜的大语言模型训练与推理任务的执行效率,降低通信开销、提升资源利用率。同时,在传统分布式应用(如图计算、内存键值存储(如Memcached))等系统中,该技术也可有效优化通讯表现与资源利用率,进一步提升整体系统吞吐与响应性能,为下一代数据中心基础设施构建提供可扩展、高效率的架构支撑。

此次DRack相关论文获USENIX ATC收录,不仅意味着华为与中国科学院计算技术研究所在CXL技术与数据中心机柜架构融合领域的探索,得到国际顶级学术界的高度认可,更标志着华为在数据中心网络领域的又一重大突破。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20154

    浏览量

    247591
  • 华为
    +关注

    关注

    218

    文章

    35805

    浏览量

    260842
  • 带宽
    +关注

    关注

    3

    文章

    1030

    浏览量

    43034
  • 主机
    +关注

    关注

    0

    文章

    1049

    浏览量

    36445

原文标题:荣誉殿堂 | 由华为、中国科学院计算技术研究所联合开发基于CXL协议的解耦式机架架构DRack论文获USENIX收录

文章出处:【微信号:Huawei_Fixed,微信公众号:华为数据通信】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中国科学院:高线性类皮肤柔性传感器研究取得系列进展

    线性度是柔性传感技术的核心测量能力,线性不足不仅增加了系统标定与数据解耦的复杂度,更直接影响到信号的物理可比性与测量可追溯性。 中国科学院重庆绿色智能技术研究院提出基于皮肤启发的双机制离电传感新机
    的头像 发表于 11-27 10:33 880次阅读
    <b class='flag-5'>中国科学院</b>:高线性类皮肤柔性传感器<b class='flag-5'>研究</b>取得系列进展

    润和软件与中国科学院广州生物医药与健康研究院达成战略合作

    近日,江苏润和软件股份有限公司(以下简称“润和软件”)与中国科学院广州生物医药与健康研究院正式签署战略合作协议。双方强强联合,将聚焦人类细胞谱系大科学研究设施场景,在国产操作系统、智能
    的头像 发表于 11-18 17:06 733次阅读
    润和软件与<b class='flag-5'>中国科学院</b>广州生物医药与健康<b class='flag-5'>研究</b>院达成战略合作

    中国科学院院士王曦,递补为中央委员

    、韦韬、邓亦武、邓修明、卢红为中央委员会委员。   公开资料显示,王曦,男,汉族,1966年8月生,江苏南通人,2001年4月加入中国共产党,1990年6月参加工作,中国科学院上海冶金研究所材料物理专业毕业,
    的头像 发表于 11-17 18:16 1081次阅读
    <b class='flag-5'>中国科学院</b>院士王曦,递补为中央委员

    【精选直播】openDACS 2025 开源EDA与芯片大赛 赛题五 赛题七 直播宣讲会

    (中国科学院计算技术所研究员)、王翕(东南大学副教授)、常开颜(中国科学院计算技术研究所)、蔡思扬(中国
    的头像 发表于 11-11 08:08 457次阅读
    【精选直播】openDACS 2025 开源EDA与芯片大赛 赛题五 赛题七 直播宣讲会

    【精选直播】openDACS 2025 开源EDA与芯片大赛 赛题六 赛题三 直播宣讲会

    的PPA优化宣讲嘉宾胡杏(中国科学院计算技术所研究员)、靳鹏威(中国科学院计算技术所)、李崇骁(中国科
    的头像 发表于 11-04 08:08 450次阅读
    【精选直播】openDACS 2025 开源EDA与芯片大赛 赛题六 赛题三 直播宣讲会

    【精选直播】openDACS 2025 开源EDA与芯片大赛 赛题二 赛题四 直播宣讲会

    (中国科学院计算技术研究所研究员)、穆嘉楠(中国科学院计算技术研究所助理研究员)特邀主持何均宏
    的头像 发表于 10-28 10:08 709次阅读
    【精选直播】openDACS 2025 开源EDA与芯片大赛 赛题二 赛题四 直播宣讲会

    中国科学院自动化研究所携手中科曙光打造高性能工具链解决方案

    2019年起,中国科学院自动化研究所以语音、文本、图像等单模态大模型的研究与应用为基石,全力攻关全球首个千亿参数多模态大模型。如今,相关产品已突破跨模态任务泛化与混合模态同步理解的技术
    的头像 发表于 08-11 11:08 882次阅读

    奇异摩尔出席第三届芯粒开发者大会AI芯片与系统分论坛

    近日,第三届芯粒开发者大会圆满落幕。大会在“集成芯片前沿技术科学基础”重大研究计划指导下,由中国科学院计算技术研究所
    的头像 发表于 07-22 11:34 1027次阅读

    中国科学院沈阳自动化研究所研究基于石墨烯/PDMS封装的医用胶带柔性传感器,用于水下机器人运动检测

    水下应用的需求仍是一项重大挑战。本文,中国科学院沈阳自动化研究所郭洪吉等研究人员在《ADVANCED MATERIALS TECHNOLOGIES》期刊发表名为“A Nanocrack-Based
    的头像 发表于 07-17 11:51 4468次阅读
    <b class='flag-5'>中国科学院</b>沈阳自动化<b class='flag-5'>研究所</b>:<b class='flag-5'>研究</b>基于石墨烯/PDMS封装的医用胶带柔性传感器,用于水下机器人运动检测

    奇异摩尔邀您相约第三届芯粒开发者大会AI芯片与系统论坛

    7月15日,由“集成芯片前沿技术科学基础”重大研究计划指导,中国科学院计算技术研究所中国电子科技集团公司第五十八
    的头像 发表于 07-01 17:14 1005次阅读

    恭贺 | 晟鹏创始人成会明院士当选欧洲科学院院士!

    近日,欧洲科学院(AcademiaEuropaea)陆续公布2025年院士入选名单,经同行推荐、评审,中国科学院深圳先进技术研究院碳中和技术研究所所长、广东晟鹏材料
    的头像 发表于 06-24 06:33 1011次阅读
    恭贺 | 晟鹏创始人成会明院士当选欧洲<b class='flag-5'>科学院</b>院士!

    中国科学院西安光机所在计算成像可解释性深度学习重建方法取得进展

    图1 MDFP-Net网络结构 近日,中国科学院西安光机所空间光学技术研究室在计算成像可解释性深度学习重建方法研究取得创新性进展。相关研究
    的头像 发表于 06-09 09:27 521次阅读
    <b class='flag-5'>中国科学院</b>西安光机所在<b class='flag-5'>计算</b>成像可解释性深度学习重建方法取得进展

    中国科学院上海微系统开发出高性能10mm大口径压电 MEMS 快反镜

     5 月 16 日消息,中国科学院宣布,上海微系统与信息技术研究所研究员武震宇、助理研究员王栎皓团队,开发了一种高性能的 10 毫米大口径压
    的头像 发表于 06-07 17:44 433次阅读
    <b class='flag-5'>中国科学院</b>上海微系统<b class='flag-5'>所</b><b class='flag-5'>开发</b>出高性能10mm大口径压电 MEMS 快反镜

    国民技术中国科学院深圳先进技术研究院达成战略合作

    近日,国民技术股份有限公司(简称“国民技术”)与中国科学院深圳先进技术研究院(简称“深圳先进院”)电驱系统专家团队在深圳签署合作意向协议,双方将在国家重点研发项目支持下,就智能机器人及
    的头像 发表于 04-25 15:45 1014次阅读

    如何坚持做难而正确的芯片研发?

    如果一件事在别人眼中是坐冷板凳,是做脏活、累活,你是否还会坚持做下去呢?以下视频来源于格致论道讲坛石侃·中国科学院计算技术研究所研究员格致论道第117期|2025年1月18日北京大家好,我是来自
    的头像 发表于 04-18 10:01 1001次阅读
    如何坚持做难而正确的芯片研发?