0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

奇异摩尔携手产业伙伴共建IO-NET芯粒工作组

奇异摩尔 来源:奇异摩尔 2026-04-02 15:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

3月31日,ODCC春季全会网络工作组会议在浙江舟山圆满落幕。为应对下一代AI网络技术的演进需求,腾讯牵头正式成立IO-NET项目工作组。该工作组将围绕面向Agent的新型互联体系,实现训练、推理、业务执行一体化展开深入探讨,携手产业链共建统一生态规范,推动AI网络持续演进。

作为IO-NET项目的重要成员,奇异摩尔依托工作组平台,牵头组织基于IO-NET的IOD芯粒工作组,联合产业链伙伴共同探索通用IOD的实现路径,为构建高效、标准化的下一代AI互联生态提供核心技术支撑。

奇异摩尔首席架构师朱琛发表主题演讲《基于通用IOD的XPU Scale-up网络互联实现路径》。演讲重点分析了Agent时代背景下,内存瓶颈正驱动集群架构向资源解耦方向演进。在这一演进过程中,通用IOD的应用场景从XPU-to-XPU拓展至XPU-to-CPU及XPU-to-Memory Pool。

朱琛指出,传统RDMA在XPU-to-CPU及XPU-to-Memory Pool场景下显得过于繁重,亟需一种更轻量化的DMA引擎。围绕这一需求,他从分层视角出发,系统探讨了从D2D,功能层以及Scale-up接口层通用IOD的实现路径。他进一步阐述了奇异摩尔作为腾讯牵头IO-NET项目组子项目的定位与未来规划,研究目标的及相关技术规范的落地展望。

Agent时代所带来的内存瓶颈

在大模型推理中,内存消耗大户远不止模型参数,更棘手的是KV Cache、长上下文、会话状态、多轮Agent记忆以及Prompt Cache等动态数据。KV Cache存储注意力机制中的键值向量,避免每生成一个token都重新计算,其大小随序列长度和批量大小线性增长,在大规模场景下甚至会超过模型权重本身。

为何需要统一内存池

在大模型训练与推理中,Batch Size是决定性能与效果的关键超参数。它不仅影响吞吐速度,更直接关系到模型的收敛行为与泛化能力。

随着Agent时代的到来,长序列已成为推理场景的主流趋势,显存需求呈指数级攀升。在这一背景下,Batch Size的选择正面临两难困境:

过大:过量占用GPU显存,极易触发显存溢出(OOM),同时推升Token生成延迟,影响服务稳定性;

过小:无法充分利用GPU计算资源,导致计算单元因“喂不饱”而持续空转,算力利用率大幅下降。

此时,统一内存池的重要性便凸显出来。通过构建全局统一、弹性伸缩的内存池,能够打破静态显存分配的僵化边界,在Batch Size动态变化时实现显存资源的灵活复用与高效调度——既能支撑更大Batch Size以提升吞吐,又能在高并发长序列场景下避免显存瓶颈,真正实现算力与内存的协同最优。

从CPU-GPU到全域统一编址

9a857ccc-2d80-11f1-90a1-92fbcf53809c.png

(图:奇异摩尔@ODCC春季大会)

如今,CPU与GPU不再是各自持有独立内存的异构设备,而是能够平等访问统一内存空间的计算单元,彻底消除了传统架构中数据在CPU内存与GPU显存之间反复拷贝的瓶颈。以英伟达为例,其通过NVLink-C2C互联构建了GPU与CPU对共享内存的无差别、低延迟访问,CPU和GPU可共享同一进程页表,硬件维护缓存一致性,GPU可直接访问CPU端LPDDR5X内存(总带宽900 GB/s),CPU也能以缓存行粒度访问GPU端内存。

华为的UB-Mesh在架构上也采用了类似思路,通过统一总线协议连接GPU、内存池、SSD、网卡等异构资源,构建可扩展至百万级芯片的大规模AI系统。

面向下一代AI推理,统一编址的理念正从“CPU-GPU对”向更广阔的异构计算生态延伸——XPU与内存池之间的协同、异构算力的统一调度、异构芯片间的互联能力,已成为下一代AI推理系统亟待突破的核心课题。

从XPU间互联到内存池互联

以IOD 芯粒让计算和互联解耦的技术路径已经逐步形成产业共识。正如Meta的最新的MTIA系列都基于上一代优化,采用模块化小芯片(芯粒,将大芯片拆分为多个独立小模块拼接,降低研发难度、提升复用性)设计,融入最新的 AI 工作负载洞察与硬件技术,并以更短的周期完成部署。这种更紧凑的迭代闭环,让硬件能更好地适配不断演变的模型架构,灵活支持未来大模型所需硬件技术的落地应用。

9ae25a78-2d80-11f1-90a1-92fbcf53809c.png

(图:奇异摩尔@ODCC春季大会)

Kiwi IOD作为一款相对通用、支持内存语义、具备RDMA引擎且灵活可扩展的IO芯粒,除了实现XPU间互联外,同样可为XPU-Memory Pool互联提供了理想技术载体。

原生支持内存语义

Kiwi IOD从底层支持内存语义(Memory Semantics),使得XPU访问远端内存池时,无需借助复杂的驱动或中间层,即可通过Load/Store指令直接读写池化内存。这种设计让远端内存访问的编程体验与访问本地内存无异,大幅降低软件开发复杂度。

轻量化协议封装

针对内存池互联场景,Kiwi IOD复用Scale-up协议,可优化报文封装开销,通过减轻IOD DMA操作(Read/Write/Atomic)的软件参与度,实现数据通路的硬件直通。

通用IOD的XPU

Scale-up网络互联实现路径

9b3a1b5a-2d80-11f1-90a1-92fbcf53809c.png

(图:奇异摩尔@ODCC春季大会)

从NoC接口来看,计算芯粒的NoC与IOD必须在协议层实现接口对齐。在协议层适配方面,UCIe协议层原生支持PCIe Flit模式与CXL Flit模式,计算芯粒与IOD的协议适配层需采用一致的映射方式以实现互通。在统一的IOD协议层接口下,IOD能够为NoC提供差异化支持:在XPU-to-XPU场景中,支持XPU个性化的原子操作;在XPU-to-Memory Pool场景中,支持XPU个性化的近存计算操作。

从功能层来看,以XPU-to-Memory Pool场景为例,内存池对XPU的内存分配策略(如静态分配、动态按需分配)以及池化内存到XPU地址空间的映射方式与地址翻译机制,可选择通过IOD实现。

从Scale-up接口来看,IOD本身支持多元化的Scale-up接口,其灵活性使其能够持续适应Scale-up生态的演进需求。

9b94b3f8-2d80-11f1-90a1-92fbcf53809c.png

(图:IO-NET内存池项目计划)

展望未来,奇异摩尔将持续依托腾讯IO-NET工作组的整体规划,牵头打造面向IO-NET的芯粒工作组,携手产业链上下游,共同构建适用于XPU-to-XPU、XPU-to-CPU及Memory Pool等场景的通用IOD技术规范,并推动专用IOD硬件的定制化落地。以此为AI Agent时代背景下的推理瓶颈提供互联领域的关键支撑,加速下一代异构计算互联生态的标准化与规模化进程。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 内存
    +关注

    关注

    9

    文章

    3231

    浏览量

    76498
  • Agent
    +关注

    关注

    0

    文章

    217

    浏览量

    29133
  • 奇异摩尔
    +关注

    关注

    0

    文章

    85

    浏览量

    4073

原文标题:生态共建 | 奇异摩尔携手产业共建IO-NET芯粒工作组,引领下一代AI网络演进

文章出处:【微信号:奇异摩尔,微信公众号:奇异摩尔】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    奇异摩尔与图灵量子达成深度战略合作

    融合的计算新范式,为全球算力产业升级注入全新动能。活动当天,奇异摩尔联合创始人兼产品解决方案副总裁祝俊东、图灵量子副总经理战永兴等重要嘉宾出席签约仪式。
    的头像 发表于 04-15 17:52 909次阅读

    得瑞领新入选全国集成电路标委会芯片应用工作组,以标准之力赋能国产存储高质量发展

    近日,全国集成电路标委会芯片应用工作组正式成立,得瑞领新作为工作组成员单位受邀参会,与产业伙伴共同探讨国产芯片规模化应用与标准化建设相关话题,助力我国集成电路
    的头像 发表于 04-15 14:25 139次阅读
    得瑞领新入选全国集成电路标委会芯片应用<b class='flag-5'>工作组</b>,以标准之力赋能国产存储高质量发展

    奇异摩尔联合成立智算互联实验室

    2026年4月2日,ODCC春季全体会议在浙江舟山成功召开。中国信通院云大所总工程师郭亮,ODCC网络工作组组长、腾讯基础网络中心总监何泽坤、奇异摩尔联合创始人&产品解决方案副总裁祝俊东、博
    的头像 发表于 04-07 14:03 251次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>联合成立智算互联<b class='flag-5'>芯</b><b class='flag-5'>粒</b>实验室

    比亚迪正式加入国际汽车工作组

    日前,比亚迪股份有限公司正式加入国际汽车工作组(IATF)。作为全球新能源汽车领军企业,比亚迪将与大众、通用等国际汽车巨头共同参与国际核心标准的制定。此举标志着中国汽车企业在国际标准领域迈出重要一步。
    的头像 发表于 03-12 11:53 534次阅读

    奇异摩尔参编人工智能加速器互联技术要求团体标准发布

    近日,中国电子工业标准化技术协会批准并发布了《人工智能超节点服务器技术要求》等28项团体标准。其中由中国移动研究院牵头、奇异摩尔产品市场&研发部门主要参编的《人工智能加速器互联技术
    的头像 发表于 01-09 11:20 766次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>参编人工智能加速器互联<b class='flag-5'>芯</b><b class='flag-5'>粒</b>技术要求团体标准发布

    半导体携手生态伙伴助力AI硬件产业规模化落地

    当前,AI大模型加速渗透硬件产业,AI硬件正从 “单点智能” 迈向 “系统级智能”,大模型已成为硬件产品的基础能力之一。顺应这一行业发展趋势,珠海泰半导体有限公司(以下简称 “泰半导体”)积极
    的头像 发表于 01-05 17:18 1359次阅读

    华为受邀出席5GDNA联盟新通话工作组产业发展专题会议

    12月23日,5GDNA联盟在北京召开2025年工作会议暨新通话工作组产业发展专题会议。来自中国信通院、中国电信研究院、中国移动终端公司、中国移动设计院、中国联通在线信息科技公司、华为、三星电子中国研究院、OPPO、vivo、紫
    的头像 发表于 12-31 11:47 922次阅读

    公司出席IEEE P1901.3双模通信国际标准工作组第九次会议

    10月14日至15日,IEEE P1901.3双模通信国际标准工作组第9次会议在乌兹别克斯坦塔什干召开,标准工作组主席,国家电网公司营销部,中国电科院,智公司所属智半导体、深国电以
    的头像 发表于 10-24 15:28 1000次阅读

    奇异摩尔助力中国移动GSE 2.5版本协议标准发布

    近日,在2025移动合作伙伴大会“算力网络联合创新”分论坛上,中国移动携手包括奇异摩尔、中兴及新华三等在内的产业合作
    的头像 发表于 10-17 16:44 1355次阅读

    奇异摩尔Networking for AI生态沙龙成功举办

    近日,中国信息通信研究院华东分院与行业领先的AI网络全栈式互联产品及解决方案提供商——奇异摩尔联合举办的“聚力向 算涌无界 Networking for AI”生态沙龙活动在上海浦东成功举办。
    的头像 发表于 10-09 12:45 926次阅读

    借助Arm技术构建计算未来

    在我们近期与业界伙伴的多次交流中,明显发现时代的大幕已徐徐拉开,行业已经不再抱存对的质疑态度,而是正在合作解决如何借助
    的头像 发表于 09-25 17:18 1333次阅读

    奇异摩尔助力OISA全向智感互联IO技术白皮书发布

    提供商,奇异摩尔凭借其在领域的深厚技术积累与产业实践,多方位贡献于该白皮书的撰写与关键技术路径的梳理
    的头像 发表于 09-23 15:55 2225次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>助力OISA全向智感互联<b class='flag-5'>IO</b><b class='flag-5'>芯</b><b class='flag-5'>粒</b>技术白皮书发布

    奇异摩尔携手中国移动发布OISA 2.0协议

    山西大同,在 2025中国算力大会主论坛上,中国移动携手包括奇异摩尔、燧原科技、壁韧科技、摩尔线程、昆仑、盛科通信、浪潮集团等多家AI基础
    的头像 发表于 08-27 15:08 3651次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b><b class='flag-5'>携手</b>中国移动发布OISA 2.0协议

    软通动力加入openEuler社区AI联合工作组

    近日,2025开放原子开源生态大会开幕,openEuler社区携手软通动力与社区成员单位共同发起成立“openEuler社区AI联合工作组”,工作组将整合芯片、算法、应用等全产业链力量
    的头像 发表于 07-25 14:42 1253次阅读

    奇异摩尔出席第三届开发者大会AI芯片与系统分论坛

    多名行业同仁齐聚一堂。由奇异摩尔承办的“第三届开发者大会 - AI芯片与系统分论坛”在无锡成功举行。
    的头像 发表于 07-22 11:34 1457次阅读