0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

奇异摩尔分享计算芯片Scale Up片间互联新途径

奇异摩尔 来源:奇异摩尔 作者:奇异摩尔 2024-12-09 09:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

开放数据中心委员会ODCC冬季全员会议于12月4日-6日在春暖花开的昆明举行。奇异摩尔首席系统架构师朱琛作为网络工作组ETH-X超节点项目的核心成员分享了AI Networking Scale Up卡间互联的新路径解决方案并展开了相关应用分析。

随着人工智能大模型训推的需求日益增长,更大的模型并行规模,模型并行中Tensor并行或MOE类型的Expert并行都会在GPU之间产生大量的通信。这对于AI网络Scale Up加速卡通讯提出了更高的显存容量及带宽、更低的延迟需求。

通常来说,Scale Up相对于Scale Out和业务网络需要更高一个数量级(10倍以上)的带宽,同时由于对于延迟的需求,要求GPU Direct直出互联的设计,并节省更多的面积给芯片的计算核心、更高的IO集成能力。

传统的做法是GPU SoC内部集成不同的IO IP通过片上网络进行通信互联。然而,Scale Up网络还在不断的演进当中,行业目前在标准制定与生态上还缺乏完备的解决方案。随着相关技术的革新与演进,对GPU的未来设计及其相关性能提出更复杂的需求与挑战。

传统基于GPU SoC IO IP的方案在先进工艺的成本与灵活性方面缺乏优势,计算芯片需要和IP使用统一一致的工艺节点;另一方面,如果对于互联的设计产生较大的改变,将花费更多的时间与精力重新设计整体芯片方案。

wKgZO2dWSc-Af8HAAACQRD9jhPQ079.png

(传统直接集成IO IP的计算芯片)

奇异摩尔作为ETH-X超节点项目的成员提出了一种新的GPU片间互联路径。一种GPU内集成IO Die (边缘IO Chiplet)的创新方案在未来Scale Up互联的场景下能够灵活应用并达到更可靠的GPU互联通信效率。

wKgZPGdWSc-Ac_2pAADOGtHJLf0385.png

(基于IO Die的计算芯片,计算芯粒和IO芯粒解耦,通过UCIe互联)

GPU计算芯粒与IO 芯粒解耦,更灵活的技术演进和创新

IO Die 让GPU芯粒和IO芯粒解耦并通过UCIe D2D互联,这种方式让GPU芯粒和IO Die能够分开进行设计,并使用不同的先进工艺节点。当前Scale up的技术正处于不断演进的过程中,基于IO Die的方案相比SoC可以提供更快的技术迭代。

复用IO Die,降低成本

采用独立的IO Die使在新的设计中复用已有的IOD成为可能,比如Central IOD AMD EPYC Turin继续复用上一代6nm制程的IOD 继续实现制程/芯粒解耦,减少工艺成本。Intel的至强6使用了边缘IOD的方式同样实现了计算芯粒和IOD的解耦。

wKgZPGdWSc-AVPqxAACKnGMWBaA532.png

(图:AMD 使用Central IOD实现内核工艺节点与IO分开 ,并复用IOD来降低成本)

灵活性及扩展性

基于Chiplet 的灵活性,用户根据各自的带宽需求自主选择IO Die的数量和类型,在Scale Up的场景下来实现互联带宽的灵活配置。

奇异摩尔的Kiwi NDSA-G2G就是上述这种GPGPU集成IO Die芯粒的新路径解决方案,不仅具备上述所列优势,并内建Scale Up所需要的网络加速控制引擎。客户只需自研计算芯粒,免去自研互联芯粒的成本,基于统一的互联协议和接口采用Kiwi NDSA-G2G芯粒来实现片间TB级的互联。

使用UCIe建立GPU芯粒与IO Die间互联

wKgZO2dWSc-AAYzVAACHi65SbLA821.png

奇异摩尔的GPU Link NDSA G2G (IO Chiplet) 通过基于UCIe的D2D IP与计算芯粒互联。UCIe是主流的D2D国际互联标准,目前已经受到了广泛芯粒上下游的认可。UCIe 1.1v 本身支持主流Streaming等协议,并通过FLIT的按需交织实现多协议的复用。基于UCIe的D2D互联无论从芯片面积占用、延迟(ns)、以及功耗的增加都在一个极低的可控制范围。

关于GPU芯粒和IO Die的通信

如果GPU芯粒和IO Die在协议层使用同种协议,互通可以无缝实现,无需进行额外的协议转换。如果GPU芯粒和IO Die在协议层采用不同的协议时,协议适配与转换可以根据客户的芯粒设计所处阶段来适配协议在哪一侧进行转换。

随着国内芯粒生态以及Scale Up网络相关技术标准的日益完善,奇异摩尔展望从片间协议再到片内协议,推动行业建立统一互联标准,从而携手产业链共同实现超过十万张加速卡的高效互联。AI网络的春天即将到来,希望的曙光在不久的将来将照拂行业的每一位前行者。

关于我们

AI网络全栈式互联架构产品及解决方案提供商

奇异摩尔,成立于2021年初,是一家行业领先的AI网络全栈式互联产品及解决方案提供商。公司依托于先进的高性能RDMA 和Chiplet技术,创新性地构建了统一互联架构——Kiwi Fabric,专为超大规模AI计算平台量身打造,以满足其对高性能互联的严苛需求。我们的产品线丰富而全面,涵盖了面向不同层次互联需求的关键产品,如面向北向Scale out网络的AI原生智能网卡、面向南向Scale up网络的GPU片间互联芯粒、以及面向芯片内算力扩展的2.5D/3D IO Die和UCIe Die2Die IP等。这些产品共同构成了全链路互联解决方案,为AI计算提供了坚实的支撑。

奇异摩尔的核心团队汇聚了来自全球半导体行业巨头如NXP、Intel、Broadcom等公司的精英,他们凭借丰富的AI互联产品研发和管理经验,致力于推动技术创新和业务发展。团队拥有超过50个高性能网络及Chiplet量产项目的经验,为公司的产品和服务提供了强有力的技术保障。我们的使命是支持一个更具创造力的芯世界,愿景是让计算变得简单。奇异摩尔以创新为驱动力,技术探索新场景,生态构建新的半导体格局,为高性能AI计算奠定稳固的基石。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5321

    浏览量

    136211
  • 数据中心
    +关注

    关注

    18

    文章

    5842

    浏览量

    75251
  • 奇异摩尔
    +关注

    关注

    0

    文章

    86

    浏览量

    4089

原文标题:聚焦昆明ODCC 冬季全员会议,奇异摩尔分享计算芯片Scale Up 片间互联新途径

文章出处:【微信号:奇异摩尔,微信公众号:奇异摩尔】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    奇异摩尔×中国移动重磅发布OISA卡互联原型平台

    ,共同探讨智能算力基础设施的未来图景。而在5月8日主论坛上,一场备受瞩目的联合发布仪式将大会推向高潮—— **奇异摩尔与中国移动正式发布基于OISA协议的卡互联原型验证平台** ,标
    的头像 发表于 05-11 11:34 641次阅读

    奇异摩尔携手中国移动共同发布基于OISA协议的卡互联原型验证平台

    系列关键成果。 奇异摩尔作为中国移动的重要产业合作伙伴,在本次大会上与中国移动共同发布了基于OISA协议的卡互联原型验证平台。 该平台由奇异
    的头像 发表于 05-10 18:11 2.2w次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>携手中国移动共同发布基于OISA协议的卡<b class='flag-5'>间</b><b class='flag-5'>互联</b>原型验证平台

    奇异摩尔与图灵量子达成深度战略合作

    上海 - 4月15日,奇异摩尔与图灵量子达成深度战略合作,双方将共同研发并推进下一代光互联OIO(Optical Input/Output)技术项目,旨在以芯片级光
    的头像 发表于 04-15 17:52 1104次阅读

    奇异摩尔联合成立智算互联芯粒实验室

    2026年4月2日,ODCC春季全体会议在浙江舟山成功召开。中国信通院云大所总工程师郭亮,ODCC网络工作组组长、腾讯基础网络中心总监何泽坤、奇异摩尔联合创始人&产品解决方案副总裁祝俊东、博
    的头像 发表于 04-07 14:03 397次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>联合成立智算<b class='flag-5'>互联</b>芯粒实验室

    Credo发布新品Blue Heron 224G AI Scale-Up Retimer芯片

    发布新品:Blue Heron 224G AI ScaleUp Retimer芯片,该产品针对需求日益攀升的线缆与 PCB 背板连接应用进行专门优化,全面支持 UALink、ESUN 与以太网协议。
    的头像 发表于 02-06 15:32 723次阅读

    THine发布无光学DSP芯片组,赋能下一代Scale-Up型AI网络“Slow and Wide”互联

    下一代Scale-Up型AI 网络的 “Slow and Wide” 互联需求,可实现功耗节省 73%、延迟降低 90%,为 AI 服务器、超大规模数据中心提供高成本
    的头像 发表于 02-04 16:26 423次阅读

    奇异摩尔参编人工智能加速器互联芯粒技术要求团体标准发布

    近日,中国电子工业标准化技术协会批准并发布了《人工智能超节点服务器技术要求》等28项团体标准。其中由中国移动研究院牵头、奇异摩尔产品市场&研发部门主要参编的《人工智能加速器互联芯粒技术要求
    的头像 发表于 01-09 11:20 899次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>参编人工智能加速器<b class='flag-5'>互联</b>芯粒技术要求团体标准发布

    奇异摩尔助力中国移动GSE 2.5版本协议标准发布

    生态攻坚计划,标志着我国在智算网络自主核心技术演进与生态构建上迈出了关键一步。自GSE 生态构建以来,奇异摩尔持续参与中国移动GSE生态联盟,并凭借在Scale Out互联领域的技术积
    的头像 发表于 10-17 16:44 1520次阅读

    奇异摩尔Networking for AI生态沙龙成功举办

    近日,中国信息通信研究院华东分院与行业领先的AI网络全栈式互联产品及解决方案提供商——奇异摩尔联合举办的“聚力向芯 算涌无界 Networking for AI”生态沙龙活动在上海浦东成功举办。
    的头像 发表于 10-09 12:45 1034次阅读

    奇异摩尔助力OISA全向智感互联IO芯粒技术白皮书发布

    提供商,奇异摩尔凭借其在芯粒领域的深厚技术积累与产业实践,多方位贡献于该白皮书的撰写与关键技术路径的梳理工作。
    的头像 发表于 09-23 15:55 2390次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>助力OISA全向智感<b class='flag-5'>互联</b>IO芯粒技术白皮书发布

    奇异摩尔携手中国移动发布OISA 2.0协议

    山西大同,在 2025中国算力大会主论坛上,中国移动携手包括奇异摩尔、燧原科技、壁韧科技、摩尔线程、昆仑芯、盛科通信、浪潮集团等多家AI基础设施产业链领先企业启动智算开放互联OISA生
    的头像 发表于 08-27 15:08 3770次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>携手中国移动发布OISA 2.0协议

    奇异摩尔Die-to-Die互联方案持续升级

    当AI大模型参数规模突破万亿级别,传统单芯片设计遭遇物理极限。芯粒技术通过模块化组合突破瓶颈,而芯片互联带宽成为决定性因素之一。近期,UCIe 3.0规范将数据传输速率从UCIe 2
    的头像 发表于 08-18 16:50 2150次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>Die-to-Die<b class='flag-5'>片</b>内<b class='flag-5'>互联</b>方案持续升级

    奇异摩尔出席第三届芯粒开发者大会AI芯片与系统分论坛

    多名行业同仁齐聚一堂。由奇异摩尔承办的“第三届芯粒开发者大会 - AI芯片与系统分论坛”在无锡成功举行。
    的头像 发表于 07-22 11:34 1579次阅读

    奇异摩尔田陌晨荣获中国半导体行业领军人物奖

    实力与发展成果。奇异摩尔创始人兼 CEO 田陌晨凭借在AI网络互联领域的创新成就,荣膺 “领军人物奖”。
    的头像 发表于 07-08 17:04 2142次阅读

    奇异摩尔亮相2025中国AI算力大会

    技术驱动下,超节点已成为国内外构建大规模HBD域应用的关键趋势。随着千亿到万亿参数MoE大模型并行训练(尤其是专家并行和张量并行)对GPU通信需求的激增,Scale-up超节点应运而生。
    的头像 发表于 07-03 11:40 1518次阅读