0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

奇异摩尔分享计算芯片Scale Up片间互联新途径

奇异摩尔 来源:奇异摩尔 作者:奇异摩尔 2024-12-09 09:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

开放数据中心委员会ODCC冬季全员会议于12月4日-6日在春暖花开的昆明举行。奇异摩尔首席系统架构师朱琛作为网络工作组ETH-X超节点项目的核心成员分享了AI Networking Scale Up卡间互联的新路径解决方案并展开了相关应用分析。

随着人工智能大模型训推的需求日益增长,更大的模型并行规模,模型并行中Tensor并行或MOE类型的Expert并行都会在GPU之间产生大量的通信。这对于AI网络Scale Up加速卡通讯提出了更高的显存容量及带宽、更低的延迟需求。

通常来说,Scale Up相对于Scale Out和业务网络需要更高一个数量级(10倍以上)的带宽,同时由于对于延迟的需求,要求GPU Direct直出互联的设计,并节省更多的面积给芯片的计算核心、更高的IO集成能力。

传统的做法是GPU SoC内部集成不同的IO IP通过片上网络进行通信互联。然而,Scale Up网络还在不断的演进当中,行业目前在标准制定与生态上还缺乏完备的解决方案。随着相关技术的革新与演进,对GPU的未来设计及其相关性能提出更复杂的需求与挑战。

传统基于GPU SoC IO IP的方案在先进工艺的成本与灵活性方面缺乏优势,计算芯片需要和IP使用统一一致的工艺节点;另一方面,如果对于互联的设计产生较大的改变,将花费更多的时间与精力重新设计整体芯片方案。

wKgZO2dWSc-Af8HAAACQRD9jhPQ079.png

(传统直接集成IO IP的计算芯片)

奇异摩尔作为ETH-X超节点项目的成员提出了一种新的GPU片间互联路径。一种GPU内集成IO Die (边缘IO Chiplet)的创新方案在未来Scale Up互联的场景下能够灵活应用并达到更可靠的GPU互联通信效率。

wKgZPGdWSc-Ac_2pAADOGtHJLf0385.png

(基于IO Die的计算芯片,计算芯粒和IO芯粒解耦,通过UCIe互联)

GPU计算芯粒与IO 芯粒解耦,更灵活的技术演进和创新

IO Die 让GPU芯粒和IO芯粒解耦并通过UCIe D2D互联,这种方式让GPU芯粒和IO Die能够分开进行设计,并使用不同的先进工艺节点。当前Scale up的技术正处于不断演进的过程中,基于IO Die的方案相比SoC可以提供更快的技术迭代。

复用IO Die,降低成本

采用独立的IO Die使在新的设计中复用已有的IOD成为可能,比如Central IOD AMD EPYC Turin继续复用上一代6nm制程的IOD 继续实现制程/芯粒解耦,减少工艺成本。Intel的至强6使用了边缘IOD的方式同样实现了计算芯粒和IOD的解耦。

wKgZPGdWSc-AVPqxAACKnGMWBaA532.png

(图:AMD 使用Central IOD实现内核工艺节点与IO分开 ,并复用IOD来降低成本)

灵活性及扩展性

基于Chiplet 的灵活性,用户根据各自的带宽需求自主选择IO Die的数量和类型,在Scale Up的场景下来实现互联带宽的灵活配置。

奇异摩尔的Kiwi NDSA-G2G就是上述这种GPGPU集成IO Die芯粒的新路径解决方案,不仅具备上述所列优势,并内建Scale Up所需要的网络加速控制引擎。客户只需自研计算芯粒,免去自研互联芯粒的成本,基于统一的互联协议和接口采用Kiwi NDSA-G2G芯粒来实现片间TB级的互联。

使用UCIe建立GPU芯粒与IO Die间互联

wKgZO2dWSc-AAYzVAACHi65SbLA821.png

奇异摩尔的GPU Link NDSA G2G (IO Chiplet) 通过基于UCIe的D2D IP与计算芯粒互联。UCIe是主流的D2D国际互联标准,目前已经受到了广泛芯粒上下游的认可。UCIe 1.1v 本身支持主流Streaming等协议,并通过FLIT的按需交织实现多协议的复用。基于UCIe的D2D互联无论从芯片面积占用、延迟(ns)、以及功耗的增加都在一个极低的可控制范围。

关于GPU芯粒和IO Die的通信

如果GPU芯粒和IO Die在协议层使用同种协议,互通可以无缝实现,无需进行额外的协议转换。如果GPU芯粒和IO Die在协议层采用不同的协议时,协议适配与转换可以根据客户的芯粒设计所处阶段来适配协议在哪一侧进行转换。

随着国内芯粒生态以及Scale Up网络相关技术标准的日益完善,奇异摩尔展望从片间协议再到片内协议,推动行业建立统一互联标准,从而携手产业链共同实现超过十万张加速卡的高效互联。AI网络的春天即将到来,希望的曙光在不久的将来将照拂行业的每一位前行者。

关于我们

AI网络全栈式互联架构产品及解决方案提供商

奇异摩尔,成立于2021年初,是一家行业领先的AI网络全栈式互联产品及解决方案提供商。公司依托于先进的高性能RDMA 和Chiplet技术,创新性地构建了统一互联架构——Kiwi Fabric,专为超大规模AI计算平台量身打造,以满足其对高性能互联的严苛需求。我们的产品线丰富而全面,涵盖了面向不同层次互联需求的关键产品,如面向北向Scale out网络的AI原生智能网卡、面向南向Scale up网络的GPU片间互联芯粒、以及面向芯片内算力扩展的2.5D/3D IO Die和UCIe Die2Die IP等。这些产品共同构成了全链路互联解决方案,为AI计算提供了坚实的支撑。

奇异摩尔的核心团队汇聚了来自全球半导体行业巨头如NXP、Intel、Broadcom等公司的精英,他们凭借丰富的AI互联产品研发和管理经验,致力于推动技术创新和业务发展。团队拥有超过50个高性能网络及Chiplet量产项目的经验,为公司的产品和服务提供了强有力的技术保障。我们的使命是支持一个更具创造力的芯世界,愿景是让计算变得简单。奇异摩尔以创新为驱动力,技术探索新场景,生态构建新的半导体格局,为高性能AI计算奠定稳固的基石。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134461
  • 数据中心
    +关注

    关注

    16

    文章

    5517

    浏览量

    74651
  • 奇异摩尔
    +关注

    关注

    0

    文章

    73

    浏览量

    3979

原文标题:聚焦昆明ODCC 冬季全员会议,奇异摩尔分享计算芯片Scale Up 片间互联新途径

文章出处:【微信号:奇异摩尔,微信公众号:奇异摩尔】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    香港科技大学(广州)与奇异摩尔联合实验室揭牌

    近日,香港科技大学(广州)-奇异摩尔联合实验室揭牌仪式在香港科技大学(广州)学生活动中心成功举行。本次仪式备受行业瞩目,吸引了来自产、投、学三界的多位专家与学者齐聚一堂。
    的头像 发表于 11-06 09:09 544次阅读

    奇异摩尔助力中国移动GSE 2.5版本协议标准发布

    生态攻坚计划,标志着我国在智算网络自主核心技术演进与生态构建上迈出了关键一步。自GSE 生态构建以来,奇异摩尔持续参与中国移动GSE生态联盟,并凭借在Scale Out互联领域的技术积
    的头像 发表于 10-17 16:44 935次阅读

    奇异摩尔Networking for AI生态沙龙成功举办

    近日,中国信息通信研究院华东分院与行业领先的AI网络全栈式互联产品及解决方案提供商——奇异摩尔联合举办的“聚力向芯 算涌无界 Networking for AI”生态沙龙活动在上海浦东成功举办。
    的头像 发表于 10-09 12:45 530次阅读

    奇异摩尔助力OISA全向智感互联IO芯粒技术白皮书发布

    提供商,奇异摩尔凭借其在芯粒领域的深厚技术积累与产业实践,多方位贡献于该白皮书的撰写与关键技术路径的梳理工作。
    的头像 发表于 09-23 15:55 1550次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>助力OISA全向智感<b class='flag-5'>互联</b>IO芯粒技术白皮书发布

    【「AI芯片:科技探索与AGI愿景」阅读体验】+工艺创新将继续维持着摩尔神话

    。那该如何延续摩尔神话呢? 工艺创新将是其途径之一,芯片中的晶体管结构正沿着摩尔定律指出的方向一代代演进,本段加速半导体的微型化和进一步集成,以满足AI技术及高性能
    发表于 09-06 10:37

    奇异摩尔携手中国移动发布OISA 2.0协议

    山西大同,在 2025中国算力大会主论坛上,中国移动携手包括奇异摩尔、燧原科技、壁韧科技、摩尔线程、昆仑芯、盛科通信、浪潮集团等多家AI基础设施产业链领先企业启动智算开放互联OISA生
    的头像 发表于 08-27 15:08 2873次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>携手中国移动发布OISA 2.0协议

    奇异摩尔Die-to-Die互联方案持续升级

    当AI大模型参数规模突破万亿级别,传统单芯片设计遭遇物理极限。芯粒技术通过模块化组合突破瓶颈,而芯片互联带宽成为决定性因素之一。近期,UCIe 3.0规范将数据传输速率从UCIe 2
    的头像 发表于 08-18 16:50 1426次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>Die-to-Die<b class='flag-5'>片</b>内<b class='flag-5'>互联</b>方案持续升级

    奇异摩尔出席第三届芯粒开发者大会AI芯片与系统分论坛

    多名行业同仁齐聚一堂。由奇异摩尔承办的“第三届芯粒开发者大会 - AI芯片与系统分论坛”在无锡成功举行。
    的头像 发表于 07-22 11:34 980次阅读

    奇异摩尔田陌晨荣获中国半导体行业领军人物奖

    实力与发展成果。奇异摩尔创始人兼 CEO 田陌晨凭借在AI网络互联领域的创新成就,荣膺 “领军人物奖”。
    的头像 发表于 07-08 17:04 1465次阅读

    奇异摩尔亮相2025中国AI算力大会

    技术驱动下,超节点已成为国内外构建大规模HBD域应用的关键趋势。随着千亿到万亿参数MoE大模型并行训练(尤其是专家并行和张量并行)对GPU通信需求的激增,Scale-up超节点应运而生。
    的头像 发表于 07-03 11:40 1181次阅读

    奇异摩尔邀您相约2025中国AI算力大会

    在2025中国AI算力大会上,奇异摩尔首席网络架构专家叶栋将带来“AI原生时代 —共筑超节点的网络基础架构”的主题演讲,分享国内外超节点解决方案在AI训练与推理领域的应用现状与挑战以及相关解决方案。
    的头像 发表于 06-17 17:49 1304次阅读

    奇异摩尔携手UALink联盟助力AI网络繁荣发展

    随着AI大模型训推集群的规模不断扩大,Scale-up网络的重要性已不限于训练集群侧,云端推理集群对于多机之间组成超节点HBD方案的需求正在逐步增加。面对其对互联性能的极致追求,目前业内主要采用专门设计的协议比如NVIDIA的NVLink及NVSwitch技术。
    的头像 发表于 04-12 14:42 1671次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>携手UALink联盟助力AI网络繁荣发展

    奇异摩尔互联之长推进OISA GPU卡互联生态适配

    进行了精彩的主题分享。 作为AI网络特别组及网络工作组的成员,奇异摩尔积极参与大会,与业界同仁共同探讨AI网络互联应用的发展趋势。 当前,国内外GPU卡
    的头像 发表于 04-01 19:35 1548次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>以<b class='flag-5'>互联</b>之长推进OISA GPU卡<b class='flag-5'>间</b><b class='flag-5'>互联</b>生态适配

    奇异摩尔受邀出席第三届HiPi Chiplet论坛

    2025年3月28日至29日,由高性能芯片互联技术联盟(HiPi 联盟)主办的 “第三届 HiPi Chiplet 论坛” 将于北京朝林松源酒店举行。本届论坛以“标准促进创新生态发展”为主题,大会
    的头像 发表于 03-25 16:59 1585次阅读

    衢州市领导莅临奇异摩尔考察调研

    近日,衢州市委书记高屹率衢州市委常委、秘书长李宁,衢州智造新城党工委书记、管委会主任方世忠等一行莅临奇异摩尔考察指导。奇异摩尔创始人兼CEO田陌晨协同公司高层管理人员向调研组全面展示了
    的头像 发表于 03-18 13:55 1302次阅读