0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

奇异摩尔携手UALink联盟助力AI网络繁荣发展

奇异摩尔 来源:奇异摩尔 2025-04-12 14:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着AI大模型训推集群的规模不断扩大,Scale-up网络的重要性已不限于训练集群侧,云端推理集群对于多机之间组成超节点HBD方案的需求正在逐步增加。面对其对互联性能的极致追求,目前业内主要采用专门设计的协议比如NVIDIA的NVLink及NVSwitch技术。在今年的GTC大会上,NVIDIA已经明确将GPU 的HBD域互联从72卡推进到576卡。 然而,NVIDIA的解决方案是基于私有协议,不仅成本高昂,且不对外开放。为了打破这一局面,AI网络产业链在去年共同发起了UALink 加速器互联协议联盟,旨在推动AI网络Scale-up互联的创新技术发展。

奇异摩尔在2024年就加入了UALink(Ultra Accelerator Link ) 加速器间互联协议联盟,并积极参与UALink标准的制定。 就在本周,UALink联盟终于迎来了1.0标准的正式发布,这一标准的发布将进一步加速AI训推基础设施的生态完善,助力AI网络的繁荣发展。

关于第一版标准,UALink 联盟董事会主席 Kurtis Bowman 表示:“随着对 AI 计算的需求不断增长,我们很高兴能够提供一项必不可少的开放行业标准技术,使下一代 AI/ML 应用能够推向市场。UALink 是唯一一款针对扩展 AI 的内存语义解决方案,它针对降低功耗、延迟和成本进行了优化,同时增加了有效带宽。UALink 200G 1.0 规范带来的突破性性能将彻底改变云服务提供商、系统 OEM 和 IP/芯片提供商处理 AI 工作负载的方式。

UALink 协议栈包括四个硬件优化层:物理层(physical)、数据链路层(data link)、事务层(transaction)和协议层(protocol)。

b55b259c-15c1-11f0-9310-92fbcf53809c.png

基于内存语义的快速GPU HBM访问

b5935200-15c1-11f0-9310-92fbcf53809c.png

(图:UALink Specification 1.0Rev)

和其他Scale-up生态有所区别的是UALink从诞生那刻起就是基于内存语义。上述表格描述了两个基于UALink的系统节点通过UAL交换机实现互联。在这个Domain中,CPU Host可通过CXL, PCIe, AMD Infinity Fabric, XGMI等协议与GPU加速器互联。基于UALink协议,GPU之间通过UAlink Switch交换机与HBD域内的其他GPU互联。

图中特别突出的是红线所指示的部分,在该HBD Domain中的任意GPU 都可以访问其他GPU的HBM,从而实现加速器之间的快速读取和写入,相较于消息语义,它的通信和互联效率是非常高的。

奇异摩尔作为Scale-up网络主要芯粒提供商自研的 NDSA-G2G IO Die 未来将支持内存语义,通过与UAlink生态适配,建立更完善的内存语义互联系统。

物理层特点Physical Layer

b5ab2722-15c1-11f0-9310-92fbcf53809c.png

(图:UALink Specification 1.0Rev)

UALink 物理层基于 802.3 以太网物理层。UALink 定义了 1、2 或 4 个串行通道,运行速率为 212.5Gbps(200GBASE-KR1/CR1、400GBASE-KR2/CR2、800GBASE-KR4/CR4)。物理层包括了使用 FEC 减少延迟的修改。该以太网物理层具有标准的前向 (FEC) 并遵循 IEEE P802.3dj 规范。通过单向和双向码字交错,让延迟得到改善,并且有一点变化以支持 680 字节的 flit。(Flit 或流控制单元是链路级别的原子数据单元)

在 PCI-Express 6.0 中,控制该标准(并且主要由英特尔主导)的 PCI-SIG 组织,并没有仅仅实现标准的 FEC,而新的FEC是转向了一种流量控制和循环冗余检查 (CRC) 错误检测的混合方式,实际上提高了信号传输的可靠性,同时降低了延迟。这样的一些机制被 UALink 采纳,并且许多对于内存架构来说不必要的东西并没有包含在其中从而轻量化了该协议。

数据链路层特点Data Link Layer

b5c6a402-15c1-11f0-9310-92fbcf53809c.png

(图:UALink Specification 1.0Rev)

数据链路层位于事务层和物理层之间。数据链路层将事务层的 64 字节 Flit 打包成物理层的 640 字节 Flit。数据链路层还提供链接伙伴之间在数据链路层发起和终止的消息服务。消息服务用于宣传事务层速率、查询连接链路伙伴上的设备和端口 ID 以及其他功能。消息服务还提供链接伙伴之间的 UART 式通信,用于固件通信。链路级重放是基于 640 字节 Flit 提供的。计算并检查 32 位 CRC,并且是 640 字节 Flit 的一部分。此外Link Level Replay的功能确保了物理层 FEC 无法纠正的比特错误存在的情况下,DL Flits 的有序传递。发送器保留有效负载 Flits的副本,直到接收器确认它们。

事务层特点Transaction Layer

b5da3a44-15c1-11f0-9310-92fbcf53809c.png

(图:UALink Specification 1.0Rev)

UALink 1.0 Spec实现压缩寻址,在实际工作负载下以高达 95% 的协议效率简化数据传输。它支持直接内存操作,例如加速器之间的读取、写入和原子事务(atomic transactions),从而保留本地和远程内存空间之间的顺序。

协议层特点Protocol Layer

b5edab1a-15c1-11f0-9310-92fbcf53809c.png

(图:UALink Specification 1.0Rev)

UALink 的协议层称为 UALink 协议级接口 (UPLI)。UPLI 定义了一个逻辑信号接口和协议,通过该协议,设备可以通过一组请求和响应消息交换数据和控制信息。UALink 规范完全定义了 UPLI 协议,并期望遵循该协议的实现将与 UALink 交换机兼容。UPLI 协议具有内置的灵活性,允许供应商创建自定义协议消息,用于相同类型的加速器之间的通信,而无需对 UALink 交换机进行任何修改。UALink 协议级接口是主要接口,实现可能在此基础上开发,通常使用第三方供应商提供的堆栈其余部分的 IP。

协议轻量化降低数据中心功耗

UALink的一个非常突出的特点就是整体设计简单轻量化。据悉,UALink 的功耗仅为同等以太网 ASIC 芯片面积的一半到三分之一(每个端口),并且每个内存结构加速器可节省 150 瓦到 200 瓦的功耗。更小的芯片尺寸意味着更便宜的芯片,更低的功耗意味着更少的电力和冷却消耗,从而降低整体 TCO。

UALink如何在中国市场落地

UALink国际互联系统开发标准在中国的应用落地,需要产业链上下游的协同配合。因此,联盟成员囊括了国内芯片制造商、以奇异摩尔为代表的芯粒厂商,以及交换机提供商等关键角色。在今年的ODCC春季全体会议上,ODCC新测组组长郭亮与UALink董事会成员孔阳博士签署了MOU合作备忘录,这标志着国内AI网络Scale-up技术创新与应用将步入快车道。

奇异摩尔作为ALS系统及UALink联盟的生态成员,正与阿里云等头部云厂商、GPU厂商通力合作,通过制定生态标准、提供GPU IO Die(NDSA-G2G)等解决方案,加速国产大模型训练推理技术的发展。

关于我们

AI网络全栈式互联架构产品及解决方案提供商

奇异摩尔,成立于2021年初,是一家行业领先的AI网络全栈式互联产品及解决方案提供商。公司依托于先进的高性能RDMA 和Chiplet技术,创新性地构建了统一互联架构——Kiwi Fabric,专为超大规模AI计算平台量身打造,以满足其对高性能互联的严苛需求。

我们的产品线丰富而全面,涵盖了面向不同层次互联需求的关键产品,如面向北向Scale out网络的AI原生智能网卡、面向南向Scale up网络的GPU片间互联芯粒、以及面向芯片内算力扩展的2.5D/3D IO Die和UCIe Die2Die IP等。这些产品共同构成了全链路互联解决方案,为AI计算提供了坚实的支撑。

奇异摩尔的核心团队汇聚了来自全球半导体行业巨头如NXPIntel、Broadcom等公司的精英,他们凭借丰富的AI互联产品研发和管理经验,致力于推动技术创新和业务发展。团队拥有超过50个高性能网络及Chiplet量产项目的经验,为公司的产品和服务提供了强有力的技术保障。我们的使命是支持一个更具创造力的芯世界,愿景是让计算变得简单。奇异摩尔以创新为驱动力,技术探索新场景,生态构建新的半导体格局,为高性能AI计算奠定稳固的基石。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    836

    浏览量

    39712
  • AI
    AI
    +关注

    关注

    89

    文章

    38104

    浏览量

    296632
  • 奇异摩尔
    +关注

    关注

    0

    文章

    73

    浏览量

    3979

原文标题:生态共建 | UALink 加速器互联协议联盟1.0版本正式发布

文章出处:【微信号:奇异摩尔,微信公众号:奇异摩尔】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    UALink协议引领人工智能计算领域变革

    今年 4 月 25 日,UALink 联盟正式发布了 UALink 200G 1.0 规范,在众多超大规模市场核心参与者的支持下,这一成果成为了该领域的重要的里程碑。该规范打造了一种低延迟、高带宽的通信架构,能够在一个机柜中支持
    的头像 发表于 11-20 09:32 362次阅读
    <b class='flag-5'>UALink</b>协议引领人工智能计算领域变革

    香港科技大学(广州)与奇异摩尔联合实验室揭牌

    近日,香港科技大学(广州)-奇异摩尔联合实验室揭牌仪式在香港科技大学(广州)学生活动中心成功举行。本次仪式备受行业瞩目,吸引了来自产、投、学三界的多位专家与学者齐聚一堂。
    的头像 发表于 11-06 09:09 544次阅读

    奇异摩尔助力中国移动GSE 2.5版本协议标准发布

    近日,在2025移动合作伙伴大会“算力网络联合创新”分论坛上,中国移动携手包括奇异摩尔、中兴及新华三等在内的产业合作伙伴重磅发布GSE 2.5版本协议标准,并同步启动“国芯国连”智算开
    的头像 发表于 10-17 16:44 935次阅读

    奇异摩尔Networking for AI生态沙龙成功举办

    近日,中国信息通信研究院华东分院与行业领先的AI网络全栈式互联产品及解决方案提供商——奇异摩尔联合举办的“聚力向芯 算涌无界 Networking for
    的头像 发表于 10-09 12:45 530次阅读

    奇异摩尔助力OISA全向智感互联IO芯粒技术白皮书发布

    在今日举行的2025开放数据中心委员会(ODCC)峰会期间,中国移动主导的《OISA全向智感互联IO芯粒技术白皮书》正式发布,并荣获2025 ODCC 年度卓越成果奖。作为AI网络全栈式互联解决方案
    的头像 发表于 09-23 15:55 1550次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b><b class='flag-5'>助力</b>OISA全向智感互联IO芯粒技术白皮书发布

    摩尔线程携手生态合作伙伴打造的AI教育实训基地启用

    近日,摩尔线程携手科大讯飞等生态合作伙伴打造的AI教育实训基地在江苏省锡山高级中学(以下简称“省锡中”)正式启用。作为无锡市惠山区首个落地的AI教育实训基地,该基地自启动以来获得了惠山
    的头像 发表于 09-08 14:43 1131次阅读

    奇异摩尔携手中国移动发布OISA 2.0协议

    山西大同,在 2025中国算力大会主论坛上,中国移动携手包括奇异摩尔、燧原科技、壁韧科技、摩尔线程、昆仑芯、盛科通信、浪潮集团等多家AI基础
    的头像 发表于 08-27 15:08 2873次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b><b class='flag-5'>携手</b>中国移动发布OISA 2.0协议

    奇异摩尔出席第三届芯粒开发者大会AI芯片与系统分论坛

    多名行业同仁齐聚一堂。由奇异摩尔承办的“第三届芯粒开发者大会 - AI芯片与系统分论坛”在无锡成功举行。
    的头像 发表于 07-22 11:34 980次阅读

    奇异摩尔田陌晨荣获中国半导体行业领军人物奖

    实力与发展成果。奇异摩尔创始人兼 CEO 田陌晨凭借在AI网络互联领域的创新成就,荣膺 “领军人物奖”。
    的头像 发表于 07-08 17:04 1465次阅读

    奇异摩尔邀您相约2025中国AI算力大会

    在2025中国AI算力大会上,奇异摩尔首席网络架构专家叶栋将带来“AI原生时代 —共筑超节点的网络
    的头像 发表于 06-17 17:49 1304次阅读

    奇异摩尔以互联之长推进OISA GPU卡间互联生态适配

    进行了精彩的主题分享。 作为AI网络特别组及网络工作组的成员,奇异摩尔积极参与大会,与业界同仁共同探讨A
    的头像 发表于 04-01 19:35 1548次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>以互联之长推进OISA GPU卡间互联生态适配

    奇异摩尔受邀出席第三届HiPi Chiplet论坛

    邀请全球产学研专家齐聚一堂,聚焦Chiplet标准技术创新生态建设与发展等核心议题展开探讨。奇异摩尔高级设计经理王彧博士应邀出席,将带来题为:“Chiplet芯粒生态的发展和应用趋势”
    的头像 发表于 03-25 16:59 1585次阅读

    衢州市领导莅临奇异摩尔考察调研

    近日,衢州市委书记高屹率衢州市委常委、秘书长李宁,衢州智造新城党工委书记、管委会主任方世忠等一行莅临奇异摩尔考察指导。奇异摩尔创始人兼CEO田陌晨协同公司高层管理人员向调研组全面展示了
    的头像 发表于 03-18 13:55 1302次阅读

    苹果加入UALink联盟,共推AI加速器新标准

    苹果公司已正式成为Ultra Accelerator Link(UALink联盟的一员,并获得了该联盟董事会席位。UALink联盟由超过6
    的头像 发表于 01-22 18:18 1158次阅读

    奇异摩尔分享计算芯片Scale Up片间互联新途径

    开放数据中心委员会ODCC冬季全员会议于12月4日-6日在春暖花开的昆明举行。奇异摩尔首席系统架构师朱琛作为网络工作组ETH-X超节点项目的核心成员分享了AI Networking S
    的头像 发表于 12-09 09:36 2330次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>分享计算芯片Scale Up片间互联新途径