0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

挑战英伟达NVLink!英特尔/谷歌等成立联盟,推出UALink 1.0

Felix分析 来源:电子发烧友网 作者:吴子鹏 2024-06-03 06:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)日前,英特尔、谷歌、微软、Meta以及其他科技巨头宣布成立一个新的行业组织——“Ultra Accelerator Link (UALink) 推广组”。目前,UALink推广组正在抓紧制定一项新的行业标准,用于推进数据中心内连接的大规模AI系统的高速和低延迟通信,摆脱英伟达NVLink在AI加速器连接方面的统治。

对于这项新的行业标准,AMD数据中心解决方案总经理Forrest Norrod表示,“行业需要一个可以快速推进的开放标准,这种标准允许多家公司为整个生态系统增加价值。”

英伟达统治AI加速器市场

有分析观点认为,英伟达在AI加速器方面的统治力,已经超过了当年英特尔对于PC处理器的统治,这让英伟达享受到了AI时代巨大的产业红利。根据英伟达2025财年第一财季财报,该公司营收达到260亿美元,同比增长262%;净利润高达148.1亿美元,同比上升628%。

那么,英伟达为什么能够在AI加速器领域体现出如此强悍的统治力呢?笔者认为主要源于三点:核心芯片、软件生态和连接技术。

在核心芯片方面,时间回溯到2020年,在GTC 2020上,英伟达推出了基于Ampere架构的新一代GPU——NVIDIA A100,这颗芯片作为通用型工作负载加速器,成为国内外AI科技巨头争抢购买的芯片,此后甚至被禁止出口到中国市场。NVIDIA A100展现了AI加速器发展的“暴力美学”,以英伟达的数据来说,NVIDIA A100相较于前一代性能暴涨了20倍。在GTC 2024上,英伟达又推出了B100芯片,架构代号为Blackwell,显存达192GB。在AI加速器芯片方面,英伟达并不是单单某一颗产品强,而是拥有一个强大的产品矩阵。在架构方面,英伟达陆续推出了Volta架构、Turing架构、Ampere架构、Hopper架构和Blackwell架构,提供B100、H200、L40S、A100、A800、H100、H800、V100等众多的芯片产品组合。

同时,针对这些产品,英伟达提供强大的软件支持。就以英伟达的CUDA生态来说,无论是通用加速,还是计算加速,CUDA生态都能够提供充足的支持。英伟达自2006年推出CUDA以来,CUDA和GPU的并行计算能力使英伟达收获了庞大的用户群。CUDA 平台包括硬件架构和编程模型,为开发人员提供了更直接、高效地利用 GPU 进行并行计算的方式。在COMPUTEX 2023 大会期间,英伟达方面透露的数据显示,目前CUDA拥有超过400万开发人员,超过 3000个应用程序,历史上CUDA下载量达到惊人的4000万。更让当前阶段CUDA显得炙手可热的是,仅仅是在2022年,CUDA下载量就有惊人的2500万,目前依然在高速增长的状态。

英伟达在AI加速器方面,第三个显著的优势就是连接技术。AI算力集群是人工智能发展的重要基础设施,就以当前最火热的AI大模型来说,单卡是无法支撑的,需要一个强大的AI算力集群。如果是基于英伟达算力卡的集群,那么主要的连接技术是NVLink和InfiniBand技术,分别负责近距离并行计算和扩大集群规模。NVLink可以直接完成GPU之间内存的互相访问,无需CPU的干预。目前英伟达NVLink已经更新到了第五代,第五代NVLink大幅提高了大型多GPU系统的可扩展性。单个NVIDIA Blackwell Tensor Core GPU支持多达18个NVLink 100 GB/s连接,总带宽可达1.8 TB/s,比上一代产品提高了两倍,是PCIe 5.0带宽的14倍之多。72-GB200 GPU NVLink域(NVL72)等服务器平台利用该技术为当今异常复杂的大型模型提供更高的可扩展性。

同时,英伟达还有NVSwitch。NVSwitch芯片是一种类似交换机ASIC的物理芯片,通过NVLink接口可以将多个GPU高速互联到一起,从而提升服务器内部多个GPU之间的通讯效率和带宽。比如,NVIDIA A100 Tensor Core GPU引入了第三代 NVLink和第二代 NVSwitch,使每CPU带宽和减少带宽都增加了一倍。如果是通过第四代 NVLink和第三代NVSwitch,可以连接八个NVIDIA H100 Tensor Core GPU的系统,具有3.6 TB / s的二等分带宽和450 GB / s的缩减操作带宽,与上一代相比,这两个数字分别增加了1.5倍和3倍。

综上所述,英伟达在AI加速器方面拥有非常全面的布局,且这种系统性方案是目前最好的AI加速方式,没有之一。统计数据显示,目前英伟达在AI加速器芯片市场的占比超过了九成,被称为人工智能领域“无可争议的领导者”。当然,这也就意味着,除英伟达AI加速器芯片外,其他厂商的芯片很难捕捉到市场机会,即便是国际大厂推出的相关芯片。一个重要的原因在于,英伟达这套围绕AI加速器布局的系统,不仅强大而且封闭,对非英伟达芯片的兼容性很差,这也被称为AI芯片发展的“英伟达路径”。让厂商很绝望的是,如果选择顺从这条路径,其产品也无法对英伟达芯片造成很大的冲击,除非是面向某些特殊的用途。

因此,英特尔、谷歌等科技巨头现在希望从连接入手,在英伟达AI加速器生态圈上撕开一个口子,以获取更多的市场份额。

UALink野心勃勃但也有隐忧

除了英特尔、谷歌、微软、Meta这四家,UALink联盟成员还包括AMD、惠普企业、博通和思科等,不过作为主要的核心供应商,Arm公司尚未参加。UALink联盟的主要职责是监督UALink规范未来的发展。

UALink联盟认为,UALink和行业规范对于标准化下一代AI数据中心和实现的 AI 和机器学习、HPC 和云应用程序接口至关重要,该小组将制定一项规范,定义AI计算舱中加速器和交换机之间扩展通信的高速、低延迟互连。

目前,UALink联盟提议的第一个版本UALink 1.0连接多达1024个AI加速器,UALink 1.0基于包括AMD的Infinity Fabric在内的开放标准。AMD的Infinity Fabric采用了一种分布式架构,其中包含多个独立的通道,每个通道都可以进行双向数据传输。这种设计使得不同核心之间可以直接进行快速而低延迟的通信,从而提高了整体性能。Infinity Fabric分为SCF和SDF。SDF负责数据传输,而SCF则负责控制传输命令。

从技术演进来看,如果Infinity Fabric技术成为UALink规范的主要组成部分,那么用户可能会担心UALink 1.0最终的连接效率问题。据悉,Infinity Fabric中的SDF部分基本是HT总线衍生的产物,这个总线原本是用于CPU的串联,而UALink 1.0的使用场景是GPGPU,两者之间在并行数据量要求方面差异巨大。因此,有业者认为,UALink 1.0规范预计不会规模性进入市场,只是奠定UALink规范的基础框架,但很难对NVLink+NVSwitch这套体系造成很大的挑战。

当然,博通和思科会积极地完善UALink 1.0以及后续的标准,博通可能会在800Gbps的 Thor产品中推出一款早期的Ultra Ethernet NIC,思科则预计将研发对标NVSwitch的相关产品。另外,目前已经加入的各家巨头,也都是各自有自己的小算盘:谷歌拥有用于训练和运行 AI 模型的定制芯片、TPU和Axion;微软Maia 100新芯片已经在Bing和Office AI产品上测试,急于进入市场;Meta此前公布了自主研发芯片MTIA的最新版本,这是专门为AI训练和推理工作设计的定制芯片系列。因此,有观点认为,一旦UALink成事,那么这些拥有自研芯片的公司将成为最大的受益者。但是,由于各自研芯片公司在芯片、架构、集群层面的理解不一,这也可能拖累UALink的发展,使得UALink虽然看上去有大批的创新力量,但是创新效率却不足。

结语

据悉,UALink 1.0将在同一时间向加入该联盟的公司提供,另外带宽更高的更新规范UALink 1.1将于2024年第四季度推出。由于英伟达不在这个联盟,也不必参加这个联盟,预计UALink 1.1推出时可能会选择直接对标某一代的NVLink。不过,在UALink能够全面对抗NVLink之前,包括微软和Meta在内的公司依然是大规模哄抢英伟达的AI加速器芯片。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10274

    浏览量

    179237
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110229
  • 英伟达
    +关注

    关注

    23

    文章

    4039

    浏览量

    97636
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    科通技术获评英特尔首批尊享级合作伙伴

    近日,科通科技获评为英特尔首批“尊享级合作联盟成员”,即英特尔合作伙伴联盟体系中的最高级别会员。这一身份认证不仅是对双方十五年深度协同的认可,也是双方在技术协同、产业赋能道路上的又一次
    的头像 发表于 11-17 16:52 517次阅读
    科通技术获评<b class='flag-5'>英特尔</b>首批尊享级合作伙伴

    是德科技推出UALink 1.0发射机测试解决方案

    是德科技(NYSE: KEYS )宣布推出UALink 1.0(Ultra Accelerator Link)发射机测试解决方案,这是专为UALink设备设计的一致性测试工具。该新型测
    的头像 发表于 10-22 18:11 1572次阅读
    是德科技<b class='flag-5'>推出</b><b class='flag-5'>UALink</b> <b class='flag-5'>1.0</b>发射机测试解决方案

    英伟斥资50亿美元入股英特尔,芯片巨头携手重塑行业格局

    在科技行业引发广泛关注的重大事件中,当地时间9月18日,全球知名的芯片企业英伟宣布,将斥资50亿美元入股英特尔,双方还达成合作协议,共同致力于人工智能基础设施和个人计算产品的联合开发。这一消息犹如
    的头像 发表于 09-22 17:35 610次阅读

    今日看点丨英伟入股英特尔;寒武纪:网传订单信息不实

    英伟入股英特尔 NVIDIA和英特尔今日宣布达成合作,将共同开发多代定制化的数据中心和个人计算产品,以加速超大规模计算、企业级及消费级市场的各类应用与工作负载的处理。   双方通过
    发表于 09-19 10:21 910次阅读

    重磅!双英强强合作,英伟英特尔投资50亿美元

    9月18日,英伟CEO黄仁勋宣布,与英特尔达成投资50亿美元的投资及技术合作,这是在双方进行一年多的讨论后做出的决定。此举标志着两大竞争对手联手,开创AI PC和数据中心合作新篇章。消息公布后,
    的头像 发表于 09-19 09:36 8880次阅读
    重磅!双英强强合作,<b class='flag-5'>英伟</b><b class='flag-5'>达</b>向<b class='flag-5'>英特尔</b>投资50亿美元

    美国商务部推进收购英特尔10%股份 估值约105亿美元

    值约105亿美元。 据悉,美国商务部长卢特尼克在19日接受美国消费者新闻与商业频道采访时透露,英特尔必须提供股权以换取联邦补贴。
    的头像 发表于 08-20 12:25 606次阅读

    分析师:英特尔转型之路,机遇与挑战并存

    ,这正是英特尔当前发展所需。上任后,他迅速推动公司组织架构重组,加大在制造与AI领域的投资,并将代工业务置于优先位置。尽管面临内外多重挑战英特尔股票在2025年上半年仍保持了稳定走势。 陈立武正在带领
    的头像 发表于 06-10 10:59 464次阅读
    分析师:<b class='flag-5'>英特尔</b>转型之路,机遇与<b class='flag-5'>挑战</b>并存

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI加速器机架级和PCIe部署方案   2025 年 5 月 19 日,北京 ——今日
    发表于 05-20 11:03 1664次阅读

    请问OpenVINO™工具套件英特尔®Distribution是否与Windows® 10物联网企业版兼容?

    无法在基于 Windows® 10 物联网企业版的目标系统上使用 英特尔® Distribution OpenVINO™ 2021* 版本推断模型。
    发表于 03-05 08:32

    英特尔®独立显卡与OpenVINO™工具套件结合使用时,无法运行推理怎么解决?

    使用英特尔®独立显卡与OpenVINO™工具套件时无法运行推理
    发表于 03-05 06:56

    英伟杀疯了!Blackwell横扫市场,AMD、英特尔加入降本浪潮

    。与此同时,随着AI大模型的普及,高计算量需求和成本压力也成为行业关注的焦点。如何在性能与成本之间找到平衡,成为整个AI芯片行业共同面临的挑战。AI大模型的出现对芯片市场产生了哪些影响,DeepSeek带来的“AI降本浪潮”又会给AMD和英特尔带来哪些机会?  
    的头像 发表于 03-02 00:02 2407次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>杀疯了!Blackwell横扫市场,AMD、<b class='flag-5'>英特尔</b>加入降本浪潮

    苹果加入UALink联盟,共推AI加速器新标准

    苹果公司已正式成为Ultra Accelerator Link(UALink联盟的一员,并获得了该联盟董事会席位。UALink联盟由超过6
    的头像 发表于 01-22 18:18 1148次阅读

    英特尔带您解锁云上智算新引擎

    在近日举办的2024火山引擎FORCE原动力大会上,英特尔与火山引擎联合发布基于英特尔 至强 6 性能核处理器的第四代服务器实例,以打造弹性算力底座的产品化实践。同时,英特尔也携手扣子共同推出
    的头像 发表于 12-23 14:05 1221次阅读

    EQTY Lab携手英特尔英伟发布可验证计算AI框架

    瑞士人工智能解决方案领域的佼佼者EQTY Lab,于近日宣布了一项重大合作成果。该公司携手全球领先的计算技术提供商英特尔和图形处理巨头英伟,共同推出了可验证计算人工智能框架(Veri
    的头像 发表于 12-20 10:46 989次阅读

    英特尔推出全新英特尔锐炫B系列显卡

    备受玩家青睐的价格提供卓越的性能与价值1,很好地满足现代游戏需求,并为AI工作负载提供加速。其配备的英特尔Xe矩阵计算引擎(XMX),为新推出的XeSS 2提供强大支持。XeSS 2的三项核心技术协同工作,共同提高性能表现、增强视觉流畅性并加快响应速度。 “   全新
    的头像 发表于 12-07 10:16 1912次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>推出</b>全新<b class='flag-5'>英特尔</b>锐炫B系列显卡