0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达发布采用NVLink-C2C技术的Grace Superchip芯片

lPCU_elecfans 来源:电子发烧友网 作者:电子发烧友网 2022-03-26 11:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)英伟达在GTC22上发布了全新的Grace Superchip,该芯片中用到了NVLink-C2C技术,而去年公开的Grace Hopper Superchip同样用到了这一技术。根据英伟达超大规模计算部门副总裁Ian Buck的说法,Chiplet和异构计算已经成了解决摩尔定律缓慢进展的两大有效手段。而NVLink-C2C这一面向die和chip的互联技术,成了英伟达对愈发普及的Chiplet设计的回应。

Superchip的互联

也许在不少人看来的印象中,提到NVLink会想到下图这个桥接多个高端显卡或专业显卡的RTX NVLink Bridge,其实NVLink这一技术在服务器级别的GPU中反倒更为普遍。从P100的第一代NVLink,到V100的第二代NVLink,A100的第三代NVLink,最后再到如今H100的第四代NVLink。NVLink可以说是跟着GPU架构一路推陈出新了,如今享受第四代NVLink性能的成了Hopper架构的GPU。而在英伟达的SERDES和LINK技术发展下,NVLink也从PCB、MCM走向了硅中介层和晶圆,也因此有了NVLink-C2C。

Grace Superchip显然用的是ARM Neoverse N2这一基于Arm v9架构的设计,但从芯片图可以看出,单个Grace Superchip芯片由两个Grace CPU组成,才让总核心数达到了144。而这两个CPU组成的方式,正是NVLink-C2C这一互联技术。我们在开头已经提到,去年公开的Grace Hopper Superchip同样使用了这一互联技术,只不过当时单个Grace Hopper Superchip芯片中互联的,是一个Grace CPU和一个Hopper GPU。

NVLink-C2C为英伟达带来的远不止这样一对一的互联方案,而是一整套系统架构上的创新。在NVLink-C2C的支持下,英伟达可以选择一个Grace CPU,两个Hopper GPU的设计,或是两个2个Grace CPU+2个Hopper GPU,甚至是2个Grace CPU+8个Hopper GPU。可以看出,NVLink-C2C为Grace和Hopper在数据中心和HPC应用提供了极大的扩展性。

远超PCIe 5.0的性能

英伟达强调,NVLink-C2C具有前所未有的性能,比如处理器与加速器之间900GB/s的高带宽数据传输,以及快速同步和高频率更新下的超低延迟,以及在先进封装英伟达芯片下,能效比可以做到PCIe 5.0的25倍,面积效率更是达到90倍。

NVLink-C2C 900GB/s的带宽确实优秀,也与第四代NVLink的性能一致,但这并不代表只要用上NVLink就能获得,我们从Hopper架构的GPU H100的参数上也能窥见一二。要想获得900GB/s的带宽性能,必须用到SXM5的大功率卡,而不是PCIe 5.0的卡,虽然前者的功耗是后者的两倍,达到了可怕的700W,但PCIe 5.0的H100在总体性能和带宽上确实差SXM5一截。

两者在PCIe 5.0上的带宽一致,都是128GB/s,但如果用上NVLink,PCIe 5.0版本的H100只能达到600GB/s的带宽,与第三代NVLink性能一致,只有SXM5版本下的NVLink才能达到满血的900GB/s。

另外在第四代NVLink和第三代NVSwitch技术的组合下,英伟达推出了NVLink Switch这一方案,该系统最多支持到256个GPU,可实现57.6TB/s的总带宽。NVLink Switch也是英伟达DGX H100 SuperPOD系统的关键技术,英伟达甚至把自己收购的Mellanox旗下的InfiniBand节点互联技术拿来对比。从上图可以看出与基于A100+InfiniBand的SuperPOD系统相比,基于H100+NVLink Switch的SuperPOD系统在对分带宽上是前者的9倍。

开放而不是独占

其实NVLink的存在最初让不少人觉得有些一家独大的意思,毕竟最早NVLink仅仅只是用于多个英伟达GPU之间的互联,仅仅只是为自家的产品提供更多优势而已。而去年发布的Grace Hopper Superchip同样用到了这一技术,但这颗芯片却是英伟达设计的Arm CPU和GPU的互联。

这让人不禁担心,如果英伟达真的成功收购了Arm,会不会利用这一优势来全面垄断数据中心和HPC市场。毕竟Arm自己给出的互联方案CMN-700支持的是CCIX 2.0和CXL 2.0这两大标准互联协议,同时为第三方加速器提供PCIe 5.0的连接。但就纸面参数给到的性能看来,NVLink这种专用方案似乎更加吃香一些。

不过Arm作为一家IP公司,目标自然是支持到多样化的加速器,从而全面发展Arm的生态。此前Arm在接受电子发烧友网采访时也表示,Arm期待给市场带来更多的灵活性,支持更多像Grace这样的系统。

好在英伟达似乎也不打算将NVLink-C2C独占,而是宣布开放这一技术,支持集成英伟达技术的芯片半定制,通过Chiplet技术充分利用自家的GPU、DPU、NIC、CPU和SoC产品,与客户的IP进行NVLink-C2C互联。

尽管收购失败,英伟达与Arm的合作并没有就此停止,英伟达也在GTC22上宣布继续与Arm紧密合作,以支持并在未来改进Arm的AMBA CHI协议,加上对CXL的支持,从而与更多加速器和处理器做到互联。

与此同时,在全行业群策群力,试图打通生态的情况下,英伟达也并不打算将NVLink-C2C作为唯一的可选方案。所以除了NVLink-C2C外,集成了英伟达芯片的定制SoC也可选用前段时日公布的UCIe通用Chiplet互联标准,所以不必将数据中心上的CPU、DPU和GPU一整套都换成英伟达旗下的产品,给到第三方服务器芯片、DPU和加速器一个机会。不过,考虑到这两种互联方式只能选其一,英伟达也强调了NVLink-C2C经过优化,拥有更低的延迟、更高的带宽和更高的能效比,该如何选择还是看厂商自己的考量了。

原文标题:900GB/s,NVLink才是英伟达的互联杀手锏

文章出处:【微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53534

    浏览量

    458996
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134445
  • 显卡
    +关注

    关注

    16

    文章

    2517

    浏览量

    71058
  • 英伟达
    +关注

    关注

    23

    文章

    4039

    浏览量

    97655

原文标题:900GB/s,NVLink才是英伟达的互联杀手锏

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    堪称史上最强推理芯片英伟发布 Rubin CPX,实现50倍ROI

    电子发烧友网报道(文/梁浩斌)近日,英伟在AI infra峰会上发布了专为大规模上下文推理设计的全新GPU系列Rubin CPX,性能堪称炸裂!   英伟
    的头像 发表于 09-11 08:25 9656次阅读
    堪称史上最强推理<b class='flag-5'>芯片</b>!<b class='flag-5'>英伟</b><b class='flag-5'>达</b><b class='flag-5'>发布</b> Rubin CPX,实现50倍ROI

    揭晓英伟最强芯片!Blackwell Ultra、Rubin芯片亮相,新机器人压轴

    新一代芯片Blackwell Ultra(GB300)、数据中心超级芯片Grace Blackwell NVLink72、NVIDIA Dynamo开源推理软件、DGX Spark和D
    的头像 发表于 03-19 09:05 3127次阅读
    揭晓<b class='flag-5'>英伟</b><b class='flag-5'>达</b>最强<b class='flag-5'>芯片</b>!Blackwell Ultra、Rubin<b class='flag-5'>芯片</b>亮相,新机器人压轴

    英伟黄仁勋:我们要做巨型芯片!最强显卡RTX 5090发布,汽车芯片Thor算力翻20倍

    50 系列、AI大模型、AI机器人、超小型AI超级计算机,以及英伟的终极目标:名为Grace Blackwell NVLink72的巨型芯片
    的头像 发表于 01-08 08:59 4876次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>黄仁勋:我们要做巨型<b class='flag-5'>芯片</b>!最强显卡RTX 5090<b class='flag-5'>发布</b>,汽车<b class='flag-5'>芯片</b>Thor算力翻20倍

    英伟发布 NVQLink 开放系统架构;国内首个汽车芯片标准验证平台投入使用

    英伟发布 NVQLink 开放系统架构 在华盛顿特区举行的英伟全球技术大会上,
    发表于 10-29 10:33 993次阅读

    英伟下一代Rubin芯片已流片

    为进入市场做准备,Rubin架构将会有6个芯片,这些芯片都已经流片。这一消息在半导体和人工智能领域引起了广泛关注,预示着英伟芯片
    的头像 发表于 09-12 17:15 958次阅读

    GB10超级芯片开卖!正式杀入AI PC

    上,英伟就正式发布了首款个人超级电脑Project DIGITS,其搭载了由英伟与联发科合作开发的NVIDIA GB10
    的头像 发表于 07-09 01:21 3734次阅读

    英伟预计向中国客户交付 “第三代” 阉割芯片

    电子发烧友网综合报道,消息人士称,英伟计划于 7 月推出第三代 “阉割芯片”。此次推出的 B20 和 B40/B30 芯片将替代 H20 芯片
    的头像 发表于 06-21 00:03 3541次阅读

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    NVlink1.0——初代的堆叠技术 英伟2014发布NVLink的首个版本——
    发表于 06-18 19:31

    NVIDIA Grace CPU C1获得广泛支持

    NVIDIA 在本周 COMPUTEX 上重点展示了其全新的 Grace CPU C1,并获得多家主要原始设计制造商合作伙伴的大力支持。
    的头像 发表于 05-22 10:01 606次阅读

    NVIDIA推出NVLink Fusion技术

    NVIDIA 发布 NVIDIA NVLink Fusion,这款全新芯片将助力行业用户通过全球领先且广泛采用的计算互连架构 —— NVIDIA N
    的头像 发表于 05-22 09:59 705次阅读

    从游戏到智能驾驶,英伟有哪些技术升级?

    [首发于智驾最前沿微信公众号]在2025年国际消费电子展(CES 2025)上,英伟重磅发布了其最新一代车规级自动驾驶芯片“Thor”,并同步展示了在智能汽车领域的
    的头像 发表于 05-16 09:02 749次阅读
    从游戏到智能驾驶,<b class='flag-5'>英伟</b><b class='flag-5'>达</b>有哪些<b class='flag-5'>技术</b>升级?

    新思科技携手英伟加速芯片设计,提升芯片电子设计自动化效率

    解决方案在英伟 GPU和英伟 CUDA-X库上所实现的加速 基于英伟 GB200
    发表于 03-19 17:59 437次阅读

    新思科技亮相英伟GTC 2025大会

    为了实现这一速度提升,新思科技在GTC全球AI大会上宣布,正在使用英伟 CUDA-X库优化其下一代半导体开发解决方案。公司还在扩大对英伟Grac
    的头像 发表于 03-19 17:53 1125次阅读

    英伟市值一夜蒸发近2万亿 英伟股价下跌超8%

    财年第四财季和全财年业绩数据上看,2025财年第四财季及全年的营收和利润都实现了大幅增长,大家特别关注的数据中心业务也是业绩增长的核心动力,展现出英伟在AI领域的强大实力。而且英伟
    的头像 发表于 03-04 10:19 988次阅读

    英伟带来Reflex 2低延迟技术

    在 2025 年国际消费电子展(CES 2025)上,英伟不仅推出了备受瞩目的 RTX 50 系列显卡,还带来了一项名为 Reflex 2 的低延迟技术,引发行业广泛关注。 Refl
    的头像 发表于 02-05 15:15 2101次阅读