0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是 NVLink?

jf_pJlTbmA9 2023-10-27 16:10 次阅读

NVLink 是加速系统中 GPUCPU 处理器的高速互连技术,推动数据和计算加速得出可执行结果。

加速计算是一项曾经只有政府研究实验室中才有的高性能计算能力。如今,它已成为主流技术。

银行、汽车制造商、工厂、医院、零售商等机构需要处理和理解的数据日益增加,他们现在正在采用 AI 超级计算机来处理这些堆积如山的数据。

这些强大、高效的系统如同一条条“超级计算高速公路”。它们在多条并行路径上同时传输数据和计算,可以瞬间得出可执行结果。

GPU 和 CPU 处理器是“公路”沿途的资源,而快速互连通道是通往它们的“匝道”。 NVLink是加速计算互连通道的黄金标准。

那么,什么是 NVLink

NVLink 是 GPU 和 CPU 之间的高速连接通道。它由一个强大的软件协议组成,通常通过印在计算机板上的多对导线实现,可以让处理器以闪电般的速度收发共享内存池中的数据。

如今,第四代 NVLink 连接主机和加速处理器的速度高达每秒 900GB/s。

这是传统 x86 服务器的互连通道——PCIe 5.0 带宽的 7 倍多。由于每传输 1 字节数据仅消耗 1.3 皮焦,因此 NVLink 的能效是 PCIe 5.0 的 5 倍。

NVLink 的历史

NVLink 最初作为 NVIDIA P100 GPU 的互连通道推出,之后便与每一代新的 NVIDIA GPU 架构同步发展。

wKgZomTDna-Ad6jGAAHeBxuVM-4009.png

2018 年,NVLink 首次亮相便被用于连接两台超级计算机——Summit和Sierra的GPU和CPU,成为了高性能计算领域的焦点。

这两套安装在美国橡树岭国家实验室和美国劳伦斯利弗莫尔国家实验室的系统正在推动药物研发、自然灾害预测等科学领域的发展。

带宽翻倍,继续发展

2020年,第三代NVLink将每个GPU的最大带宽翻倍提高至600GB/s,每个NVIDIA A100 Tensor Core GPU中都有十几条互连通道。

A100 为全球各地企业数据中心云计算服务和 HPC 实验室的 AI 超级计算机提供动力。

如今,一个NVIDIA H100 Tensor Core GPU中包含18条第四代NVLink互连通道。这项技术已承担了一项新的战略任务——帮助打造全球领先的CPU和加速器。

芯片到芯片互联

NVIDIA NVLink-C2C 是一种板级互连技术,它能够在单个封装中将两个处理器连接成一块超级芯片。比如它通过连接两块 CPU 芯片,使NVIDIA Grace CPU超级芯片具有144个Arm Neoverse V2核心,为云、企业和HPC用户带来了高能效性能。

NVIDIA NVLink-C2C 还将 Grace CPU 和 Hopper GPU 连接成 Grace Hopper超级芯片,将用于处理最棘手的 HPC 和 AI 工作的加速计算能力集合到一块芯片中。

计划在瑞士国家计算中心投入使用的 AI 超级计算机 Alps将是首批使用 Grace Hopper 的计算机之一。这套高性能系统将在今年晚些时候上线,用于处理从天体物理学到量子化学等领域的大型科学问题。

Grace CPU 包含 144 个 Arm Neoverse V2 核心,通过 NVLink-C2C 互连。

Grace 和 Grace Hopper 还非常适合用于提升高要求云计算工作负载的能效。

例如Grace Hopper是最适合用于推荐系统的处理器。这些互联网的经济引擎需要快速、高效地访问大量数据,才能每天向数十亿用户提供数万亿条结果。

wKgZomTDncKAGonwAAJYVhQK4mQ657.png

与使用传统 CPU 的 Hopper 相比,采用 Grace Hopper 的推荐系统的性能提高了 4 倍,并且效率更高。

另外,NVLink 还被用于为汽车制造商提供的强大系统级芯片,包括 NVIDIA Hopper、Grace 和 Ada Lovelace 处理器等。车载计算平台 NVIDIA DRIVE Thor 将数字仪表板、车载信息娱乐、自动驾驶、泊车等诸多智能功能统一整合到单个架构中。

乐高式计算链路

NVLink 的作用就像是乐高积木的凸粒和凹槽。它是构建超级系统以处理超大型 HPC 和 AI 工作的基础。

例如,NVIDIA DGX 系统中的八个 GPU 上的 NVLink 通过 NVSwitch 芯片共享快速、直接的连接。它们共同组成了一个 NVLink 网络,使服务器中的每一个 GPU 都是一套系统的一部分。

为了获得更强大的性能,DGX 系统本身可以堆叠成由 32 台服务器组成的模块化单元,形成一个强大、高效的计算集群。

NVLink 是一项关键的技术,它可以让用户轻松地将模块化的 NVIDIA DGX 系统扩展成为一个 AI 性能高达 1 EXAFLOP 的 SuperPOD。

用户可以利用DGX内部的NVLink网络与两者之间的NVIDIA Quantum-2 InfiniBand交换以太网,将32个DGX系统模块连接成一台AI超级计算机。例如,一台NVIDIA DGX H100 SuperPOD包含256个H100 GPU,可提供最高1 EXAFLOP的峰值AI性能。

如要进一步提高性能,用户还可以使用云中的 AI 超级计算机,例如微软Azure使用数万个 A100 和 H100 GPU 打造的超级计算机。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    447

    文章

    47821

    浏览量

    409207
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10451

    浏览量

    206583
  • NVIDIA
    +关注

    关注

    14

    文章

    4597

    浏览量

    101762
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4424

    浏览量

    126724
收藏 人收藏

    评论

    相关推荐

    IBM联合英伟达发布NVLink 将与PCIe抢市场

    英伟达和IBM今日宣布推出名为NVLink的高速互联。这项新技术将集合到英伟达的未来GPU里,预计2016年将开始引入Pascal GPU架构,同时还有IBM未来版本的强大处理器。
    发表于 03-26 08:13 717次阅读

    900GB/s,NVLink才是英伟达的互联杀手锏

    电子发烧友网报导(文/周凯扬)英伟达在GTC22上发布了全新的Grace Superchip,该芯片中用到了NVLink-C2C技术,而去年公开的Grace Hopper Superchip同样用到
    的头像 发表于 03-25 07:03 5022次阅读

    特斯拉V100 Nvlink是否支持v100卡的nvlink变种的GPU直通?

    /4029/SYS-4029GP-TVRT.cfm)我们正试图做pci将GPU直接传输到VM中但是当我们通过pci设备并安装驱动程序时,我们会从nvidia-nvlink模块中获得错误。是否支持v100卡的nvlink
    发表于 09-12 16:25

    英伟达GPU卡多卡互联NVLink,系统累积的公差,是怎么解决的?是连接器吸收的?

    英伟达不断推出GPU卡,并且实现多卡互联NVLink,实际整个系统会累积到一个较大的公差,而目前市面上已有的连接器只能吸收较少的公差,这个是怎么做到匹配的呢?
    发表于 03-05 16:17

    技嘉发布的NVLink连接器支持RGB灯光

    10月3日消息 随着RTX 2080和RTX 2080 Ti显卡的推出,各家厂商也推出了自家的NVLink连接器,已提供给发烧友使用,让他们享受到最为强大的显卡性能。之前华硕就公布了自家
    发表于 10-10 17:07 713次阅读

    技嘉发布全新NVLink连接器:拥有RGB灯光

    【大比特导读】10月3日消息 随着RTX 2080和RTX 2080 Ti显卡的推出,各家厂商也推出了自家的NVLink连接器,已提供给发烧友使用,让他们享受到最为强大的显卡性能。之前华硕就公布
    发表于 12-24 16:46 295次阅读

    RTX 3080 PCB上没有NVLink连接器

    查看两张照片,立即弹出的一件事是RTX 3080 PCB上没有NVLink连接器。另一方面,RTX 3090具有一个,考虑到其双GPU支持,可以预期。
    的头像 发表于 09-25 16:17 3969次阅读

    GTC2022大会亮点:NVIDIA宣布推出NVIDIA NVLink Switch系统

    GTC2022大会亮点:NVIDIA宣布推出NVIDIA NVLink Switch系统,借助NVLink Switch系统,可以将其扩展为一个巨大的拥有32个节点、256个GPU的DGX POD,都可借助4个端口光学收发器连接到NVL
    的头像 发表于 03-24 15:15 2692次阅读
    GTC2022大会亮点:NVIDIA宣布推出NVIDIA <b class='flag-5'>NVLink</b> Switch系统

    英伟达发布采用NVLink-C2C技术的Grace Superchip芯片

    电子发烧友网报道(文/周凯扬)英伟达在GTC22上发布了全新的Grace Superchip,该芯片中用到了NVLink-C2C技术,而去年公开的Grace Hopper Superchip同样用到
    的头像 发表于 03-26 11:20 2659次阅读

    什么是 NVLink

    NVLink 是加速系统中 GPU 和 CPU 处理器的高速互连技术,推动数据和计算加速得出可执行结果。 加速计算是一项曾经只有政府研究实验室中才有的高性能计算能力。如今,它已成为主流技术。 银行
    的头像 发表于 04-19 04:05 2155次阅读
    什么是 <b class='flag-5'>NVLink</b>?

    一文解析Nvlink的诞生和技术演进历程

    Nvlink-C2C是个错误的技术路径。 我仿佛记得Nvlink-C2C的主架构师Wei wei是我大学同学 ?有这么个模糊印象。 如果单纯从技术的角度,Nvlink-C2C真的是一个恰到好处的设计,挺佩服的。增之一分则太长,减
    发表于 07-03 11:50 3543次阅读
    一文解析<b class='flag-5'>Nvlink</b>的诞生和技术演进历程

    NVLink的演进

    2014年,NVLink 1.0发布,并应用在P100芯片上,如下图所示。两颗GPU之间有4条NVlink, 每个link中包含8个lane, 每条lane的速率是20Gb/s, 因此整个系统的双向带宽为160GB/s,是PCIe3 x16带宽的5倍。
    的头像 发表于 10-11 15:32 1309次阅读
    <b class='flag-5'>NVLink</b>的演进

    英伟达AI服务器NVLink版与PCIe版有何区别?又如何选择呢?

    在人工智能领域,英伟达作为行业领军者,推出了两种主要的GPU版本供AI服务器选择——NVLink版(实为SXM版)与PCIe版。这两者有何本质区别?又该如何根据应用场景做出最佳选择呢?让我们深入探讨一下。
    的头像 发表于 03-19 11:21 1016次阅读
    英伟达AI服务器<b class='flag-5'>NVLink</b>版与PCIe版有何区别?又如何选择呢?

    NVLink的演进:从内部互联到超级网络

    NVLink是NVIDIA开发的一种高速、低延迟的互联技术,旨在连接多个GPU以实现高性能并行计算。与传统的PCIe总线相比,NVLink提供了更高的带宽和更低的延迟,使得GPU之间可以更加高效地共享数据和通信。
    的头像 发表于 04-13 11:22 573次阅读
    <b class='flag-5'>NVLink</b>的演进:从内部互联到超级网络

    全面解读英伟达NVLink技术

    NVLink是一种解决服务器内GPU之间通信限制的协议。与传统的PCIe交换机不同,NVLink带宽有限,可以在服务器内的GPU之间实现高速直接互连。第四代NVLink提供更高的带宽,每条通道达到112Gbps,比PCIe Ge
    发表于 04-22 11:01 91次阅读
    全面解读英伟达<b class='flag-5'>NVLink</b>技术