0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是 NVLink?

jf_pJlTbmA9 2023-10-27 16:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVLink 是加速系统中 GPUCPU 处理器的高速互连技术,推动数据和计算加速得出可执行结果。

加速计算是一项曾经只有政府研究实验室中才有的高性能计算能力。如今,它已成为主流技术。

银行、汽车制造商、工厂、医院、零售商等机构需要处理和理解的数据日益增加,他们现在正在采用 AI 超级计算机来处理这些堆积如山的数据。

这些强大、高效的系统如同一条条“超级计算高速公路”。它们在多条并行路径上同时传输数据和计算,可以瞬间得出可执行结果。

GPU 和 CPU 处理器是“公路”沿途的资源,而快速互连通道是通往它们的“匝道”。 NVLink是加速计算互连通道的黄金标准。

那么,什么是 NVLink

NVLink 是 GPU 和 CPU 之间的高速连接通道。它由一个强大的软件协议组成,通常通过印在计算机板上的多对导线实现,可以让处理器以闪电般的速度收发共享内存池中的数据。

如今,第四代 NVLink 连接主机和加速处理器的速度高达每秒 900GB/s。

这是传统 x86 服务器的互连通道——PCIe 5.0 带宽的 7 倍多。由于每传输 1 字节数据仅消耗 1.3 皮焦,因此 NVLink 的能效是 PCIe 5.0 的 5 倍。

NVLink 的历史

NVLink 最初作为 NVIDIA P100 GPU 的互连通道推出,之后便与每一代新的 NVIDIA GPU 架构同步发展。

wKgZomTDna-Ad6jGAAHeBxuVM-4009.png

2018 年,NVLink 首次亮相便被用于连接两台超级计算机——Summit和Sierra的GPU和CPU,成为了高性能计算领域的焦点。

这两套安装在美国橡树岭国家实验室和美国劳伦斯利弗莫尔国家实验室的系统正在推动药物研发、自然灾害预测等科学领域的发展。

带宽翻倍,继续发展

2020年,第三代NVLink将每个GPU的最大带宽翻倍提高至600GB/s,每个NVIDIA A100 Tensor Core GPU中都有十几条互连通道。

A100 为全球各地企业数据中心云计算服务和 HPC 实验室的 AI 超级计算机提供动力。

如今,一个NVIDIA H100 Tensor Core GPU中包含18条第四代NVLink互连通道。这项技术已承担了一项新的战略任务——帮助打造全球领先的CPU和加速器。

芯片到芯片互联

NVIDIA NVLink-C2C 是一种板级互连技术,它能够在单个封装中将两个处理器连接成一块超级芯片。比如它通过连接两块 CPU 芯片,使NVIDIA Grace CPU超级芯片具有144个Arm Neoverse V2核心,为云、企业和HPC用户带来了高能效性能。

NVIDIA NVLink-C2C 还将 Grace CPU 和 Hopper GPU 连接成 Grace Hopper超级芯片,将用于处理最棘手的 HPC 和 AI 工作的加速计算能力集合到一块芯片中。

计划在瑞士国家计算中心投入使用的 AI 超级计算机 Alps将是首批使用 Grace Hopper 的计算机之一。这套高性能系统将在今年晚些时候上线,用于处理从天体物理学到量子化学等领域的大型科学问题。

Grace CPU 包含 144 个 Arm Neoverse V2 核心,通过 NVLink-C2C 互连。

Grace 和 Grace Hopper 还非常适合用于提升高要求云计算工作负载的能效。

例如Grace Hopper是最适合用于推荐系统的处理器。这些互联网的经济引擎需要快速、高效地访问大量数据,才能每天向数十亿用户提供数万亿条结果。

wKgZomTDncKAGonwAAJYVhQK4mQ657.png

与使用传统 CPU 的 Hopper 相比,采用 Grace Hopper 的推荐系统的性能提高了 4 倍,并且效率更高。

另外,NVLink 还被用于为汽车制造商提供的强大系统级芯片,包括 NVIDIA Hopper、Grace 和 Ada Lovelace 处理器等。车载计算平台 NVIDIA DRIVE Thor 将数字仪表板、车载信息娱乐、自动驾驶、泊车等诸多智能功能统一整合到单个架构中。

乐高式计算链路

NVLink 的作用就像是乐高积木的凸粒和凹槽。它是构建超级系统以处理超大型 HPC 和 AI 工作的基础。

例如,NVIDIA DGX 系统中的八个 GPU 上的 NVLink 通过 NVSwitch 芯片共享快速、直接的连接。它们共同组成了一个 NVLink 网络,使服务器中的每一个 GPU 都是一套系统的一部分。

为了获得更强大的性能,DGX 系统本身可以堆叠成由 32 台服务器组成的模块化单元,形成一个强大、高效的计算集群。

NVLink 是一项关键的技术,它可以让用户轻松地将模块化的 NVIDIA DGX 系统扩展成为一个 AI 性能高达 1 EXAFLOP 的 SuperPOD。

用户可以利用DGX内部的NVLink网络与两者之间的NVIDIA Quantum-2 InfiniBand交换以太网,将32个DGX系统模块连接成一台AI超级计算机。例如,一台NVIDIA DGX H100 SuperPOD包含256个H100 GPU,可提供最高1 EXAFLOP的峰值AI性能。

如要进一步提高性能,用户还可以使用云中的 AI 超级计算机,例如微软Azure使用数万个 A100 和 H100 GPU 打造的超级计算机。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54440

    浏览量

    469405
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11330

    浏览量

    225904
  • NVIDIA
    +关注

    关注

    14

    文章

    5694

    浏览量

    110118
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5272

    浏览量

    136070
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA NVLink 深度解析

    引言 NVIDIA NVLink 是一种关键的高速互连技术,专为加速计算而设计,尤其是在多 GPU 系统以及 GPU 和支持 CPU 之间 ^1^。NVLink 的出现标志着传统互连瓶颈的突破,凸显
    的头像 发表于 05-06 18:14 5766次阅读

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    带宽和1.8TB/s的NVLink带宽,使处理能力翻倍,大幅增加内存容量和带宽,为处理大规模人工智能模型和复杂计算提供必要资源。 针对大规模模型如GPT-MoE-1.8T,HGX B200的推理性
    发表于 05-13 17:16

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    的应用层面的工作,对于芯片底层基本原理兴趣缺缺,本帖结合自己实际生活与工作中对GPU新品的应用实例和书中内容分享下相关见解。 NVlink的初应用 **NVlink(SLI)**是NVIDIA公司针对
    发表于 06-18 19:31

    特斯拉V100 Nvlink是否支持v100卡的nvlink变种的GPU直通?

    /4029/SYS-4029GP-TVRT.cfm)我们正试图做pci将GPU直接传输到VM中但是当我们通过pci设备并安装驱动程序时,我们会从nvidia-nvlink模块中获得错误。是否支持v100卡的nvlink
    发表于 09-12 16:25

    英伟达GPU卡多卡互联NVLink,系统累积的公差,是怎么解决的?是连接器吸收的?

    英伟达不断推出GPU卡,并且实现多卡互联NVLink,实际整个系统会累积到一个较大的公差,而目前市面上已有的连接器只能吸收较少的公差,这个是怎么做到匹配的呢?
    发表于 03-05 16:17

    技嘉发布的NVLink连接器支持RGB灯光

    10月3日消息 随着RTX 2080和RTX 2080 Ti显卡的推出,各家厂商也推出了自家的NVLink连接器,已提供给发烧友使用,让他们享受到最为强大的显卡性能。之前华硕就公布了自家
    发表于 10-10 17:07 1092次阅读

    技嘉发布全新NVLink连接器:拥有RGB灯光

    【大比特导读】10月3日消息 随着RTX 2080和RTX 2080 Ti显卡的推出,各家厂商也推出了自家的NVLink连接器,已提供给发烧友使用,让他们享受到最为强大的显卡性能。之前华硕就公布了
    发表于 12-24 16:46 553次阅读

    GTC2022大会亮点:NVIDIA宣布推出NVIDIA NVLink Switch系统

    GTC2022大会亮点:NVIDIA宣布推出NVIDIA NVLink Switch系统,借助NVLink Switch系统,可以将其扩展为一个巨大的拥有32个节点、256个GPU的DGX POD,都可借助4个端口光学收发器连接到NVL
    的头像 发表于 03-24 15:15 3880次阅读
    GTC2022大会亮点:NVIDIA宣布推出NVIDIA <b class='flag-5'>NVLink</b> Switch系统

    什么是 NVLink

    NVLink 是加速系统中 GPU 和 CPU 处理器的高速互连技术,推动数据和计算加速得出可执行结果。 加速计算是一项曾经只有政府研究实验室中才有的高性能计算能力。如今,它已成为主流技术。 银行
    的头像 发表于 04-19 04:05 4417次阅读
    什么是 <b class='flag-5'>NVLink</b>?

    一文解析Nvlink的诞生和技术演进历程

    Nvlink-C2C是个错误的技术路径。 我仿佛记得Nvlink-C2C的主架构师Wei wei是我大学同学 ?有这么个模糊印象。 如果单纯从技术的角度,Nvlink-C2C真的是一个恰到好处的设计,挺佩服的。增之一分则太长,减
    发表于 07-03 11:50 6297次阅读
    一文解析<b class='flag-5'>Nvlink</b>的诞生和技术演进历程

    NVLink的演进

    2014年,NVLink 1.0发布,并应用在P100芯片上,如下图所示。两颗GPU之间有4条NVlink, 每个link中包含8个lane, 每条lane的速率是20Gb/s, 因此整个系统的双向带宽为160GB/s,是PCIe3 x16带宽的5倍。
    的头像 发表于 10-11 15:32 4803次阅读
    <b class='flag-5'>NVLink</b>的演进

    NVLink的演进:从内部互联到超级网络

    NVLink是NVIDIA开发的一种高速、低延迟的互联技术,旨在连接多个GPU以实现高性能并行计算。与传统的PCIe总线相比,NVLink提供了更高的带宽和更低的延迟,使得GPU之间可以更加高效地共享数据和通信。
    的头像 发表于 04-13 11:22 2883次阅读
    <b class='flag-5'>NVLink</b>的演进:从内部互联到超级网络

    全面解读英伟达NVLink技术

    NVLink是一种解决服务器内GPU之间通信限制的协议。与传统的PCIe交换机不同,NVLink带宽有限,可以在服务器内的GPU之间实现高速直接互连。第四代NVLink提供更高的带宽,每条通道达到112Gbps,比PCIe Ge
    发表于 04-22 11:01 3582次阅读
    全面解读英伟达<b class='flag-5'>NVLink</b>技术

    NVIDIA推出NVLink Fusion技术

    NVIDIA 发布 NVIDIA NVLink Fusion,这款全新芯片将助力行业用户通过全球领先且广泛采用的计算互连架构 —— NVIDIA NVLink 打造的强健合作伙伴生态系统,构建半定制 AI 基础设施。
    的头像 发表于 05-22 09:59 1017次阅读

    使用NVIDIA NVLink Fusion技术提升AI推理性能

    本文详细阐述了 NVIDIA NVLink Fusion 如何借助高效可扩展的 NVIDIA NVLink scale-up 架构技术,满足日益复杂的 AI 模型不断增长的需求。
    的头像 发表于 09-23 14:45 1117次阅读
    使用NVIDIA <b class='flag-5'>NVLink</b> Fusion技术提升AI推理性能