0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是 NVLink?

NVIDIA英伟达 来源:未知 2023-04-19 04:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVLink 是加速系统中 GPUCPU 处理器的高速互连技术,推动数据和计算加速得出可执行结果。

加速计算是一项曾经只有政府研究实验室中才有的高性能计算能力。如今,它已成为主流技术。

银行、汽车制造商、工厂、医院、零售商等机构需要处理和理解的数据日益增加,他们现在正在采用 AI 超级计算机来处理这些堆积如山的数据。

这些强大、高效的系统如同一条条“超级计算高速公路”。它们在多条并行路径上同时传输数据和计算,可以瞬间得出可执行结果。

GPU 和 CPU 处理器是“公路”沿途的资源,而快速互连通道是通往它们的“匝道”。NVLink 是加速计算互连通道的黄金标准。

那么,什么是 NVLink?

NVLink 是 GPU 和 CPU 之间的高速连接通道。它由一个强大的软件协议组成,通常通过印在计算机板上的多对导线实现,可以让处理器以闪电般的速度收发共享内存池中的数据。

如今,第四代 NVLink 连接主机和加速处理器的速度高达每秒 900GB/s。

这是传统 x86 服务器的互连通道——PCIe 5.0 带宽的 7 倍多。由于每传输 1 字节数据仅消耗 1.3 皮焦,因此 NVLink 的能效是 PCIe 5.0 的 5 倍。

NVLink 的历史

NVLink 最初作为 NVIDIA P100 GPU 的互连通道推出,之后便与每一代新的 NVIDIA GPU 架构同步发展。

daa33fec-de23-11ed-bfe3-dac502259ad0.jpg

2018 年,NVLink 首次亮相便被用于连接两台超级计算机——Summit 和 Sierra 的 GPU 和 CPU,成为了高性能计算领域的焦点。

这两套安装在美国橡树岭国家实验室和美国劳伦斯利弗莫尔国家实验室的系统正在推动药物研发、自然灾害预测等科学领域的发展。

带宽翻倍,继续发展

2020 年,第三代 NVLink 将每个 GPU 的最大带宽翻倍提高至 600GB/s,每个 NVIDIA A100 Tensor Core GPU 中都有十几条互连通道。

A100 为全球各地企业数据中心云计算服务和 HPC 实验室的 AI 超级计算机提供动力。

如今,一个 NVIDIA H100 Tensor Core GPU 中包含 18 条第四代 NVLink 互连通道。这项技术已承担了一项新的战略任务——帮助打造全球领先的 CPU 和加速器。

芯片到芯片互联

NVIDIA NVLink-C2C 是一种板级互连技术,它能够在单个封装中将两个处理器连接成一块超级芯片。比如它通过连接两块 CPU 芯片,使 NVIDIA Grace CPU 超级芯片具有 144 个 Arm Neoverse V2 核心,为云、企业和 HPC 用户带来了高能效性能。

NVIDIA NVLink-C2C 还将 Grace CPU 和 Hopper GPU 连接成 Grace Hopper 超级芯片,将用于处理最棘手的 HPC 和 AI 工作的加速计算能力集合到一块芯片中。

计划在瑞士国家计算中心投入使用的 AI 超级计算机 Alps 将是首批使用 Grace Hopper 的计算机之一。这套高性能系统将在今年晚些时候上线,用于处理从天体物理学到量子化学等领域的大型科学问题。

Grace 和 Grace Hopper 还非常适合用于提升高要求云计算工作负载的能效。

例如 Grace Hopper 是最适合用于推荐系统的处理器。这些互联网的经济引擎需要快速、高效地访问大量数据,才能每天向数十亿用户提供数万亿条结果。

dab5048e-de23-11ed-bfe3-dac502259ad0.jpg

与使用传统 CPU 的 Hopper 相比,采用 Grace Hopper 的推荐系统的性能提高了 4 倍,并且效率更高。

另外,NVLink 还被用于为汽车制造商提供的强大系统级芯片,包括 NVIDIA Hopper、Grace 和 Ada Lovelace 处理器等。车载计算平台 NVIDIA DRIVE Thor 将数字仪表板、车载信息娱乐、自动驾驶、泊车等诸多智能功能统一整合到单个架构中。

“乐高式”计算链路

NVLink 的作用就像是乐高积木的凸粒和凹槽。它是构建超级系统以处理超大型 HPC 和 AI 工作的基础。

例如,NVIDIA DGX 系统中的八个 GPU 上的 NVLink 通过 NVSwitch 芯片共享快速、直接的连接。它们共同组成了一个 NVLink 网络,使服务器中的每一个 GPU 都是一套系统的一部分。

为了获得更强大的性能,DGX 系统本身可以堆叠成由 32 台服务器组成的模块化单元,形成一个强大、高效的计算集群。

用户可以利用 DGX 内部的 NVLink 网络与两者之间的 NVIDIA Quantum-2 InfiniBand 交换以太网,将 32 个 DGX 系统模块连接成一台 AI 超级计算机。例如,一台 NVIDIA DGX H100 SuperPOD 包含 256 个 H100 GPU,可提供最高 1 EXAFLOP 的峰值 AI 性能。

如要进一步提高性能,用户还可以使用云中的 AI 超级计算机,例如微软Azure使用数万个 A100 和 H100 GPU 打造的超级计算机。OpenAI 等团队正在使用这项服务训练一些全球最大的生成式 AI 模型。

这再次印证了加速计算的力量。


原文标题:什么是 NVLink?

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4129

    浏览量

    99810

原文标题:什么是 NVLink?

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    小马智行发布新一代自动驾驶域控制器

    4月25日,小马智行发布全新一代自动驾驶域控制器。该域控制器系统由小马智行与NVIDIA合作开发,基于NVIDIA DRIVE Hyperion平台,并由集成了NVLink技术的NVIDIA
    的头像 发表于 04-29 11:22 720次阅读

    硅光成AI胜负手?英伟达20亿美元战略投资Marvell

    纳入英伟达 AI 生态体系,并在硅光子技术领域展开深度合作,旨在帮助客户更高效地搭建 AI 算力基础设施。   构建 “异构计算” 新范式 根据双方签署的战略协议,此次合作的核心围绕NVLink Fusion—— 英伟达推出的机架级平台技术展开。该平台允许客户基于英伟达 NVLi
    的头像 发表于 04-06 07:02 1.2w次阅读

    AI算力中心:基于SiC功率器件的电源架构之±400V与+800V深度解析与根本区别

    数据中心基础设施正经历一场由人工智能驱动的范式转换。随着大语言模型(LLM)的参数量向万亿级别迈进,以及高带宽互连技术(如NVIDIA NVLink)将成百上千个图形处理器(GPU)融合为单一计算实体,计算密度的飙升彻底打破了传统数据中心的物理边界 。
    的头像 发表于 03-28 09:21 343次阅读
    AI算力中心:基于SiC功率器件的电源架构之±400V与+800V深度解析与根本区别

    NVIDIA在CES 2026发布新一代Rubin AI平台

    通过跨 NVIDIA Vera CPU、Rubin GPU、NVLink 6 交换机、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太网交换机的极致协同设计,大幅缩短训练时间,降低推理 token 生成成本。
    的头像 发表于 01-09 10:23 947次阅读

    NVIDIA和AWS扩展全栈合作伙伴关系

    亚马逊云科技(AWS)将 NVIDIA NVLink Fusion 集成到其定制芯片中,包括新一代 Tranium4 芯片、Graviton 和 AWS Nitro System。
    的头像 发表于 12-13 09:20 1188次阅读

    Arm Neoverse平台集成NVIDIA NVLink Fusion

    新闻重点 Arm 与 NVIDIA 持续深化合作,在 AI 时代推动协同设计与合作迈向新高度。 生态系统合作伙伴可将高效的 Arm 架构计算能力集成至 NVIDIA NVLink Fusion
    的头像 发表于 11-26 11:08 624次阅读

    Arm 宣布为 Neoverse 平台导入 NVLink Fusion 互联

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2025年11月19日 09:05:39

    今日看点:加速进化完成新一轮超亿元融资;Arm 宣布为 Neoverse 平台导入英伟达 NVLink Fusion 互联

    苹果、高通或考虑采用英特尔先进封装技术 据媒体报道,英特尔的EMIB先进封装技术吸引苹果和高通关注,该技术被视为台积电产品的可行替代方案。   苹果近日发布DRAM封装工程师招聘需求,要求具备CoWoS、EMIB、SoIC和PoP等先进封装技术经验。而高通为其数据中心业务部门招聘的产品管理总监职位也要求熟悉英特尔的EMIB技术。   据悉,英特尔CEO及高层过去曾多次强调,自家的Foveros和EMIB技术已吸引了多家客户的兴趣,并具备大规模量产的能力。   Arm 宣
    发表于 11-18 10:29 1234次阅读

    使用NVIDIA NVLink Fusion技术提升AI推理性能

    本文详细阐述了 NVIDIA NVLink Fusion 如何借助高效可扩展的 NVIDIA NVLink scale-up 架构技术,满足日益复杂的 AI 模型不断增长的需求。
    的头像 发表于 09-23 14:45 1244次阅读
    使用NVIDIA <b class='flag-5'>NVLink</b> Fusion技术提升AI推理性能

    NVIDIA在Hot Chips 2025大会展示创新技术

    本周在加利福尼亚州帕洛阿尔托(Palo Alto)举行的 Hot Chips 大会上,NVIDIA 专家详细介绍了 NVIDIA NVLink 和Spectrum-X 以太网技术、Blackwell 以及 CUDA 如何为全球数百万的 AI 工作流加速推理。
    的头像 发表于 08-27 12:52 2121次阅读

    光通信+分布式架构,突破传统网络架构瓶颈

    NVLink Switch)或光学电路(如TPUv4的OCS),其成本随集群规模呈指数级增长。例如,NVLink Switch单台成本高达数万美元,且仅支持单节点级扩展(如DGX H100集群最多8-GPU互联
    的头像 发表于 06-20 09:10 4590次阅读

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    的应用层面的工作,对于芯片底层基本原理兴趣缺缺,本帖结合自己实际生活与工作中对GPU新品的应用实例和书中内容分享下相关见解。 NVlink的初应用 **NVlink(SLI)**是NVIDIA公司针对
    发表于 06-18 19:31

    面向半定制AI基础架构的NVIDIA NVLink Fusion技术

    为了高效应对 AI 工作负载,数据中心正在被重构。这是一项非常复杂的工作,因此,NVIDIA 目前正在交付以 NVIDIA 机架级架构为单位的 AI 工厂。为了让 AI 工厂发挥最佳性能,许多加速器需要以更大的带宽和更低的延迟在机架规模上协同工作,并以最节能的方式支持尽可能多的用户。
    的头像 发表于 06-06 14:59 1662次阅读
    面向半定制AI基础架构的NVIDIA <b class='flag-5'>NVLink</b> Fusion技术

    NVIDIA特供芯片B30曝光,没有HBM,没有NVLink

    最新的Blackwell架构,使用GDDR7显存,而非高频宽内存(HBM),也不会采用台积电的先进封装技术。   不少人认为多GPU扩展能力指的是NVLink,但NVIDIA已在其消费级GPU芯片
    的头像 发表于 06-04 00:13 5137次阅读

    英伟达开放NVLink,华为异军突起,AI集群通信技术为什么这么火?

    行业芯事行业资讯
    脑极体
    发布于 :2025年05月30日 20:51:24