0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

面向半定制AI基础架构的NVIDIA NVLink Fusion技术

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-06-06 14:59 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

为了高效应对 AI 工作负载,数据中心正在被重构。这是一项非常复杂的工作,因此,NVIDIA 目前正在交付以 NVIDIA 机架级架构为单位的 AI 工厂。为了让 AI 工厂发挥最佳性能,许多加速器需要以更大的带宽和更低的延迟在机架规模上协同工作,并以最节能的方式支持尽可能多的用户。

设计满足这些需求的机架会面临许多技术挑战。这需要高密度的加速器、网卡(NICs)、交换机以及纵向扩展和横向扩展网络,所有这些都紧密相关。这种高密配置对于提供当今 AI 所需的高级计算能力和背板带宽至关重要。

传统的风冷方法通常不足以满足此类高密部署的需求,因此需要高密度液冷机架,例如NVIDIA NVLink高速纵向扩展互连技术。图说明了 NVLink 和更大的纵向扩展域如何提供最佳性能。NVIDIA 机架式扩展解决方案提供了一条经过验证的可扩展路径,通向更快速、更高效的基础设施。

NVIDIA AI 工厂生态系统

NVIDIA 为 AI 工厂建立了成熟的生态系统。其中包括先进 GPU 技术和用于纵向扩展计算网的 NVIDIA NVLink。NVIDIA NVLink Switch 芯片可在 72 个 GPU的 NVLink 域中实现 130 TB/s 的 GPU 带宽。NVIDIA Quantum-X800 InfiniBand、NVIDIA Spectrum-X Ethernet 和 NVIDIA Bluefield-3 DPU 支持扩展到数十万个 GPU。

此外,与领先的传统 CPU 相比,NVIDIA Grace 等高性能 CPU 可提供高达 2 倍的能效,并在低功耗的情况下提供惊人的带宽。这种机架级架构在广大的 OEM 和 ODM 合作伙伴网络的支持下,已经部署到各大云提供商,奠定了现代 AI 工厂的基础。

面向半定制 AI 基础架构的 NVIDIA NVLink Fusion

新推出的NVIDIA NVLink Fusion是一种面向芯片的技术,可让超大规模企业利用 NVIDIA NVLink 生态系统构建半定制 AI 基础设施。

NVLink Fusion 使用户能够半定制 ASIC 或 CPU,从而实现出色的性能扩展。那些超大规模企业可以直接用到 NVLink、NVIDIA NVLink-C2C 、NVIDIA Grace CPU、NVIDIA GPU、NVIDIA CPO 网络、机架扩展架构和 NVIDIA Mission Control 软件的创新成果。

由于超大规模企业已经在部署完整的 NVIDIA 机架级解决方案,这使他们能够在 AI 工厂中提供异构芯片产品,同时在单一可扩展的硬件基础设施上实现标准化。凭借 NVIDIA 丰富的基础设施合作伙伴生态系统,NVLink Fusion 使用者可轻松进行大规模部署和管理。

NVIDIA NVLink 纵向扩展互连

NVLink Fusion 的核心是突破性互连技术 NVLink。为了充分发挥大规模 AI 模型的潜力,机架内每个 GPU 之间的无缝通信至关重要。第 5 代 NVLink 可为每个 GPU 提供 1.8 TB/s 的双向带宽,是 PCIe Gen5 带宽的 14 倍,可在非常复杂的大型模型中实现无缝高速通信。它还通过面向集合通信的网络计算技术提高了吞吐量并降低了延迟。NVLink 带宽每扩展 2 倍,即可将机架级 AI 性能提升 1.3-1.4 倍。

半定制 AI 基础架构的行业应用

NVLink Fusion 使超大规模企业能够将其半定制 ASIC 无缝集成到高度优化和广泛部署的数据中心架构中。NVLink Fusion 包含 NVLink 芯片,可通过相同的 NVIDIA 机架级扩展架构来纵向扩展 NVIDIA 和半定制 ASIC 的混合基础设施,并与 NVIDIA CPU、NVIDIA NVLink 交换机、NVIDIA ConnectX Ethernet SuperNIC、NVIDIA BlueField DPU 以及用于横向扩展解决方案的 NVIDIA Quantum 和 NVIDIA Spectrum-X 交换机搭配使用。领先的超大规模企业已经在部署 NVIDIA NVLink 全机架解决方案,并且通过使用 NVLink Fusion 在同一机架架构上实现异构芯片数据中心的标准化,从而加快产品上市时间。

NVLink Fusion 技术还为 AI 创新者开辟了另一种集成途径,即通过 NVIDIA NVLink-C2C 技术将半定制 CPU 连接到 NVIDIA GPU。合作伙伴可以将其先进的 CPU 技术与 NVIDIA GPU 相结合,实现内存一致性,从而提供 NVIDIA 全栈 AI 基础架构产品。NVIDIA NVLink-C2C 最初应用于 NVIDIA Grace Hopper 和 NVIDIA Grace CPU 超级芯片,可提供 900 GB/s 的一致性互连带宽。

图显示了不同的 NVLink Fusion 组合选项。

eab9901e-4142-11f0-b715-92fbcf53809c.jpg

图 :NVLink Fusion 机架部署示例

专为 AI 工厂打造的软件

通过 NVLink Fusion 连接的 AI 工厂可以由 Mission Control 提供支持,这是一个统一的运营和编排软件平台,可自动执行 AI 数据中心和工作负载的复杂管理。

从配置部署到验证基础设施,再到编排任务关键型工作负载,Mission Control 可增强 AI 工厂运营,帮助企业更快地启动和运行前沿模型

NVLink Fusion 合作伙伴生态系统

NVIDIA 生态系统涵盖定制芯片设计师、CPU、IP 和 OEM/ODM 合作伙伴,提供通过 NVIDIA 来大规模部署定制芯片的完整解决方案。借助 NVLink Fusion,他们可以与 NVIDIA 合作伙伴生态系统合作,将 NVIDIA 机架级解决方案部署集成到数据中心基础设施中。高性能 AI 工厂可以快速纵向扩展,以满足模型训练和代理式 AI 推理等严苛工作负载的需求。

面向 AI 的加速网络平台

NVIDIA Quantum-X800 InfiniBand 平台、NVIDIA Spectrum-X Ethernet 网络平台、NVIDIA Bluefield-3 DPU 和 NVIDIA Connect-X SuperNIC 可以为大规模 AI 数据中心提供可扩展的性能、效率和安全性。

NVLink Fusion 可为系统中的每个 GPU 提供 800 Gb/s 的总数据吞吐量,并与 Quantum-X800 和 Spectrum-X 平台无缝集成,使 AI 工厂和云数据中心能够在没有瓶颈的情况下处理万亿参数模型。

NVIDIA 光电一体化(CPO)交换机是 NVIDIA Quantum-X 和 Spectrum-X 平台的一部分,通过集成硅光技术取代了可插拔光模块,与传统网络相比,其能效提高了 3.5 倍 ,网络可靠性提高了 10 倍,信号完整性提高了 63 倍,部署时间缩短了 1.3 倍。

NVIDIA 的 CPO 网络简化了管理和设计,为计算基础设施提供更强大的功能。这些优势对于迈向未来百万级 GPU 的 AI 工厂至关重要。

BlueField-3 DPU 扩展到整个数据中心,可加速 GPU 对数据的访问、保障云上多租户的安全和高效的数据中心运营。NVIDIA GB300 NVL72 架构率先在 GPU 和 ConnectX-8 SuperNIC 之间引入 PCIe Gen6 连接,无需独立的 PCIe 交换机接口。新的 I/O 模块将在同一设备上配备两个 ConnectX-8 芯片,为系统中的每个 GPU 提供全速的 800 Gb/s 网络连接。

总结

AI 变革所需的基础设施不但强大,还要敏捷、可扩展且高效。仅靠添加更多的独立服务器或组件已不再可行。未来依赖于深度集成的机架级解决方案,使海量计算资源能够作为一个统一的整体运行。NVIDIA 的 NVLink 技术一直在其 GPU 平台上处于纵向扩展架构的前沿。现在,借助 NVLink Fusion,NVIDIA 将这种经过验证的出色性能扩展能力应用到半定制芯片领域。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11222

    浏览量

    223000
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109117
  • AI
    AI
    +关注

    关注

    90

    文章

    38186

    浏览量

    296981
  • 计算平台
    +关注

    关注

    0

    文章

    88

    浏览量

    9960

原文标题:借助 NVIDIA NVLink Fusion 将半定制计算平台集成到机架级架构

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm Neoverse平台集成NVIDIA NVLink Fusion

    新闻重点 Arm 与 NVIDIA 持续深化合作,在 AI 时代推动协同设计与合作迈向新高度。 生态系统合作伙伴可将高效的 Arm 架构计算能力集成至 NVIDIA
    的头像 发表于 11-26 11:08 302次阅读

    NVIDIA推出面向语言、机器人和生物学的全新开源AI技术

    NVIDIA 秉持对开源的长期承诺,推出了面向语言、机器人和生物学的全新开源 AI 技术,为构建开源生态系统做出贡献,扩展 AI 的普及并推
    的头像 发表于 11-06 11:49 712次阅读

    使用NVIDIA NVLink Fusion技术提升AI推理性能

    本文详细阐述了 NVIDIA NVLink Fusion 如何借助高效可扩展的 NVIDIA NVLink scale-up
    的头像 发表于 09-23 14:45 599次阅读
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>NVLink</b> <b class='flag-5'>Fusion</b><b class='flag-5'>技术</b>提升<b class='flag-5'>AI</b>推理性能

    NVIDIA在Hot Chips 2025大会展示创新技术

    本周在加利福尼亚州帕洛阿尔托(Palo Alto)举行的 Hot Chips 大会上,NVIDIA 专家详细介绍了 NVIDIA NVLink 和Spectrum-X 以太网技术、Bl
    的头像 发表于 08-27 12:52 1638次阅读

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    。。) 原理学习 在「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中,作者详解了从帕斯卡架构到40系的Hopper架构技术演变进化,按照出版时间算是囊括了
    发表于 06-18 19:31

    NVIDIA特供芯片B30曝光,没有HBM,没有NVLink

    最新的Blackwell架构,使用GDDR7显存,而非高频宽内存(HBM),也不会采用台积电的先进封装技术。   不少人认为多GPU扩展能力指的是NVLink,但NVIDIA已在其消费
    的头像 发表于 06-04 00:13 4357次阅读

    借助NVIDIA技术加速半导体芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 网络架构和交换机,以及诸如
    的头像 发表于 05-27 13:59 891次阅读

    NVIDIA推出NVLink Fusion技术

    NVIDIA 发布 NVIDIA NVLink Fusion,这款全新芯片将助力行业用户通过全球领先且广泛采用的计算互连架构 ——
    的头像 发表于 05-22 09:59 716次阅读

    英伟达台北设办事处!开放NVLink生态,800GB桌面超算面世

    发布了小型个人AI超级计算机产品DGX Station、企业级AI运算平台RTX Pro Server、定制NVLink
    的头像 发表于 05-20 09:11 6768次阅读
    英伟达台北设办事处!开放<b class='flag-5'>NVLink</b>生态,800GB桌面超算面世

    NVIDIA NVLink 深度解析

    引言 NVIDIA NVLink 是一种关键的高速互连技术,专为加速计算而设计,尤其是在多 GPU 系统以及 GPU 和支持 CPU 之间 ^1^。NVLink 的出现标志着传统互连瓶
    的头像 发表于 05-06 18:14 4134次阅读

    NVIDIA Blackwell数据手册与NVIDIA Blackwell架构技术解析

    NVIDIA Blackwell数据手册与NVIDIA Blackwell 架构技术解析
    的头像 发表于 03-20 17:19 1745次阅读

    通用汽车和NVIDIA合作构建定制AI系统

    通用汽车和 NVIDIA 宣布正在借助 AI、仿真和加速计算技术,合作打造下一代汽车、工厂和机器人。
    的头像 发表于 03-20 14:40 1471次阅读

    VirtualLab Fusion应用:仿真结果的格式&amp;定制

    了如何根据个人喜好或者报告或发布模板的特定需求定制和格式化探测器结果。 VirtualLab Fusion中的可视化设置 本文档演示了如何使用全局选项来个性化VirtualLab Fusion的视图设置。
    发表于 02-25 08:48

    NVIDIA推出面向RTX AI PC的AI基础模型

    NVIDIA 今日发布能在 NVIDIA RTX AI PC 本地运行的基础模型,为数字人、内容创作、生产力和开发提供强大助力。
    的头像 发表于 01-08 11:01 881次阅读

    联发科与NVIDIA合作 为NVIDIA 个人AI超级计算机设计NVIDIA GB10超级芯片

    ,为各类采用Arm架构SoC的设备提供卓越的AI、通信、多媒体与高能效用户体验。联发科将丰富的专业技术带入此次与NVIDIA的合作中,以共同打造业界先进的平台。 联发科副董事
    的头像 发表于 01-07 16:26 840次阅读