0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达GTC25亮点:NVIDIA Blackwell Ultra 开启 AI 推理新时代

向上 来源:英伟达 作者:英伟达 2025-03-20 15:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

加速训练和测试时扩展推理,加速 AI 推理、代理式 AI 和物理 AI。

• 全球领先计算机制造商、云服务提供商和 GPU 云供应商将强化训练和测试时扩展推理能力,从逻辑推理到代理式 AI和物理 AI。
• 全新开源的 NVIDIA Dynamo 推理软件,通过显著提升吞吐量、更快的响应速度以及降低总体拥有成本(TCO),实现推理 AI 服务的规模化扩展。
• NVIDIA Spectrum-X 增强型 800G 以太网网络,为 AI 基础设施显著降低延迟和抖动。

NVIDIA 推出 NVIDIA BlackwellAI 工厂平台的新一代产品 —— NVIDIA Blackwell Ultra,开启了 AI 推理新时代。

NVIDIA Blackwell Ultra 提升了训练和测试时扩展推理能力(test-time scaling inference), 即通过在推理过程中增加计算量来提升准确率的技术,以帮助全球各地的企业加速AI推理、代理式AI及物理AI等应用的开发与部署。

基于一年前推出的突破性的 Blackwell 架构,Blackwell Ultra 包括 NVIDIA GB300 NVL72 机架级解决方案和 NVIDIA HGX™ B300 NVL16 系统。 GB300 NVL72 的 AI 性能是NVIDIA GB200 NVL72 的 1.5 倍,这使得建造 AI 工厂 的收入机会与基于NVIDIA Hopper™构建的系统相比增加了 50 倍。

人工智能实现了巨大的飞跃 —— 推理和代理式AI对计算性能的需求呈数量级增长,”NVIDIA创始人兼首席执行官黄仁勋表示。“我们为这一时刻设计了 Blackwell Ultra —— 它是一款单一且多功能的平台,能够轻松高效地完成预训练、后训练以及推理型AI推理任务。”

NVIDIA Blackwell Ultra 实现 AI 推理

NVIDIA GB300 NVL72 在一个机架设计中连接了 72 个 Blackwell Ultra GPU 和 36 个基于Arm Neoverse 架构的 NVIDIA Grace™ CPU,整体表现如同一个巨型 GPU,专为测试时扩展而打造。通过 GB300 NVL72,AI 模型能够利用平台增强的计算能力探索多种解决方案,将复杂请求分解为多个步骤,从而生成更高质量的响应。

GB300 NVL72 预计还将通过 NVIDIA DGX™ Cloud提供,该平台是一个端到端的全托管 AI 平台,部署于领先的云服务上,通过软件、服务和 AI 专业知识为不断发展的工作负载优化性能。配备 DGX GB300 系统的 NVIDIA DGX SuperPOD™ 采用 GB300 NVL72 机架设计,为客户提供了一个交钥匙式 AI 工厂。

NVIDIA HGX B300 NVL16 相比 Hopper 代产品,LLM 推理速度提速了 11 倍,计算性能提升了 7 倍,内存容量扩大了 4 倍,可为最复杂的工作负载(如 AI 推理)提供突破性性能。

此外,Blackwell Ultra 平台特别适用于以下应用:
  • 代理式 AI, 利用复杂推理和迭代规划自主解决复杂的多步骤问题。 AI 智能体系统超越了简单的指令执行。 他们能够推理、规划并采取行动以实现特定目标。
  • 物理 AI,使企业能够实时生成合成的、具有高度真实感的视频,用于大规模训练机器人自动驾驶汽车等应用。

NVIDIA 横向扩展基础架构以实现绝佳性能

先进的横向扩展型网络是 AI 基础架构的重要组成部分,可在降低延迟和抖动的同时提供卓越性能。

Blackwell Ultra 系统与[ NVIDIA Spectrum-X™ 以太网]和[ NVIDIA Quantum-X800 InfiniBand]平台无缝集成,通过 NVIDIA ConnectX®-8 SuperNIC 为系统中的每个 GPU 提供 800 Gb/s 的数据吞吐率。 这为 AI 工厂和云数据中心提供了极佳的远程直接内存访问(RDMA)能力,使其能够无瓶颈地处理 AI 推理模型。

NVIDIA BlueField®-3 DPU,作为 Blackwell Ultra 系统的重要组件,能够实现多租户网络架构、GPU 计算资源弹性扩展、数据访问加速以及实时网络安全检测 。

全球技术领导者拥抱 Blackwell Ultra

合作伙伴预计将从 2025 年下半年开始推出基于 Blackwell Ultra 的产品。

思科、戴尔科技、慧与、联想和超微预计将推出基于 Blackwell Ultra 的各类服务器,此外还包括 Aivres、华擎、华硕、Eviden、Foxconn、技嘉科技、英业达、和硕、云达科技(QCT)、纬创和纬颖科技。

云服务提供商亚马逊云科技(AWS)、谷歌云、微软 Azure 和 Oracle Cloud Infrastructure(OCI),以及 GPU 云提供商 CoreWeave、Crusoe、Lambda、Nebius、Nscale、Yotta 和 YTL 将成为首批提供 Blackwell Ultra 支持实例的供应商。

NVIDIA 软件创新减少 AI 瓶颈

全部 NVIDIA Blackwell 产品组合都得到 NVIDIA AI 全栈平台支持。 同时发布的 [NVIDIA Dynamo]开源推理框架可扩展推理 AI 服务,通过提供最高效的测试时计算扩展解决方案,得以实现吞吐量的飞跃,同时降低响应时间和模型服务成本。

NVIDIA Dynamo 是全新的 AI 推理服务软件,旨在为部署推理 AI 模型的 AI 工厂最大化 token 收益。它可以协调和加速数千个 GPU 之间的推理通信,并使用分离式服务在不同的 GPU 上分离大语言模型的预处理和生成阶段。这使得每个阶段都能根据其特定需求进行独立优化,确保 GPU 资源利用率最大化。

Blackwell 系统非常适合运行全新的 [NVIDIA Llama Nemotron 推理模型]和 NVIDIA AI-Q Blueprint,这些都得到用于生产级 AI 的 [NVIDIA AI Enterprise]软件平台支持。 NVIDIA AI Enterprise 软件平台包括 [NVIDIA NIM][™][ 微服务],以及企业可以在 NVIDIA 加速的云、数据中心和工作站上部署的 AI 框架、库和工具。

Blackwell 平台建立在 NVIDIA 强大的开发工具生态系统之上,包括 NVIDIA CUDA-X™ 库、超过 600 万开发者和 4,000 多个可跨数千 GPU 扩展性能的应用程序。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109047
  • AI
    AI
    +关注

    关注

    89

    文章

    38085

    浏览量

    296317
  • 英伟达
    +关注

    关注

    23

    文章

    4039

    浏览量

    97637
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    揭晓英伟最强芯片!Blackwell Ultra、Rubin芯片亮相,新机器人压轴

    电子发烧友网报道(文/莫婷婷)北京时间3月19日晚间,NVIDIA 创始人兼首席执行官黄仁勋在2025年GTC开发者大会上发表了主题演讲,介绍了英伟
    的头像 发表于 03-19 09:05 3121次阅读
    揭晓<b class='flag-5'>英伟</b><b class='flag-5'>达</b>最强芯片!<b class='flag-5'>Blackwell</b> <b class='flag-5'>Ultra</b>、Rubin芯片亮相,新机器人压轴

    NVIDIA英伟 GTC 巴黎亮点NVIDIA CEO黄仁勋公布欧洲AI发展新蓝图

    联合举办的 GTC 巴黎上,NVIDIA 创始人兼 CEO 黄仁勋传递出一个明确信息:欧洲不仅采用 AI,还正在建设 AI。 黄仁勋在面向线上以及巴黎体育宫现场观众发表演讲时表示:“
    的头像 发表于 06-13 11:44 975次阅读
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>英伟</b><b class='flag-5'>达</b> <b class='flag-5'>GTC</b> 巴黎<b class='flag-5'>亮点</b>:<b class='flag-5'>NVIDIA</b> CEO黄仁勋公布欧洲<b class='flag-5'>AI</b>发展新蓝图

    英伟GTC2025亮点NVIDIA认证计划扩展至企业存储领域,加速AI工厂部署

    ,现在已将企业存储纳入其中,旨在通过加速计算、网络、软件和存储,助力企业更高效地部署 AI 工厂。 在企业构建 AI 工厂的过程中,获取高质量数据对于确保 AI 模型的卓越性能和可靠性至关重要。 在
    的头像 发表于 03-21 19:38 1705次阅读

    英伟GTC2025亮点NVIDIA开源cuOpt开启决策优化新时代

    每秒钟都在进行关键决策。物流公司决定货运卡车的调度方案,零售企业思考货架的最优配置,航空公司在暴风雨后紧急改变航线。这些绝非是简单的路线选择,更是包含数百万个变量的高风险谜题,一旦出错,不仅造成经济损失,还会造成客户流失。 然而,这种情况正在发生改变。 NVIDIA 宣布开源其
    的头像 发表于 03-21 19:34 1513次阅读

    英伟GTC2025亮点NVIDIA Blackwell加速计算机辅助工程软件,实现实时数字孪生性能数量级提升

    Ansys、Altair、Cadence、Siemens 和 Synopsys 等领先软件提供商纷纷采用 NVIDIA Blackwell NVIDIAGTC 大会上宣布,包括
    的头像 发表于 03-21 15:12 1248次阅读

    英伟GTC2025亮点NVIDIA、Alphabet 和谷歌携手开启代理式与物理AI的未来

    、优化能源电网等。在 NVIDIA GTC 全球 AI 大会上,来自 Google DeepMind、Isomorphic Labs、I
    的头像 发表于 03-21 15:10 1751次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b><b class='flag-5'>GTC</b>2025<b class='flag-5'>亮点</b>:<b class='flag-5'>NVIDIA</b>、Alphabet 和谷歌携手<b class='flag-5'>开启</b>代理式与物理<b class='flag-5'>AI</b>的未来

    英伟GTC2025亮点:Oracle与NVIDIA合作助力企业加速代理式AI推理

    Oracle 数据库与 NVIDIA AI 相集成,使企业能够更轻松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA
    的头像 发表于 03-21 12:01 1171次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b><b class='flag-5'>GTC</b>2025<b class='flag-5'>亮点</b>:Oracle与<b class='flag-5'>NVIDIA</b>合作助力企业加速代理式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    英伟GTC2025亮点NVIDIA与行业领先存储企业共同推出面向AI时代的新型企业基础设施

    的参考设计,领先的存储提供商可用来构建全新的 AI 基础设施,以满足 AI 推理工作负载的严苛要求:即企业存储平台,搭载由 NVIDIA 加速计算、网络和软件驱动的
    的头像 发表于 03-21 09:42 1059次阅读

    英伟GTC2025亮点 NVIDIA推出Cosmos世界基础模型和物理AI数据工具的重大更新

    新模型可实现物理 AI 的预测、可控世界生成和推理。 两款全新Blueprint为机器人和自动驾驶汽车后训练提供海量物理 AI 合成数据生成技术。 1X、Agility Robotics
    的头像 发表于 03-20 19:01 1174次阅读

    NVIDIA GTC2025 亮点 NVIDIA推出 DGX Spark个人AI计算机

    台式超级计算机由 NVIDIA Grace Blackwell 驱动,为开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机制造商(包括华硕、Dell Technologies、HP
    的头像 发表于 03-20 18:59 1261次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GTC</b>2025 <b class='flag-5'>亮点</b>  <b class='flag-5'>NVIDIA</b>推出 DGX Spark个人<b class='flag-5'>AI</b>计算机

    NVIDIA Blackwell白皮书:NVIDIA Blackwell Architecture Technical Brief

    NVIDIA Blackwell白皮书:NVIDIA Blackwell Architecture Technical Brief
    的头像 发表于 03-20 18:35 2383次阅读

    NVIDIA Blackwell数据手册与NVIDIA Blackwell架构技术解析

    NVIDIA Blackwell数据手册与NVIDIA Blackwell 架构技术解析
    的头像 发表于 03-20 17:19 1686次阅读

    英伟GTC25亮点NVIDIA Dynamo开源库加速并扩展AI推理模型

    NVIDIA Dynamo 提高了推理性能,同时降低了扩展测试时计算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的
    的头像 发表于 03-20 15:03 1073次阅读

    英伟GTC2025大会关键信息点总结 Blackwell Ultra 量子计算与机器人

    英伟 GTC 2025 大会关键信息点总结
    的头像 发表于 03-20 14:18 1349次阅读

    新思科技携手英伟加速芯片设计,提升芯片电子设计自动化效率

    B200 Blackwell架构,新思科技 Proteus预计将计算光刻仿真的速度提升20倍 英伟NIM推理微服务集成将生成式
    发表于 03-19 17:59 435次阅读