0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA在Hot Chips 2025大会展示创新技术

NVIDIA英伟达 来源:NVIDIA英伟达 2025-08-27 12:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本周在加利福尼亚州帕洛阿尔托(Palo Alto)举行的 Hot Chips 大会上,NVIDIA 专家详细介绍了 NVIDIA NVLink 和Spectrum-X 以太网技术、Blackwell 以及 CUDA 如何为全球数百万的 AI 工作流加速推理。

AI 逻辑推理和网络成为 Hot Chips 大会的首要焦点。

Hot Chips是一个面向行业和学术界的关于处理器及系统架构的重要论坛,在太平洋时间 8 月 24 - 26 日于斯坦福大学举办,旨在展示创新成果,推动 AI 工厂发展,助力万亿美元的数据中心计算市场。

大会期间,NVIDIA 与谷歌(Google)和微软(Microsoft)等行业领导者在 8 月 24 日(星期日)一起举办了一场“授课式”会议——探讨如何为数据中心设计以机柜为单位的新架构。

此外,NVIDIA 专家还在四场会议和一场课程中详细介绍了:

NVIDIA 网络(包括NVIDIA ConnectX-8 SuperNIC)支持机整柜和数据中心规模的 AI 逻辑推理。(由NVIDIA 负责网卡和 SoC 的首席架构师 Idan Burstein 主讲)

由NVIDIA Blackwell 架构所支持的神经渲染的进步及推理能力的巨大飞跃——从而提供更高级别的图形和仿真功能。(由 NVIDIA 系统架构高级总监 Marc Blackstein 主讲)

基于硅光技术的NVIDIA CPO 交换机——采用光速光纤取代铜缆,可更快地传送信息,并且功耗更低,助力打造高效、高性能的十亿瓦级 AI 工厂。本次演讲还将重点介绍 NVIDIA Spectrum-XGS 以太网,这是一种新的跨地域扩展技术,可将多个分布式数据中心组合为 AI 超级工厂。(由 NVIDIA 网络高级副总裁 Gilad Shainer 主讲)

NVIDIA GB10 超级芯片成为NVIDIA DGX Spark台式超级计算机的引擎。(由 NVIDIA 高级杰出工程师 Andi Skende 主讲)

这些都是 NVIDIA 的最新技术如何通过加速推理来推动各个领域和各种规模的 AI 创新的一部分。

NVIDIA 网络促进了大规模的 AI 创新

AI 逻辑推理指的是 AI 系统可以通过多个 AI 推理步骤来分析和解决复杂问题——这需要机柜级规模的性能,以便高效地提供最佳的用户体验。

如今,为 AI 工作负载提供动力的数据中心里,网络如同中枢神经系统一样——将所有组件(服务器、存储设备和其他硬件)统一连接成一个强大的计算单元。

Burstein 在 Hot Chips 大会上的报告将会深入探讨 NVIDIA 网络技术(特别是 NVIDIA ConnectX-8 SuperNIC)如何实现高速、低延迟的多 GPU 通信,并在大规模场景下提供领先的 AI 逻辑推理性能。

NVIDIA ConnectX-8 SuperNIC

作为 NVIDIA 网络平台的一部分,NVIDIA NVLink、NVLink Switch 和 NVLink Fusion 提供了纵向扩展(scale-up)连接——能够在服务器内部及跨服务器连接 GPU 和计算元件,实现超低延迟、高带宽的数据交换。

NVIDIA Spectrum-X 以太网提供了横向扩展(scale-out) 来连接整个集群,能够快速将海量数据集导入到 AI 模型中,并编排数据中心内的 GPU 到 GPU 的通信。Spectrum-XGS跨区域扩展(scale-across)技术将 Spectrum-X 以太网的卓越性能和扩展能力扩展到多个分布式数据中心,组成十亿瓦级的智能 AI 超级工厂。

NVIDIA Spectrum-XGS 以太网连接多个分布式 AI 数据中心

作为 Spectrum-X Ethernet 的核心,CPO 交换机推升了大规模 AI 基础设施的性能和效率极限。Gilad Shainer 将在其演讲中详细介绍这一内容。

NVIDIA Blackwell NVL72——单机柜百亿亿级(Exascale)计算机——配备了 36 个 NVIDIA 超级芯片,其中每组芯片包含 2 个 NVIDIA GPU 和 1 个 NVIDIA CPU,通过目前最大的 NVLink 域实现互连。NVLink 交换机为 AI 和高性能计算工作负载提供每秒 130 TB/s的低延迟 GPU 通信。

NVIDIA 单机柜系统

NVIDIA Blackwell 架构,在推理性能方面实现了巨大的跃进。

NVIDIA GeForce RTX 5090 D v2 GPU(同样由 Blackwell 提供支持)——通过 NVIDIA DLSS 4 技术将当今游戏中的 AI 性能翻倍。

它还能够为游戏添加神经网络渲染功能,提供至高可达 10 倍的性能提升、10 倍的存储空间扩展,并将设计周期缩短 10 倍,有助于增强计算机图形和仿真中的逼真度。这不但在低功耗的情况下提供了流畅、灵敏的视觉体验,而且大大提升了游戏角色和特效的拟真度。

NVIDIA CUDA 是全球应用最广泛的计算基础设施,让用户能在任何地方利用 NVIDIA Blackwell 部署与运行AI模型。

全球已有数亿台的 GPU 运行 CUDA,从NVIDIA Blackwell 架构规模的系统到搭载 GeForce RTX 和 NVIDIA RTX PRO 的 PC 和工作站,包括由 NVIDIA GB10 提供支持的 NVIDIA DGX Spark(在 Skende 的会议中讨论过的)也即将发布。

算法到 AI 超级计算机

对大语言模型(LLM)的全面优化

NVIDIA DGX Spark

DGX Spark 用小巧的机身提供了强大的性能和功能,使开发者、研究人员、数据科学家和学生能够在桌面上突破生成式 AI 的界限,加速各行业的工作负载。

作为 NVIDIA Blackwell 平台的一部分,DGX Spark 支持 NVFP4,这是一种低精度数值格式,用于实现高效的代理式 AI 推理,特别是针对大语言模型(LLM)。

通过开源协作推动推理创新

NVIDIA 通过加速各种开放源代码库和框架,来加速和优化 LLM 和分布式推理的 AI 工作负载。这些平台包括NVIDIA TensorRT-LLM、NVIDIA Dynamo、TileIR、Cutlass、NVIDIA 集合通信库和 NIXL——它们都已被集成到数百万个工作流中。

为了支持开发者们能够使用自己的框架,NVIDIA 已与顶级开放框架供应商合作,为 FlashInfer、PyTorch、SGLang、vLLM 等提供模型优化。

此外,NVIDIA NIM 微服务也可用于 OpenAI 的 gpt-oss 和 Llama 4 等热门开放模型,使开发者能够轻松地在其喜欢的基础设施上,像运行自托管模型一样灵活安全地操作托管应用程序界面。

参与 NVIDIA 在 Hot Chips 大会上的活动,以了解推理和加速计算的最新进展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 以太网
    +关注

    关注

    41

    文章

    5924

    浏览量

    179546
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109098
  • AI
    AI
    +关注

    关注

    89

    文章

    38121

    浏览量

    296683

原文标题:Hot Chips 大会热门主题:各种规模的推理、网络和 AI 创新都源于 NVIDIA

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2025天马微电子全球创新大会隆重举行

    11月18日, 以“创见·新境”为主题的2025天马微电子全球创新大会(TIC 2025武汉隆重举办。
    的头像 发表于 11-21 16:53 671次阅读

    2025奇瑞全球创新大会即将召开

    还将举办开阳全球星火创新大赛、奇瑞国际技术之夜、造型日、国际生态大会等一系列活动,全方位展示奇瑞电动化、网联化、智能化、共享化等前瞻领域的
    的头像 发表于 10-17 14:17 373次阅读

    NVIDIA AI网络闪耀2025云栖大会

    2025 云栖大会于 9 月 24 日至 9 月 26 日举办,NVIDIA 作为大会巅峰合作伙伴参与 2025 云栖
    的头像 发表于 10-13 11:19 806次阅读

    NVIDIA精彩亮相2025云栖大会

    2025 云栖大会于 9 月 26 日圆满落幕。NVIDIA 以“洞见 AI 未来”为主题参加云栖,分享和展示了软硬件协同的全栈 AI 优化,以及具身智能、汽车、制造、专业可视化等领域
    的头像 发表于 10-13 11:01 822次阅读

    华为兆瓦超充荣获2025全球新能源汽车创新技术

    近日,2025世界新能源汽车大会公布了2025“全球新能源汽车前沿及创新技术”评选结果,华为数字能源技术有限公司“基于全液冷和功率池化架构的
    的头像 发表于 10-10 17:53 1034次阅读

    村田中国亮相2025开放计算创新技术大会:以创新技术驱动智能化发展

    2025年8月7日,中国北京——今日,全球居先的综合电子元器件制造商村田中国(以下简称“村田”) 亮相2025开放计算创新技术大会(OCP China Day),围绕
    的头像 发表于 08-07 16:09 648次阅读
    村田中国亮相<b class='flag-5'>2025</b>开放计算<b class='flag-5'>创新技术</b><b class='flag-5'>大会</b>:以<b class='flag-5'>创新技术</b>驱动智能化发展

    是德科技邀您相约2025开放计算创新技术大会

    2025开放计算创新技术大会将于8月7日北京国际饭店举办,围绕“开放变革”主题,分享开放计算技术创新
    的头像 发表于 08-01 16:41 1329次阅读

    康尼新能源亮相2025走进小鹏新技术展示交流会

    近日,"2025走进小鹏新技术展示交流会"广州小鹏汽车总部盛大启幕。本次交流会汇聚了产业链上下游众多领军企业,通过前沿技术
    的头像 发表于 06-28 16:20 1064次阅读

    NVIDIAICRA 2025展示多项最新研究成果

    亚特兰大举行的国际机器人与自动化大会 (ICRA) 上,NVIDIA 展示了其在生成式 AI、仿真和自主操控领域的多项研究成果。
    的头像 发表于 06-06 14:56 1115次阅读

    回顾2025蓝牙亚洲大会 蓝牙创新技术引领连接新纪元

    创新技术连接智能未来   2025蓝牙亚洲大会在深圳会展中心(福田)5号馆于2025年5月23日圆满闭幕。本次
    的头像 发表于 05-30 19:59 1471次阅读
    回顾<b class='flag-5'>2025</b>蓝牙亚洲<b class='flag-5'>大会</b>  蓝牙<b class='flag-5'>创新技术</b>引领连接新纪元

    2025 NVIDIA创业企业展示澳门站圆满收官

    澳门站首次作为 NVIDIA 创业企业展示分站城市,聚焦 AI 智能体、物理 AI 和机器人等前沿技术,更有 NVIDIA Omniverse、NV
    的头像 发表于 05-29 14:12 781次阅读

    2025 NVIDIA创业企业展示上海站圆满收官

    近日,2025 NVIDIA 创业企业展示——上海站在上海创新创意设计研究院圆满举办。
    的头像 发表于 05-20 16:31 759次阅读

    2025年联想创新科技大会即将开幕

    正式定档!2025年联想创新科技大会(Tech World),将于5月7日在上海世博中心精彩开幕。大会以“Smarter AI for all 让AI成为创新生产力”为主题,将聚焦混合
    的头像 发表于 04-15 15:58 723次阅读

    天马微电子亮相2025国际显示技术大会

    3月22-25日,2025 国际显示技术大会(ICDT 2025厦门佰翔会展中心盛大举行。作
    的头像 发表于 03-25 10:11 1192次阅读

    MediaTek将于MWC 2025展示创新技术

    MediaTek 将于 2025 年世界移动通信大会(MWC 2025)第三展厅 3D10 展台展示多项无线通信迈向下一代 6G 的重要技术
    的头像 发表于 02-27 18:04 1817次阅读