0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA与Google探讨AI模型的演进方向

NVIDIA英伟达 来源:NVIDIA英伟达 2026-04-03 10:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在 GTC 会场,观众座无虚席,两位计算领域最具影响力的领导人物,NVIDIA 首席科学家 Bill Dally,以及 Google DeepMind 与 Google Research 首席科学家 Jeff Dean 登台对话。他们的工作深刻塑造了大规模机器学习的发展轨迹。

这场对话与其说是传统座谈,不如说是一场深度学习的“即兴演奏会”,两位深入探讨了 AI 模型的演进方向,以及为何硬件架构如今已与 AI 的进步密不可分。

Dean 开场时回顾了模型能力的快速跃迁,尤其在如“数学和编程”等具备“可验证奖励”的领域。曾经令模型束手无策的任务,如今已能可靠地执行;基于智能体的工作流甚至能在数小时乃至数天内几乎无需人工干预的情况下自主运行。他强调,这一转变正在重塑 AI 系统的本质,使其从被动响应提示的工具,转变为“在后台持续运作的智能体”。

对此,Dally 表示,这种演进将延迟问题推至聚光灯下。推理速度成为智能体在大规模环境中推理、规划与迭代的首要设计约束。他解释道,当前大部分延迟并非来自计算本身,而是源于通信。每一层之间的数据传递、每一次片外访问、每比特在导线上的移动,都会带来时间与能耗成本。NVIDIA 的应对策略是推动架构向 Dally 所称的“光速”设计迈进:最大限度减少路由成本、消除排队等待,并缩短数据必须传输的物理距离。

在讨论能效时,这一“不要移动数据”的原则被反复提及。一次乘加运算可能仅耗几飞焦耳(极小的能量单位),但从外部存储器读取数据的能耗却可能高出数千倍。Dally 介绍了利用 SRAM 的局部性并探索堆叠式 DRAM 技术,通过将计算单元紧邻内存部署,从根本上改善这一能耗失衡。其目标不仅是降低能耗,更是在相同功耗下实现更高性能。

讨论还延伸到利用 AI 设计运行 AI 的芯片。Dally 举例说,如今强化学习系统能够在一夜之间生成标准单元库,即预设计、预验证且完整表征的基础逻辑模块集合;而基于 NVIDIA 设计历史训练的内部大语言模型,正帮助初级工程师掌握数十年的架构知识。这些系统并非取代人类设计师,而是增强他们的能力,压缩开发周期,并拓展值得探索的创新空间。

展望未来,两位演讲者不约而同地聚焦于同一个关键词:协同设计。突破性的进展将来自机器学习研究人员与系统架构师之间的紧密反馈循环。正如 Dean 所言,有时你在硅片上加入一个小型实验性功能,就可能带来巨大回报,硬件性能可因此实现“10 到 20 倍”的提升。

本场对话最终回归人本价值。教育、医疗与科学发现被一致视为 AI 能产生深远积极影响的领域,尤其是当系统变得个性化、具备上下文理解并持续学习的情况下。Dean 表示,“我认为 AI 在医疗领域的应用将极具变革性”。

如果台上这两位行业领导者所畅想的未来成真,那将不只是更快的模型运行在更好的硬件上,而将开启一个一个智能、能效与规模协同演进的全新计算时代。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110102
  • AI
    AI
    +关注

    关注

    91

    文章

    40982

    浏览量

    302533
  • 模型
    +关注

    关注

    1

    文章

    3811

    浏览量

    52257

原文标题:GTC2026 | 当 AI 遇见光速:NVIDIA Bill Dally 与 Google Jeff Dean 共话未来

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA 成立由全球领先 AI 实验室组成的 Nemotron Coalition,推动开放前沿模型发展

    新闻摘要: ● NVIDIA Nemotron Coalition 是模型构建者和 AI 实验室的首个此类全球合作项目,致力于通过共享专业知识、数据和计算来推进开放前沿基础模型的发展。
    的头像 发表于 03-17 11:14 282次阅读
    <b class='flag-5'>NVIDIA</b> 成立由全球领先 <b class='flag-5'>AI</b> 实验室组成的 Nemotron Coalition,推动开放前沿<b class='flag-5'>模型</b>发展

    NVIDIA 扩展开放模型系列,推动代理式、物理和医疗 AI 下一阶段发展

    新闻摘要: ●NVIDIA Nemotron 3 全模态理解模型 (Omni-understanding Models) 为 AI 智能体提供动力 ,使其能够实现自然对话、复杂推理和高级视觉能力
    的头像 发表于 03-17 09:18 490次阅读
    <b class='flag-5'>NVIDIA</b> 扩展开放<b class='flag-5'>模型</b>系列,推动代理式、物理和医疗 <b class='flag-5'>AI</b> 下一阶段发展

    NVIDIA Jetson模型赋能AI在边缘端落地

    开源生成式 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行 NVIDIA Nemotron、
    的头像 发表于 03-16 16:27 587次阅读
    <b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>模型</b>赋能<b class='flag-5'>AI</b>在边缘端落地

    NVIDIA推出代理式AI蓝图与电信推理模型

    借助全新开源大型电信模型NVIDIA Blueprint,电信运营商能够利用自有数据训练 AI 智能体,构建自主网络。
    的头像 发表于 03-06 17:37 3050次阅读

    NVIDIA推动面向数字与物理AI的开源模型发展

    NVIDIA 发布一系列涵盖语音、安全与辅助驾驶领域的全新 AI 工具,其中包括面向移动出行领域的行业级开源视觉-语言-动作推理模型(Reasoning VLA) NVIDIA DRI
    的头像 发表于 12-13 09:50 1520次阅读

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助
    的头像 发表于 12-01 09:25 1401次阅读

    NVIDIA DGX Spark助力构建自己的AI模型

    作为个人 AI 超级计算机,为世界各地的 AI 研究人员、数据科学家和学生提供 NVIDIA Grace Blackwell 平台的强大功能。
    的头像 发表于 11-21 09:25 1513次阅读
    <b class='flag-5'>NVIDIA</b> DGX Spark助力构建自己的<b class='flag-5'>AI</b><b class='flag-5'>模型</b>

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    NVIDIA 利用全新开源模型与仿真库加速机器人研发进程

    。   借助全新的 NVIDIA Cosmos 世界基础模型,开发者可以生成多样化数据,从而大规模加速物理 AI 模型的训练。   来自斯 坦福大学、苏黎世
    的头像 发表于 09-30 09:52 3200次阅读
    <b class='flag-5'>NVIDIA</b> 利用全新开源<b class='flag-5'>模型</b>与仿真库加速机器人研发进程

    什么是AI模型的推理能力

    NVIDIA 的数据工厂团队为 NVIDIA Cosmos Reason 等 AI 模型奠定了基础,该模型近日在 Hugging Face
    的头像 发表于 09-23 15:19 1448次阅读

    使用NVIDIA NVLink Fusion技术提升AI推理性能

    本文详细阐述了 NVIDIA NVLink Fusion 如何借助高效可扩展的 NVIDIA NVLink scale-up 架构技术,满足日益复杂的 AI 模型不断增长的需求。
    的头像 发表于 09-23 14:45 1100次阅读
    使用<b class='flag-5'>NVIDIA</b> NVLink Fusion技术提升<b class='flag-5'>AI</b>推理性能

    【下载】5G/6G 公开资料整理|AI/ML、NTN、ISAC 等方向(持续更新)

    大家好!我们把近期从公开渠道收集并整理的一批 5G/6G 学习资料做了系统分类,便于大家查阅与检索。资料涵盖多个热点方向,包括但不限于:- AI/ML 在无线通信与网络优化中的应用(大模型、RRM
    发表于 09-08 16:07

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    是展望未来的AGI芯片,并探讨相关的发展和伦理话题。 各章的目录名称如下: 第1章 大模型浪潮下,AI芯片的需求与挑战免费 第2章 实现深度学习AI芯片的创新方法与架构 第3章
    发表于 09-05 15:10

    NVIDIA通过全新 Omniverse库、Cosmos物理AI模型AI计算基础设施,为机器人领域开启新篇章

    NVIDIA 通过全新 Omniverse 库、Cosmos 物理 AI 模型AI 计算基础设施,为机器人领域开启新篇章   · 全新 NVID
    的头像 发表于 08-12 11:29 1978次阅读
    <b class='flag-5'>NVIDIA</b>通过全新 Omniverse库、Cosmos物理<b class='flag-5'>AI</b><b class='flag-5'>模型</b>及<b class='flag-5'>AI</b>计算基础设施,为机器人领域开启新篇章

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 开源其物理 AI 平台 NVIDIA Cosmos 中的关键模型——NVIDIA Cosmos Reason-1-7B。
    的头像 发表于 07-09 10:17 1001次阅读