电子发烧友网报道(文/黄山明)日前,黄仁勋在GTC台北2026大会正式亮相,并围绕“驱动新一代AI的技术突破”展开,重点不再是单一的芯片,而是从云端到终端的全栈AI工厂解决方案。
对于全球AI相关从业者来看,黄仁勋此次在中国台北的演讲,关乎未来AI的发展方向。甚至在进一步告诉全球,英伟达已经不单单是芯片公司,而是升级成为了一家AI工业时代的基础设施公司。
代理式Agent已经到来
一开场,黄仁勋便强调,AI已经从单纯的生成式模型进化成为了能够自主感知、规划并执行复杂任务的“智能体”。目前全球有3000-4000万专业开发者以编程为生,GitHub上的应用AI编程的调用次数,从2023年的3亿次增长至2026年的前几个月的14亿次。
有趣的是,黄仁勋认为,在AI热潮下,软件工程师的数量实际上正在增加。因此市场中谈论因为AI而减少工作机会,完全是无稽之谈。
从产业角度来看,黄仁勋认为Token就是资产,甚至已经成为了获利的营收单位。如果AI公司想要创造更多利润,就需要生成更多的Token,建设更多的Token工厂。这也是为何如今算力需求急速攀升,因为全球都在建设AI工厂。
从“卖芯片”到“教别人造工厂”
在此次演讲中,黄仁勋正式发布了NVIDIA DSX™(Data Center Scale Systems)平台。如果说DGX是单台AI服务器,那么DSX就是整个AI工厂操作系统,把开源软件库、API、参考设计、加速计算平台和合作伙伴技术整合到一起,用于AI工厂的设计、部署、运营全生命周期。
简单来说,过去企业需要采购GPU、CPU、网络、存储等来自己组装,但现在英伟达可以直接售卖一个完整的AI工厂,包括Blackwell GPU集群、NVLink网络、Spectrum-X网络、存储系统、软件栈、Agent平台等。
显然,在黄仁勋的构想中,未来的企业采购的将不是GPU,而是一个可以直接生产Token的AI工厂。这实际上是在复制当年IBM卖大型机的模式,不过这次的对象变成了AI。
为Agent AI重做系统级计算
此次演讲中,黄仁勋还提到Vera Rubin架构已实现全面量产,与上一代Grace Blackwell平台相比,其大规模智能体吞吐量提高了10倍,每兆瓦推理吞吐量最高提升35倍。采用台积电第3代3nm制程与CoWoS-L封装,首次支持8层HBM4高带宽存储,Rubin GPU集成288GB HBM4,带宽22TB/s。
并凭借成熟的开源MGX设计,英伟达供应链生态系统的数百家合作伙伴正在30多个国家/地区的350多家工厂中加速Vera Rubin的生产,供应链规模达到了Grace Blackwell的两倍。2026年6月全面投产,Q3开始向大客户交付,秋季开始出货。
黄仁勋表示,Vera Rubin已经超越“推理芯片”范畴,是一整个代理式AI系统,没有线缆、没有软管、没有风扇,只有一块PCB把两侧连起来。过去需要两个小时完成的任务,如今只需要五分钟就能完成,并且可靠性“超乎想象”。
Vera Rubin是英伟达迄今为止规模最大的POD级平台,该平台将NVIDIA Vera Rubin NVL72系统、NVIDIA Vera CPU、NVIDIA Groq 3 LPX、NVIDIA Vera BlueField-4 STX存储和NVIDIA Spectrum-6 SPX以太网机架整合到一个完全集成的系统中。
此外,黄仁勋还提到了Vera CPU,称其是一款专为AI时代打造的CPU。代理式AI是没有耐心的,世界以纳秒计算,每次工具调用、数据访问都必须极低延迟,因此必须为AI时代重新设计CPU。
Vera CPU代理沙箱效能是x86 CPU的1.8倍,专为智能体AI和强化学习时代打造,提供最高单线程性能和每核带宽,可构建AI工厂,大规模扩展智能体AI。资料显示,Vera CPU采用台积电3nm工艺,热设计功耗450W,支持系统内存高达1.5TB,最高支持FP8精度。
此外,Vera CPU相比传统x86架构CPU,在实时流数据处理任务中实现了6倍的性能提升。具体表现为延迟从18毫秒降低至3毫秒,这在金融交易、高频数据处理等对延迟极度敏感的场景中具有革命性意义。
英伟达布局物理AI
值得注意的是,此次英伟达重点提到了Cosmos,英伟达官方对其的定义是面向智能汽车和机器人开发者的平台,整合了世界基础模型、高级分词器、护栏和加速数据处理/管理管道,用来更快地构建、评估、部署和模拟物理AI模型,同时降低现实世界测试与验证风险。
简单说,只要在Cosmos上输入文本、图像、视频、机器人传感器数据、运动轨迹等,就可以输出基于物理规律生成的虚拟世界视频、未来状态预测、合成数据等,这是专为机器人、自动驾驶等物理AI提供仿真环境、合成数据以及世界模型。
此次英伟达发布了英伟达Cosmos 3,定位明显升级,即全模态、混合Transformer架构,让其既是视觉语言模型,又是世界模型/视频基础模型,也可以作为世界动作模型主干网络。而搭建了这个云上平台,自然是为了彻底进入物理AI做准备。
因此在本次演讲的末尾,英伟达正式发布了面向Windows系统个人电脑的新款处理器RTX Spark,正式进军个人电脑芯片市场,目标直指英特尔在PC领域的垄断地位。
RTX Spark是一款面向AI+创作+游戏的Windows PC超级新品,采用台积电3nm工艺,由联发科合作的20核Grace CPU +英伟达Blackwell RTX GPU组成(6144 CUDA核心),AI性能达到1petaFLOP。
配备128GB统一内存,具备NVLink-C2C芯片级互联,把数据中心级互联技术带入PC。可在本地运行1200亿参数LLM,支持100万Token上下文。
同时,RTX Spark还可渲染超过90GB的3D场景,编辑12K 4:2:2视频,生成4K AI视频,并在1440P分辨率下以超过100帧每秒运行3A游戏。平台还将支持DLSS 4.5光线重建和RTX Video 4倍帧生成等新技术。
今年秋季起,戴尔、联想、华硕、惠普、微软 Surface、微星等品牌将推出RTX Spark笔记本与台式机。目前微软官方宣布推出Surface Laptop Ultra笔记本,将首发搭载英伟达RTX Spark处理器。
总结
显然,黄仁勋此次在中国台北的这次演讲,就是要宣告全球,英伟达已经不再是一家单纯的GPU公司,而是通过Vera Rubin、RTX Spark以及物理AI的全面布局,构建一个覆盖全场景的全栈AI计算帝国。
对于全球AI相关从业者来看,黄仁勋此次在中国台北的演讲,关乎未来AI的发展方向。甚至在进一步告诉全球,英伟达已经不单单是芯片公司,而是升级成为了一家AI工业时代的基础设施公司。

代理式Agent已经到来
一开场,黄仁勋便强调,AI已经从单纯的生成式模型进化成为了能够自主感知、规划并执行复杂任务的“智能体”。目前全球有3000-4000万专业开发者以编程为生,GitHub上的应用AI编程的调用次数,从2023年的3亿次增长至2026年的前几个月的14亿次。

有趣的是,黄仁勋认为,在AI热潮下,软件工程师的数量实际上正在增加。因此市场中谈论因为AI而减少工作机会,完全是无稽之谈。
从产业角度来看,黄仁勋认为Token就是资产,甚至已经成为了获利的营收单位。如果AI公司想要创造更多利润,就需要生成更多的Token,建设更多的Token工厂。这也是为何如今算力需求急速攀升,因为全球都在建设AI工厂。
从“卖芯片”到“教别人造工厂”
在此次演讲中,黄仁勋正式发布了NVIDIA DSX™(Data Center Scale Systems)平台。如果说DGX是单台AI服务器,那么DSX就是整个AI工厂操作系统,把开源软件库、API、参考设计、加速计算平台和合作伙伴技术整合到一起,用于AI工厂的设计、部署、运营全生命周期。

简单来说,过去企业需要采购GPU、CPU、网络、存储等来自己组装,但现在英伟达可以直接售卖一个完整的AI工厂,包括Blackwell GPU集群、NVLink网络、Spectrum-X网络、存储系统、软件栈、Agent平台等。

显然,在黄仁勋的构想中,未来的企业采购的将不是GPU,而是一个可以直接生产Token的AI工厂。这实际上是在复制当年IBM卖大型机的模式,不过这次的对象变成了AI。
为Agent AI重做系统级计算
此次演讲中,黄仁勋还提到Vera Rubin架构已实现全面量产,与上一代Grace Blackwell平台相比,其大规模智能体吞吐量提高了10倍,每兆瓦推理吞吐量最高提升35倍。采用台积电第3代3nm制程与CoWoS-L封装,首次支持8层HBM4高带宽存储,Rubin GPU集成288GB HBM4,带宽22TB/s。
并凭借成熟的开源MGX设计,英伟达供应链生态系统的数百家合作伙伴正在30多个国家/地区的350多家工厂中加速Vera Rubin的生产,供应链规模达到了Grace Blackwell的两倍。2026年6月全面投产,Q3开始向大客户交付,秋季开始出货。

黄仁勋表示,Vera Rubin已经超越“推理芯片”范畴,是一整个代理式AI系统,没有线缆、没有软管、没有风扇,只有一块PCB把两侧连起来。过去需要两个小时完成的任务,如今只需要五分钟就能完成,并且可靠性“超乎想象”。

Vera Rubin是英伟达迄今为止规模最大的POD级平台,该平台将NVIDIA Vera Rubin NVL72系统、NVIDIA Vera CPU、NVIDIA Groq 3 LPX、NVIDIA Vera BlueField-4 STX存储和NVIDIA Spectrum-6 SPX以太网机架整合到一个完全集成的系统中。

此外,黄仁勋还提到了Vera CPU,称其是一款专为AI时代打造的CPU。代理式AI是没有耐心的,世界以纳秒计算,每次工具调用、数据访问都必须极低延迟,因此必须为AI时代重新设计CPU。

Vera CPU代理沙箱效能是x86 CPU的1.8倍,专为智能体AI和强化学习时代打造,提供最高单线程性能和每核带宽,可构建AI工厂,大规模扩展智能体AI。资料显示,Vera CPU采用台积电3nm工艺,热设计功耗450W,支持系统内存高达1.5TB,最高支持FP8精度。

此外,Vera CPU相比传统x86架构CPU,在实时流数据处理任务中实现了6倍的性能提升。具体表现为延迟从18毫秒降低至3毫秒,这在金融交易、高频数据处理等对延迟极度敏感的场景中具有革命性意义。
英伟达布局物理AI
值得注意的是,此次英伟达重点提到了Cosmos,英伟达官方对其的定义是面向智能汽车和机器人开发者的平台,整合了世界基础模型、高级分词器、护栏和加速数据处理/管理管道,用来更快地构建、评估、部署和模拟物理AI模型,同时降低现实世界测试与验证风险。

简单说,只要在Cosmos上输入文本、图像、视频、机器人传感器数据、运动轨迹等,就可以输出基于物理规律生成的虚拟世界视频、未来状态预测、合成数据等,这是专为机器人、自动驾驶等物理AI提供仿真环境、合成数据以及世界模型。
此次英伟达发布了英伟达Cosmos 3,定位明显升级,即全模态、混合Transformer架构,让其既是视觉语言模型,又是世界模型/视频基础模型,也可以作为世界动作模型主干网络。而搭建了这个云上平台,自然是为了彻底进入物理AI做准备。

因此在本次演讲的末尾,英伟达正式发布了面向Windows系统个人电脑的新款处理器RTX Spark,正式进军个人电脑芯片市场,目标直指英特尔在PC领域的垄断地位。
RTX Spark是一款面向AI+创作+游戏的Windows PC超级新品,采用台积电3nm工艺,由联发科合作的20核Grace CPU +英伟达Blackwell RTX GPU组成(6144 CUDA核心),AI性能达到1petaFLOP。
配备128GB统一内存,具备NVLink-C2C芯片级互联,把数据中心级互联技术带入PC。可在本地运行1200亿参数LLM,支持100万Token上下文。
同时,RTX Spark还可渲染超过90GB的3D场景,编辑12K 4:2:2视频,生成4K AI视频,并在1440P分辨率下以超过100帧每秒运行3A游戏。平台还将支持DLSS 4.5光线重建和RTX Video 4倍帧生成等新技术。
今年秋季起,戴尔、联想、华硕、惠普、微软 Surface、微星等品牌将推出RTX Spark笔记本与台式机。目前微软官方宣布推出Surface Laptop Ultra笔记本,将首发搭载英伟达RTX Spark处理器。
总结
显然,黄仁勋此次在中国台北的这次演讲,就是要宣告全球,英伟达已经不再是一家单纯的GPU公司,而是通过Vera Rubin、RTX Spark以及物理AI的全面布局,构建一个覆盖全场景的全栈AI计算帝国。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
cpu
+关注
关注
68文章
11388浏览量
226623 -
英伟达
+关注
关注
23文章
4135浏览量
99852 -
黄仁勋
+关注
关注
9文章
125浏览量
58941
发布评论请先 登录
相关推荐
热点推荐
豪言自家芯片比英伟达GPU强10倍,这家AI公司再获融资
的 “复仇者联盟” 正在硅谷悄然集结,他们创立的 MatX 公司刚刚完成 5 亿美元 B 轮融资,豪言要打造性能 10 倍于英伟达 GPU 的专用 AI 芯片,试图在通用
中国AI芯片市场:华为将占半壁江山,英伟达跌落,这家第二
2026年华为将占据中国AI芯片市场50%的份额,成为该领域的绝对领导者。 目前,英伟达(NVIDIA)以39%的市场份额位居中国AI芯片市场首位,华为以相近的份额紧随其后。
英伟达发布RTX Spark超级芯片
近日,英伟达GTC大会上,黄仁勋扔出了一颗重磅炸弹——RTX Spark超级芯片。这不是一张显卡,而是一颗把CPU、GPU和AI单元全部塞进同一块硅片的Arm SoC,搭载NVIDIA
突发!特朗普批准英伟达H200芯片对华出口,抽成25%
据最新消息,美国总统特朗普已批准英伟达向中国出口其H200人工智能芯片,但要求从销售额中抽取25%作为分成。这意味着英伟达在游说美国政府放宽
黄仁勋:英伟达AI芯片订单排到2026年 英伟达上季营收加速增长62%再超预期
AI芯片总龙头英伟达的财报终于带来了惊喜;英伟达公司发布财报数据显示,上季营收加速增长62%;再
英伟达下一代Rubin芯片已流片
继8月底英伟达透露Rubin架构芯片计划明年量产后,当地时间9月8日的高盛技术会议上,英伟达又谈到Rubin的进展。
英伟达被传暂停生产H20芯片 外交部回应
据外媒《the Information》在当地时间的8月21日下午爆料称,英伟达可能已经暂停生产H20芯片。据称,英伟达已正式下达指示给到供
央视专访英伟达创始人黄仁勋 黄仁勋:总感觉公司快倒闭了
》栏目播出了对英伟达公司创始人兼首席执行官黄仁勋的采访。在央视采访中,黄仁勋盛赞DeepSeek、华为,他客观的表示,中国的AI市场无论有没有英伟达
英伟达揭下了芯片公司的标签
评论