英伟达揭下了芯片公司的标签-电子发烧友网

电子发烧友网报道（文/黄山明）日前，黄仁勋在GTC台北2026大会正式亮相，并围绕“驱动新一代AI的技术突破”展开，重点不再是单一的芯片，而是从云端到终端的全栈AI工厂解决方案。

对于全球AI相关从业者来看，黄仁勋此次在中国台北的演讲，关乎未来AI的发展方向。甚至在进一步告诉全球，英伟达已经不单单是芯片公司，而是升级成为了一家AI工业时代的基础设施公司。

代理式Agent已经到来

一开场，黄仁勋便强调，AI已经从单纯的生成式模型进化成为了能够自主感知、规划并执行复杂任务的“智能体”。目前全球有3000-4000万专业开发者以编程为生，GitHub上的应用AI编程的调用次数，从2023年的3亿次增长至2026年的前几个月的14亿次。

有趣的是，黄仁勋认为，在AI热潮下，软件工程师的数量实际上正在增加。因此市场中谈论因为AI而减少工作机会，完全是无稽之谈。

从产业角度来看，黄仁勋认为Token就是资产，甚至已经成为了获利的营收单位。如果AI公司想要创造更多利润，就需要生成更多的Token，建设更多的Token工厂。这也是为何如今算力需求急速攀升，因为全球都在建设AI工厂。

从“卖芯片”到“教别人造工厂”

在此次演讲中，黄仁勋正式发布了NVIDIA DSX™（Data Center Scale Systems）平台。如果说DGX是单台AI服务器，那么DSX就是整个AI工厂操作系统，把开源软件库、API、参考设计、加速计算平台和合作伙伴技术整合到一起，用于AI工厂的设计、部署、运营全生命周期。

简单来说，过去企业需要采购GPU、CPU、网络、存储等来自己组装，但现在英伟达可以直接售卖一个完整的AI工厂，包括Blackwell GPU集群、NVLink网络、Spectrum-X网络、存储系统、软件栈、Agent平台等。

显然，在黄仁勋的构想中，未来的企业采购的将不是GPU，而是一个可以直接生产Token的AI工厂。这实际上是在复制当年IBM卖大型机的模式，不过这次的对象变成了AI。

为Agent AI重做系统级计算

此次演讲中，黄仁勋还提到Vera Rubin架构已实现全面量产，与上一代Grace Blackwell平台相比，其大规模智能体吞吐量提高了10倍，每兆瓦推理吞吐量最高提升35倍。采用台积电第3代3nm制程与CoWoS-L封装，首次支持8层HBM4高带宽存储，Rubin GPU集成288GB HBM4，带宽22TB/s。

并凭借成熟的开源MGX设计，英伟达供应链生态系统的数百家合作伙伴正在30多个国家/地区的350多家工厂中加速Vera Rubin的生产，供应链规模达到了Grace Blackwell的两倍。2026年6月全面投产，Q3开始向大客户交付，秋季开始出货。

黄仁勋表示，Vera Rubin已经超越“推理芯片”范畴，是一整个代理式AI系统，没有线缆、没有软管、没有风扇，只有一块PCB把两侧连起来。过去需要两个小时完成的任务，如今只需要五分钟就能完成，并且可靠性“超乎想象”。

Vera Rubin是英伟达迄今为止规模最大的POD级平台，该平台将NVIDIA Vera Rubin NVL72系统、NVIDIA Vera CPU、NVIDIA Groq 3 LPX、NVIDIA Vera BlueField-4 STX存储和NVIDIA Spectrum-6 SPX以太网机架整合到一个完全集成的系统中。

此外，黄仁勋还提到了Vera CPU，称其是一款专为AI时代打造的CPU。代理式AI是没有耐心的，世界以纳秒计算，每次工具调用、数据访问都必须极低延迟，因此必须为AI时代重新设计CPU。

Vera CPU代理沙箱效能是x86 CPU的1.8倍，专为智能体AI和强化学习时代打造，提供最高单线程性能和每核带宽，可构建AI工厂，大规模扩展智能体AI。资料显示，Vera CPU采用台积电3nm工艺，热设计功耗450W，支持系统内存高达1.5TB，最高支持FP8精度。

此外，Vera CPU相比传统x86架构CPU，在实时流数据处理任务中实现了6倍的性能提升。具体表现为延迟从18毫秒降低至3毫秒，这在金融交易、高频数据处理等对延迟极度敏感的场景中具有革命性意义。

英伟达布局物理AI

值得注意的是，此次英伟达重点提到了Cosmos，英伟达官方对其的定义是面向智能汽车和机器人开发者的平台，整合了世界基础模型、高级分词器、护栏和加速数据处理/管理管道，用来更快地构建、评估、部署和模拟物理AI模型，同时降低现实世界测试与验证风险。

简单说，只要在Cosmos上输入文本、图像、视频、机器人传感器数据、运动轨迹等，就可以输出基于物理规律生成的虚拟世界视频、未来状态预测、合成数据等，这是专为机器人、自动驾驶等物理AI提供仿真环境、合成数据以及世界模型。

此次英伟达发布了英伟达Cosmos 3，定位明显升级，即全模态、混合Transformer架构，让其既是视觉语言模型，又是世界模型/视频基础模型，也可以作为世界动作模型主干网络。而搭建了这个云上平台，自然是为了彻底进入物理AI做准备。

因此在本次演讲的末尾，英伟达正式发布了面向Windows系统个人电脑的新款处理器RTX Spark，正式进军个人电脑芯片市场，目标直指英特尔在PC领域的垄断地位。

RTX Spark是一款面向AI+创作+游戏的Windows PC超级新品，采用台积电3nm工艺，由联发科合作的20核Grace CPU +英伟达Blackwell RTX GPU组成（6144 CUDA核心），AI性能达到1petaFLOP。

配备128GB统一内存，具备NVLink-C2C芯片级互联，把数据中心级互联技术带入PC。可在本地运行1200亿参数LLM，支持100万Token上下文。

同时，RTX Spark还可渲染超过90GB的3D场景，编辑12K 4:2:2视频，生成4K AI视频，并在1440P分辨率下以超过100帧每秒运行3A游戏。平台还将支持DLSS 4.5光线重建和RTX Video 4倍帧生成等新技术。

今年秋季起，戴尔、联想、华硕、惠普、微软 Surface、微星等品牌将推出RTX Spark笔记本与台式机。目前微软官方宣布推出Surface Laptop Ultra笔记本，将首发搭载英伟达RTX Spark处理器。

总结

显然，黄仁勋此次在中国台北的这次演讲，就是要宣告全球，英伟达已经不再是一家单纯的GPU公司，而是通过Vera Rubin、RTX Spark以及物理AI的全面布局，构建一个覆盖全场景的全栈AI计算帝国。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

cpu

cpu

+关注

关注
68

文章
11388

浏览量
226623
英伟达

英伟达

+关注

关注
23

文章
4135

浏览量
99852
黄仁勋

黄仁勋

+关注

关注
9

文章
125

浏览量
58941

搜索历史

英伟达揭下了芯片公司的标签

评论