国产来袭！2nm AI GPU？-电子发烧友网

电子发烧友网报道（文/黄山明）在当前，GPU已经从最初的游戏图形渲染工具，逐渐演变为智能时代的核心。简单来说，如果没有GPU，今天我们所熟知的ChatGPT、自动驾驶、AI绘画等技术根本无法在合理的时间和成本内实现。

近日，据媒体报道，上海棣山科技有限公司（以下简称“棣山科技”）对外披露其2nm高端AI GPU芯片最新研发进展。据悉，该公司自主攻关的这款芯片已达到国际前沿设计水平，目前核心研发工作仍处于原型验证关键阶段。

国产2nm高端AI GPU

公开资料显示，棣山科技成立于2021年，定位为专注高端半导体芯片研发与制造的高新技术企业，业务包括CMOS图像传感器、MEMS陀螺传感器以及高算力AI GPU。

从此次该公司公布的AI GPU芯片来看，采用2nm工艺，FinFET/GAA混合制程加上Chiplet异构集成，搭载公司自主研发的棣山智核（DS-Core），核心晶体管数量达1700亿颗，芯片面积约800mm²，采用2.5D CoWoSL封装，拥有1700亿晶体管。

报道称，经多轮严谨仿真测试验证，该芯片算力表现突出，其中FP32单精度算力可达50 TFLOPS，FP16半精度算力达100 TFLOPS，FP4低精度算力高达400 TFLOPS，可灵活适配不同精度需求的人工智能大模型训练、推理等高端算力场景。

同时能效比较上一代产品提升40%，典型功耗控制在350W以内，每瓦算力可达142 GFLOPS，实现性能与能效的平衡。

并且研发团队还攻克了HBM封装互联、超低延迟片间通信（<0.25ns/mm）、微流道高效热管理三大核心技术瓶颈，其中搭载的HBM4内存单颗容量达48GB，引脚速率超11Gb/s，内存带宽可达3.2TB/s，相较上一代HBM3E带宽提升约2.5倍，可满足大模型训练时海量数据的高速传输需求。

还采用了微流道热管理技术，宣称热失控风险降低68%，芯片温度控制在85℃以下，以帮助解决2nm高密度芯片的发热问题。还支持NVLink 6兼容互连协议，单链路达1.6TB/s，能兼容主流CUDA生态。

这也是棣山科技在2025年首款自研2nm AI GPU原型芯片完成设计的第三阶段，但值得注意的是，截至目前为止，这颗芯片仍未进入正式流片阶段，未完成从设计到实体芯片的关键跨越。

主要原因在于受到先进制程代工、EDA工具适配、量产良率爬坡等行业共性挑战的影响，棣山科技原计划在2025年底完成流片前验证，到2026年Q1实现量产，但这一目标显然已经延后。

从行业的常规流程来看，高端AI芯片从原型验证到流片测试，再到量产良率提升，最后到客户导入及规模化商用，通常需要1-2年的时间。即便是英伟达的产品迭代周期也在10-24个月，例如从Hopper架构到Blackwell架构也经历了约2年的研发和验证周期。这意味着这颗国产AI GPU，想要实现量产，至少也需要等待2028年，并且还有几个巨大的难题需要解决。

PPT造芯？

尽管对于国内企业推出的高端AI GPU感到振奋，但理论和实际往往有着巨大的区别。目前棣山科技的这颗2nm AI GPU仍然存在于设计阶段，但问题在于当前全球公开量产最先进制程掌握在台积电/三星手中，2nm工艺在业内仍处于试产阶段，并且EDA工具、IP授权、关键工艺模块都受到了严格的出口管制。

尤其是EDA，目前支持GAA的最新版EDA软件早已对华禁止出口，而2nm工艺涉及复杂的量子效应和物理场分析，没有Synopsys或Cadence的顶级工具支持，纯靠国产EDA或旧版工具设计出1700亿晶体管的复杂芯片，成功率极低。

而在国内的公开信息中，没有任何成规模的2nm产线公开宣布投产，那么棣山科技的这颗芯片要如何进行制造呢？

并且Chiplet、2.5D/3D 封装（CoWoSL等）虽然国内有布局，但成熟度与台积电差距仍较大。棣山科技在这种情况下，能否拿到台积电的2nm产能？

在没有公开技术路线和第三方验证的情况下，便宣称其“2nm AI GPU已达到国际前沿设计水平”，这一点值得商榷。

另一方面，棣山科技宣称使用HBM4显存，带宽达3.2TB/s，但HBM4目前主要由SK海力士、三星和美光垄断，高端HBM显存属于美国对华出口管制的重点对象。国产HBM产业链虽然在发展，但要在2026年量产高性能HBM4，技术难度极高，目前尚未有成熟的公开量产消息。

此外，NVLink是英伟达的专有互连技术，公开资料中各代协议和带宽都有明确版本，但是NVLink 6兼容在公开信息里几乎没有什么先例，更多是面向内部的生态。即使真有合作或者授权，通常也会在英伟达官方渠道或合作伙伴名单中看到痕迹，但这里面并未有棣山科技的身影。

至于CUDA兼容，本身就可以通过自己的编译器/中间层实现，但真正好用、性能无损地跑主流框架和模型，需要大量工程和生态投入。

国内目前公开的国产GPU宣布CUDA兼容的很多，但真正在生产环境大规模替代英伟达的案例极少，更多是能跑，但是迁移成本很高。

也就是说，目前棣山科技所公布的这款产品，只是一个早期芯片项目，用作纸面设计、架构研究和仿真验证，是完全合理的。

但是将2nm/GAA/HBM4/NVLink 6这种级别的指标，在未流片阶段就大规模对外宣传，很容易误导外界以为很快能量产，这与实际技术成熟度严重脱节。

并且令人疑惑的是，天眼查显示公司参保人数为0（2024年报），即便后来有扩张，也说明团队规模和项目体量未必能够支撑2nm AI GPU 这种顶级工程的快速推进。

总结

如果从物理定律上来看，这颗芯片是可能的，但目前产品还主要停留在设计阶段，尚无第三方验证的实物与测试结果。它更像是一个展示技术的产品，对外披露国内企业在架构设计上的能力。但从现实角度来看，目前并不适合将其当做接近量产的产品，更不要基于这些宣传来做重大商业决策。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
28

文章
5339

浏览量
136287
AI芯片

AI芯片

+关注

关注
17

文章
2187

浏览量
36896
国产替代

国产替代

+关注

关注
0

文章
331

浏览量
2681

搜索历史

国产来袭！2nm AI GPU？

评论