0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国产来袭!2nm AI GPU?

Simon观察 来源:电子发烧友网 作者:黄山明 2026-04-15 07:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/黄山明)在当前,GPU已经从最初的游戏图形渲染工具,逐渐演变为智能时代的核心。简单来说,如果没有GPU,今天我们所熟知的ChatGPT、自动驾驶AI绘画等技术根本无法在合理的时间和成本内实现。

近日,据媒体报道,上海棣山科技有限公司(以下简称“棣山科技”)对外披露其2nm高端AI GPU芯片最新研发进展。据悉,该公司自主攻关的这款芯片已达到国际前沿设计水平,目前核心研发工作仍处于原型验证关键阶段。

国产2nm高端AI GPU

公开资料显示,棣山科技成立于2021年,定位为专注高端半导体芯片研发与制造的高新技术企业,业务包括CMOS图像传感器MEMS陀螺传感器以及高算力AI GPU。

从此次该公司公布的AI GPU芯片来看,采用2nm工艺,FinFET/GAA混合制程加上Chiplet异构集成,搭载公司自主研发的棣山智核(DS-Core),核心晶体管数量达1700亿颗,芯片面积约800mm²,采用2.5D CoWoSL封装,拥有1700亿晶体管。

报道称,经多轮严谨仿真测试验证,该芯片算力表现突出,其中FP32单精度算力可达50 TFLOPS,FP16半精度算力达100 TFLOPS,FP4低精度算力高达400 TFLOPS,可灵活适配不同精度需求的人工智能大模型训练、推理等高端算力场景。

同时能效比较上一代产品提升40%,典型功耗控制在350W以内,每瓦算力可达142 GFLOPS,实现性能与能效的平衡。

并且研发团队还攻克了HBM封装互联、超低延迟片间通信(<0.25ns/mm)、微流道高效热管理三大核心技术瓶颈,其中搭载的HBM4内存单颗容量达48GB,引脚速率超11Gb/s,内存带宽可达3.2TB/s,相较上一代HBM3E带宽提升约2.5倍,可满足大模型训练时海量数据的高速传输需求。

还采用了微流道热管理技术,宣称热失控风险降低68%,芯片温度控制在85℃以下,以帮助解决2nm高密度芯片的发热问题。还支持NVLink 6兼容互连协议,单链路达1.6TB/s,能兼容主流CUDA生态。

这也是棣山科技在2025年首款自研2nm AI GPU原型芯片完成设计的第三阶段,但值得注意的是,截至目前为止,这颗芯片仍未进入正式流片阶段,未完成从设计到实体芯片的关键跨越。

主要原因在于受到先进制程代工、EDA工具适配、量产良率爬坡等行业共性挑战的影响,棣山科技原计划在2025年底完成流片前验证,到2026年Q1实现量产,但这一目标显然已经延后。

从行业的常规流程来看,高端AI芯片从原型验证到流片测试,再到量产良率提升,最后到客户导入及规模化商用,通常需要1-2年的时间。即便是英伟达的产品迭代周期也在10-24个月,例如从Hopper架构到Blackwell架构也经历了约2年的研发和验证周期。这意味着这颗国产AI GPU,想要实现量产,至少也需要等待2028年,并且还有几个巨大的难题需要解决。

PPT造芯?

尽管对于国内企业推出的高端AI GPU感到振奋,但理论和实际往往有着巨大的区别。目前棣山科技的这颗2nm AI GPU仍然存在于设计阶段,但问题在于当前全球公开量产最先进制程掌握在台积电/三星手中,2nm工艺在业内仍处于试产阶段,并且EDA工具、IP授权、关键工艺模块都受到了严格的出口管制。

尤其是EDA,目前支持GAA的最新版EDA软件早已对华禁止出口,而2nm工艺涉及复杂的量子效应和物理场分析,没有Synopsys或Cadence的顶级工具支持,纯靠国产EDA或旧版工具设计出1700亿晶体管的复杂芯片,成功率极低。

而在国内的公开信息中,没有任何成规模的2nm产线公开宣布投产,那么棣山科技的这颗芯片要如何进行制造呢?

并且Chiplet、2.5D/3D 封装(CoWoSL等)虽然国内有布局,但成熟度与台积电差距仍较大。棣山科技在这种情况下,能否拿到台积电的2nm产能?

在没有公开技术路线和第三方验证的情况下,便宣称其“2nm AI GPU已达到国际前沿设计水平”,这一点值得商榷。

另一方面,棣山科技宣称使用HBM4显存,带宽达3.2TB/s,但HBM4目前主要由SK海力士、三星和美光垄断,高端HBM显存属于美国对华出口管制的重点对象。国产HBM产业链虽然在发展,但要在2026年量产高性能HBM4,技术难度极高,目前尚未有成熟的公开量产消息。

此外,NVLink是英伟达的专有互连技术,公开资料中各代协议和带宽都有明确版本,但是NVLink 6兼容在公开信息里几乎没有什么先例,更多是面向内部的生态。即使真有合作或者授权,通常也会在英伟达官方渠道或合作伙伴名单中看到痕迹,但这里面并未有棣山科技的身影。

至于CUDA兼容,本身就可以通过自己的编译器/中间层实现,但真正好用、性能无损地跑主流框架和模型,需要大量工程和生态投入。

国内目前公开的国产GPU宣布CUDA兼容的很多,但真正在生产环境大规模替代英伟达的案例极少,更多是能跑,但是迁移成本很高。

也就是说,目前棣山科技所公布的这款产品,只是一个早期芯片项目,用作纸面设计、架构研究和仿真验证,是完全合理的。

但是将2nm/GAA/HBM4/NVLink 6这种级别的指标,在未流片阶段就大规模对外宣传,很容易误导外界以为很快能量产,这与实际技术成熟度严重脱节。

并且令人疑惑的是,天眼查显示公司参保人数为0(2024年报),即便后来有扩张,也说明团队规模和项目体量未必能够支撑2nm AI GPU 这种顶级工程的快速推进。

总结

如果从物理定律上来看,这颗芯片是可能的,但目前产品还主要停留在设计阶段,尚无第三方验证的实物与测试结果。它更像是一个展示技术的产品,对外披露国内企业在架构设计上的能力。但从现实角度来看,目前并不适合将其当做接近量产的产品,更不要基于这些宣传来做重大商业决策。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5339

    浏览量

    136287
  • AI芯片
    +关注

    关注

    17

    文章

    2187

    浏览量

    36896
  • 国产替代
    +关注

    关注

    0

    文章

    331

    浏览量

    2681
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    马斯克:要建一座2nm芯片厂,能在里面“抽雪茄、吃汉堡”

    电子发烧友网报道(文/李弯弯)在AI时代,数据量呈爆炸式增长,对计算能力的需求也与日俱增。2nm工艺的芯片能够在更小的面积上集成更多的晶体管,从而大幅提升芯片的性能和能效。然而,2nm芯片的制造
    的头像 发表于 01-09 09:15 7544次阅读

    2nm“诸神之战”打响!性能飙升+功耗骤降,台积电携联发科领跑

    电子发烧友网报道(文/莫婷婷)2025年,2nm制程正式开启全球半导体“诸神之战”。就在近期,MediaTek(联发科)宣布,首款采用台积电 2 纳米制程的旗舰系统单芯片(SoC)已成功完成设计流片
    的头像 发表于 09-19 09:40 1.4w次阅读
      <b class='flag-5'>2nm</b>“诸神之战”打响!性能飙升+功耗骤降,台积电携联发科领跑

    AI需求飙升!ASML新光刻机直击2nm芯片制造,尼康新品获重大突破

    *1(L/S*2)高分辨率。扇出型面板级封装(FOPLP)技术为何会获得台积电、三星等代工大厂的青睐?比较传统的光刻机设备,尼康DSP-100的技术原理有何不同?能解决AI芯片生产当中的哪些痛点问题? 针对2nm、3
    的头像 发表于 07-24 09:29 8973次阅读
    <b class='flag-5'>AI</b>需求飙升!ASML新光刻机直击<b class='flag-5'>2nm</b>芯片制造,尼康新品获重大突破

    OrangePi RV2 深度技术评测:RISC-V AI融合架构的先行者

    :8核RISC-V,支持RVV 1.0 256-bit向量扩展 制程 :22nm(未见官方披露,据行业资料为22nm) CPU频率 :最高2.0 GHz AI算力 :CPU核内融合2
    发表于 03-03 20:19

    三星2nm良率提升至50%,2027年前实现晶圆代工业务盈利可期

    据报道,三星电子第一代2nm GAA制程(SF2)良率已稳定在50%,该数据也通过其量产的Exynos 2600处理器得到印证。
    的头像 发表于 01-19 18:16 3747次阅读

    2nm芯片量产狂欢下,一个被忽视的“测不准”危机

    三星2nm GAA芯片量产背后,隐藏“测不准”危机。原子级尺度下,量子隧穿、工艺波动等使芯片从“确定性”转向“概率性”,传统测试假设崩塌。测试面临测量精度不足、动态功耗管理复杂、信号完整性脆弱三重
    的头像 发表于 12-30 17:02 1225次阅读

    三星发布Exynos 2600,全球首款2nm SoC,NPU性能提升113%

    电子发烧友网综合报道 近日,三星电子正式发布其手机芯片Exynos 2600。这款芯片意义非凡,它不仅是三星首款2nm芯片,更是全球首款采用2纳米(2nm)全环绕栅极(GAA)工艺制造的智能手机系统
    的头像 发表于 12-25 08:56 9244次阅读
    三星发布Exynos 2600,全球首款<b class='flag-5'>2nm</b> SoC,NPU性能提升113%

    国产芯片真的 “稳” 了?这家企业的 14nm 制程,已经悄悄渗透到这些行业…

    最近扒了扒国产芯片的进展,发现中芯国际(官网链接:https://www.smics.com)的 14nm FinFET 制程已经不是 “实验室技术” 了 —— 从消费电子的中端处理器,到汽车电子
    发表于 11-25 21:03

    国产AI芯片真能扛住“算力内卷”?海思昇腾的这波操作藏了多少细节?

    最近行业都在说“算力是AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思昇腾910B,实测下来有点超出预期——7nm工艺下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    发表于 10-27 13:12

    全球首款2nm芯片被曝准备量产 三星Exynos 2600

    据外媒韩国媒体 ETNews 在9 月 2 日发文报道称全球首款2nm芯片被曝准备量产;三星公司已确认 Exynos 2600 将成为全球首款采用 2nm 工艺的移动 SoC 芯片,目前该芯片完成
    的头像 发表于 09-04 17:52 3017次阅读

    今日看点丨三星美国厂2nm产线运作;《人工智能生成合成内容标识办法》正式生效

    三星美国厂2nm 产线运作 美国2nm晶圆代工厂近期再添生力军,在特斯拉高阶主管亲自赴厂区督军下,原本暂缓的三星美国德州新厂2nm产线近期传出继续运作,业界已传出力拼明年2026年内量产目标。台积电
    发表于 09-02 11:26 2002次阅读

    今日看点:传台积电先进2nm芯片生产停用中国大陆设备;保时捷裁员约200人

    传台积电先进2nm芯片生产停用中国大陆设备   业内媒体报道,根据多位知情人士透露,台积电正在其最先进的2nm芯片工厂中停止使用中国大陆芯片制造设备,以避免美国可能采取的限制措施扰乱生产。 消息指出
    发表于 08-26 10:00 2848次阅读

    曝三星S26拿到全球2nm芯片首发权 三星获特斯拉千亿芯片代工大单

    我们来看看三星的最新消息: 曝三星S26拿到全球2nm芯片首发权 数码博主“刹那数码”爆料称,三星Exynos 2600芯片已进入质量测试阶段,计划在今年10月完成基于HPB(High
    的头像 发表于 07-31 19:47 2079次阅读

    算力存储:首款2nm定制SRAM来了!

    电子发烧友网综合报道,Marvell 美满电子当地时间 17 日宣布推出业界首款 2nm 定制 SRAM,可为 AI xPU 算力设备提供至高 6Gb(即 768MB)的高速片上缓存。Marvell
    的头像 发表于 06-21 00:57 7751次阅读

    台积电2nm良率超 90%!苹果等巨头抢单

    当行业还在热议3nm工艺量产进展时,台积电已经悄悄把2nm技术推到了关键门槛!据《经济日报》报道,台积电2nm芯片良品率已突破 90%,实现重大技术飞跃!
    的头像 发表于 06-04 15:20 1767次阅读