英伟达失守中国区！推理需求爆发，国产GPU抢滩上市-电子发烧友网

电子发烧友网报道（文/莫婷婷）近日，上海证券交易所公告显示，沐曦集成电路（上海）股份有限公司（简称“沐曦”）将在10月24日迎来科创板上市委审议。这家成立于2020年的国产GPU新锐，估值已达210亿元。而在此前，另一家国产GPU公司摩尔线程已于9月26日率先过会。这两大GPU企业接连冲刺IPO，背后是中国AI算力需求爆发式增长与全球供应链格局重塑的多重驱动。

AI推理算力需求爆发，算力市场格局生变
大模型从训练走向规模化推理落地，AI算力的需求结构也在发生变化。云天励飞副总裁罗忆指出，当下国产推理芯片需求已超过训练芯片，进一步带来全球Token调用量飙升。在2024年年初至今的一年半时间里，整个产业上的消耗Token的客户数量增长了300余倍，而海外OpenRouter平台的Token调用量在过去12个月中更是激增35倍。云天励飞预测，到2030年，全球每日消耗的Token数量或将超过当前水平的一万倍。

在需求结构变化的过程中，对算力的要求除了峰值性能，还强调能效比、成本效益和部署灵活性。这一趋势在DeepSeek、Qwen等大模型的部署实践中尤为明显。

摩尔线程副总裁王华在近期技术分享中给出一组数据：以英伟达H100集群为例，DeepSeek 模型算力需求约3.4×10²⁴flops， GPT-4算力需求达 10²⁵flops，且在训练天数也随之变化，在千卡集群中的训练天数分别为 97 天、602天，万卡集群需 13 天、80 天。在这个背景下，FP8（8位浮点）混合精度训练已成为提升大模型训练效率的关键技术。他指出：从FP32 到 FP16 再到 FP8，精度每下降一半，算力可提升一倍。

与此同时，大规模算力集群的可靠性与管理效率也成为关键挑战。王华强调：“万卡、十万卡级集群的训练已无法依赖纯实验验证，必须通过模拟工具（如摩尔线程开源的Simumax）和全生命周期管理机制来保障稳定性。”这表明，算力竞争已从单一芯片性能的比拼，转向“芯片+软件栈+集群管理”的系统级能力较量。

在算力需求暴涨的背景下，国内AI芯片企业迎来市场发展机会。罗忆表示，目前国产算力芯片与海外芯片的实际使用占比已基本达到五五开，预计在不久的将来将超过海外芯片。

从全球市场来看，AI芯片由英伟达和AMD等国际巨头垄断。在国内市场，根据不同的技术路线可以分为通用型计算架构（GPU）芯片设计企业沐曦、摩尔线程、海光信息、天数智芯、壁仞科技等，以及专用型计算架构（ASIC/DSA）芯片设计企业华为海思、寒武纪、昆仑芯、燧原科技等。

受美国高性能GPU/AI芯片出口管制与国内国产化发展等因素影响，海外厂商在中国市场的份额呈现明显下降趋势。特别是英伟达在经历A100、H100被禁，再到H20被曝存在安全问题后，在华市场逐渐失守。黄仁勋在近日表示，“受美国政府出口管制影响，英伟达在中国AI市场的份额已大幅下滑，从95%跌至0%”。

国产AI芯片公司在国内市场、AI算力的需求结构等变化中迎来了历史性的发展窗口，以不同技术路径切入市场，国产GPU企业也逐渐崭露头角。

国产GPU加速上市，填补市场空白正当时
摩尔线程9月26日闪电过会后，沐曦将在10月24 日上会的消息也备受业内人士关注。在这个节点，沐曦正式对外发布首款全国产通用GPU——曦云C600，通过自研了GPGPU架构及指令集等，实现完全本土化，为其顺利上市带来强有力的技术背书和市场竞争力。

当前摩尔线程和沐曦的技术进展如何，为何选择此时上市？

从上述两家公司的官网可以看到，公司技术积累已逐渐步入收获期。以沐曦为例，公司的产品主要覆盖人工智能计算、通用计算和图形渲染三大领域，产品包括曦思N系列GPU（智算推理）、曦云C系列GPU（训推一体和通用计算），以及正在研发的曦彩G系列GPU（图形渲染）。

沐曦基于自主研发的GPU IP与统一的GPU计算和渲染架构，在通用性、单卡性能、集群性能及稳定性、生态兼容与迁移效率等方面具备较强的核心竞争力。例如上述提到的新品曦云C600基于自主IP，支持FP8多精度混合算力，兼容国际主流GPU生态（CUDA）的软件生态体系，具备易用性和可扩展性。

摩尔线程则基于自主研发的MUSA架构，率先实现了在单芯片架构上同时支持AI计算加速、图形渲染、物理仿真以及超高清视频处理所需计算能力的突破。摩尔线程已经成功自主研发并量产四代高性能GPU架构，并基于此推出了十余款高性能GPU加速卡与模组，以及D800计算服务器和KUAE智能计算集群等产品。凭借MTT S/X系列全功能GPU，原生支持FP64到FP8全精度算力，形成完整的软件生态。

其次，市场需求爆发，订单逐渐增加。摩尔线程在2022-2024年度及2025年1-6月，AI智算产品合计实现10.01亿元的收入。在今年上半年的前五大客户中，前三大客户均向其下了AI智算产品订单。沐曦在2025年1-3月营收已达3.2亿元，其中训推一体机系列GPU板卡就贡献了3.1亿元。

摩尔线程2025年上半年前五大客户情况（图源摩尔线程招股书）

此外，作为高研发投入的行业，资本助力是GPU芯片企业规模化发展的关键。企查查显示，自成立至今，沐曦已经完成了10次股权融资记录，投资方包括红杉资本、经纬创投、上海浦东引领区投资中心等。此次IPO，沐曦股份拟募资约39亿元、摩尔线程拟募资80亿元。

不少行业机构看好沐曦、摩尔股份的未来发展潜力。民生证券认为，国产GPU企业上市进程在不断加速，通过募资推动国产GPU在制程工艺、芯片架构、计算密度和能效比等方面不断迭代，缩小与国际领先水平的代差，更是代表国产GPU产业链正从技术追赶迈向生态构建，打造自主可控的国产算力产业链，国产算力有望全面崛起。

沐曦部分股权融资事件（图源企查查）

架构自研+生态兼容，国产GPU的技术拼图逐渐完善
那么，英伟达留下的市场空白有多大，沐曦、摩尔线程又有哪些技术积累？

英伟达在中国市场的份额下滑，为国产GPU创造了巨大的替代空间。英国皇家工程院院士郭毅曾在公开演讲时指出，中国云端AI芯片市场规模有望在2027年突破480亿美元，国产GPU市占率预计将超80%。

整个行业对国产GPU芯片的发展寄予高度期望，期待其在技术突破与生态构建的双重驱动下，迎来新的突破。

在技术路线上，沐曦采用了通用GPU架构，摩尔线程以自主研发的全功能GPU为核心，推出MUSA架构。全功能GPU是指具备功能完备性与精度完整性的GPU，在单一GPU芯片中集成了 AI 计算加速、图形渲染、物理仿真等多种能力，单一芯片支持FP64 Vector、FP8 Tensor、INT8 Tensor等不同计算精度，以满足GPU加速不同场景的计算需求。

更关键的是，国产GPU的崛起不仅是硬件替代，更是生态重构。GPU软件生态方面，英伟达于2006年推出的通用并行计算架构和编程模型CUDA经过多年积淀，CUDA生态具有强大粘性，如今整个人工智能计算的应用生态大多构建在 CUDA 的基础之上，自建生态绝非易事，因此国产厂商在自建生态的同时保持对 CUDA生态的兼容是最佳方案。

在这方面，沐曦推出MXMACA软件栈可兼容CUDA生态，软硬件的深度协同确保了公司产品性能的高效释放。摩尔线程自主研发的MUSA架构，能够最小化迁移成本，从芯片指令集级别对标并兼容国外主流产品，实现从芯片到软件，从AI、图形到科学计算的整体生态兼容。

沐曦的MXMACA、摩尔线程的MUSA生态，都在积极构建自主可控的软件栈，降低用户迁移门槛，从而快速切入市场。同时，通富微电、长电科技等产业链公司深度参与，正推动国产GPU从“单点突破”走向“全产业链协同”。业内消息指出，通富微电负责沐曦曦云C500系列芯片的封测。

可以期待的是，随着沐曦、摩尔线程等GPU芯片企业成功上市，资本与产业的双轮驱动将加速技术迭代，或将重塑全球AI竞争格局。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

推理

推理

+关注

关注
0

文章
9

浏览量
7427
英伟达

英伟达

+关注

关注
23

文章
4137

浏览量
99854

搜索历史

英伟达失守中国区！推理需求爆发，国产GPU抢滩上市

评论