0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达失守中国区!推理需求爆发,国产GPU抢滩上市

Monika观察 来源:电子发烧友网 作者:莫婷婷 2025-10-22 09:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


电子发烧友网报道(文/莫婷婷)近日,上海证券交易所公告显示,沐曦集成电路(上海)股份有限公司(简称“沐曦”)将在10月24日迎来科创板上市委审议。这家成立于2020年的国产GPU新锐,估值已达210亿元。而在此前,另一家国产GPU公司摩尔线程已于9月26日率先过会。这两大GPU企业接连冲刺IPO,背后是中国AI算力需求爆发式增长与全球供应链格局重塑的多重驱动。

AI推理算力需求爆发,算力市场格局生变
大模型从训练走向规模化推理落地,AI算力的需求结构也在发生变化。云天励飞副总裁罗忆指出,当下国产推理芯片需求已超过训练芯片,进一步带来全球Token调用量飙升。在2024年年初至今的一年半时间里,整个产业上的消耗Token的客户数量增长了300余倍,而海外OpenRouter平台的Token调用量在过去12个月中更是激增35倍。云天励飞预测,到2030年,全球每日消耗的Token数量或将超过当前水平的一万倍。

在需求结构变化的过程中,对算力的要求除了峰值性能,还强调能效比、成本效益和部署灵活性。这一趋势在DeepSeek、Qwen等大模型的部署实践中尤为明显。

摩尔线程副总裁王华在近期技术分享中给出一组数据:以英伟达H100集群为例,DeepSeek 模型算力需求约3.4×10²⁴flops, GPT-4算力需求达 10²⁵flops,且在训练天数也随之变化,在千卡集群中的训练天数分别为 97 天、602天,万卡集群需 13 天、80 天。在这个背景下,FP8(8位浮点)混合精度训练已成为提升大模型训练效率的关键技术。他指出:从FP32 到 FP16 再到 FP8,精度每下降一半,算力可提升一倍。

与此同时,大规模算力集群的可靠性与管理效率也成为关键挑战。王华强调:“万卡、十万卡级集群的训练已无法依赖纯实验验证,必须通过模拟工具(如摩尔线程开源的Simumax)和全生命周期管理机制来保障稳定性。”这表明,算力竞争已从单一芯片性能的比拼,转向“芯片+软件栈+集群管理”的系统级能力较量。

在算力需求暴涨的背景下,国内AI芯片企业迎来市场发展机会。罗忆表示,目前国产算力芯片与海外芯片的实际使用占比已基本达到五五开,预计在不久的将来将超过海外芯片。

从全球市场来看,AI芯片由英伟达和AMD等国际巨头垄断。在国内市场,根据不同的技术路线可以分为通用型计算架构(GPU)芯片设计企业沐曦、摩尔线程、海光信息、天数智芯、壁仞科技等,以及专用型计算架构(ASIC/DSA)芯片设计企业华为海思寒武纪、昆仑芯、燧原科技等。

受美国高性能GPU/AI芯片出口管制与国内国产化发展等因素影响,海外厂商在中国市场的份额呈现明显下降趋势。特别是英伟达在经历A100、H100被禁,再到H20被曝存在安全问题后,在华市场逐渐失守。黄仁勋在近日表示,“受美国政府出口管制影响,英伟达在中国AI市场的份额已大幅下滑,从95%跌至0%”。

国产AI芯片公司在国内市场、AI算力的需求结构等变化中迎来了历史性的发展窗口,以不同技术路径切入市场,国产GPU企业也逐渐崭露头角。


国产GPU加速上市,填补市场空白正当时
摩尔线程9月26日闪电过会后,沐曦将在10月24 日上会的消息也备受业内人士关注。在这个节点,沐曦正式对外发布首款全国产通用GPU——曦云C600,通过自研了GPGPU架构及指令集等,实现完全本土化,为其顺利上市带来强有力的技术背书和市场竞争力。

当前摩尔线程和沐曦的技术进展如何,为何选择此时上市?

从上述两家公司的官网可以看到,公司技术积累已逐渐步入收获期。以沐曦为例,公司的产品主要覆盖人工智能计算、通用计算和图形渲染三大领域,产品包括曦思N系列GPU(智算推理)、曦云C系列GPU(训推一体和通用计算),以及正在研发的曦彩G系列GPU(图形渲染)。

沐曦基于自主研发的GPU IP与统一的GPU计算和渲染架构,在通用性、单卡性能、集群性能及稳定性、生态兼容与迁移效率等方面具备较强的核心竞争力。例如上述提到的新品曦云C600基于自主IP,支持FP8多精度混合算力,兼容国际主流GPU生态(CUDA)的软件生态体系,具备易用性和可扩展性。

摩尔线程则基于自主研发的MUSA架构,率先实现了在单芯片架构上同时支持AI计算加速、图形渲染、物理仿真以及超高清视频处理所需计算能力的突破。摩尔线程已经成功自主研发并量产四代高性能GPU架构,并基于此推出了十余款高性能GPU加速卡与模组,以及D800计算服务器和KUAE智能计算集群等产品。凭借MTT S/X系列全功能GPU,原生支持FP64到FP8全精度算力,形成完整的软件生态。

其次,市场需求爆发,订单逐渐增加。摩尔线程在2022-2024年度及2025年1-6月,AI智算产品合计实现10.01亿元的收入。在今年上半年的前五大客户中,前三大客户均向其下了AI智算产品订单。沐曦在2025年1-3月营收已达3.2亿元,其中训推一体机系列GPU板卡就贡献了3.1亿元。
wKgZPGj4L1CAcWM4AADPokm6b-E010.png 
摩尔线程2025年上半年前五大客户情况(图源摩尔线程招股书)

此外,作为高研发投入的行业,资本助力是GPU芯片企业规模化发展的关键。企查查显示,自成立至今,沐曦已经完成了10次股权融资记录,投资方包括红杉资本、经纬创投、上海浦东引领区投资中心等。此次IPO,沐曦股份拟募资约39亿元、摩尔线程拟募资80亿元。

不少行业机构看好沐曦、摩尔股份的未来发展潜力。民生证券认为,国产GPU企业上市进程在不断加速,通过募资推动国产GPU在制程工艺、芯片架构、计算密度和能效比等方面不断迭代,缩小与国际领先水平的代差,更是代表国产GPU产业链正从技术追赶迈向生态构建,打造自主可控的国产算力产业链,国产算力有望全面崛起。
wKgZPGj4L12AMoXoAAJPD1o3yyc763.png 
沐曦部分股权融资事件(图源企查查)

架构自研+生态兼容,国产GPU的技术拼图逐渐完善
那么,英伟达留下的市场空白有多大,沐曦、摩尔线程又有哪些技术积累?

英伟达在中国市场的份额下滑,为国产GPU创造了巨大的替代空间。英国皇家工程院院士郭毅曾在公开演讲时指出,中国云端AI芯片市场规模有望在2027年突破480亿美元,国产GPU市占率预计将超80%。

整个行业对国产GPU芯片的发展寄予高度期望,期待其在技术突破与生态构建的双重驱动下,迎来新的突破。

在技术路线上,沐曦采用了通用GPU架构,摩尔线程以自主研发的全功能GPU为核心,推出MUSA架构。全功能GPU是指具备功能完备性与精度完整性的GPU,在单一GPU芯片中集成了 AI 计算加速、图形渲染、物理仿真等多种能力,单一芯片支持FP64 Vector、FP8 Tensor、INT8 Tensor等不同计算精度,以满足GPU加速不同场景的计算需求。

更关键的是,国产GPU的崛起不仅是硬件替代,更是生态重构。GPU软件生态方面,英伟达于2006年推出的通用并行计算架构和编程模型CUDA经过多年积淀,CUDA生态具有强大粘性,如今整个人工智能计算的应用生态大多构建在 CUDA 的基础之上,自建生态绝非易事,因此国产厂商在自建生态的同时保持对 CUDA生态的兼容是最佳方案。

在这方面,沐曦推出MXMACA软件栈可兼容CUDA生态,软硬件的深度协同确保了公司产品性能的高效释放。摩尔线程自主研发的MUSA架构,能够最小化迁移成本,从芯片指令集级别对标并兼容国外主流产品,实现从芯片到软件,从AI、图形到科学计算的整体生态兼容。

沐曦的MXMACA、摩尔线程的MUSA生态,都在积极构建自主可控的软件栈,降低用户迁移门槛,从而快速切入市场。同时,通富微电、长电科技等产业链公司深度参与,正推动国产GPU从“单点突破”走向“全产业链协同”。业内消息指出,通富微电负责沐曦曦云C500系列芯片的封测。

可以期待的是,随着沐曦、摩尔线程等GPU芯片企业成功上市,资本与产业的双轮驱动将加速技术迭代,或将重塑全球AI竞争格局。




声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 推理
    +关注

    关注

    0

    文章

    9

    浏览量

    7403
  • 英伟达
    +关注

    关注

    23

    文章

    4041

    浏览量

    97695
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    堪称史上最强推理芯片!英伟发布 Rubin CPX,实现50倍ROI

    电子发烧友网报道(文/梁浩斌)近日,英伟在AI infra峰会上发布了专为大规模上下文推理设计的全新GPU系列Rubin CPX,性能堪称炸裂!  
    的头像 发表于 09-11 08:25 9683次阅读
    堪称史上最强<b class='flag-5'>推理</b>芯片!<b class='flag-5'>英伟</b><b class='flag-5'>达</b>发布 Rubin CPX,实现50倍ROI

    国产GPU再下一城,群起突围英伟+AMD

    上市。   根据Jon Peddie Research的数据,独立GPU市场英伟一家独大,近年来持续维持超80%的市场份额,而AMD公司则占据剩余近20%的市场份额。自人工智能市场
    的头像 发表于 07-07 08:59 6803次阅读
    <b class='flag-5'>国产</b><b class='flag-5'>GPU</b>再下一城,群起突围<b class='flag-5'>英伟</b><b class='flag-5'>达</b>+AMD

    英伟 Q3 狂揽 308 亿

    英伟 2025 财年第三季度交出亮眼成绩单,数据中心业务营收飙至 308 亿美元,同比增长 112%,占总销售额的 88%。这一爆发式增长,核心源于全球 AI 算力需求激增,谷歌、微
    的头像 发表于 11-20 18:11 1071次阅读

    AI推理需求爆发!高通首秀重磅产品,国产GPU的自主牌怎么打?

    10月29日,在安博会的2025智能算力应用及产业发展论坛上,超聚变数字技术有限公司深圳解决方案总监丁元钊表示,原来我们预计2026年是AI推理爆发元年,2025年DeepSeek-R1,V3模型
    的头像 发表于 10-30 00:46 1.3w次阅读
    AI<b class='flag-5'>推理</b><b class='flag-5'>需求</b><b class='flag-5'>爆发</b>!高通首秀重磅产品,<b class='flag-5'>国产</b><b class='flag-5'>GPU</b>的自主牌怎么打?

    英伟自研HBM基础裸片

    "后的下一代AI GPU "Feynman"。   有分析指出,英伟此举或是将部分GPU功能集成到基础裸片中,旨在提高HBM和GPU的整体
    的头像 发表于 08-21 08:16 2532次阅读

    H20中国卖爆!英伟紧急向台积电加订30万块

    ,性能上相当于英伟另一款主流GPU芯片H100的20%左右。   尽管如此,在美国解禁对H20芯片的出口后,需求仍然超出了想象。据路透社报道,中国
    的头像 发表于 07-30 08:08 3011次阅读

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1
    发表于 07-25 08:18

    英伟获美批准恢复H20在华销售,同步推出全新兼容GPU

    7月15日上午,央广财经记者从英伟方面确认,英伟已经获得美国批准,将恢复 H20 在中国的销售,并推出面向
    的头像 发表于 07-16 17:49 672次阅读

    英伟黄仁勋:将向中国市场销售H20芯片 中国市场至关重要

    英伟CEO黄仁勋在北京访问期间发表声明称,将恢复在中国销售其H20 GPU芯片,并根据美国出口限制为中国市场推出一款新的
    的头像 发表于 07-15 14:32 1097次阅读

    英伟拟再推中国特供GPU,今年6月量产!

    电子发烧友网综合报道 近年来,美国政府对华半导体出口管制政策不断收紧,英伟等半导体企业面临严峻挑战。为保持在中国市场的竞争力,英伟推出了
    发表于 05-27 00:03 4614次阅读

    GPU 维修干货 | 英伟 GPU H100 常见故障有哪些?

    ABSTRACT摘要本文主要介绍英伟H100常见的故障类型和问题。JAEALOT2025年5月5日今年,国家政府报告提出要持续推进“人工智能+”行动,大力发展人工智能行业,市场上对算力的需求持续
    的头像 发表于 05-05 09:03 2477次阅读
    <b class='flag-5'>GPU</b> 维修干货 | <b class='flag-5'>英伟</b><b class='flag-5'>达</b> <b class='flag-5'>GPU</b> H100 常见故障有哪些?

    国产推理服务器如何选择?深度解析选型指南与华颉科技实战案例

    人工智能技术的爆发催生了对推理算力的迫切需求,而进口服务器的高成本与技术依赖性,推动了国产推理服务器的快速发展。据IDC预测,到2025年,
    的头像 发表于 03-24 17:11 944次阅读
    <b class='flag-5'>国产</b><b class='flag-5'>推理</b>服务器如何选择?深度解析选型指南与华颉科技实战案例

    英伟GTC25亮点:NVIDIA Blackwell Ultra 开启 AI 推理新时代

    英伟GTC25亮点:NVIDIA Blackwell Ultra 开启 AI 推理新时代
    的头像 发表于 03-20 15:35 1225次阅读

    无法调用GPU插件推理的远程张量API怎么解决?

    运行了使用 GPU 插件的远程张量 API 的推理。但是,它未能共享 OpenCL* 内存,但结果不正确。
    发表于 03-06 06:13

    英伟辟谣中国市场断供消息

    在全球的重要市场之一,公司高度重视并持续投入中国市场的发展。同时,英伟中国郑重承诺,将继续为中国客户提供高质量的产品和优质的服务,确保客户
    的头像 发表于 12-13 09:56 949次阅读