0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI推理需求爆发!高通首秀重磅产品,国产GPU的自主牌怎么打?

章鹰观察 来源:电子发烧友原创 作者:章鹰 2025-10-30 00:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(电子发烧友网报道 文/章鹰)近日,Omdia半导体研究团队高级顾问宋卓在2025年湾芯展论坛上表示,该研究团队对2025年全球及国内半导体市场保持乐观,受到AI云服务相关硬件的持续投入推动影响,2025年全球半导体市场收入将达到7815亿美元,预计同比2024年增长16.3%。

云天励飞副总裁罗忆看好AI推理需求的增长,他指出国内AI面临两大拐点:1、算力需求爆发,大模型推理算力需求将在2026年超越训练需求,成为算力消耗的主题,占据所有算力需求的比例将超过70%。2、国产算力芯片的使用比例不久将会超过海外芯片,目前两者达到五五分。

图1:AI推理需求爆发

10月29日,在安博会的2025智能算力应用及产业发展论坛上,超聚变数字技术有限公司深圳解决方案总监丁元钊表示,原来我们预计2026年是AI推理爆发元年,2025年DeepSeek-R1,V3模型推出,直接推动AI推理市场的上扬,未来3-5年都是AI推理领域的规模应用阶段。不管是行业应用,还是算力相关的芯片,都将大规模的围绕AI推理来爆发。

AI推理火爆主要的驱动力是什么?高通最新AI推理芯片,还有国内AI推理芯片领域,沐曦科技、云天励飞、百度昆仑芯片的最新进展如何?本文将详细汇总和分析。

AI推理火爆背后驱动力:边缘AI需求暴增,Token调用量攀升,成本可控成新趋势

2025年以来,随着大模型(如DeepSeek、ChatGPT等)在医疗、金融、政务、消费电子等场景广泛部署,AI工作负载正从“训练”转向“推理”。2025年,全球推理任务占比预计达67%,2028年将提升至73%。

2025年被视为“AI Agent元年”,智能体从被动执行转向自主规划与决策,单次任务消耗的Token量是传统对话的100倍以上。大模型普及正驱动全球日均Token调用量飞速攀升,据统计,全球AI巨头月消耗token量已经来到千万亿量级,且仍在持续提升。Token调用量的攀升直接带动了推理算力需求的指数级增长。据麦肯锡预测,全球AI推理市场将于2028年达到1500亿美元,年复合增长率达40%,远高于训练市场的20%。

云天励飞副总裁罗忆指出,Token数可能每年增长10倍,但是算力基础设施投入上,基本是一倍增加,如何弥补中间的鸿沟?这就意味着需要更少的算力解决更多Token的推理。

高通发布两款AI芯片,进军数据中心AI推理市场

10月27日晚间,美国移动芯片巨头高通宣布推出两款数据中心人工智能芯片——AI200和AI250,两款芯片对应的AI推理优化解决方案,可提供更高内存容量和优秀的AI推理优化,预计分别于2026年和2027年商用。

英伟达主导数据中心GPU不同的是,高通选择了一条差异化竞争策略:以机架级性能、高内存实现快速的生成式AI推理为核心方向,强调其在能效、总拥有成本等方面的优势。

AI200 推出一款专用机架级 AI 推理解决方案,旨在为大型语言和多模态模型 (LLM、LMM) 推理及其他 AI 工作负载提供低总拥有成本 (TCO) 和优化的性能。它支持每卡 768 GB LPDDR,可提供更高的内存容量和更低的成本,从而为 AI 推理提供卓越的扩展性和灵活性。

AI250 解决方案将首次采用基于近内存计算的创新内存架构,通过提供超过 10 倍的有效内存带宽和更低的功耗,为 AI 推理工作负载带来效率和性能的跨越式提升。

据悉,AI200 和 AI250 产品均采用直接液体冷却技术进行冷却,利用 PCIe 互连进行纵向扩展,利用以太网进行横向扩展,并提供 160kW 的机架级功耗。高通没有透露有关每个机架的芯片数量或机架将提供的计算性能的信息。

高通还透露,首批AI机架解决方案将于2026年起部署于中东客户“HUMAIN”公司的数据中心。这被视为高通AI芯片商业化的重要里程碑。

沐曦C600登场,单卡算力和内存超越H20

在最新沐曦科技披露的IPO文件看,2025年前3个月,沐曦来自训推一体系列产品的收入占比高达97.87%。沐曦科技主要产品覆盖AI计算、通用计算、图形渲染三大领域,先后推出用于智算推理的曦思N系列GPU、用于训推一体和通用计算的曦云C系列GPU,以及正在研发用于图形渲染的曦彩G系列GPU。

2023年,沐曦推出首款训推一体GPU芯片曦云C500,并在此基础上推出了曦云C550;该系列基于国产供应链的产品曦云C600已完成流片。

图:曦云C600 图片来自沐曦科技微信

以英伟达 H20为例,其核心优势在于大容量显存、高速互连带宽、多精度计算能力等。曦云C500系列产品的单卡算力已超过 H20,最新一代曦云 C600 系列产品的单卡算力亦领先于英伟达H20,并具备 FP8 计算单元,能够支持多精度计算。同时,曦云 C600 系列产品配备了大容量显存,超过 H20 的96GB 版本,可以有效承载更大规模数据与模型、减少数据交换的性能损耗、提升多任务并行执行能力。

据悉,曦云C500系列产品的下游客户以国家人工智能公共算力平台、运营商智算平台、商业化智算中心以及教科研、金融等行业客户为主。

云天励飞推出四款推理芯片,覆盖边缘到云的多种场景

云天励飞在湾芯展展出了多款自研芯片——DeepEdge 10、DeepEdge 10C、DeepEdge 10 Max、DeepEdge 200,覆盖从边缘到云端的多种推理场景。

DeepEdge10芯片是云天励飞自主研发的AI推理高性能芯片,采用国产14nm Chiplet工艺,并内置国产RISC-V核。该系列芯片基于“算力积木”AI芯片架构,能够封装成不同算力的芯片,覆盖8T至256T的算力应用,可支持包括Transformer模型、BEV模型、CV大模型、LLM大模型等各类主流模型的高效推理,并已完成DeepSeek 系列模型以及国产鸿蒙操作系统的适配。

图:云天励飞四款AI推理芯片

公司还推出了更高阶的 DeepEdge 200 芯片,面向更高并发和云端推理场景。该芯片采用 D2D Chiplet + C2C Mesh Torus 互连,可把多颗 Die 像积木一样拼成 256 TOPS 的“单片”,这款芯片通过“算力积木”把 256 TOPS 级别的大算力塞进 35 W 功耗包络,同时保留横向扩展和软件栈兼容性,成为目前国产 AI 推理芯片中少数能兼顾“边缘高能效”与“云端高并发”的单芯片方案。

百度昆仑芯P800,部分性能与A100相当,中标中国移动采购大单

2025年2月20日,百度旗下的昆仑芯团队正式发布了P800型号AI芯片,成为国产AI芯片领域的一次重大创新。此次发布的重要亮点在于,这款芯片首度支持单机部署DeepSeek V3/R1671B满血版大模型。

推理性能:在运行DeepSeek-R1/V3满血版671B模型时,昆仑芯P800单机8卡的量达到2437tokens/s,并发量达到256,比英伟达A100更快。在同样负载情况下,P800的推理延迟比A100降低了18%。值得关注的是,昆仑芯P800在能耗方面比A100提高了约15%的功效比,在资源有限的环境中具有优势。

2025 年中国移动 AI 通用计算(推理型)集采,P800 拿下三个标包 70%-100% 份额,标志着其进入电信级规模采购。

本文由电子发烧友原创,转载请注明以上来源。微信号zy1052625525。需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱zhangying@huaqiu.com。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54631

    浏览量

    470900
  • 高通
    +关注

    关注

    78

    文章

    7761

    浏览量

    200585
  • 云天励飞
    +关注

    关注

    0

    文章

    187

    浏览量

    12703
  • 沐曦
    +关注

    关注

    1

    文章

    118

    浏览量

    1894
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国产来袭!2nm AI GPU

    的时间和成本内实现。   近日,据媒体报道,上海棣山科技有限公司(以下简称“棣山科技”)对外披露其2nm高端AI GPU芯片最新研发进展。据悉,该公司自主攻关的这款芯片已达到国际前沿设计水平,目前核心研发工作仍处于原型验证关键阶
    的头像 发表于 04-15 07:02 8762次阅读

    通挑战英伟达,发布768GB内存AI推理芯片,“出征”AI数据中心

    电子发烧友网报道(文/莫婷婷)随着生成式AI应用的爆发式增长,数据中心对高效、低成本、低功耗AI推理能力的需求急剧上升。
    的头像 发表于 10-29 10:36 4057次阅读
    <b class='flag-5'>高</b>通挑战英伟达,发布768GB内存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>数据中心

    通挑战英伟达!发布768GB内存AI推理芯片,“出征”AI数据中心

    电子发烧友网报道(文/莫婷婷)随着生成式AI应用的爆发式增长,数据中心对高效、低成本、低功耗AI推理能力的需求急剧上升。
    的头像 发表于 10-29 09:14 6863次阅读
    <b class='flag-5'>高</b>通挑战英伟达!发布768GB内存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>数据中心

    英伟达失守中国区!推理需求爆发国产GPU抢滩上市

    亿元。而在此前,另一家国产GPU公司摩尔线程已于9月26日率先过会。这两大GPU企业接连冲刺IPO,背后是中国AI算力需求
    的头像 发表于 10-22 09:09 8736次阅读
    英伟达失守中国区!<b class='flag-5'>推理</b><b class='flag-5'>需求</b><b class='flag-5'>爆发</b>,<b class='flag-5'>国产</b><b class='flag-5'>GPU</b>抢滩上市

    华邦电子携三大核心产品线CITE 2026

    4 月 9 日,第十四届中国电子信息博览会(CITE)于深圳正式开幕,华邦电子重磅登陆深圳会展中心(福田)一号馆 1A010 展位,携客制化内存解决方案(CMS)、编码型闪存及 TrustME 安全闪存三大核心产品线
    的头像 发表于 04-11 14:18 1755次阅读
    华邦电子携三大核心<b class='flag-5'>产品</b>线<b class='flag-5'>首</b><b class='flag-5'>秀</b>CITE 2026

    AI推理芯片需求爆发,OpenAI欲寻求新合作伙伴

    电子发烧友网综合报道,在人工智能迅猛发展的当下,AI推理芯片需求正呈爆发式增长。   AI推理
    的头像 发表于 02-03 17:15 3411次阅读

    曦望发布新一代推理GPU芯片,单位Token推理成本降低90%

    电子发烧友网报道 1月27日,国产GPU厂商曦望(Sunrise)重磅发布新一代推理GPU芯片——启望S3。这是曦望在近一年累计完成约30亿
    的头像 发表于 01-28 17:38 9874次阅读

    今日看点:消息称 AMD、通考虑导入 SOCAMM 内存;曦望发布新一代推理GPU芯片启望S3

    推理深度定制的GPGPU芯片。其单芯片推理性能提升5倍,支持从FP16到FP8、FP6、FP4等多精度灵活切换,释放低精度推理效率,这种设计更贴合当前MoE和长上下文模型在推理阶段的
    发表于 01-28 11:09 1442次阅读

    瑞芯微SOC智能视觉AI处理器

    。B2版本通常在功耗、稳定性和部分外围接口支持上有所优化。NPU: 集成0.8 TOPS的NPU,支持INT8/INT16混合运算,能满足大多数边缘侧的轻量级AI推理需求(如分类、检测、识别)。多媒体
    发表于 12-19 13:44

    Neway微波产品国产化替代方案

    了客户的采购成本,还通过本地化生产缩短了交期,满足了客户对自主可控的需求。例如,在部分产品中,Neway通过采用国产电源组件,实现了与进口产品
    发表于 12-18 09:24

    算力积木+3D堆叠!GPNPU架构创新,应对AI推理需求

    电子发烧友网报道(文/李弯弯)2025年,人工智能正式迈入应用推理时代。大模型从实验室走向千行百业,推理需求呈指数级爆发。然而,高昂的推理
    的头像 发表于 12-11 08:57 8234次阅读

    国产AI芯片真能扛住“算力内卷”?海思昇腾的这波操作藏了多少细节?

    最近行业都在说“算力是AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思昇腾910B,实测下来有点超出预期——7nm工艺下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    发表于 10-27 13:12

    款全国产通用GPU芯片发布 沐曦集成推出曦云C600

    ,并支持MetaXLink超节点扩展技术,在硬件性能和软件兼容上完全满足下一代生成式AI的训练和推理需求。 而且,沐曦股份与中国科学院合作的国产千卡集群,已完成多个大模型全参数训练,证
    的头像 发表于 10-19 20:04 4.7w次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    与边缘AI的不同特点: 边缘推理的优势:可以提供数据处理速度和响应速度,满足实时需求;可以缩短网络延迟,降低成本;可以提高安全性和隐私性,保护用户数据。 前面说的都是好处,那面临的困难有哪些呢
    发表于 09-12 16:07

    国产真自研高性能图形 GPU 重磅发布:跑分超 RTX4060,畅玩《黑神话・悟空》

    电子发烧友网报道(文 / 吴子鹏)7 月 26 日,砺算科技在 “砥砺算芯 超越极限” 产品发布会上,重磅发布GPU 芯片 “7G100” 系列和
    发表于 07-26 21:45 6292次阅读
    <b class='flag-5'>国产</b>真自研高性能图形 <b class='flag-5'>GPU</b> <b class='flag-5'>重磅</b>发布:跑分超 RTX4060,畅玩《黑神话・悟空》