0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

力争百万 Tokens 推理成本降低百倍:云天励飞发布未来三年大算力芯片战略,首曝 DeepVerse 路线图

Monika观察 来源:云天励飞 作者:云天励飞 2026-02-03 20:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2月3日,云天励飞正式举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力 AI 推理芯片战略布局。面对人工智能从“基础模型构建”迈向“规模化应用落地”的重要转折点,公司宣布将核心研发资源集中于攻克大模型落地的“成本壁垒”,致力于通过底层架构创新,力争实现百万 Tokens 推理成本降低 100 倍以上的目标,推动 AI 从技术尝鲜走向普惠生产力。



产业变局:推理竞速,从“参数内卷”转向“效能为王”

过去一年,全球算力产业的风向标已发生显著偏转,重心正加速向推理侧倾斜。谷歌在 2025 年 4 月发布第七代 TPU “Ironwood”时,明确将其定位为“面向推理时代”的基石,强调在大规模推理与能效上的系统化优化。

与此同时,围绕“更低时延、更低成本”的推理芯片与系统能力,产业整合动作也在加速。2025 年 12 月,英伟达与 Groq 达成非独占许可安排,并吸纳其核心工程人才团队加入,此举被视为强化推理与实时工作负载能力的关键布局。

这些行业信号共同指向一个趋势:推理侧竞争已不再单纯是“把模型做得更强”的参数竞赛,而是“让应用跑得更久、更稳、更便宜”的效能竞赛,单位推理成本与交付效率已成为规模化落地的最大门槛。

架构破局:GPNPU 路线重新定义“通用生态”与“极致能效”

推理时代的胜负手不在单点指标,而在系统级协同:既要承接主流软件生态,又要在推理负载下实现更优能效与更低时延。

云天励飞确立了 GPNPU 技术路线,并提出了“GPNPU = GPGPU + NPU + 3D 堆叠存储”的核心公式,旨在兼顾通用计算的“通用性”与 NPU 的“高效性”,在工程层面同时解决可迁移、可部署、可持续降本三大难题。
在通用生态层面,鉴于 CUDA 仍是全球最成熟、覆盖最广的加速计算平台之一,云天励飞的 GPNPU 架构致力于正视主流生态的迁移成本问题,能够实现一行代码完成 CUDA 程序兼容,极大降低了进入生产系统的门槛。


在推理能效层面,NPU 能够实现更高的计算效率和能效比,面对大模型推理这种高度结构化、可被体系化优化的负载,专用化设计带来的能效优势更容易转化为真实成本优势,这也是国际厂商持续加码专用路线的重要原因。

同时,针对行业公认的“内存墙”瓶颈,云天励飞正深度研发 3D 堆叠存储及更前沿的互连技术,以提升带宽与能效,降低推理时延。

在架构工程与产品化路径上,云天励飞进一步强调了两项可落地的优势。首先是“算力积木”架构,即通过 Chiplet 扩展与互连思路,将标准计算单元进行模块化封装与组合,让算力像搭积木一样按需扩展,形成从边缘到更大规模推理的弹性产品形态。

其次是面向推理的系统级优化能力,公司拒绝单纯的“芯片参数竞赛”,而是主张把“模型怎么跑得更省”沉淀到架构里,围绕真实业务负载持续迭代,逐项击穿推理链路中的成本与时延瓶颈,最终形成可复制交付的综合最优解。

五大核心要素构筑坚实护城河,将打造千卡集群

云天励飞董事长兼 CEO 陈宁在演讲中指出,支撑公司跨越周期的,是长期积累构筑的商业护城河。他将核心竞争力总结为技术、产能、生态、市场、资本五大关键要素。这五大维度的协同共振,不仅是云天励飞应对行业激烈竞争的底气,更为未来三年战略的稳步落地提供了坚实的体系化保障。

针对行业普遍关注的供应链安全问题,云天励飞高级副总裁、CFO 兼董秘邓浩然特别强调,公司目前是国内屈指可数手握充足国产产能保障的企业之一,这一战略储备为后续芯片的大规模量产与交付提供了极高的确定性。

陈宁还详细解读了云天励飞的“1+4”架构:“1”指聚焦于AI大算力推理芯片,“4”则是四大事业部。作为生态构建者,四大事业部旨在解决芯片从“研发生产、优化打磨到市场推广”的核心难题。其中,政企事业部作为基石,将凭借深厚的行业经验,将战略重点转向推理设备和智算中心的建设。此外,云天励飞还计划打造区域级“千卡集群”,树立城市AI算力赋能的新标杆。

蓝图展开:DeepVerse 领衔,全场景算力矩阵精准卡位

面向未来三年的规划,云天励飞CTO李爱军表示,将不遗余力投入大算力芯片DeepVerse的研发,围绕推理成本、时延与吞吐的核心矛盾持续迭代,并按产品节奏梯度覆盖市场需求。

路线图将对标国际主流平台的代际演进,聚焦长上下文预填充(Prefill)、低时延解码(Decode)等关键推理阶段的系统优化,在真实负载下持续兑现“更便宜、更稳定、更易部署”的交付目标。



推理时代的竞争,本质是“单位推理成本”的竞争。只有把推理做得足够便宜、足够稳定、足够易用,AI 才能从“看得见的能力”走向“用得起的生产力”。

未来,云天励飞将以 GPNPU 架构为核心,大力推进云端大算力强化软硬协同与存储体系攻坚,力争将百万 Tokens 推理成本降低 100 倍以上,推动大模型从示范应用走向规模化交付。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    云天中标湛江市AI渗透支撑新质生产基础设施建设项目

    日前,云天中标湛江市AI渗透支撑新质生产基础设施建设项目。根据项目规划,公司将基于自研国产AI推理加速卡,参与建设AI
    的头像 发表于 03-14 09:04 728次阅读

    国内首个国产AI推理千卡集群落地,采用云天全自研AI推理芯片

    3 月 12 日,云天中标湛江市AI渗透支撑新质生产基础设施建设项目,中标金额4.2亿元。项目将基于云天
    发表于 03-12 11:10 1319次阅读

    百亿Token一分钱!云天喊出“推理成本降”,公布三年路线图

    再次阐述了GPNPU架构的技术内涵,并公开了未来三年
    的头像 发表于 02-09 14:54 5698次阅读
    百亿Token一分钱!<b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b>喊出“<b class='flag-5'>推理成本</b>万<b class='flag-5'>倍</b>降”,公布<b class='flag-5'>三年</b><b class='flag-5'>三</b>芯<b class='flag-5'>路线图</b>

    云天正式举办大芯片战略前瞻会

    2月3日,云天正式举办“大芯片战略前瞻会”,
    的头像 发表于 02-06 17:23 3852次阅读

    曦望发布新一代推理GPU芯片,单位Token推理成本降低90%

    已突破万片。   启望S3是专为大模型推理打造的定制化GPGPU芯片。在典型推理场景下,它的整体性价比较上一代提升超10。在
    的头像 发表于 01-28 17:38 9535次阅读

    云天与360集团签署战略合作协议

    12月22日,云天与360集团签署战略合作协议。双方将围绕“纳米AI”底座建设、大模型安
    的头像 发表于 12-25 17:09 627次阅读

    云天:AI推理需求狂飙,国产芯片机遇期加速到来

    今年来自国内外的半导体创新领袖企业高管们又带来哪些前瞻观点?此次,电子发烧友网特别采访了云天,以下是这家公司对2026半导体产业的分析与展望。
    的头像 发表于 12-23 10:13 1.2w次阅读
    <b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b>:AI<b class='flag-5'>推理</b>需求狂飙,国产<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>机遇期加速到来

    积木+3D堆叠!GPNPU架构创新,应对AI推理需求

    电子发烧友网报道(文/李弯弯)2025,人工智能正式迈入应用推理时代。大模型从实验室走向千行业,推理需求呈指数级爆发。然而,高昂的推理成本
    的头像 发表于 12-11 08:57 8071次阅读

    云天AI推理芯片如何赋能千行

    11月26日,云天会客厅第二期生态沙龙暨深商联高科技高成长创新营走进上市公司活动圆满举办。来自深圳科技领域的多位企业负责人齐聚云天,共同探讨AI
    的头像 发表于 12-03 13:58 748次阅读

    云天亮相ICCAD-Expo 2025

    当大模型从技术探索迈向规模化应用深水区,“供需失衡”与“推理成本高企”已成为制约产业发展的关键瓶颈。
    的头像 发表于 11-25 11:27 591次阅读

    云天与金蝶达成战略合作

    11月4日,在2025金蝶全球创见者大会上,云天与金蝶签署战略合作协议。
    的头像 发表于 11-05 18:09 1807次阅读

    云天亮相2025湾区半导体产业生态博览会

    在2025湾区半导体产业生态博览会(湾芯展)上,云天以“积木”为核心理念,携全栈AI推理
    的头像 发表于 10-16 17:45 1117次阅读

    云天正式加入OISA生态

    近日,云天正式加入 OISA 生态,携手产业伙伴共同推动国产 AI 芯片互联体系建设,为中国
    的头像 发表于 10-11 13:59 806次阅读

    云天亮相2025全球AI芯片峰会

    9 月 17 日,全球 AI 芯片峰会在上海举行,云天董事长兼 CEO 陈宁出席并发表演讲。
    的头像 发表于 09-17 17:56 1535次阅读

    《AI芯片:科技探索与AGI愿景》—— 勾勒计算未来战略罗盘

    如果说是AGI的“燃料”,那么AI芯片就是制造燃料的“精炼厂”。本书的卓越之处在于,它超越了单纯的技术拆解,成功绘制了一幅从专用智能迈向通用智能的“战略
    发表于 09-17 09:32