0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云天励飞正式举办大算力芯片战略前瞻会

云天励飞 来源:云天励飞 2026-02-06 17:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2月3日,云天励飞正式举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力 AI 推理芯片战略布局。

会上,云天励飞提出“训练追赶、推理超车”的战略方向,并发布了基于“PD 分离”思路的芯片路线图:力争实现百万 Tokens 推理成本降低 100 倍以上的目标,推动 AI 从技术尝鲜走向普惠生产力。

战略方向:训练追赶,推理超车

云天励飞董事长兼 CEO 陈宁博士在会上指出,训练芯片与推理芯片在算力需求上存在显著差异。训练芯片更侧重“绝对值”,对算力规模、带宽能力以及科学计算的复杂精度要求更高,且对成本相对不敏感;推理芯片的核心考量则在于成本、效率与市场经济学,关键在于每一个 Token 背后的边际成本与整体性价比。

陈宁表示,公司致力于持续降低百万 Token 的成本,目标是通过下一代芯片实现“百万 Tokens 一分钱”。未来三年,公司希望将成本进一步降至“百万 Tokens 0.1分钱”,以加速大模型应用的规模化落地。

对于未来五年的中国芯片产业发展,陈宁提出“训练追赶、推理超车”的策略:在训练芯片领域,目标是持续追赶,尽量保持差距不被拉大;而在推理芯片领域,依托中国丰富的应用场景、强大的基础设施能力以及开源模型生态,有机会实现突破与超车。

基于“PD 分离”架构,三年规划三代芯片

针对大模型时代云推理场景的需求,云天励飞 CTO 李爱军在会上介绍了公司的技术解构与路线图。

他表示,云天励飞将全力投入云推理场景的大算力芯片研发,基于对大模型推理计算特征的理解,按照“PD 分离”的系统架构规划两类大算力芯片:

P 芯片(Prefill):面向计算密集型需求设计,满足 Prefill 阶段的高算力要求;

D 芯片(Decode):面向访存密集型需求设计,满足 Decode 阶段的高带宽需求。

李爱军介绍,公司在芯片微架构层面针对 Attention 及 AFN 等计算特点进行细粒度分析,并在底层实现针对性优化。在一个包含 1024 颗芯片的超节点内,P 芯片与 D 芯片可实现有效组合,以满足大模型云推理的集群化部署需求。

未来三年,云天励飞规划了三代芯片产品:

今年(第一年):打造第一代超节点P 芯片,面向百万级长上下文场景进行 Prefill 推理优化,算力水平对标Hopper架构;

明年(第二年):研发第一代超节点D 芯片,聚焦 Decode 推理的低时延目标,算力水平对标Blackwell架构;

2028 年(第三年):推出第二代超节点D 芯片,面向毫秒级推理时延目标进一步优化,带动 Prefill 与 Decode 性能提升,算力层面有望看齐下一代Rubin芯片。

李爱军表示,上述路线图的核心支撑是云天励飞的GPNPU 架构。GPNPU 不仅是处理器架构,也体现了对大模型推理系统架构的整体理解,其主要技术亮点包括四个方面:

GPGPU 级通用编程能力(CUDA 兼容):面向国内芯片“易用性”痛点,GPNPU 架构强调对主流 CUDA 等生态的兼容与迁移支持,以降低客户模型部署与迁移门槛;

极致能效的 NPU 内核:围绕推理效率与能效比进行深度优化,提升推理侧性价比;

引入 3D Memory 结构:采用 3D Memory 结构,以获得更高带宽与更低访问时延,提升推理效率;

算力积木架构:公司延续过去五年在国产工艺上的探索,以“算力积木”架构定义下一代芯片的 Scale-up 超节点,以满足万亿级乃至十万亿级 MoE 架构大模型的推理需求。

推理时代的竞争,本质是“单位推理成本”的竞争。只有把推理做得足够便宜、足够稳定、足够易用,AI 才能从“看得见的能力”走向“用得起的生产力”。

未来,云天励飞将以 GPNPU 架构为核心,大力推进云端大算力芯片,强化软硬协同与存储体系攻坚,力争将百万 Tokens 推理成本降低 100 倍以上,推动大模型从示范应用走向规模化交付。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41976

    浏览量

    303072
  • 云天励飞
    +关注

    关注

    0

    文章

    187

    浏览量

    12703
  • 算力
    +关注

    关注

    2

    文章

    1773

    浏览量

    16857

原文标题:云天励飞公布大算力芯片战略:目标把百万 Tokens 推理成本降低 100 倍以上

文章出处:【微信号:IntelliFusion2,微信公众号:云天励飞】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    云天中标湛江市AI渗透支撑新质生产基础设施建设项目

    日前,云天中标湛江市AI渗透支撑新质生产基础设施建设项目。根据项目规划,公司将基于自研国产AI推理加速卡,参与建设AI推理算集群,并
    的头像 发表于 03-14 09:04 859次阅读

    百亿Token一分钱!云天喊出“推理成本万倍降”,公布三年三芯路线图

    电子发烧友网报道(文/莫婷婷)当前,全球人工智能迈入具身智能(Agentic AI)时代,云天董事长兼CEO陈宁博士在“大
    的头像 发表于 02-09 14:54 5949次阅读
    百亿Token一分钱!<b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b>喊出“推理成本万倍降”,公布三年三芯路线图

    力争百万 Tokens 推理成本降低百倍:云天发布未来三年大芯片战略,首曝 DeepVerse 路线图

    2月3日,云天正式举办“大芯片
    的头像 发表于 02-03 20:25 3296次阅读
    力争百万 Tokens 推理成本降低百倍:<b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b>发布未来三年大<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b><b class='flag-5'>战略</b>,首曝 DeepVerse 路线图

    云天与360集团签署战略合作协议

    12月22日,云天与360集团签署战略合作协议。双方将围绕“纳米AI”底座建设、大模型安
    的头像 发表于 12-25 17:09 696次阅读

    云天:AI推理需求狂飙,国产芯片机遇期加速到来

    今年来自国内外的半导体创新领袖企业高管们又带来哪些前瞻观点?此次,电子发烧友网特别采访了云天,以下是这家公司对2026年半导体产业的分析与展望。
    的头像 发表于 12-23 10:13 1.2w次阅读
    <b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b>:AI推理需求狂飙,国产<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>机遇期加速到来

    AI教父Hinton对话云天陈宁

    在大模型步入深水区的当下,AI 的下一个临界点究竟在哪里?在 2025 GIS 全球创新峰会现场,深度学习奠基人、“AI 教父” Geoffrey Hinton 与云天董事长兼 CEO 陈宁
    的头像 发表于 12-03 14:04 908次阅读

    云天AI推理芯片如何赋能千行百业

    11月26日,云天会客厅第二期生态沙龙暨深商联高科技高成长创新营走进上市公司活动圆满举办。来自深圳科技领域的多位企业负责人齐聚云天,共同
    的头像 发表于 12-03 13:58 824次阅读

    云天亮相2025中国国际半导体博览

    2025年11月23日,第二十二届中国国际半导体博览(IC China 2025)在北京国家会议中心启幕。在24日举办的 “人工智能及大模型芯片论坛” 上,云天
    的头像 发表于 11-25 11:29 899次阅读

    云天与金蝶达成战略合作

    11月4日,在2025金蝶全球创见者大会上,云天与金蝶签署战略合作协议。
    的头像 发表于 11-05 18:09 1872次阅读

    云天飞出席第二届湾区半导体产业投融资战略发展论坛

    在2025湾芯展同期举办的第二届湾区半导体产业投融资战略发展论坛上,云天董事长兼CEO陈宁受邀出席并发表演讲。
    的头像 发表于 10-27 10:02 937次阅读

    云天亮相2025湾区半导体产业生态博览

    在2025湾区半导体产业生态博览(湾芯展)上,云天以“积木”为核心理念,携全栈AI推理
    的头像 发表于 10-16 17:45 1165次阅读

    云天与前海大数据公司、勤达睿达成战略合作

    近日,深圳市前海大数据资源管理中心有限公司、深圳云天技术股份有限公司、勤达睿香港有限公司(Kyndryl)正式签署战略合作协议,围绕智
    的头像 发表于 10-11 14:02 750次阅读

    云天正式加入OISA生态

    近日,云天正式加入 OISA 生态,携手产业伙伴共同推动国产 AI 芯片互联体系建设,为中国
    的头像 发表于 10-11 13:59 892次阅读

    云天亮相2025全球AI芯片峰会

    9 月 17 日,全球 AI 芯片峰会在上海举行,云天董事长兼 CEO 陈宁出席并发表演讲。
    的头像 发表于 09-17 17:56 1625次阅读

    云天亮相SEMI-e 2025深圳国际半导体展

    9月10日,SEMI-e深圳国际半导体展暨2025集成电路产业创新展在深圳举行。云天受邀出席同期举办的“端侧AI芯片新架构与新应用专题研
    的头像 发表于 09-12 14:31 1920次阅读