0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云天励飞出席GAIR 2025 AI算力新十年专场

云天励飞 来源:云天励飞 2025-12-22 09:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

12月13日,GAIR 2025「AI 算力新十年」专场在深圳举行。作为国内前沿技术与产业变革的重要风向标,GAIR大会历经七届积淀,见证并推动了中国 AI 产业从算法突破、硬件迭代,到商业落地的完整过程。本届论坛直面智能体系的底层核心——算力,从架构、生态、工具链到产业化落地,探寻未来十年的关键变量。

云天励飞副总裁罗忆出席并发表主题演讲,围绕大模型从“训练竞赛”走向“推理规模化”的产业拐点,分享了面向推理时代的关键判断与实践思考。

罗忆指出,过去几年行业主要通过更大算力、更大数据、更大参数推动智能上限持续提升,但随着应用从简单问答走向长上下文、工具调用与更复杂的智能体形态,产业关注点正在发生迁移:不再止步于“把模型炼得更强”,而是更强调“把推理做得更便宜、更稳定、更可规模化交付”。

在这一背景下,大模型应用面临的核心挑战正逐步呈现为“经济学困境”——模型规模扩大带来的算力与带宽成本上升具有明显的放大效应,只有通过稀疏化、蒸馏、量化等技术与工程优化持续降低门槛,AI 才可能从“高成本探索”走向“规模化普惠”。

围绕推理时代的衡量标准,罗忆进一步强调,竞争指标不应仅停留在芯片的理论算力峰值,而应回到“单位投入能够产出多少有效 token”。

这意味着,系统瓶颈往往不在算力本身,而在内存与互连带宽,以及由此带来的算力等待与利用率下降;在相近硬件条件下,谁能提升 MFU(算力/模型利用率)、减少无效等待,谁就更有机会把单位 token 成本摊薄到更具商业可行性的区间,从而支撑推理应用的规模化落地。

在国产 AI 推理芯片的发展方向上,罗忆提出三点思路:一是加强软件生态兼容,在更好承接算法迭代的同时提升算力利用效率;二是突破存储与带宽相关瓶颈,积极支持 3D memory 等技术路线;三是面向异构计算持续优化整体性价比,以更可持续的成本结构推动应用渗透。

他同时表示,行业的共同目标应是让推理服务的成本持续下探,并在未来三到五年推动“百万 token 成本降至 1 元以内”成为可触达的目标区间,从而更好支撑“人工智能+”在千行百业的普及。

云天励飞自2014年成立以来,一直坚持算法与芯片的协同迭代,聚焦推理场景推动技术与产品的持续演进。目前,公司正探索面向云端推理的新型架构方向——GPNPU,力求在兼顾通用性与效率的同时,最大限度降低开发和迁移的门槛。

面向推理规模化的新阶段,云天励飞将继续以“更高效、更普惠的推理算力”为目标,推动从芯片到系统再到交付的工程能力建设,与产业伙伴共同完善生态与应用路径,让算力投入更高效地转化为可度量、可复制的业务价值,形成从“算力基建”到“价值闭环”的正向循环。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41976

    浏览量

    303077
  • 算力
    +关注

    关注

    2

    文章

    1773

    浏览量

    16857
  • 大模型
    +关注

    关注

    2

    文章

    3863

    浏览量

    5296

原文标题:GAIR 2025|从训练竞赛到推理经济学,AI 算力进入新十年变量期

文章出处:【微信号:IntelliFusion2,微信公众号:云天励飞】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    云天飞中标湛江市AI渗透支撑新质生产基础设施建设项目

    日前,云天飞中标湛江市AI渗透支撑新质生产基础设施建设项目。根据项目规划,公司将基于自研国产AI推理加速卡,参与建设
    的头像 发表于 03-14 09:04 859次阅读

    百亿Token一分钱!云天飞喊出“推理成本万倍降”,公布三三芯路线图

    飞再次阐述了GPNPU架构的技术内涵,并公开了未来三芯片路线图,致力于成为“最懂AI的推理芯片领军企业”。   GPNPU:打造中
    的头像 发表于 02-09 14:54 5950次阅读
    百亿Token一分钱!<b class='flag-5'>云天</b><b class='flag-5'>励</b>飞喊出“推理成本万倍降”,公布三<b class='flag-5'>年</b>三芯路线图

    云天飞正式举办大芯片战略前瞻会

    2月3日,云天飞正式举办“大芯片战略前瞻会”,首次对外公布未来三的大
    的头像 发表于 02-06 17:23 3960次阅读

    力争百万 Tokens 推理成本降低百倍:云天飞发布未来三芯片战略,首曝 DeepVerse 路线图

    2月3日,云天飞正式举办“大芯片战略前瞻会”,首次对外公布未来三的大
    的头像 发表于 02-03 20:25 3296次阅读
    力争百万 Tokens 推理成本降低百倍:<b class='flag-5'>云天</b><b class='flag-5'>励</b>飞发布未来三<b class='flag-5'>年</b>大<b class='flag-5'>算</b><b class='flag-5'>力</b>芯片战略,首曝 DeepVerse 路线图

    奇异摩尔入选2025度上海产业大经典案例

    了智产业链的众多知名企业与行业专家,共同探讨产业发展新趋势。会上,主办方正式颁布了2025度上海
    的头像 发表于 12-25 09:34 927次阅读

    AI教父Hinton对话云天飞陈宁

    在大模型步入深水区的当下,AI 的下一个临界点究竟在哪里?在 2025 GIS 全球创新峰会现场,深度学习奠基人、“AI 教父” Geoffrey Hinton 与云天
    的头像 发表于 12-03 14:04 908次阅读

    云天飞亮相2025中国国际半导体博览会

    202511月23日,第二十二届中国国际半导体博览会(IC China 2025)在北京国家会议中心启幕。在24日举办的 “人工智能及大模型芯片论坛” 上,云天
    的头像 发表于 11-25 11:29 899次阅读

    云天飞与金蝶达成战略合作

    11月4日,在2025金蝶全球创见者大会上,云天飞与金蝶签署战略合作协议。
    的头像 发表于 11-05 18:09 1872次阅读

    云天飞出席第二届湾区半导体产业投融资战略发展论坛

    2025湾芯展同期举办的第二届湾区半导体产业投融资战略发展论坛上,云天飞董事长兼CEO陈宁受邀出席并发表演讲。
    的头像 发表于 10-27 10:02 937次阅读

    需求狂飙下的“效率竞赛”,国产AI芯片有何破局之道?

    %,同比上升12.8个百分点。 10月15日,在2025湾芯展上,云天飞副总裁罗忆给现场听众带来《打造智时代的新质生产》演讲,他现场提
    的头像 发表于 10-19 01:11 1w次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>需求狂飙下的“效率竞赛”,国产<b class='flag-5'>AI</b>芯片有何破局之道?

    云天飞亮相2025湾区半导体产业生态博览会

    2025湾区半导体产业生态博览会(湾芯展)上,云天飞以“积木”为核心理念,携全栈AI推理
    的头像 发表于 10-16 17:45 1166次阅读

    云天飞正式加入OISA生态

    近日,云天飞正式加入 OISA 生态,携手产业伙伴共同推动国产 AI 芯片互联体系建设,为中国生态注入新的动力。
    的头像 发表于 10-11 13:59 893次阅读

    云天飞亮相2025全球AI芯片峰会

    9 月 17 日,全球 AI 芯片峰会在上海举行,云天飞董事长兼 CEO 陈宁出席并发表演讲。
    的头像 发表于 09-17 17:56 1625次阅读

    云天飞亮相SEMI-e 2025深圳国际半导体展

    9月10日,SEMI-e深圳国际半导体展暨2025集成电路产业创新展在深圳举行。云天飞受邀出席同期举办的“端侧AI芯片新架构与新应用专题研
    的头像 发表于 09-12 14:31 1920次阅读

    云天飞出席2025亚布力论坛创新年会

    近日,2025 亚布力论坛第十一届创新年会在杭州开幕,云天飞董事长兼 CEO 陈宁博士受邀出席,分享了他对未来 AI 产业化发展的趋势研判
    的头像 发表于 07-10 11:36 1413次阅读