0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从训练到推理:大模型算力需求的新拐点已至

颖脉Imgtec 2026-02-05 16:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在大模型产业发展的早期阶段,行业焦点主要集中在大模型训练所需的算力投入。一个万亿参数大模型的训练可能需要数千张GPU芯片连续运行数月,成本高达数千万甚至上亿元。但随着大模型技术的成熟和应用落地,推理算力正在成为市场关注的新焦点。


一、训练算力的"一次性投入"困境

大模型训练是典型的"一次性高成本投入"模式。根据OpenAI的公开数据,GPT-3.5的训练大约使用了1024张A100芯片,耗时约3个月,成本超过1000万美元。而GPT-4的训练成本更是达到了上亿美元级别。这种高成本的训练模式使得大模型技术长期被少数巨头企业掌握。

但训练只是大模型应用的第一步,真正考验算力能力的是大规模商业应用后的推理阶段。一个活跃用户每天与大模型的互动可能需要消耗数美元的推理算力成本,而当用户规模达到百万级甚至千万级时,推理算力的需求将呈指数级增长。


二、推理算力需求的新拐点根据IDC中国的预测,中国智能算力规模仍将保持高速增长,2025年将较2024年增长43%,2026年中国智能算力规模将达到2024年的两倍。其中,推理算力的增长速度将远超训练算力。

中国IDC圈创始人、CEO黄超表示,2026年产业智能体将进入百花齐放的发展阶段,算力应用正从"训练主导"悄然转向"推理驱动",推理算力需求的爆发周期即将全面到来。科智咨询发布的《算力基础设施产业发展现状与未来趋势》报告显示,到2026年,中国智算需求将占新增需求的71%,而其中推理算力的占比将超过50%。

从用户数据来看,推理算力的需求增长已经显现。QuestMobile发布的AI应用周活排行榜显示,豆包、DeepSeek、元宝、蚂蚁阿福位列周活前四,新上线的蚂蚁阿福和灵光增长迅猛,通用AI在用户规模上保持优势。这些活跃用户每天产生的海量推理请求,对算力服务商的推理能力提出了极高要求。


三、推理算力的技术新挑战与训练算力相比,推理算力面临着完全不同的技术挑战:

  • 低时延要求:用户与大模型的交互需要即时响应,推理时延需要控制在数百毫秒以内,否则会严重影响用户体验。
  • 高并发支持:商业应用场景下,大模型可能需要同时处理数十万甚至数百万用户的请求,需要算力系统具备强大的并发处理能力。
  • 能效比优化:推理算力是持续消耗型需求,能效比直接决定了企业的运营成本。根据国际能源署的预测,到2030年,AI设施的用电量将增长五倍,对推理算力的能效比提出了更高要求。
  • 异构算力协同:不同的大模型推理场景对算力的需求各不相同,需要算力系统支持CPU、GPU、NPU等多种异构芯片的协同工作。

为了应对这些挑战,算力服务商正在探索新的技术路径。比如,中科曙光推出的"scaleX"万卡超集群系统采用浸没相变液冷技术,将PUE值降至1.04,显著提升了推理算力的能效比。华为则推出了昇腾AI芯片及全栈解决方案,针对推理场景进行了深度优化,支持高并发、低时延的推理服务。


四、算力服务商的新机遇推理算力需求的爆发,为算力服务商带来了新的发展机遇:

  • 长期稳定的营收来源:推理算力需求具有持续性和稳定性,相比一次性的训练算力需求,更适合作为算力服务商的核心营收来源。
  • 垂直行业定制化服务:不同行业的大模型应用场景对推理算力的需求各不相同,算力服务商可以针对金融、医疗、教育等垂直行业提供定制化的推理算力解决方案。
  • 绿色算力应用场景:推理算力对能效比的高要求,推动了绿色算力技术的发展。廊坊的智算集群通过AI算法对系统进行数据分析,动态调整负载分配,将PUE值降至1.25以下,为绿色推理算力应用提供了范例。
  • 边缘推理算力布局:随着大模型应用向终端设备延伸,边缘推理算力需求正在快速增长。算力服务商可以通过部署边缘推理节点,为终端设备提供低时延的推理服务。

ae192636-0269-11f1-96ea-92fbcf53809c.jpg


五、未来趋势展望从训练到推理的算力需求拐点已经到来,未来大模型产业的竞争将更多地围绕推理算力展开:

  • 推理芯片将成为市场新宠:专门针对大模型推理优化的芯片将成为市场关注的焦点,国产推理芯片厂商有望迎来发展黄金期。
  • 推理算力服务将标准化:随着推理算力需求的增长,行业将逐渐形成标准化的推理算力服务模式,为企业提供便捷的算力获取途径。
  • 大模型推理将走向开源:开源大模型的推理部署将变得更加便捷,降低企业的推理算力使用门槛,推动大模型应用的广泛落地。
  • 绿色推理算力将成为标配:随着双碳目标的推进,绿色推理算力将成为算力服务商的核心竞争力之一。

对于算力服务商而言,抓住推理算力需求的新拐点,提前布局推理算力基础设施和技术方案,将在未来的市场竞争中占据主动地位。

本文转自:并济科技

内容来源于科智咨询、QuestMobile、中国IDC圈等公开信息,

引用时请以最新官方版本为准;

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算力
    +关注

    关注

    2

    文章

    1772

    浏览量

    16857
  • 大模型
    +关注

    关注

    2

    文章

    3862

    浏览量

    5295
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    直播预告|玄铁 x Canonical:本地推理到 AI 工厂,基于 RISC-V 的 AI 基础设施创新路径探讨

    AI 需求云端蔓延至终端,RISC-V 如何以一以贯之的开放架构,打通“本地推理”到“
    发表于 05-15 12:15

    科技云报到:信通院《智能服务研究报告(2026年)》深度解析 产业迎来关键破局点

    科技云报到原创。 2026年,生成式AI与大模型的规模化落地,把智能力推到了数字经济的C位。千亿参数模型的跨域训练、亿级用户的高并发
    的头像 发表于 05-12 09:42 522次阅读
    科技云报到:信通院《智能<b class='flag-5'>算</b><b class='flag-5'>力</b>服务研究报告(2026年)》深度解析 <b class='flag-5'>算</b><b class='flag-5'>力</b>产业迎来关键破局点

    AI Ceph 分布式存储教程资料大模型学习资料2026

    在人工智能的浪潮中,、算法与数据被誉为三驾马车。然而,随着大模型(LLM)参数量突破万亿级别,数据集规模膨胀 PB 乃至 EB 级别,传统的存储架构
    发表于 05-01 17:35

    神州鲲泰携手趋境科技推出大模型推理智能调度解决方案

    近日,华为中国合作伙伴大会现场,神州鲲泰与趋境科技正式签订生态合作协议,并联合推出面向企业级大模型推理场景的智能调度解决方案。
    的头像 发表于 04-17 15:12 629次阅读
    神州鲲泰携手趋境科技推出大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>智能<b class='flag-5'>算</b><b class='flag-5'>力</b>调度解决方案

    中国芯片的拐点时刻

    作者|Taylor出品|芯片技术与工艺当OpenAI的GPT-5在得克萨斯州的机房中昼夜轰鸣,当Nvdia的H200芯片被炒数十万美元仍一卡难求,中国的芯片产业正站在一个历史性拐点
    的头像 发表于 01-31 07:00 2216次阅读
    中国<b class='flag-5'>算</b><b class='flag-5'>力</b>芯片的<b class='flag-5'>拐点</b>时刻

    AI正在以肉眼可见的速度不断攀升

    模型训练到推理部署,单卡性能比拼到整机柜、整集群的系统能力竞争,AI 基础设施的演进,早已不再只是“芯片性能”的问题。
    的头像 发表于 12-24 14:21 726次阅读

    积木+3D堆叠!GPNPU架构创新,应对AI推理需求

    电子发烧友网报道(文/李弯弯)2025年,人工智能正式迈入应用推理时代。大模型从实验室走向千行百业,推理需求呈指数级爆发。然而,高昂的推理
    的头像 发表于 12-11 08:57 8234次阅读

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    反而压到了310W。更有意思的是它的异构架构:NPU+CPU+DVPP的组合,居然能同时扛住训练推理场景,之前做自动驾驶算法时,用它跑模型时延直接降了20%。 但疑惑也有:这种
    发表于 10-27 13:12

    需求狂飙下的“效率竞赛”,国产AI芯片有何破局之道?

    %,同比上升12.8个百分点。 10月15日,在2025湾芯展上,云天励飞副总裁罗忆给现场听众带来《打造智时代的新质生产》演讲,他现场提出的两大观点引发大家的共鸣。他表示,目前国内AI产业面临两大拐点:一是
    的头像 发表于 10-19 01:11 1w次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>需求</b>狂飙下的“效率竞赛”,国产AI芯片有何破局之道?

    与电力的终极博弈,填上了AIDC的“电力黑洞”

    ),专注于提供人工智能训练推理所需的服务、数据服务和算法服务。AIDC采用异构计算架构,结合GPU、FPGA、ASIC等多种AI加速芯片,形成高并发分布式系统,以满足大
    的头像 发表于 09-22 02:43 9233次阅读

    科技上线赤兔推理引擎服务,创新解锁FP8大模型

    模型轻量化部署方案。用户通过远程平台预置的模型镜像与AI工具,仅需50%的GPU即可解
    的头像 发表于 07-30 21:44 1131次阅读

    模型推理显存和计算量估计方法研究

    随着人工智能技术的飞速发展,深度学习大模型在各个领域得到了广泛应用。然而,大模型推理过程对显存和计算资源的需求较高,给实际应用带来了挑战。为了解决这一问题,本文将探讨大
    发表于 07-03 19:43

    AI新基建背后的中国芯力量——中微爱芯服务器芯片国产化替代全景解读

    人工智能(AI)技术正以颠覆性力量重塑全球产业图景,深度学习的复杂模型训练到生成式AI的实时推理,其背后是海量数据与指数级增长的
    的头像 发表于 06-20 13:55 2222次阅读
    AI<b class='flag-5'>算</b><b class='flag-5'>力</b>新基建背后的中国芯力量——中微爱芯服务器芯片国产化替代全景解读

    网络的“神经突触”:AI互联技术如何重构分布式训练范式

      电子发烧友网综合报道 随着AI技术迅猛发展,尤其是大型语言模型的兴起,对于需求呈现出爆炸性增长。这不仅推动了智中心的建设,还对网
    的头像 发表于 06-08 08:11 7879次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>网络的“神经突触”:AI互联技术如何重构分布式<b class='flag-5'>训练</b>范式

    革命:RoCE实测推理时延比InfiniBand低30%的底层逻辑

    AI 训练推理中的网络效率瓶颈,助力数据中心在高带宽、低延迟、高可靠性的需求下实现资源的最优配置。
    的头像 发表于 05-28 14:08 2330次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>革命:RoCE实测<b class='flag-5'>推理</b>时延比InfiniBand低30%的底层逻辑