0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从英伟达电话会看Agentic AI推理与FPGA价值

FPGA技术专栏 来源:FPGA技术专栏 2026-03-04 17:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2026年2月,英伟达发布2026财年Q4财报:营收681亿美元,同比增长73%,数据中心业务增长75%——预期中的超预期。更值得关注的,是电话会中反复出现的几个关键词:Agentic AI、推理需求、低延迟。英伟达明确判断:Agentic AI 已达到实用拐点,算力已经具备盈利性,推理延迟成为 AI 基础设施的竞争焦点。

Agentic AI 改变了什么?

Agentic AI 的概念并不新鲜——让 AI 像人类一样自主规划、调用工具、完成任务,业界已经期待了很多年。但期待是一回事,愿意付费是另一回事。企业一直有一个疑问:它到底能做到什么程度?有没有用户愿意付费?值不值得我花钱?

英伟达(黄仁勋)认为 Agentic AI 已达到实用拐点,并且将年初火热的可本地化部署 AI 代理工具 OpenClaw 与 Anthropic 的 Claude Cowork 一同作为该拐点到来的市场印证。

技术上,AI 已经可以主动监控任务状态,自己调用工具、完成任务,无需人工催促。

业务上,付费模式也已经跑通,美国 AI 客服独角兽 Sierra 推行“按效果付费”——AI 成功解决问题才收费,转人工则免费,成立 18 个月估值达 100 亿美元。国内也一样,蚂蚁数科、众数信科等纷纷试点 RaaS(效果即服务)模式。众数信科与客户在招采场景达成阶梯式效果付费——按 AI 处理的案件数量及准确率分段计费。IDC 预测,到 2028 年,70% 的软件供应商将转向按业务结果、交易量或自动化成果计费。

技术突破和商业模式的跑通,将进一步加速企业竞争。

过去,推理延迟可能够用就行。现在,推理延迟就是用户体验,就是用户留存和订单转化。毕竟一个智能客服如果反应迟缓,用户可能直接挂断;一个实时翻译如果延迟波动,对话就会卡顿;一个自动驾驶决策如果慢了几毫秒,可能就是事故。

这就引出了英伟达的第二个观点,推理延迟成为AI基础设施的竞争焦点。

Agentic AI 如何改变推理需求?

会议另一细节也引起了行业关注:英伟达收购了Groq。Groq 的核心技术 LPU 最显著的特点是确定性低延迟——通过静态调度和软件定义硬件,避免传统GPU的指令调度开销。这恰恰是 GPU 架构的先天短板:为了通用性,GPU 必须保留复杂的调度逻辑,导致延迟存在波动。

这已经不是英伟达第一次引入外部技术完善生态,弥补延迟短板。早在 2023 年,英伟达就与 Lattice 合作将 FPGA 集成到 Jeston Orin 和 IGX Orin 平台中。

FPGA 端到端推理延迟可稳定在 1ms 以下,关键路径甚至可达纳秒级。对于高频交易、工业控制、自动驾驶、电子医疗等场景,这是不可替代的优势。

(FPGA+GPU 医疗内窥镜解决方案 Z19-M)

与 LPU 不同,它还更加灵活,因为它能编程、可定制。如今算法迭代速度非常快,FPGA 可随时重新配置硬件逻辑,升级算法,还能实现同一片 FPGA 验证不同功能。

FPGA 的另一优势是低功耗,它能针对特定模型定制数据通路,消除冗余计算。同性能下,功耗可降至 GPU 的 1/3 到 1/2。在功耗受限的边缘场景,这往往是能不能部署的决定性因素。同时,低功耗意味着更高的能效比,在规模化的行业客户面前,能效比的差异会被放大成真金白银的竞争力。

总结

英伟达电话会释放的信号是明确的,Agentic AI 正在引爆推理需求,算力投资将持续增长。

但同样明确的是:推理需求是多样化的,没有一种架构能通吃所有场景。GPU 在高吞吐场景中无可争议地占据主导,但低延迟、高能效、可定制的场景,正是 FPGA 的用武之地。

对行业客户而言,不是二选一,而是如何组合。异构计算——GPU+FPGA 协同工作,成为越来越多务实客户的选择。

ALINX 作为国内领先的 FPGA 开发板和解决方案商,使命是让行业客户享受 FPGA 的优势,而不必承受 FPGA 的开发之重。

我们提供:

开箱即用的 FPGA 开发板:客户即拿即用,无需从零设计硬件。

针对行业的参考设计:工业视觉、电子医疗、自动驾驶、航天通信等典型场景方案。

技术支持与方案评估:帮助客户判断“FPGA是否适合我的场景”,降低试错成本。

如果您正在评估 AI 推理硬件选型,不确定 FPGA 是否适合您的场景,欢迎联系我们。我们可以基于您的具体需求,提供方案评估。

我们愿与您一起,找到性能、延迟、成本的最优平衡。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1664

    文章

    22571

    浏览量

    640772
  • AI
    AI
    +关注

    关注

    91

    文章

    41976

    浏览量

    303077
  • 人工智能
    +关注

    关注

    1821

    文章

    50511

    浏览量

    267743
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    净利暴涨156%!英特尔释出Q1财报“王炸”,CPU迎史诗级“价值回归”?

    电子发烧友网报道(文/席安帝) 在AI大模型“一路狂奔”的时代,凭借GPU持续统治AI算力“江湖”的英伟,曾一路将英特尔远远甩在身后。   但随着
    的头像 发表于 04-27 09:07 2233次阅读
    净利暴涨156%!英特尔释出Q1财报“王炸”,CPU迎史诗级“<b class='flag-5'>价值</b>回归”?

    高通挑战英伟,发布768GB内存AI推理芯片,“出征”AI数据中心

    亿美元的数据中心市场中抢占一席之地。 就在10月28日,高通面向数据中心连发两款AI芯片,AI200 和 AI250 芯片,打造下一代 AI 推理
    的头像 发表于 10-29 10:36 4065次阅读
    高通挑战<b class='flag-5'>英伟</b><b class='flag-5'>达</b>,发布768GB内存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>数据中心

    高通挑战英伟!发布768GB内存AI推理芯片,“出征”AI数据中心

    亿美元的数据中心市场中抢占一席之地。   就在10月28日,高通面向数据中心连发两款AI芯片,AI200 和 AI250 芯片,打造下一代 AI
    的头像 发表于 10-29 09:14 6864次阅读
    高通挑战<b class='flag-5'>英伟</b><b class='flag-5'>达</b>!发布768GB内存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>数据中心

    堪称史上最强推理芯片!英伟发布 Rubin CPX,实现50倍ROI

    电子发烧友网报道(文/梁浩斌)近日,英伟AI infra峰会上发布了专为大规模上下文推理设计的全新GPU系列Rubin CPX,性能堪称炸裂!  
    的头像 发表于 09-11 08:25 1.1w次阅读
    堪称史上最强<b class='flag-5'>推理</b>芯片!<b class='flag-5'>英伟</b><b class='flag-5'>达</b>发布 Rubin CPX,实现50倍ROI

    AI推理需求井喷!英伟Q1营收大涨,H20禁售难挡增长步伐

    电子发烧友原创 章鹰 在中美科技企业争夺人工智能高地的竞争中,处于第一方阵的美国AI芯片公司英伟公司最新交出了让市场满意的答卷。 5月28日,英伟
    的头像 发表于 05-31 01:13 8508次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>需求井喷!<b class='flag-5'>英伟</b><b class='flag-5'>达</b>Q1营收大涨,H20禁售难挡增长步伐

    直播预告|玄铁 x Canonical:本地推理AI 工厂,基于 RISC-V 的 AI 基础设施创新路径探讨

    系列】专题直播第三期—— 「本地推理AI 工厂,基于 RISC-V 的 AI 基础设施创新路径探讨」 即将开播! 本期特邀无剑联盟伙伴成员 Canonical 团队与玄铁的技术专
    发表于 05-15 12:15

    GPU不是AI的唯一解:英伟用Groq LPU证明,推理赛道需要“另一条腿”

    大会上,英伟CEO黄仁勋正式发布了Vera Rubin AI超级计算机平台。这一平台的问世,不仅标志着英伟战略
    的头像 发表于 03-24 11:27 6206次阅读
    GPU不是<b class='flag-5'>AI</b>的唯一解:<b class='flag-5'>英伟</b><b class='flag-5'>达</b>用Groq LPU证明,<b class='flag-5'>推理</b>赛道需要“另一条腿”

    AI推理芯片需求爆发,OpenAI欲寻求新合作伙伴

    电子发烧友网综合报道,在人工智能迅猛发展的当下,AI推理芯片需求正呈爆发式增长。   AI推理,即支撑如ChatGPT这类AI模型响应用户问
    的头像 发表于 02-03 17:15 3423次阅读

    迈向吉瓦级AI工厂的能源变革:英伟Rubin平台电源架构解析

    随着人工智能(AI)模型参数量突破万亿级别,大语言模型(LLM)的训练向推理、以及更高级的代理型AI(Agentic
    的头像 发表于 01-15 17:42 1106次阅读
    迈向吉瓦级<b class='flag-5'>AI</b>工厂的能源变革:<b class='flag-5'>英伟</b><b class='flag-5'>达</b>Rubin平台电源架构解析

    恩智浦推出全新eIQ Agentic AI框架

    恩智浦半导体宣布推出全新eIQ Agentic AI框架,进一步巩固其在安全实时边缘AI领域的领导地位。该工具支持在边缘设备上直接实现自主智能体功能,助力资深与新手设备开发人员简化并加速智能体
    的头像 发表于 01-13 11:15 1661次阅读

    英伟重磅出手!AI 推理存储全面觉醒

    许可合作,将采用Groq的推理技术。   随后,Groq公司宣布已与英伟就其推理技术达成非独家许可协议。根据协议条款,Groq创始人乔纳森·罗斯(Jonathan Ross)、总裁桑
    的头像 发表于 12-26 08:44 1.2w次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>重磅出手!<b class='flag-5'>AI</b> <b class='flag-5'>推理</b>存储全面觉醒

    第四次工业革命AI将实现十亿倍增长 | 中国AI芯片与英伟的角色

    内容提要:黄仁勋BG2专访:英伟、OpenAI、算力未来与美国梦AI规模定律与推理的革命:在传统的AI规模定律(预训练、后训练)之上,引入
    的头像 发表于 09-29 07:20 1418次阅读
    第四次工业革命<b class='flag-5'>AI</b>将实现十亿倍增长 | 中国<b class='flag-5'>AI</b>芯片与<b class='flag-5'>英伟</b><b class='flag-5'>达</b>的角色

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    当今社会,AI已经发展很迅速了,但是你了解AI的发展历程吗?本章作者将为我们打开AI的发展历程以及需求和挑战的面纱。 2017年开始生成式AI
    发表于 09-12 16:07

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    ,以“全流量采集 + AI根因诊断 + 预测性运维”为核心支柱,推动企业网络运维模式传统的“被动响应”向“主动防御”和“故障自愈”的智能化方向跃迁。 三大核心能力:AI推理引擎重塑网
    发表于 07-16 15:29