0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm携手Google Cloud推进代理式AI基础设施规模化落地

Arm社区 来源:Arm社区 2026-05-06 09:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:ArmAI 事业部软件生态系统总监 Yan Fisher

Google Cloud 正通过多项升级举措,稳步推进代理式人工智能 (Agentic AI) 的规模化落地。此次更新包含全新 TPU 8t 和 TPU 8i 系统,同时在 Google Kubernetes Engine (GKE) 上线 Agent Sandbox。作为定制化部署框架,它能够高效、安全地运行复杂的多步骤 AI 系统。这套全新的代理式基础设施,搭载Google 基于 Arm Neoverse 平台打造的 Axion 处理器,充分体现出行业核心趋势:新一代 AI 工作负载正加速转向定制化 CPU 架构。

随着代理式 AI 从技术试验迈向商用部署,基础设施的需求正在迭代变革。传统推理仅依赖单次模型调用,而智能体系统需要持续编排调度逻辑推理链、工具调用和实时数据读取。这大幅拉高了并发压力、时延敏感度与整体算力消耗,让 CPU 成为承载业务稳定运行的核心关键。

这正是 Arm 架构基础设施的核心优势所在。Arm Neoverse 平台专为高吞吐、高能效计算场景打造,Google Axion 便是典型代表,已然成为规模化部署代理式 AI 的坚实底座。

规模化代理式 AI:Axion 走在前沿

Google Cloud 正式发布第八代 TPU 系统,延续了其长期深耕定制芯片设计的技术积淀。本次新品针对训练与推理应用做出差异化划分,推出 TPU 8t 与 TPU 8i 两款型号;同时首次搭载 Google Axion CPU 作为计算头节点 (header)。该设计有效降低数据预处理时延,保障 TPU 算力引擎满载运行、杜绝算力闲置卡顿。

当然,TPU 并非全部布局。Google Cloud 正全力推进“AI Hypercomputer”协同设计愿景,另一项关键发布是 GKE Agent Sandbox。它提供可扩展、低时延的基础设施,使智能体能够在不牺牲性能的前提下,安全地执行不受信任的代码和工具调用。借助 Google Axion,用户可以在领先的基础设施之上构建智能体,同时兼顾成本效益与技术选择的灵活性。

运行在 Google Axion 处理器之上、基于 gVisor 打造,且支持 Kata Containers 的 GKE Agent Sandbox,可实现以下性能指标:

每个集群每秒支持 300 个沙箱

首指令执行时延低于 1 秒

要维持如此高的沙箱吞吐能力和低时延执行表现,底层基础设施始终承受着持续压力。随着代理式 AI 逐步成为主流部署范式,其所依赖的基础设施必须在吞吐能力、响应速度与能效方面同步提升,才能在大规模场景下可靠运行智能体工作负载。Axion 正是为满足这一需求而设计。

随着智能体系统不断扩张,推理效率的重要性愈发凸显。低效的推理能力会直接导致智能体无法正常运转;而缺少智能体编排,推理算力也将长期处于闲置状态。将两大核心任务部署到基于 CPU 的基础设施之上,企业即可在严控成本的前提下,实现高性能智能体系的规模化扩展。

Axion 赋能 AI 推理:以极致性能重构成本效益

C4A 虚拟机搭载基于 Arm Neoverse V2 平台的 Axion CPU,经过深度优化,可与专用加速器形成能力互补。依托通用计算底座高效承载高并行、时延敏感型工作负载,实现高吞吐 AI 推理。

该优势已在实际部署环境中得到充分验证。欧洲在线旅游平台 loveholidays 需在 PB 级数据之上,稳定运行大规模向量嵌入与推理工作负载;规模化部署场景下,纯加速器方案成本高昂,落地门槛极高。

loveholidays 工程负责人 Dimitri Lerko 表示:“业务高速发展下,我们的词元 (token) 处理需求增速已远超预算扩容节奏。面对现有海量数据规模,依靠 GPU 承载大规模向量嵌入与推理负载成本难以为继,因此提升 CPU 能效成为核心诉求。依托 Axion 系列的 C4A 和 N4A 虚拟机,我们获得了充足的性价比优势,得以基于 CPU 构建实时 AI 决策管线,运行定制化模型与开源模型推理。这一落地模式在以往完全不具备可行性。”

实测数据显示,在多种 AI 推理工作负载中,C4A 始终优于当前一代的 x86 实例:

0e3202a4-4054-11f1-90a1-92fbcf53809c.jpg

Axion 产品组合扩展

针对需要更高控制能力的工作负载,Axion 系列新增 C4A Metal 原生裸金属实例(预览版),将一致的 Arm 架构从云端延伸至边缘侧。该实例支持跨环境统一开发、验证与部署,可直接访问硬件资源,消除虚拟化层 (hypervisor) 性能损耗,提供稳定可预期的运行表现。十分适用于需求严苛的用例,包括汽车 vHIL、原生安卓 CI/CD,以及对控制能力、性能表现与架构一致性有严苛要求的专用企业基础设施。

松下汽车系统北美公司首席技术官 Andrew Poliak 表示:“松下正跨云端与车端,打造新一代车载体验。在 C4A Metal 实例预览阶段,我们采用与边缘侧架构完全一致的 Arm 裸金属环境,研发团队可依托统一平台,完成车载应用的全流程开发、测试与验证。依托比特级一致性能力,我们可实现云端至车端的无缝迁移,在两端运行完全相同的二进制程序,无需因架构不同而为迁移部署耗费资源。”

与此同时,作为 Axion 系列最新成员的 N4A,为 Web 服务、API 调用以及数据处理管线等横向扩展型工作负载提供了高性价比的计算基础。

C4A、C4A Metal 与 N4A 共同构成了一个统一、面向不同工作负载优化的产品组合,既覆盖 AI 推理,也支持横向扩展型应用,并贯穿云端到边缘环境,帮助团队在 Arm 计算平台上同时实现性能与成本的优化。

Arm 优先部署,构筑领先生态

Arm 已支撑起业内规模庞大、增速领先的软件生态系统,持续推动云端与边缘侧向以 Arm 架构优先的计算转型。Google 已在 Axion 处理器上运行包括 BigQuery、Spanner、Bigtable、Google Earth Engine、Google Compute Engine、GKE Dataflow、Cloud Batch 等多项生产级服务,并在其部署环境中完成超 30,000 款内部应用的架构迁移。

对于刚刚启动迁移的企业,Arm 的云迁移资源中心 (Arm Cloud Migration Resource Hub)[1]提供了 100 多条 Learning Path[2],覆盖 Google Axion 上的常见工作负载模式。在整个 Neoverse 生态中,Arm Software Ecosystem Dashboard[3]可用于追踪已验证的软件及其推荐版本;同时,遵循 SystemReady VE 标准,可确保软件从部署第一天起即可实现无缝互操作。Elastic、MongoDB、Palo Alto Networks、Redis Labs 以及 Couchbase 等领先的独立软件开发商 (ISV) 均已在基于 Axion 的基础设施上完成全面验证。

开始使用 Google Axion

无论是通过 GKE Agent Sandbox 部署智能体工作负载,在 C4A 上优化推理性能,还是借助 N4A 扩展通用计算能力,Axion 都为现代 AI 基础设施提供了一个一致、基于 Arm 计算平台的坚实基础。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20344

    浏览量

    255359
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9596

    浏览量

    393838
  • Google
    +关注

    关注

    5

    文章

    1817

    浏览量

    60656

原文标题:Arm 携手 Google Cloud,依托 Axion 处理器重新定义代理式 AI 基础设施

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm计算平台持续演进赋能AI迈入全新发展阶段

    人工智能 (AI) 正迈入全新发展阶段,从技术探索试验转向规模化地持续部署具备推理、规划和执行能力的系统。代理式 AI 系统的兴起正在加速计算领域的这一变革,进一步提升
    的头像 发表于 05-06 10:03 256次阅读
    <b class='flag-5'>Arm</b>计算平台持续演进赋能<b class='flag-5'>AI</b>迈入全新发展阶段

    Infosys携手OpenAI开启企业AI转型新纪元:技术融合驱动商业价值规模化释放

    ;的双轮驱动时代。双方将通过OpenAI前沿AI模型与Infosys Topaz Fabric代理式AI套件的深度整合,帮助全球企业跨越AI实验阶段,实现从技术验证到
    的头像 发表于 05-06 09:55 318次阅读

    NVIDIA与Google Cloud携手推进代理式与物理AI发展

    NVIDIA Blackwell GPU 以及由 NVIDIA Nemotron 和 NeMo 提供支持、基于 Gemini Enterprise Agent Platform 的代理式 AI 来构建 AI 工厂。
    的头像 发表于 04-27 15:35 414次阅读

    NetApp与Google Cloud深化合作:重构分布式云数据基础设施的“安全主权”新范式

    NetApp与Google Cloud签署四年期企业级协议,通过NetApp存储解决方案与Google Distributed Cloud(GDC)的深度集成,为全球企业构建“全栈物理
    的头像 发表于 04-27 11:04 857次阅读

    Cadence 与 Google 合作,利用 ChipStack AI Super Agent 在 Google Cloud 上扩展 AI 驱动的芯片设计

    合作,利用 Google Cloud 上的 Gemini 模型优化 Cadence® ChipStack™ AI Super Agent。此次合作使 Cadence 站在向代理式设计自
    的头像 发表于 04-24 13:22 154次阅读

    Cadence与Google合作,利用ChipStack AI Super Agent在Google Cloud上扩展AI驱动的芯片设计

    Cadence ChipStack AI Super Agent 集成 Google Gemini 模型,加速新一代代理驱动型设计自动 中国上海,2026 年 4 月 24 日 ——
    的头像 发表于 04-24 10:36 1286次阅读

    Arm AGI CPU加速新一代基础设施建设

    近期,Arm 推出 Arm AGI CPU,一款由 Arm 自主设计、面向人工智能 (AI) 数据中心的 CPU,旨在满足日益增长的代理式
    的头像 发表于 04-09 15:55 365次阅读

    精彩演讲·不容错过 | 智能规模化:平台驱动,赋能半导体全生态AI分析规模化落地

    精彩演讲不容错过演讲信息论坛:设计创新论坛:AI智能应用和汽车芯片时间:2026年3月26日1645地点:上海浦东嘉里大酒店,三楼,上海厅3演讲主题:智能规模化:平台驱动,赋能半导体全生态AI分析
    的头像 发表于 03-26 13:03 409次阅读
    精彩演讲·不容错过 | 智能<b class='flag-5'>规模化</b>:平台驱动,赋能半导体全生态<b class='flag-5'>AI</b>分析<b class='flag-5'>规模化</b><b class='flag-5'>落地</b>

    泰芯半导体携手生态伙伴助力AI硬件产业规模化落地

    当前,AI大模型加速渗透硬件产业,AI硬件正从 “单点智能” 迈向 “系统级智能”,大模型已成为硬件产品的基础能力之一。顺应这一行业发展趋势,珠海泰芯半导体有限公司(以下简称 “泰芯半导体”)积极携手生态伙伴,以核心芯片技术赋能
    的头像 发表于 01-05 17:18 1441次阅读

    软通动力携手华为昇腾推进AI智能体规模化部署

    企业AI智能体规模化落地”主题演讲,分享了软通动力在AI智能体领域的前沿实践与成熟解决方案,获得行业高度关注。
    的头像 发表于 09-28 17:50 1770次阅读

    软通动力如何推动工业AI规模化落地

    近日,在2025世界人工智能大会(WAIC 2025)“AI数算 重构智造产链生态”2025智能趋势论坛上,软通动力集团咨询与数字创新服务线联席总裁李国亮受邀出席圆桌对话:《智造“最后一公里”》——工业AI
    的头像 发表于 07-30 17:27 1267次阅读

    代理式AIAI智能体在不同行业中的实际应用

    代理式 AI 的时代已经到来。如今,代理式 AI 已经驱动应用迈向深度场景融合与规模化落地。这波
    的头像 发表于 07-28 14:28 1432次阅读

    NVIDIA全栈加速代理式AI应用落地

    在近期举办的 AWS 中国峰会上,NVIDIA 聚焦于“NVIDIA 全栈加速代理式 AI 应用落地”,深入探讨了代理式 AI (Agent
    的头像 发表于 07-14 11:41 1487次阅读

    NVIDIA携手微软加速代理式AI发展

    代理式 AI 正在重新定义科学探索,推动各行各业的研究突破和创新发展。NVIDIA 和微软正通过深化合作提供先进的技术,从云到 PC 加速代理式 AI 应用的发展。
    的头像 发表于 05-27 14:03 1254次阅读

    基于代理式AI建立网络安全防御体系

    NVIDIA AI 安全栈为先进的代理式系统提供信任、控制和管理支持。
    的头像 发表于 05-07 14:29 1351次阅读