0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云开发者正加速向Arm架构迁移

Arm社区 来源:Arm社区 2026-02-02 15:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能 (AI) 正重塑数字格局,开发者也正面临全新挑战:基础设施不仅要具备强大算力,还需兼具可扩展性、成本效益和高能效等特征。当前,亚马逊云科技、谷歌、微软、Oracle Cloud Infrastructure (OCI) 及 NVIDIA 等超大规模云服务提供商与 AI 领军企业,均已基于 Arm 架构打造定制化解决方案,布局 AI 数据中心

这一趋势正在蓬勃展开。2025 年头部超大规模云服务提供商的新增服务器算力中,有近半数是基于 Arm 架构。Arm Neoverse 平台正在为量产级 AI 工作流、向量搜索引擎、实时机器学习 (ML) 平台及云原生微服务提供算力支撑,同时在成本效益、吞吐量与节能方面实现可量化的显著提升。随着 AI 工作负载持续扩展,基础设施的选择愈发关键。

若你是开发者,现在正是探索 Arm 架构基础设施适配工具的最佳时机 —— 这类工具大多支持自助式使用,专为加速业务迁移而打造。若你是企业首席信息官 (CIO),不妨继续阅读,了解哪些企业已率先完成向 Arm 架构的迁移,以及它们在生产环境中实现了怎样的性能与成本收益。

下文将为你拆解当前架构变革的核心内容、背后的关键价值,以及众多开发者如何借助自助式工具,以超乎预期的速度加速向 Arm 架构迁移。

AI 工作负载贯穿端到端

Arm 赋能全流程优化

AI 的应用早已不再局限于推理或模型训练环节。从数据预处理、模型编排,到实时服务与内存管理,如今的 AI 技术栈已覆盖整个计算工作流。这也带来了延迟、成本、功耗及扩展性方面的全新系统级挑战,而这些早已超出了传统通用 CPU 的设计初衷与能力范围。

Arm 在这场变革中扮演核心角色 —— 其价值不仅限于 CPU 层面,更贯穿整个 AI 系统架构。

在亚马逊云科技, Arm Neoverse 核心为 Graviton 通用计算平台、Nitro 数据处理单元 (DPU) 提供算力支撑,并作为 AI 加速器的头节点 (head node),为 AI 工作流打造高度集成、能效出众的基础设施。

NVIDIA 亦采用类似架构设计:Arm 架构是 Grace 与 Vera CPU 的技术基石,二者均作为 AI 系统的头节点部署;同时 Arm 还为 BlueField DPU 提供算力支撑,助力数据迁移与卸载处理,为 AI 数据中心设计打造一体化的平台解决方案。

凭借卓越的每瓦性能、强大的内存带宽,以及在Amazon Graviton、Google Cloud Axion、Microsoft Azure Cobalt、NVIDIA Grace 等平台上的规模化部署,基于 Arm 架构的基础设施正日益成为可扩展、高性价比 AI 工作负载的优选方案。

Arm 正成为云计算的新标准

云计算领域正经历一场战略性转变:全球领先的云服务提供商均在加码基于 Arm 架构的基础设施建设,将其作为融合型 AI 数据中心规模化部署的默认路径。这并非试点探索,而是着眼于长期的架构战略。

在软件层面,Atlassian、Spotify 和优步 (Uber) 等企业,已开始借助通用工具与社区文档,将核心工作负载迁移至基于 Arm 架构的云基础设施,且无需对底层平台进行深度重构。Atlassian 表示,在将核心服务迁移至 Arm 实例后,计算成本显著降低,CI/CD 工作流运行速度也得到提升;Spotify 在后端工作负载中试用 Graviton 平台后,实现了显著的基础设施效率提升;Uber 则通过基于 Arm 架构的基础设施,在优化微服务性能的同时,降低了单实例的运营成本。

与此同时,Arm 提供的一系列工具正加速这一迁移进程。例如 Arm 模型上下文协议 (MCP) 服务器以及集成于 GitHub Copilot 的 Arm 云迁移智能体 (Cloud Migration Agent),正帮助开发者评估工作负载兼容性、加快云迁移进程,并实现稳定可靠的规模化部署。目前,专为各类 Arm 云平台量身打造的 Arm MCP 服务器已面向所有软件开发者开放,它可将云迁移工具与专业经验直接融入开发者常用的 AI 助手中,从而赋能自主化的智能体工作流。

通过自动化最佳实践、加速开发流程并提供实时指导,该工具显著简化了迁移路径,让开发团队从项目首日起,即可更轻松地获得成本、能效与性能优势。早期用户的反馈也验证了其在真实迁移场景中具备高度实用性。

开发者转向 Arm 架构的五大案例

除上述全球软件企业外,其他科技公司在日常运营中采用基于 Arm 架构的云基础设施时,也收获了类似效益。

借助 Graviton3,LLM 推理成本降低 35%

Vociply AI 是一家专注于大规模部署大语言模型 (LLM) 的 AI 初创企业,在切换至 Amazon Graviton3 后,其月度基础设施成本从 2000 美元降至 1300 美元,同时性能实现同步提升,具体包括:

性价比提升 40%

词元 (token) 吞吐量提升 15.6%

功耗降低 23%

这一成果得益于 Arm Neoverse 核心、Neon 指令集深度优化,以及 llama.cpp 等量化推理引擎的支持。

生成式 AI 工作流提速,基础设施成本降低 40%

生成式 IT 及 AI 解决方案平台 Esankethik 将其完整技术栈 —— 涵盖预处理、训练与推理环节,全面迁移至基于 Arm 架构的 Graviton 实例,取得了显著成效,具体包括:

推理业务延迟降低 25%

每百万次请求的 Lambda 成本降低 40%

内存效率提升 15%

通过在 Arm 平台上统一运行预处理、训练与推理任务,Esankethik 有效缓解了性能瓶颈,并显著提升了系统可扩展性。

SiteMana 实现实时 ML 的稳定规模化

获客技术公司 SiteMana 已将其实时 ML 推理与数据摄取任务迁移至 Graviton3 平台,并取得了显著成效:

月度成本降低约 25%

P95 延迟降低约 15%

网络带宽提升 2.5 倍

此次迁移有效解决了 CPU 降频问题,并实现了峰值负载下的系统性能稳定。

AuthZed 提升开发者工作流效率

AuthZed 作为基础设施服务授权平台,已将其从开发笔记本到云端的所有工作负载统一迁移至 Arm 架构,由此实现了:

本地构建速度提升 40%

生产环境 CPU 利用率提升 20% - 25%

计算成本降低约 20%

该方案在不改变开发者既有工作习惯的前提下,实现了工作流程的大幅精简优化。

Zilliz Cloud 提升 AI 搜索吞吐量

面向生产级 AI 应用的全托管向量数据库平台 Zilliz Cloud,将其向量搜索引擎迁移至 Graviton3 后,实现了以下优化成果:

索引构建性能提升 50%

十亿级查询场景下,向量搜索速度提升 20%

单查询成本降低,吞吐量提升

该成果适用于语义搜索、检索增强生成 (RAG) 及多模态 AI 任务。

为 AI 云时代而生

Arm Neoverse 专为现代工作负载打造 —— 涵盖 LLM、向量搜索、实时 ML、数据分析及高密度微服务等场景。与 x86 相比,基于 Arm 的实例具备以下优势:

更卓越的性价比优势

更出色的 AI 与云原生工作负载性能

成熟的软件生态与完善的开发者工具链

通过 Arm KleidiAI 为 AI 框架提供优化支持,实现无缝性能调优与集成

Arm 提供涵盖开发者资源、性能调优指南与云迁移清单在内的完整套件,显著简化 AI 与云工作负载的迁移流程。这些资源可降低迁移阻力,支持性能调优,且无需对平台进行全面重构。

开发者可通过 Arm 云迁移计划获取迁移资源、技术指南及专家咨询服务。此外,Arm MCP 服务器现已向所有开发者开放,可帮助识别并高效执行从 x86 到 Arm 架构的迁移。

Arm 云迁移计划:https://www.arm.com/zh-cn/markets/computing-infrastructure/arm-cloud-migration

Arm MCP 服务器:https://developer.arm.com/servers-and-cloud-computing/arm-mcp-server

AI 时代的基础设施平台

基于 Arm 的云基础设施正快速成为 AI 计算战略的基石。

随着工作负载持续扩展,能效的重要性日益凸显,基础设施需以更少资源提供更多价值。Arm 为打造下一代 AI 系统的开发者,提供了切实可行的实践路径。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9583

    浏览量

    393490
  • AI
    AI
    +关注

    关注

    91

    文章

    40941

    浏览量

    302520
  • 工作负载
    +关注

    关注

    0

    文章

    14

    浏览量

    2125

原文标题:

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2025华为开发者大赛暨开发者年度会议成功举办

    开发者大赛总决赛、CEO圆桌、主论坛大咖分享、分论坛技术演讲、开发者展区&CodeLabs等多元议题,推动开发工具链、智能体开发、具身智能
    的头像 发表于 12-31 13:32 965次阅读

    深入剖析ARM64异常处理:开发者必须掌握的底层核心逻辑

    与软件的协同操作逻辑,都是开发者必备的核心能力。今天我们就深度拆解ARM64异常处理机制,同时聊聊 开发者为何必须关注这一技术点 。 一、异常发生后,CPU的自动操作细节 当ARM64
    的头像 发表于 12-24 07:05 1322次阅读
    深入剖析<b class='flag-5'>ARM</b>64异常处理:<b class='flag-5'>开发者</b>必须掌握的底层核心逻辑

    2025乐鑫科技全球开发者大会圆满落幕

    2025 年 11 月 25–26 日,第四届乐鑫全球开发者大会圆满落幕。两天时间里,围绕 “从到端的智能创新”,乐鑫科技 (688018.SH) 携手全球生态伙伴,在线上与开发者们共同搭建了一场关于 AIoT 未来形态的技术
    的头像 发表于 12-05 10:35 1054次阅读

    开源实,下一个标杆就是你!RT-Thread 20周年开发者大会全球招募开启

    当开源的种子在二十年前播下,谁能预见,它将长成一片驱动万物智联的茂密森林?当一行行代码被全球开发者共同编织,谁能想象,它悄然重塑我们身边的生产力基石?今天,我们怀着无比激动与感恩的心情,全球
    的头像 发表于 12-01 18:17 478次阅读
    开源<b class='flag-5'>向</b>实,下一个标杆就是你!RT-Thread 20周年<b class='flag-5'>开发者</b>大会全球招募开启

    2025开放原子开发者大会开源欧拉AI创新分论坛即将启幕

    智算浪潮席卷全球,操作系统正从“适配AI”“原生AI”跨越,开源模式已成为技术突破与全球协作的核心引擎。聚焦AGI时代的算力需求与业务创新,11月21日,2025开放原子开发者大会——开源欧拉AI
    的头像 发表于 11-13 09:59 765次阅读

    Arm亮相2025 OPPO开发者大会

    10 月 15 日,OPPO ColorOS 16 发布会暨 OPPO 开发者大会在深圳隆重召开,大会现场除发布 OPPO 最新技术外,还举办了多场论坛,与业界领袖共同探讨科技创新与人工智能 (AI
    的头像 发表于 10-18 14:52 2372次阅读

    华为开发者共赢AI未来

    ,与开发者共赢”主题演讲,详细阐述了华为生态的最新进展,并宣布华为开发者空间全面升级,全新集成多种AI原生应用开发能力。
    的头像 发表于 09-20 15:58 1803次阅读

    华为与全球开发者共赢昇腾生态

    在华为全联接大会2025期间,华为昇腾计算业务总裁张迪煊发表了“以开发者为中心,加速自主创新,共赢昇腾生态”的主题演讲,宣布CANN技术指导委员会正式成立,并表示昇腾将持续聚焦开发者诉求,围绕昇腾的开放性、易用性和兼容性进行
    的头像 发表于 09-20 15:57 2106次阅读

    一文了解Arm神经超级采样 (Arm Neural Super Sampling, Arm NSS) 深入探索架构、训练和推理

    本文将从训练、网络架构到后处理和推理等方面,深入探讨 Arm 神经超级采样 (Arm Neural Super Sampling, Arm NSS) 的工作原理,希望为机器学习 (ML
    的头像 发表于 08-14 16:11 3242次阅读

    矽速科技正式入驻 RuyiSDK 开发者社区,共建 RISC-V 开发者生态!

    开发的开源套件,致力于为RISC-V开发者提供完整、全栈、功能强大的开发工具链,涵盖编译、调试、模拟等全流程支持,并兼容市场上主流RISC-V开发板,
    的头像 发表于 07-10 11:00 1368次阅读
    矽速科技正式入驻 RuyiSDK <b class='flag-5'>开发者</b>社区,共建 RISC-V <b class='flag-5'>开发者</b>生态!

    HDC 2025开发者主题演讲精彩回顾

    日前,华为开发者大会(HDC 2025)进入第二天,行业领袖、技术专家、全球开发者齐聚现场,共同见证这场科技盛会。在开发者主题演讲中,华为技术专家深入解析HarmonyOS的最新技术、体验创新以及
    的头像 发表于 07-09 11:20 1466次阅读

    广汽集团亮相华为开发者大会2025

    此前,6月20日-22日,华为开发者大会(HDC 2025)火热举办,超过200名各行业代表、全球开发者齐聚一堂,共襄盛举。广汽集团副总经理江秀、数字化业务领域负责人及相关业务代表等参加本次大会。
    的头像 发表于 06-27 16:22 1172次阅读

    Arm携手微软共筑计算和PC未来

    计算平台并从中受益。无论是在 Microsoft Azure 的云端还是在 Windows on Arm PC 的边缘侧,开发者可以在任何地方加速其应用和工作负载。
    的头像 发表于 05-28 14:08 1045次阅读

    诚迈科技携HongZOS亮相开源鸿蒙开发者大会,加速生态繁荣与产业跃迁

    5月24日,开源鸿蒙开发者大会2025在深圳隆重举行。作为开源鸿蒙生态的核心共建和A类捐赠人,诚迈科技深度参与本次盛会:共同发布开源鸿蒙5.1Release版本,斩获多项荣誉,并展示了基于开源鸿蒙
    的头像 发表于 05-26 11:59 1327次阅读
    诚迈科技携HongZOS亮相开源鸿蒙<b class='flag-5'>开发者</b>大会,<b class='flag-5'>加速</b>生态繁荣与产业跃迁

    Windows Arm64托管运行器正式支持GitHub Actions

    的面向 GitHub Copilot 的 Arm 扩展程序,更是进一步简化并加速 Arm 架构服务器的
    的头像 发表于 04-28 14:23 1280次阅读