0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm首款自研AGI CPU尽显Arm能效之优!单线程释放强大性能,同等机架塞更多CPU功耗还更低

晶芯观察 来源:未知 作者:黄晶晶 2026-03-27 09:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近,Arm 发布首款自研的数据中心 CPU即Arm AGI CPU,专为代理式 AI 基础设施打造,可实现单机架性能达到 x86 平台的两倍以上。



Arm看到,随着企业不断扩大由智能体驱动的应用规模,数据中心对每吉瓦 (GW) 功耗提供的CPU算力需求将增长至当前的四倍以上。传统数据中心架构下每1吉瓦的数据中心算力需要3000万个CPU核,在AGI时代这一需求将扩展至1.2亿个。也就是说,相同功耗限制下实现算力的大幅提升。

面向 AI 规模化基础设施的ArmCPU既能支撑高吞吐量所需的性能,又能满足实际功耗限制下的能效要求,同时采用简化架构,摆脱 x86 处理器的额外开销与复杂性。如此一来,以高能效为突出特点的Arm CPU在数据中心市场具有巨大的机会。



ArmAGI CPU聚焦三大特性,单线程设计突破性能天花板

Arm AGI CPU 的核心特性从性能、扩展性、能效等方面具体来看。

首先是性能。单颗CPU集成多达136个 Arm NeoverseV3 核心,在单核、系统级芯片 (SoC)、刀片式服务器及机架各层级均实现行业领先的性能表现,同时提供每核心 6GB/s 内存带宽,时延低于 100 ns。

Arm高管解析,基于台积电3nm工艺,该CPU主频可达3.7GHz,每个核配2MB二级缓存,采用96路PCIe 6.0,CXL3.0支持内存扩展功能。DDR5支持6GB带宽,每个核能够满速运行。采用双小芯片设计,每个小芯片直接集成内存与IO,不需复杂的NUMA架构(非一致性内存访问架构),或是在片与片间跳转。

扩展性方面,300瓦TDP 设计,每线程独立核心,可在持续负载下提供确定性性能,避免降频与线程闲置。

能效方面,Arm 的参考服务器采用 1OU 双节点设计,每台刀片服务器中集成两颗 CPU 芯片,并配备独立内存与 I/O,共计 272 个核心。这些刀片服务器可在标准风冷 36 千瓦 (kW) 机架中满配部署,30 台刀片服务器可提供总计 8,160 个核心。此外,Arm 还与 Supermicro 合作推出 200 千瓦 (kW) 液冷设计方案,可容纳 336 颗 Arm AGI CPU,提供超过 45,000 个核心。

“确保每个时钟周期完成更多工作负载,这一直是ARM的优势。传统上CPU通过提升频率、超频来提升运行速度,但功耗也会随之提升。超频是没有办法长期稳定运行的。传统架构多线程状态下两个任务一个核工作,但IO和带宽并没有提升,只是把瓶颈移到了其他地方,而且CPU还要管理这些进程。数据中心运营商不得不超配30%或更多来解决非线程拓展的问题。但AGI CPU使用单线程,就可以全程稳定和满性能运行,我们可以线性拓展,我们的IO子系统为匹配这些核提供6GB内存带宽。”

这些特性能够实现更高的工作负载密度,更优的加速器利用率,并在现有功耗预算内释放更多可用算力。Arm AGI CPU 可实现单机架性能达到 x86 平台的两倍以上,每吉瓦 AI 数据中心算力的资本支出 (CAPEX) 节省高达 100 亿美元。

从IP到CSS再到自研芯片全方位方案,市场足够大客户认可度高

Arm高管表示,合作伙伴可根据需求,灵活选择 Arm IP 授权、 Arm CSS 方案,或直接部署 Arm 自主设计的芯片产品。

在谈到这种商业模式是否会与客户竞争时,Arm高管直言他们的多元化服务得到了客户的积极支持。他说,我们认为这一市场蕴藏着极其巨大的机遇,足以容纳众多参与者。除自研芯片外,我们将继续保留IP授权、计算子系统 (CSS) 授权的商业模式,我们的战略是通过产品矩阵的拓展满足广泛客户的多元化需求。包括亚马逊、谷歌、微软在内的多家Arm技术授权客户均对此次发布表示支持,他们不仅为Arm,也为整个生态感到振奋。此外,NVIDIA 也在相关视频中发表了积极评价,这些足以体现产业链各方对我们这一布局的态度。

Arm 已确认与Meta、Cerebras、Cloudflare、F5 科技、OpenAI、Positron、Rebellions、SAP、SK 电讯等企业达成进一步的商务合作。这些客户将在代理式 CPU 核心应用场景中部署 Arm AGI CPU,覆盖加速器管理、控制平面处理、云与企业级 API、任务与应用托管等领域。

为加快产品落地与规模化部署,Arm 与永擎电子、联想、广达电脑、Supermicro 等头部 OEM 厂商及 ODM 厂商展开合作,早期系统现已推出,更广泛的商用部署预计将于今年下半年落地。

超大规模云服务商、云计算、芯片、内存、网络、软件、系统设计与制造等领域的 50 余家领军企业,均对 Arm 计算平台向芯片领域拓展表示支持。其中包括亚马逊云科技、博通、谷歌、Marvell、美光、微软、NVIDIA、三星、SK 海力士、台积公司等行业标杆企业。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm AGI CPU加速新一代基础设施建设

    近期,Arm 推出 Arm AGI CPU,一Arm 自主设计、面向人工智能 (AI) 数
    的头像 发表于 04-09 15:55 273次阅读

    深入解析LPC3180:高性能ARM微控制器的卓越

    深入解析LPC3180:高性能ARM微控制器的卓越选 在嵌入式系统设计领域,一性能、低功耗
    的头像 发表于 04-09 09:30 103次阅读

    详解Arm AGI CPU 1OU双节点参考服务器

    近日发布的Arm AGI CPUArm 面向人工智能 (AI) 数据中心的量产级芯片产
    的头像 发表于 04-01 15:09 463次阅读

    Arm亲自下场!款数据中心AGI CPU发布!

    Arm今日发布Arm 设计的数据中心 CPU——Arm
    的头像 发表于 03-25 08:39 2965次阅读
    <b class='flag-5'>Arm</b>亲自下场!<b class='flag-5'>自</b><b class='flag-5'>研</b><b class='flag-5'>首</b>款数据中心<b class='flag-5'>AGI</b> <b class='flag-5'>CPU</b>发布!

    NVIDIA推出Vera CPU以显著提升系统性能

    NVIDIA 今日发布 NVIDIA Vera CPU,这是全球专为代理式 AI 与强化学习时代打造的处理器,其效率是传统机架CPU
    的头像 发表于 03-18 14:33 1306次阅读

    Nginx高并发连接调实战手册

    Nginx 的高性能源自其事件驱动架构。与 Apache 的"每连接一线程"模型不同,Nginx 使用单线程事件循环处理数千个并发连接。理解这套架构是调的前提。
    的头像 发表于 03-16 15:28 369次阅读

    最小化ARM Cortex-M CPU功耗的方法与技巧分享

    %(当针对运行时间进行优化后)。   Thumb-2中包含了许多功能强大的指令,能够有效减少基础运算所需的时钟周期数。减少时钟周期数意味着现在你能够以更少的CPU功耗完成手头的工作。例如,假设要完成一
    发表于 01-21 06:19

    那么龙芯CPU性能如何呢?

    龙芯系列CPU的最新动态 以下是龙芯系列CPU的最新动态(截至2025年10月): 龙芯CPU性能如何? 以下是龙芯CPU
    的头像 发表于 12-03 13:42 1384次阅读

    Linux多线程对比单线程的优势

    。「提高响应性」:线程可以使程序更加响应用户输入或其他事件,避免阻塞。线程相比单线程的优点:「并发性」:多线程可以同时执行多个任务,而单线程
    发表于 12-01 06:11

    ARM技术的特点

    精简指令集(RISC) 与复杂指令集(CISC,如 x86 架构)相比,ARM 指令集更简洁,指令长度固定(多为 32 位),执行效率更高,适合低功耗场景。 低功耗与高性能平衡 设计注
    发表于 08-18 13:31

    Arm KleidiAI与XNNPack集成实现AI性能提升

    Arm KleidiAI 首次集成到 XNNPack 已过去整整一年。KleidiAI 是一高度优化的软件库,旨在加速 Arm CPU
    的头像 发表于 08-08 15:19 3102次阅读
    <b class='flag-5'>Arm</b> KleidiAI与XNNPack集成实现AI<b class='flag-5'>性能</b>提升

    Arm CEO:公司正在芯片

    据外媒路透社报道,Arm CEO Rene Haas透露,Arm正在投资开发自有芯片,并计划将部分利润投资于制造自己的芯片和其他组件。与对应的是Arm预测的下一财季经营业绩也会因为
    的头像 发表于 07-31 11:49 761次阅读

    Arm 公司面向移动端市场的 ​Arm Lumex​ 深度解读

    子系统(CSS)​ ​ 在移动端的落地形态,Lumex 旨在通过高度集成化的软硬件方案,解决移动设备在 AI 性能比与开发效率上的挑战。以下从技术架构、性能突破、应用场景、生态系
    的头像 发表于 05-29 09:54 4543次阅读

    正点原子Linux最小系统板RK3506B资料发布!超低功耗,满载功耗低发热小,实现性能双突破!

    正点原子Linux最小系统板RK3506B资料发布!超低功耗,满载功耗低发热小,实现性能双突破! 正点原子RK3506B开发板基于RK
    发表于 05-15 15:27

    Arm CPU适配通义千问Qwen3系列模型

    与阿里巴巴开源的轻量级深度学习框架 MNN 已深度集成。得益于此,Qwen3-0.6B、Qwen3-1.7B 及 Qwen3-4B 三模型能够在搭载 Arm 架构 CPU 的移动设备上无缝运行,为用户提供卓越的端侧 AI 推
    的头像 发表于 05-12 16:37 1581次阅读