最近,Arm 发布首款自研的数据中心 CPU即Arm AGI CPU,专为代理式 AI 基础设施打造,可实现单机架性能达到 x86 平台的两倍以上。

Arm看到,随着企业不断扩大由智能体驱动的应用规模,数据中心对每吉瓦 (GW) 功耗提供的CPU算力需求将增长至当前的四倍以上。传统数据中心架构下每1吉瓦的数据中心算力需要3000万个CPU核,在AGI时代这一需求将扩展至1.2亿个。也就是说,相同功耗限制下实现算力的大幅提升。
面向 AI 规模化基础设施的ArmCPU既能支撑高吞吐量所需的性能,又能满足实际功耗限制下的能效要求,同时采用简化架构,摆脱 x86 处理器的额外开销与复杂性。如此一来,以高能效为突出特点的Arm CPU在数据中心市场具有巨大的机会。
ArmAGI CPU聚焦三大特性,单线程设计突破性能天花板
Arm AGI CPU 的核心特性从性能、扩展性、能效等方面具体来看。
首先是性能。单颗CPU集成多达136个 Arm NeoverseV3 核心,在单核、系统级芯片 (SoC)、刀片式服务器及机架各层级均实现行业领先的性能表现,同时提供每核心 6GB/s 内存带宽,时延低于 100 ns。
Arm高管解析,基于台积电3nm工艺,该CPU主频可达3.7GHz,每个核配2MB二级缓存,采用96路PCIe 6.0,CXL3.0支持内存扩展功能。DDR5支持6GB带宽,每个核能够满速运行。采用双小芯片设计,每个小芯片直接集成内存与IO,不需复杂的NUMA架构(非一致性内存访问架构),或是在片与片间跳转。
扩展性方面,300瓦TDP 设计,每线程独立核心,可在持续负载下提供确定性性能,避免降频与线程闲置。
能效方面,Arm 的参考服务器采用 1OU 双节点设计,每台刀片服务器中集成两颗 CPU 芯片,并配备独立内存与 I/O,共计 272 个核心。这些刀片服务器可在标准风冷 36 千瓦 (kW) 机架中满配部署,30 台刀片服务器可提供总计 8,160 个核心。此外,Arm 还与 Supermicro 合作推出 200 千瓦 (kW) 液冷设计方案,可容纳 336 颗 Arm AGI CPU,提供超过 45,000 个核心。
“确保每个时钟周期完成更多工作负载,这一直是ARM的优势。传统上CPU通过提升频率、超频来提升运行速度,但功耗也会随之提升。超频是没有办法长期稳定运行的。传统架构多线程状态下两个任务一个核工作,但IO和带宽并没有提升,只是把瓶颈移到了其他地方,而且CPU还要管理这些进程。数据中心运营商不得不超配30%或更多来解决非线程拓展的问题。但AGI CPU使用单线程,就可以全程稳定和满性能运行,我们可以线性拓展,我们的IO子系统为匹配这些核提供6GB内存带宽。”
这些特性能够实现更高的工作负载密度,更优的加速器利用率,并在现有功耗预算内释放更多可用算力。Arm AGI CPU 可实现单机架性能达到 x86 平台的两倍以上,每吉瓦 AI 数据中心算力的资本支出 (CAPEX) 节省高达 100 亿美元。
从IP到CSS再到自研芯片全方位方案,市场足够大客户认可度高
Arm高管表示,合作伙伴可根据需求,灵活选择 Arm IP 授权、 Arm CSS 方案,或直接部署 Arm 自主设计的芯片产品。
在谈到这种商业模式是否会与客户竞争时,Arm高管直言他们的多元化服务得到了客户的积极支持。他说,我们认为这一市场蕴藏着极其巨大的机遇,足以容纳众多参与者。除自研芯片外,我们将继续保留IP授权、计算子系统 (CSS) 授权的商业模式,我们的战略是通过产品矩阵的拓展满足广泛客户的多元化需求。包括亚马逊、谷歌、微软在内的多家Arm技术授权客户均对此次发布表示支持,他们不仅为Arm,也为整个生态感到振奋。此外,NVIDIA 也在相关视频中发表了积极评价,这些足以体现产业链各方对我们这一布局的态度。
Arm 已确认与Meta、Cerebras、Cloudflare、F5 科技、OpenAI、Positron、Rebellions、SAP、SK 电讯等企业达成进一步的商务合作。这些客户将在代理式 CPU 核心应用场景中部署 Arm AGI CPU,覆盖加速器管理、控制平面处理、云与企业级 API、任务与应用托管等领域。
为加快产品落地与规模化部署,Arm 与永擎电子、联想、广达电脑、Supermicro 等头部 OEM 厂商及 ODM 厂商展开合作,早期系统现已推出,更广泛的商用部署预计将于今年下半年落地。
超大规模云服务商、云计算、芯片、内存、网络、软件、系统设计与制造等领域的 50 余家领军企业,均对 Arm 计算平台向芯片领域拓展表示支持。其中包括亚马逊云科技、博通、谷歌、Marvell、美光、微软、NVIDIA、三星、SK 海力士、台积公司等行业标杆企业。
发布评论请先 登录
深入解析LPC3180:高性能ARM微控制器的卓越之选
NVIDIA推出Vera CPU以显著提升系统性能与能效
Nginx高并发连接调优实战手册
最小化ARM Cortex-M CPU功耗的方法与技巧分享
那么龙芯CPU性能如何呢?
Linux多线程对比单线程的优势
ARM技术的特点
Arm KleidiAI与XNNPack集成实现AI性能提升
Arm首款自研AGI CPU尽显Arm能效之优!单线程释放强大性能,同等机架塞更多CPU功耗还更低
评论