作者:Arm 云 AI 事业部产品经理 Shivangi Agrawal
近日发布的Arm AGI CPU是 Arm 首款面向人工智能 (AI) 数据中心的量产级芯片产品。与此同时,Arm 也同步推出一款模块化、基于标准的 1OU 双节点参考服务器,将基于 Arm Neoverse V3 打造的 Arm AGI CPU 所秉持的机架优先设计理念落到实处。参考服务器提供贴近实际的生产环境,可用于工作负载评估、软件栈优化,并加速下一代 Arm 架构基础设施的落地部署。
随着 AI 应用加速普及,数据中心正迈入一个全新发展纪元。云服务规模快速扩张,受代理式 AI 用例的加速驱动,AI 工作负载不再局限于模型训练,而是开始广泛部署在商用场景中。为紧跟发展节奏,基础设施必须在供电、散热与空间限制不变的前提下,实现算力与能效的大幅提升。
性能已不再由单台服务器定义,而是由机架级来衡量。提升单机架算力、优化能效、最大化基础设施密度,已然成为现代数据中心架构设计的决定性驱动因素。
专为机架级部署而生
Arm AGI CPU 1OU 双节点参考服务器另辟蹊径,以 1OU 机箱双节点服务器形态面向机架级部署打造,大幅提升单机架的算力密度。这一设计理念贯穿平台的多个维度,呈现诸多亮点:
智能体性能调优:每节点最多搭载 136 个 Neoverse V3 核心,单核内存带宽高达 6 GB/s,延迟低于 100ns,性能稳居行业前列。
机架扩展架构:300W TDP 可在标准 36kW 风冷机架中部署多达 8,160 个核心;相较之下,500W TDP 的 x86 方案则需使用 2U 机箱。
出色算力密度:单机架性能达到同类 x86 方案两倍以上。[注]
[注] 数值为估算值
参考服务器的重要意义
放眼整个行业,芯片厂商都会利用参考平台为系统设计与软件适配提供经过验证的设计蓝本。这类平台可让基础设施合作伙伴在自研定制服务器之前,先在接近生产环境中对全新芯片进行评估。将新一代平台推向市场,需要一套完整的系统环境,包括固件、操作系统、内存、存储、网络及系统管理等组件。
参考服务器堪称量产服务器的起步基石,可实现:
加快平台上线时间:开发者可启动多种操作系统、部署软件栈,并即刻开展平台专项优化。
经过验证的系统架构:内存、I/O、存储和固件等组件均已完成预先集成和测试。
性能评估:合作伙伴可对实际工作负载进行基准测试、功耗评估,并了解平台在其生产环境中的实际表现。
加速生态系统发展:OEM/ODM、操作系统厂商、ISV 以及云服务提供商均可围绕统一平台开展协作。
全新的 Arm AGI CPU 1OU 双节点参考服务器,正是为这些目标而打造。
内在核心:Arm AGI CPU
该平台的核心,正是 Arm AGI CPU。这款处理器基于 Neoverse V3 平台打造,专为现代云计算与 AI 工作负载量身定制,凝聚了 Arm 近十年在 Neoverse 基础设施领域的技术积淀与创新成果,并转化为可规模化量产的服务器级芯片。Arm AGI CPU 采用台积公司先进的 3nm N3P 工艺制造,在 300W 风冷功耗范围内,全核频率最高可达 3.2 GHz。这为现代 AI 与云工作负载带来了高密度算力与出色的每瓦性能。
Arm AGI CPU 单颗最多集成 136 个高性能 Neoverse V3 核心,其基于 Armv9.2 指令集架构 (ISA),每个核心配备双 128 位第二代可伸缩矢量扩展 (SVE2) 单元。这些特性可高效加速 AI 与机器学习能力,支持 bfloat16 及 INT8 MMLA 指令。Arm AGI CPU 全核主频最高可达 3.2GHz(boost 最高 3.7GHz),在推理请求处理、数据预处理等对延迟敏感的任务中,展现出强劲的单核性能。其设计可灵活扩展,高度适配 AI 推理、代理式 AI、云原生计算及各类企业级实际工作负载。
高内存带宽
满足数据密集型工作负载需求
现代工作负载对系统高效处理海量数据传输的能力提出了更高要求。Arm AGI CPU 集成 12 通道 DDR5 内存,支持最高 8,800 MT/s 速率的 DIMM,提供超过 800 GB/s 的内存带宽。这种高带宽内存架构可实现单核 6 GB/s 带宽,使平台在 AI 推理、大规模数据分析、高性能数据库等工作负载下保持高吞吐能力。
通过缓解内存瓶颈,系统可以更充分地利用 CPU 核心资源,支持数据密集型业务的更高效运行。
专为异构计算设计
赋能代理式 AI 数据中心
CPU 是 AI 数据中心的基石,在代理式 AI 领域扮演关键角色,作为 AI 系统的头节点承担以下核心任务,包括协调控制平面、调度和路由工作负载、管理 I/O、处理网络与存储服务、执行安全策略、管理专用加速器之间的数据编排,以及保障整体系统的平衡。
为支撑这类异构计算环境,Arm AGI CPU 提供了丰富的高速 I/O 接口与可组合式架构,具体包括:
96 条 PCIe Gen6 通道,用于连接加速器、网络和存储;
原生支持 CXL 3.0,可实现内存扩展和池化;
AMBA CHI 扩展链路,面向未来芯粒与加速器互联架构。
凭借这些特性,CPU 可作为核心编排层,协调整个系统内的数据迁移与工作负载执行。
基于开放标准构建的模块化平台
Arm AGI CPU 1OU 双节点参考服务器在设计上同样致力于简化 Arm 合作伙伴的系统评估与平台开发工作。它搭载了预先验证的即用型软硬件框架,可快速进行设计、部署以及工作负载性能评估。该服务器设计遵循开放计算项目 (OCP) 与 Arm SystemReady 标准。
该服务器采用 OCP DC-MHS 架构,这是超大规模数据中心广泛使用的模块化服务器设计标准。该方案不仅实现了灵活的系统配置,更与现代数据中心基础设施高度兼容;尤为关键的是,它支持复用 OCP 网卡 (NIC)、DC-SCM 等现有行业标准组件,减少了定制化平台设计需求。
模块化 1OU 设计,符合 OCP DC-MHS(数据中心模块化硬件系统)规范。
采用 DC-MHS M-SDNO B305 类单路 350W 服务器主板,适配 21 英寸 ORv3 机架。
Arm SystemReady 与 Server Base Manageability 标准,可保障软件在持续扩展的 Neoverse 云平台上稳定运行。Arm AGI CPU 1OU 双节点参考服务器符合 Arm SystemReady 标准,可直接运行全球最大的软件生态系统,开箱即用,为开发者提供熟悉的环境,轻松融入 Arm 软件生态系统。
双节点 1U 设计
提升节点部署密度
Arm AGI CPU 1OU 双节点参考服务器采用双节点 (2N) 配置,可在 1U 机箱内配置两个独立计算节点,额定功耗 1,100W。此设计可让数据中心运营商在相同物理空间内,将每机架计算节点数翻倍,显著提升整体算力密度。在大规模部署场景中,该设计可实现单机架部署更多核心,同时优化空间利用率与基础设施效率。
每个节点配备:一颗 Arm AGI CPU、12 个 DDR5 DIMM 插槽,以及强大的 PCIe Gen 6.0 扩展能力。存储方面,采用 PCIe Gen5.0 SSD ,位于前端,方便运维,每个节点支持 E1.S 系统启动盘与数据盘组合,并配备额外的内置存储接口,提供更灵活的扩展选项。每个节点搭载一张 NIC 3.0 网卡,提供高带宽网络连接,保障机架内高效数据传输,并可无缝集成至现代数据中心网络。
系统管理通过搭载 ASPEED AST2600 BMC 的 DC-SCM 2.1 模块实现。标准前面板 I/O 接口(USB 3.0、1GbE、Micro USB、Mini DisplayPort)便于调试与访问。散热采用 19+1 冗余双转子风扇方案。整机通过符合 OCP ORv3 标准的 48V 总线供电,高度适配现代数据中心基础设施。
系统经过全面验证
品质值得信赖
从信号完整性仿真到硬件压力测试,Arm AGI CPU 1OU 双节点参考服务器均按照行业标准完成设计与验证。系统针对 PCIe Gen6 和 DDR5 接口执行了严格的裕量测试,标准认证流程还涵盖了眼图测试、电压/时序校验及一致性合规检测。
在散热设计上,该平台可在 40℃ 环境温度下持续稳定支撑 350W 系统级芯片 (SoC) 运行。可靠性测试涵盖高低温循环、耐湿性测试、运行负载测试 (OLT) 以及振动/冲击评估,全面保障设备在实际部署环境中的稳定性和可靠性。
此外,该平台还配备测试点、调试接口与上电调试诊断功能,支持固件与芯片验证团队的开发和调试工作。
芯片生命周期 (SLC) 管理是集群 (fleet) 管理的关键环节。随着该参考服务器的发布,Arm 同步推出全新的 Arm 系统诊断工具 (Arm System Diagnostic Tools)。作为一套现代化的 SLC 健康管理工具,它可在静默数据损坏 (SDC) 等系统问题影响工作负载前,实现提前检测、诊断与预防。压力与稳定性测试模式可保障硬件顺利部署,SDC 与 SLT 模式则可确保集群持续稳定运行。
从硬件平台到开发环境
Arm 不止于提供高性能硬件,更致力于在云端与本地环境中,为开发者打造全栈式开发体验。为此,Arm 持续深耕工具研发,让开发者能更便捷、更高效地在 Arm 平台上开展性能分析与优化工作。
相关新增功能将把系统级与硬件级运行数据整合,并提供指导性分析,帮助开发者更轻松地定位 CPU、内存及整体系统的性能瓶颈。这些举措立足于 Arm 更广泛的软件战略,旨在简化基于 Arm 平台的迁移、验证与优化流程,让开发者满怀信心地迁移至 Arm 架构,轻松达成量产级性能表现。
不断扩展的行业合作伙伴生态系统
Arm AGI CPU 得到了日益壮大的软硬件合作伙伴生态系统的鼎力支持。
Arm 携手各行业供应商,构建了覆盖内存、存储、网络等关键系统组件的认证供应商名录 (AVL),只为帮助客户放心选用经过验证的组件。
与此同时,包括永擎電子、联想、Supermicro 等主流服务器制造商正基于 Arm AGI CPU 积极开发并验证量产系统,为客户提供更加丰富的定制化方案与部署支持。
服务器离不开固件的支持。Arm 与 AMI 紧密合作,确保其行业标准的 Aptio BIOS 和 MegaRAC OneTree BMC 产品,结合 EDK2、OpenBMC 等开源参考实现,为全行业技术创新与高效运维奠定坚实基础。
为支持有意评估此平台的软件开发者与 ISV 合作伙伴,Arm 正与 Canonical、红帽、SUSE 等主流 Linux 发行版厂商紧密协作,确保为量产系统提供官方认证支持。此外,开发者可借助由适配 Arm 架构的 1,000 余款开源及商业软件包所构成的成熟软件生态系统,构建并运行自己的工作负载。
设计软件包、工具和客户支持
为加速开发进程,Arm 提供详尽的技术文档与设计软件包,包括全套原理图、布局文件、SI/PI 模型、电源与散热方案、固件指南及安装说明。另外还包含 BIOS 与 BMC 上电调试流程,方便团队集成定制固件或扩展平台功能。
客户还可访问板载调试工具、培训资源以及持续完善的自助知识库。无论客户是首次部署基于 Arm 架构的服务器,还是将 Arm AGI CPU 集成到更大规模的平台,Arm 都将在每一环节全程跟进,为其保驾护航。
加速新一代基础设施建设
Arm AGI CPU 1OU 双节点参考服务器,是推动基于 Arm 计算平台建设新一代 AI 基础设施的重要里程碑。在芯片与参考平台设计阶段,Arm AGI CPU 便以机架级部署为核心目标,助力基础设施提供商为现代数据中心提高算力密度、优化能效并降低运营成本。
此外,该系统将高性能 Arm 服务器芯片、模块化标准平台与完备的软件栈相结合,为开发者与合作伙伴提供了探索、评估与部署规模化 Arm 架构基础设施所需的各种能力。
无论你正在设计定制化基础设施、为基于 Arm 架构的系统优化工作负载,还是打造新一代具备 AI 功能的云服务,Arm AGI CPU 1OU 双节点参考服务器都将为你的业务发展提供坚实算力支撑。
* 本文为 Arm 原创文章,转载请留言联系获得授权并注明出处。
-
ARM
+关注
关注
135文章
9583浏览量
393492 -
cpu
+关注
关注
68文章
11320浏览量
225833 -
服务器
+关注
关注
14文章
10344浏览量
91738 -
数据中心
+关注
关注
18文章
5754浏览量
75195
原文标题:详解 Arm AGI CPU 1OU 双节点参考服务器
文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
Arm首款自研AGI CPU尽显Arm能效之优!单线程释放强大性能,同等机架塞更多CPU功耗还更低
全球首创!RISC-V+AI架构高性能服务器CPU成功点亮
多核服务器的CPU亲和性配置与负载均衡优化
算能发布超节点服务器,128颗BM1690芯片组成
硅谷GPU云服务器是什么意思?使用指南详解
高密度ARM服务器的散热设计
高通SoC阵列服务器
双路服务器和单路服务器区别有多大?用实际应用场景对比一文讲透
ARM服务器解决方案
云电竞服务器 工作原理
SoC集群服务器 与 ARM架构阵列服务器 关系
详解Arm AGI CPU 1OU双节点参考服务器
评论