0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

详解Arm AGI CPU 1OU双节点参考服务器

Arm社区 来源:Arm社区 2026-04-01 15:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:ArmAI 事业部产品经理 Shivangi Agrawal

近日发布的Arm AGI CPU是 Arm 首款面向人工智能 (AI) 数据中心的量产级芯片产品。与此同时,Arm 也同步推出一款模块化、基于标准的 1OU 双节点参考服务器,将基于 Arm Neoverse V3 打造的 Arm AGI CPU 所秉持的机架优先设计理念落到实处。参考服务器提供贴近实际的生产环境,可用于工作负载评估、软件栈优化,并加速下一代 Arm 架构基础设施的落地部署。

随着 AI 应用加速普及,数据中心正迈入一个全新发展纪元。云服务规模快速扩张,受代理式 AI 用例的加速驱动,AI 工作负载不再局限于模型训练,而是开始广泛部署在商用场景中。为紧跟发展节奏,基础设施必须在供电、散热与空间限制不变的前提下,实现算力与能效的大幅提升。

性能已不再由单台服务器定义,而是由机架级来衡量。提升单机架算力、优化能效、最大化基础设施密度,已然成为现代数据中心架构设计的决定性驱动因素。

专为机架级部署而生

Arm AGI CPU 1OU 双节点参考服务器另辟蹊径,以 1OU 机箱双节点服务器形态面向机架级部署打造,大幅提升单机架的算力密度。这一设计理念贯穿平台的多个维度,呈现诸多亮点:

智能体性能调优:每节点最多搭载 136 个 Neoverse V3 核心,单核内存带宽高达 6 GB/s,延迟低于 100ns,性能稳居行业前列。

机架扩展架构:300W TDP 可在标准 36kW 风冷机架中部署多达 8,160 个核心;相较之下,500W TDP 的 x86 方案则需使用 2U 机箱。

出色算力密度:单机架性能达到同类 x86 方案两倍以上。[注]

[注] 数值为估算值

参考服务器的重要意义

放眼整个行业,芯片厂商都会利用参考平台为系统设计与软件适配提供经过验证的设计蓝本。这类平台可让基础设施合作伙伴在自研定制服务器之前,先在接近生产环境中对全新芯片进行评估。将新一代平台推向市场,需要一套完整的系统环境,包括固件、操作系统、内存、存储、网络及系统管理等组件。

参考服务器堪称量产服务器的起步基石,可实现:

加快平台上线时间:开发者可启动多种操作系统、部署软件栈,并即刻开展平台专项优化。

经过验证的系统架构:内存、I/O、存储和固件等组件均已完成预先集成和测试。

性能评估:合作伙伴可对实际工作负载进行基准测试、功耗评估,并了解平台在其生产环境中的实际表现。

加速生态系统发展:OEM/ODM、操作系统厂商、ISV 以及云服务提供商均可围绕统一平台开展协作。

全新的 Arm AGI CPU 1OU 双节点参考服务器,正是为这些目标而打造。

内在核心:Arm AGI CPU

该平台的核心,正是 Arm AGI CPU。这款处理器基于 Neoverse V3 平台打造,专为现代云计算与 AI 工作负载量身定制,凝聚了 Arm 近十年在 Neoverse 基础设施领域的技术积淀与创新成果,并转化为可规模化量产的服务器级芯片。Arm AGI CPU 采用台积公司先进的 3nm N3P 工艺制造,在 300W 风冷功耗范围内,全核频率最高可达 3.2 GHz。这为现代 AI 与云工作负载带来了高密度算力与出色的每瓦性能。

Arm AGI CPU 单颗最多集成 136 个高性能 Neoverse V3 核心,其基于 Armv9.2 指令集架构 (ISA),每个核心配备双 128 位第二代可伸缩矢量扩展 (SVE2) 单元。这些特性可高效加速 AI 与机器学习能力,支持 bfloat16 及 INT8 MMLA 指令。Arm AGI CPU 全核主频最高可达 3.2GHz(boost 最高 3.7GHz),在推理请求处理、数据预处理等对延迟敏感的任务中,展现出强劲的单核性能。其设计可灵活扩展,高度适配 AI 推理、代理式 AI、云原生计算及各类企业级实际工作负载。

高内存带宽

满足数据密集型工作负载需求

现代工作负载对系统高效处理海量数据传输的能力提出了更高要求。Arm AGI CPU 集成 12 通道 DDR5 内存,支持最高 8,800 MT/s 速率的 DIMM,提供超过 800 GB/s 的内存带宽。这种高带宽内存架构可实现单核 6 GB/s 带宽,使平台在 AI 推理、大规模数据分析、高性能数据库等工作负载下保持高吞吐能力。

通过缓解内存瓶颈,系统可以更充分地利用 CPU 核心资源,支持数据密集型业务的更高效运行。

专为异构计算设计

赋能代理式 AI 数据中心

CPU 是 AI 数据中心的基石,在代理式 AI 领域扮演关键角色,作为 AI 系统的头节点承担以下核心任务,包括协调控制平面、调度和路由工作负载、管理 I/O、处理网络与存储服务、执行安全策略、管理专用加速器之间的数据编排,以及保障整体系统的平衡。

为支撑这类异构计算环境,Arm AGI CPU 提供了丰富的高速 I/O 接口与可组合式架构,具体包括:

96 条 PCIe Gen6 通道,用于连接加速器、网络和存储;

原生支持 CXL 3.0,可实现内存扩展和池化;

AMBA CHI 扩展链路,面向未来芯粒与加速器互联架构。

凭借这些特性,CPU 可作为核心编排层,协调整个系统内的数据迁移与工作负载执行。

基于开放标准构建的模块化平台

Arm AGI CPU 1OU 双节点参考服务器在设计上同样致力于简化 Arm 合作伙伴的系统评估与平台开发工作。它搭载了预先验证的即用型软硬件框架,可快速进行设计、部署以及工作负载性能评估。该服务器设计遵循开放计算项目 (OCP) 与 Arm SystemReady 标准。

该服务器采用 OCP DC-MHS 架构,这是超大规模数据中心广泛使用的模块化服务器设计标准。该方案不仅实现了灵活的系统配置,更与现代数据中心基础设施高度兼容;尤为关键的是,它支持复用 OCP 网卡 (NIC)、DC-SCM 等现有行业标准组件,减少了定制化平台设计需求。

模块化 1OU 设计,符合 OCP DC-MHS(数据中心模块化硬件系统)规范。

采用 DC-MHS M-SDNO B305 类单路 350W 服务器主板,适配 21 英寸 ORv3 机架。

Arm SystemReady 与 Server Base Manageability 标准,可保障软件在持续扩展的 Neoverse 云平台上稳定运行。Arm AGI CPU 1OU 双节点参考服务器符合 Arm SystemReady 标准,可直接运行全球最大的软件生态系统,开箱即用,为开发者提供熟悉的环境,轻松融入 Arm 软件生态系统。

双节点 1U 设计

提升节点部署密度

Arm AGI CPU 1OU 双节点参考服务器采用双节点 (2N) 配置,可在 1U 机箱内配置两个独立计算节点,额定功耗 1,100W。此设计可让数据中心运营商在相同物理空间内,将每机架计算节点数翻倍,显著提升整体算力密度。在大规模部署场景中,该设计可实现单机架部署更多核心,同时优化空间利用率与基础设施效率。

每个节点配备:一颗 Arm AGI CPU、12 个 DDR5 DIMM 插槽,以及强大的 PCIe Gen 6.0 扩展能力。存储方面,采用 PCIe Gen5.0 SSD ,位于前端,方便运维,每个节点支持 E1.S 系统启动盘与数据盘组合,并配备额外的内置存储接口,提供更灵活的扩展选项。每个节点搭载一张 NIC 3.0 网卡,提供高带宽网络连接,保障机架内高效数据传输,并可无缝集成至现代数据中心网络。

系统管理通过搭载 ASPEED AST2600 BMC 的 DC-SCM 2.1 模块实现。标准前面板 I/O 接口(USB 3.0、1GbE、Micro USB、Mini DisplayPort)便于调试与访问。散热采用 19+1 冗余双转子风扇方案。整机通过符合 OCP ORv3 标准的 48V 总线供电,高度适配现代数据中心基础设施。

系统经过全面验证

品质值得信赖

信号完整性仿真到硬件压力测试,Arm AGI CPU 1OU 双节点参考服务器均按照行业标准完成设计与验证。系统针对 PCIe Gen6 和 DDR5 接口执行了严格的裕量测试,标准认证流程还涵盖了眼图测试、电压/时序校验及一致性合规检测。

在散热设计上,该平台可在 40℃ 环境温度下持续稳定支撑 350W 系统级芯片 (SoC) 运行。可靠性测试涵盖高低温循环、耐湿性测试、运行负载测试 (OLT) 以及振动/冲击评估,全面保障设备在实际部署环境中的稳定性和可靠性。

此外,该平台还配备测试点、调试接口与上电调试诊断功能,支持固件与芯片验证团队的开发和调试工作。

芯片生命周期 (SLC) 管理是集群 (fleet) 管理的关键环节。随着该参考服务器的发布,Arm 同步推出全新的 Arm 系统诊断工具 (Arm System Diagnostic Tools)。作为一套现代化的 SLC 健康管理工具,它可在静默数据损坏 (SDC) 等系统问题影响工作负载前,实现提前检测、诊断与预防。压力与稳定性测试模式可保障硬件顺利部署,SDC 与 SLT 模式则可确保集群持续稳定运行。

从硬件平台到开发环境

Arm 不止于提供高性能硬件,更致力于在云端与本地环境中,为开发者打造全栈式开发体验。为此,Arm 持续深耕工具研发,让开发者能更便捷、更高效地在 Arm 平台上开展性能分析与优化工作。

相关新增功能将把系统级与硬件级运行数据整合,并提供指导性分析,帮助开发者更轻松地定位 CPU、内存及整体系统的性能瓶颈。这些举措立足于 Arm 更广泛的软件战略,旨在简化基于 Arm 平台的迁移、验证与优化流程,让开发者满怀信心地迁移至 Arm 架构,轻松达成量产级性能表现。

不断扩展的行业合作伙伴生态系统

Arm AGI CPU 得到了日益壮大的软硬件合作伙伴生态系统的鼎力支持。

Arm 携手各行业供应商,构建了覆盖内存、存储、网络等关键系统组件的认证供应商名录 (AVL),只为帮助客户放心选用经过验证的组件。

与此同时,包括永擎電子、联想、Supermicro 等主流服务器制造商正基于 Arm AGI CPU 积极开发并验证量产系统,为客户提供更加丰富的定制化方案与部署支持。

服务器离不开固件的支持。Arm 与 AMI 紧密合作,确保其行业标准的 Aptio BIOS 和 MegaRAC OneTree BMC 产品,结合 EDK2、OpenBMC 等开源参考实现,为全行业技术创新与高效运维奠定坚实基础。

为支持有意评估此平台的软件开发者与 ISV 合作伙伴,Arm 正与 Canonical、红帽、SUSE 等主流 Linux 发行版厂商紧密协作,确保为量产系统提供官方认证支持。此外,开发者可借助由适配 Arm 架构的 1,000 余款开源及商业软件包所构成的成熟软件生态系统,构建并运行自己的工作负载。

设计软件包、工具和客户支持

为加速开发进程,Arm 提供详尽的技术文档与设计软件包,包括全套原理图、布局文件、SI/PI 模型、电源与散热方案、固件指南及安装说明。另外还包含 BIOS 与 BMC 上电调试流程,方便团队集成定制固件或扩展平台功能。

客户还可访问板载调试工具、培训资源以及持续完善的自助知识库。无论客户是首次部署基于 Arm 架构的服务器,还是将 Arm AGI CPU 集成到更大规模的平台,Arm 都将在每一环节全程跟进,为其保驾护航。

加速新一代基础设施建设

Arm AGI CPU 1OU 双节点参考服务器,是推动基于 Arm 计算平台建设新一代 AI 基础设施的重要里程碑。在芯片与参考平台设计阶段,Arm AGI CPU 便以机架级部署为核心目标,助力基础设施提供商为现代数据中心提高算力密度、优化能效并降低运营成本。

此外,该系统将高性能 Arm 服务器芯片、模块化标准平台与完备的软件栈相结合,为开发者与合作伙伴提供了探索、评估与部署规模化 Arm 架构基础设施所需的各种能力。

无论你正在设计定制化基础设施、为基于 Arm 架构的系统优化工作负载,还是打造新一代具备 AI 功能的云服务,Arm AGI CPU 1OU 双节点参考服务器都将为你的业务发展提供坚实算力支撑。

* 本文为 Arm 原创文章,转载请留言联系获得授权并注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9583

    浏览量

    393492
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11320

    浏览量

    225833
  • 服务器
    +关注

    关注

    14

    文章

    10344

    浏览量

    91738
  • 数据中心
    +关注

    关注

    18

    文章

    5754

    浏览量

    75195

原文标题:详解 Arm AGI CPU 1OU 双节点参考服务器

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm AGI CPU加速新一代基础设施建设

    近期,Arm 推出 Arm AGI CPU,一款由 Arm 自主设计、面向人工智能 (AI) 数据中心的
    的头像 发表于 04-09 15:55 275次阅读

    Arm首款自研AGI CPU尽显Arm能效之优!单线程释放强大性能,同等机架塞更多CPU功耗还更低

    的应用规模,数据中心对每吉瓦 (GW) 功耗提供的CPU算力需求将增长至当前的四倍以上。传统数据中心架构下每1吉瓦的数据中心算力需要3000万个CPU核,在AGI时代这一需求将扩展至1
    的头像 发表于 03-27 09:12 221次阅读
    <b class='flag-5'>Arm</b>首款自研<b class='flag-5'>AGI</b> <b class='flag-5'>CPU</b>尽显<b class='flag-5'>Arm</b>能效之优!单线程释放强大性能,同等机架塞更多<b class='flag-5'>CPU</b>功耗还更低

    Arm亲自下场!自研首款数据中心AGI CPU发布!

    Arm今日发布首款由 Arm 设计的数据中心 CPU——Arm AGI CPU,专为代理式 AI
    的头像 发表于 03-25 08:39 2966次阅读
    <b class='flag-5'>Arm</b>亲自下场!自研首款数据中心<b class='flag-5'>AGI</b> <b class='flag-5'>CPU</b>发布!

    全球首创!RISC-V+AI架构高性能服务器CPU成功点亮

    电子发烧友网报道 长久以来,全球高端服务器CPU市场一直被x86和ARM架构所主导,我国在核心算力领域长期受制于人,高端芯片供应链安全面临重大挑战。   近日,蓝芯算力(深圳)科技有限公司宣布,公司
    的头像 发表于 02-28 09:22 6605次阅读

    多核服务器CPU亲和性配置与负载均衡优化

    某大厂的资深架构师小王最近遇到了一个头疼的问题:新采购的路AMD EPYC 7763(128核心)服务器,在高并发场景下的性能表现竟然还不如之前的32核服务器。经过深入排查,发现问题出在CP
    的头像 发表于 08-27 14:45 1020次阅读

    43630-2023服务器最新节能标准适用范围

    服务器能效限定值及能效等级》的适用范围如下:适用范围1.产品类型-塔式服务器:单路(1CPU插槽)或
    的头像 发表于 08-07 10:30 2225次阅读
    43630-2023<b class='flag-5'>服务器</b>最新节能标准适用范围

    算能发布超节点服务器,128颗BM1690芯片组成

    电子发烧友网综合报道 在2025世界人工智能大会上,算能最新发布了一款超节点服务器,可提供多达8T显存空间以及巨大的FP8算力,形成一台强大“智算服务器”单机设备。据工作人员介绍,这是基于算能
    的头像 发表于 08-03 07:33 8109次阅读
    算能发布超<b class='flag-5'>节点</b><b class='flag-5'>服务器</b>,128颗BM1690芯片组成

    ARM集群服务器 定义

    ARM集群服务器的核心定义可归纳为以下要点: 一、核心定义 ARM集群服务器是将‌多个基于ARM架构的处理
    的头像 发表于 06-25 08:09 2494次阅读
    <b class='flag-5'>ARM</b>集群<b class='flag-5'>服务器</b> 定义

    硅谷GPU云服务器是什么意思?使用指南详解

    硅谷GPU云服务器本质上是一种IaaS(基础设施即服务)产品,它将物理服务器上的GPU资源通过虚拟化技术分割成可弹性调配的云服务。与普通CPU
    的头像 发表于 06-16 09:41 709次阅读

    高密度ARM服务器的散热设计

    高密度ARM服务器的散热设计融合了硬件创新与系统级优化技术,以应对高集成度下的散热挑战,具体方案如下: 一、核心散热技术方案 高效散热架构‌ 液冷技术主导‌:冷板式液冷方案通过直接接触CPU/GPU
    的头像 发表于 06-09 09:19 1031次阅读
    高密度<b class='flag-5'>ARM</b><b class='flag-5'>服务器</b>的散热设计

    高通SoC阵列服务器

    高通SoC阵列服务器是基于高通系统级芯片(SoC)构建的高密度计算解决方案,核心特点为低功耗、高算力集成与模块化设计,主要应用于边缘计算和云服务场景。以下是其技术特性和应用方向的综合分析: 一
    的头像 发表于 06-03 07:37 1412次阅读

    服务器和单路服务器区别有多大?用实际应用场景对比一文讲透

    服务器采购和部署的过程中,我们经常听到“单路服务器”和“服务器”这两个概念。乍一听好像就差一个“处理插槽”,但实际用起来,区别还真不
    的头像 发表于 05-22 15:53 2833次阅读
    <b class='flag-5'>双</b>路<b class='flag-5'>服务器</b>和单路<b class='flag-5'>服务器</b>区别有多大?用实际应用场景对比一文讲透

    ARM服务器解决方案

    ARM服务器解决方案已成为异构计算领域的重要技术路径,其核心优势与多元化场景适配性正加速产业渗透。以下为关键要点分析: 一、核心优势与架构设计 能效比优化‌ ARM架构基于RISC指令集,单
    的头像 发表于 05-16 07:44 1268次阅读
    <b class='flag-5'>ARM</b><b class='flag-5'>服务器</b>解决方案

    云电竞服务器 工作原理

    云电竞服务器工作原理详解 一、核心架构原理 虚拟化资源池‌ 通过 ‌KVM/VMware‌ 等虚拟化技术将物理服务器(含NVIDIA GPU集群)抽象为可动态分配的算力资源池,每个用户独享独立虚拟机
    的头像 发表于 05-14 07:44 749次阅读
    云电竞<b class='flag-5'>服务器</b> 工作原理

    SoC集群服务器ARM架构阵列服务器 关系

    一、定义与定位 SoC集群服务器‌ 以系统级芯片(SoC)为核心算力单元,通过高速网络将多节点互联形成的分布式计算集群。每个SoC芯片集成CPU、GPU、NPU等多种处理单元,并支持多核异构计算
    的头像 发表于 04-24 07:49 1135次阅读
    SoC集群<b class='flag-5'>服务器</b> 与 <b class='flag-5'>ARM</b>架构阵列<b class='flag-5'>服务器</b> 关系