0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm Neoverse CSS N3助力快速实现出色能效

Arm社区 来源:Arm社区 2024-02-29 13:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

突破传统基础设施

从云到边缘,Arm Neoverse 正凭借出色的性能、效率、设计灵活性和总体拥有成本 (TCO) 优势,革新传统基础设施芯片领域。

云和超大规模服务运营商正不断增大计算密度。随着 Microsoft Cobalt、阿里巴巴的倚天 710、AmpereOne等配置 128 核或以上的 CPU 设计进入市场,单个封装可实现的性能更强,且下一代的目标还将远高于 128 核。

随着 CPU 性能逐步提高,市场对人工智能 (AI)、网络和加密加速器等专用计算的需求也随之持续增长。这显然需要将这些加速器集成在一起,才能更有效地提高性能和效率,与此同时,还需实现模块化设计,以便将加速器与不同的通用计算引擎进行混合搭配。

基于 Neoverse N3 CPU 的Neoverse CSS N3

813757de-d6bd-11ee-a297-92fbcf53809c.jpg

图 1:Neoverse CSS N3 概览

Arm Neoverse 计算子系统 (CSS) 支持在新的工艺节点上快速开发先进的系统级芯片 (SoC)。通过在设计中使用预配置、预验证的 CSS,合作伙伴节省了 80 人/年的工程师时间,以及相应的机会成本,使其能够专注于实现助其系统增值的“秘密法宝”。

Neoverse CSS N3 构建在 Neoverse CSS N2 经过市场验证的优良表现之上,能通过新的架构功能提供更高的性能和效率,为数据中心市场带来更优越的单芯片性能和单 TCO 性能表现。此外,Neoverse CSS N3 还为边缘和网络应用带来了出色的效率。CSS N3 以 Neoverse S3 系统 IP 为基础,Neoverse S3 系统 IP 包括了一致性网状网络 CMN S3、系统内存管理单元 MMU S3 和片上网络 NOC S3。此外,CSS N3 还包含系统管理和本地控制处理器,以及 CPU 和系统 IP 协同设计与共同开发,以优化 PPA 和系统级功能的支持。

Neoverse CSS N3 支持 32 颗 Neoverse N3 核心,可在低至 40W 的功率范围内实现优异性能。该产品具备高度可配置性,适用于电信、数据处理单元 (DPU) 、网络和云等多个领域,可以在 8 核至 32 核之间进行扩展配置。

除了性能和效率的大幅提升之外,Neoverse CSS N3 还支持基于芯粒的设计。它支持 UCIe 晶粒间 (die-to-die) 连接标准,结合 Arm 新的 AMBA CHI C2C 协议,为构建异构加速计算奠定了基础。可以预见的是,Arm Neoverse CSS N3 将在当今专用计算领域蓬勃发展。

基于 CSS N3 的芯粒可通过 AMBA CHI C2C 连接到 I/O 一致性加速器,从而将加速器封装在一起,进一步提高性能和效率,这一方法可用来取代传统的解决方案。在过往的解决方案中,其加速器是通过 PCIe 进行板级连接,这会导致更高的延迟、软件复杂性和功耗。

Neoverse N3 CPU优异的效率表现

以每瓦性能来衡量的性能效率是 CPU 评估的一大关键指标。5G/6G 无线基础设施要求现代计算解决方案表现出更高的性能,同时功耗预算须保持不变。新一代的 DPU 需要配备功能更强大的 CPU,以便在 PCIe 设备规范的限制内运行成熟的操作系统、虚拟机、容器及其他数据包处理功能。头部云服务提供商正着手在机架的冷却能力范围内,部署核心数量更多、更密集的 CPU。“能效”几乎是所有细分市场的主要设计决策要素。Neoverse N3 便是以能效作为其设计核心。

Neoverse N3 CPU 延续了 Neoverse N2 经过市场验证的效率表现。经过 Arm CPU 设计团队的不懈努力,他们强化了分支预测器、预取器的性能,并优化了微架构,进而实现了效率的提升。此外,他们还改进了电源管理表现,增加了精度更高的每核动态电压频率调整 (DVFS) 功能,以实现更出色的性能效率。这些工作成果使得 N3 在效率表现上比上一代产品提高了 20% 以上。

Neoverse N3 可以满足多样的 SoC 设计要求,包括 16 核网络设计、32 核电信 RAN 或云 DPU 设计,以及 192 核超大规模和云 CPU 等等。Neoverse N3 还提供了多种电压和频率选择,与 Neoverse N2 相比,其每核性能效率提高了 20% 至近 50%。

814966cc-d6bd-11ee-a297-92fbcf53809c.jpg

图 1:Arm Neoverse N3 CPU

延续卓越效率表现

在面积和功耗配置与 Neoverse N2 大致相同,且采用一样的工艺节点下,Neoverse N3 在机器学习 (ML) 和数据分析工作负载方面的性能约提升了三倍,在 SQL 数据库、选定压缩应用程序,以及整数运算性能等方面分别约提升了 1.3 倍、1.2 倍,以及 1.1 倍的性能。

灵活的缓存配置

Neoverse N3 提供多种缓存配置,可满足不同计算场景的需求。许多横向扩展的云数据分析和数据库应用均能从更靠近核心的较大缓存中受益,因此我们为这一细分领域推出了 2MB L2 缓存选项。此外,1MB L2 缓存选项主要针对 5G/6G 无线基础设施、企业网络、DPU 和智能网卡 (SmartNIC) 以及超大规模服务器等各种任务中的通用计算,能够实现性能和面积的良好平衡;而较小的 32KB L1 和 128KB 则适合那些对缓存不敏感,但仍希望能以较小占用空间提供良好算力的工作负载。

总结

Neoverse N3 CPU 的推出实现了 Neoverse N 系列持续提供出色的每瓦性能的目标。新的 CSS N3 结合了 Neoverse N3 优异的性能和效率与 Neoverse S3 系统 IP,成为一套定制性更强的计算子系统。与上一代的 CSS 相比,Neoverse CSS N3的每瓦性能可提高 20% 至近 50%。CSS N3 平台适用于云到边缘设计,可帮助我们的合作伙伴将 Arm 强大的处理器与加密、网络或 AI 加速器等等多种专用组件结合在一起,打造更具差异性的新产品。

我们的合作伙伴将有望在 2024 年底推出基于 Neoverse N3 和 CSS N3 的创新芯片设计,让我们共同翘首以待。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9499

    浏览量

    388731
  • 加速器
    +关注

    关注

    2

    文章

    836

    浏览量

    39712
  • SoC芯片
    +关注

    关注

    2

    文章

    662

    浏览量

    36835
  • 人工智能
    +关注

    关注

    1813

    文章

    49739

    浏览量

    261549

原文标题:Arm Neoverse CSS N3 助力快速实现出色能效

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm Neoverse平台集成NVIDIA NVLink Fusion

    生态系统,实现全缓存一致性与高带宽互连。 随着 AI 数据中心对 Arm Neoverse 的需求持续增长,客户在将工作负载加速器连接至 Arm 平台时拥有更多选择。 人工智能 (A
    的头像 发表于 11-26 11:08 288次阅读

    通信机房能耗监测:提升实现绿色运营的关键路径

    数据中心管理成为关键环节。能耗监测通过实时数据采集与分析,帮助运营商精准掌握用电情况,优化能源分配,降低碳排放,助力实现“碳达峰、碳中和”目标。13641854052 通信机房能耗
    的头像 发表于 10-11 09:45 330次阅读
    通信机房能耗监测:提升<b class='flag-5'>能</b><b class='flag-5'>效</b>与<b class='flag-5'>实现</b>绿色运营的关键路径

    Arm正式取消Cortex命名!CPU向着高算力进发,Lumex CSS平台加持!

    工智能 (AI) 体验的先进计算平台。   CSSArm推出的计算子系统,针对不同的应用领域,提供包括Arm Neoverse 计算子系统、面向汽车行业的
    的头像 发表于 09-17 08:25 2732次阅读
    <b class='flag-5'>Arm</b>正式取消Cortex命名!CPU向着高算力进发,Lumex <b class='flag-5'>CSS</b>平台加持!

    合科泰MOSFET如何推动充电宝升级

    2025年8月实施了充电宝新国标,其核心指标包括额定输出容量大于90%,这个变化提高了电源转换效率要求,把原本的隐性需求转变成了硬性要求。合科泰半导体基于自主研发的SGT工艺平台,推出了HKTQ65N03、HKTG50N03等明星产品,通过技术突破
    的头像 发表于 09-15 15:27 896次阅读
    合科泰MOSFET如何推动充电宝<b class='flag-5'>能</b><b class='flag-5'>效</b>升级

    全新Arm Lumex CSS平台实现两位数性能提升

    及下一代个人电脑加速其人工智能 (AI) 体验的先进计算平台。Lumex CSS 平台集成了搭载第二代可伸缩矩阵扩展 (SME2) 技术的最高性能 Arm CPU、GPU 及系统 IP,不仅能助力生态
    的头像 发表于 09-10 16:14 748次阅读
    全新<b class='flag-5'>Arm</b> Lumex <b class='flag-5'>CSS</b>平台<b class='flag-5'>实现</b>两位数性能提升

    Arm Zena CSS加速软件和芯片开发进程

    Arm Zena CSS 能够显著缩短开发周期,使软件团队能够在物理硬件推出前就启动开发工作,进而助力车厂至少提前一年将新款车型推向市场。
    的头像 发表于 08-25 16:22 1813次阅读

    西门子 Veloce CS 助力 Arm Neoverse 计算子系统验证与确认

    子系统 (CSS) 的设计流程的一部分。 对于我们的生态合作伙伴而言,产品上市速度日益成为关注焦点,而这也是在当前计算时代保持竞争力的关键。Arm Neoverse CSS 的核心要素
    的头像 发表于 08-06 09:26 2535次阅读

    Arm Neoverse N2平台实现DeepSeek-R1满血版部署

    颇具优势。Arm 携手合作伙伴,在 Arm Neoverse N2 平台上使用开源推理框架 llama.cpp 实现 DeepSeek-R1
    的头像 发表于 07-03 14:37 988次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> <b class='flag-5'>N</b>2平台<b class='flag-5'>实现</b>DeepSeek-R1满血版部署

    Arm 公司面向 PC 市场的 ​Arm Niva​ 深度解读

    子系统(CSS)​ ​ 的垂直领域延伸,Niva 旨在通过软硬件深度整合,解决传统 x86 架构在比、AI 加速与生态兼容性上的痛点。以下结合技术架构、性能突破、竞争格局与战略意义展开分析: 一、技术架构
    的头像 发表于 05-29 09:56 1304次阅读

    Arm 公司面向移动端市场的 ​Arm Lumex​ 深度解读

    子系统(CSS)​ ​ 在移动端的落地形态,Lumex 旨在通过高度集成化的软硬件方案,解决移动设备在 AI 性能、比与开发效率上的挑战。以下从技术架构、性能突破、应用场景、生态系统及战略价值展开分析: 一、技术架构:异构计
    的头像 发表于 05-29 09:54 4054次阅读

    解读基于Arm Neoverse V2平台的Google Axion处理器

    云计算需求在人工智能 (AI) 时代的爆发式增长,推动了开发者寻求性能优化且高能的解决方案,以降低总体拥有成本 (TCO)。Arm 致力于通过 Arm Neoverse 平台满足不断
    的头像 发表于 04-21 13:47 890次阅读

    Arm Neoverse CMN S3 推动Compute Express Link (CXL) 存储创新

    高性能、可扩展且高效的解决方案。Arm Neoverse CMN S3 能够无缝管理一致性通信和内存共享,是适合现代存储架构的变革性解决方案,其专为支持 Compute Express Link
    发表于 04-09 18:19 1009次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CMN S<b class='flag-5'>3</b> 推动Compute Express Link (CXL) 存储创新

    如何在基于Arm Neoverse平台的CPU上构建分布式Kubernetes集群

    在本文中,我们将以 X(原 Twitter)为例,演示如何在基于 Arm Neoverse 平台的 CPU 上构建分布式 Kubernetes 集群,以根据推文实时监控情绪变化。如此一来,你可以充分利用 Arm
    的头像 发表于 03-25 15:58 650次阅读
    如何在基于<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>平台的CPU上构建分布式Kubernetes集群

    基于MediaTek MT9679芯片的坚果投影N3 Pro介绍

    坚果投影 N3 Pro 搭载 MediaTek MT9679 旗舰投影芯片,该芯片配备 4 核 Arm Cortex-A73 CPU 及 Arm Mail-G52 MC1 GPU,强悍性能与强大算力
    的头像 发表于 03-24 09:10 2184次阅读

    Arm技术助力Google Axion处理器加速AI工作负载推理

    Arm Neoverse V2 平台赋的 Google Axion 处理器已在 Google Cloud 上正式上线,其中,C4A 是首款基于 Axion 的云虚拟机,为基于 CPU 的人工智能 (AI) 推理和通用云工作
    的头像 发表于 02-14 14:11 958次阅读
    <b class='flag-5'>Arm</b>技术<b class='flag-5'>助力</b>Google Axion处理器加速AI工作负载推理