Arm 近日公开了Arm® Neoverse V1 和 N2 平台的产品细节,两者满足了基础设施应用的各种需求。这两个平台的设计旨在解决当前正在运行的各种工作负载和应用问题,与上一代N1相比,并分别带来 50%和 40%的性能提升。此外,Arm也同时发布了CMN-700,作为构建基于Neoverse V1和 N2 平台高性能SoC的关键部件。
Neoverse V1:最宽微架构+SVE矢量运算

Neoverse V1平台 / Arm
与上一代N1相比,Neoverse V1带来了50%的性能提升和1.8倍的矢量工作负载优化、以及4倍的机器学习工作负载优化。得益于Arm迄今为止最宽的微架构以及SVE功能,Neoverse V1可以容纳更多运行中的指令,延长了代码存活期,也为芯片设计人员提供了灵活性。Arm 现有的 SIMD 指令集 NEON 难以对某些代码进行矢量化处理,而 SVE 可以直接取用相同的代码,并很好地对其进行自动矢量化,相比于 NEON,SVE可将处理速度提高近3.5倍。

已经用到Neoverse V1的HPC项目 / Arm
目前法国芯片公司SiPearl、印度信息技术部(MEITY)韩国电子通信研究所(ETRI)都在各自的HPC项目中用到了Neoverse V1。
Neoverse N2:首个Armv9+SVE2平台

Neoverse N2提高云端到边缘性能效率 / Arm
Arm在几周前发布了Armv9架构,以满足全球对无所不在的专用处理能力的需求,而新公布的Neoverse N2平台正是第一个基于Armv9架构的平台。

SVE2 / Arm
相比于N1,Neoverse N2在保持相同水平的功率和面积效率的基础上,单线程性能提升了40%。不仅如此,Neoverse N2也是第一个具备SVE2功能的平台,作为SVE和Neon的超集,SVE2为云端到边缘的性能效率带来了巨大提升。SVE主要用于加速HPC,而SVE2可广泛运用于机器学习、数字信号处理和5G等应用场景,同时兼具SVE的编程简易性和可移植性等优势。
CMN-700:下一代总线赋能异构SoC

Neoverse CMN-700 / Arm
作为上一代CMN-600的升级,CMN-700支持的最大核心数可达512颗。通过对CCIX 2.0和CXL 2.0的支持,也为客户提供了更多的定制和扩展选项,为紧密耦合的异构计算提供了更大的灵活性。
异构计算的趋势
随着异构计算的逐步发展,我们已经看到了很多CPU和GPU搭配的趋势,比如英伟达近期公布的基于Arm Neoverse的Grace芯片,就是一个用于AI超算的CPU。英伟达在互联技术上采用的是自研的NVLink技术,而非PCIE。Arm基础设施事业部高级副总裁兼总经理 Chris Bergey提到,与多样化的加速器功能进行互联,比如AI加速器,这对未来的市场时相当关键的。比如CMN-700已经支持了CXL和CCIX这样的互联标准,未来Arm期待给市场带来更多的灵活性,并支持更多像Grace这样的系统。
这样的异构趋势也囊括了FPGA,Arm基础设施事业部全球高级总监邹挺补充道,现在已经有合作伙伴将Neoverse N2和FPGA加速卡放在异构计算系统中使用。有的Arm合作伙伴还将FPGA加速器和N2放在一个芯片上做成SoC,通过Chiplet的技术来实现异构计算的灵活性。
公有云的广泛应用

腾讯云加码Arm生态 / Arm 腾讯云
Neoverse的广泛应用在公有云厂商中尤为明显,比如AWS、阿里云和腾讯云等。腾讯专项测试技术中心总监黄闻欣提到腾讯去年和Arm正式签署了一份合作协议,希望通过合作加速Arm Neoverse技术的测评和适配。通过TencentBench测试框架发现,得益于更多可扩展的CPU核心数,Arm服务器比传统的服务器性能表现更强劲,尤其是在AI推理和图片处理领域。
Neoverse V1:最宽微架构+SVE矢量运算

Neoverse V1平台 / Arm
与上一代N1相比,Neoverse V1带来了50%的性能提升和1.8倍的矢量工作负载优化、以及4倍的机器学习工作负载优化。得益于Arm迄今为止最宽的微架构以及SVE功能,Neoverse V1可以容纳更多运行中的指令,延长了代码存活期,也为芯片设计人员提供了灵活性。Arm 现有的 SIMD 指令集 NEON 难以对某些代码进行矢量化处理,而 SVE 可以直接取用相同的代码,并很好地对其进行自动矢量化,相比于 NEON,SVE可将处理速度提高近3.5倍。

已经用到Neoverse V1的HPC项目 / Arm
目前法国芯片公司SiPearl、印度信息技术部(MEITY)韩国电子通信研究所(ETRI)都在各自的HPC项目中用到了Neoverse V1。
Neoverse N2:首个Armv9+SVE2平台

Neoverse N2提高云端到边缘性能效率 / Arm
Arm在几周前发布了Armv9架构,以满足全球对无所不在的专用处理能力的需求,而新公布的Neoverse N2平台正是第一个基于Armv9架构的平台。

SVE2 / Arm
CMN-700:下一代总线赋能异构SoC

Neoverse CMN-700 / Arm
作为上一代CMN-600的升级,CMN-700支持的最大核心数可达512颗。通过对CCIX 2.0和CXL 2.0的支持,也为客户提供了更多的定制和扩展选项,为紧密耦合的异构计算提供了更大的灵活性。
异构计算的趋势
随着异构计算的逐步发展,我们已经看到了很多CPU和GPU搭配的趋势,比如英伟达近期公布的基于Arm Neoverse的Grace芯片,就是一个用于AI超算的CPU。英伟达在互联技术上采用的是自研的NVLink技术,而非PCIE。Arm基础设施事业部高级副总裁兼总经理 Chris Bergey提到,与多样化的加速器功能进行互联,比如AI加速器,这对未来的市场时相当关键的。比如CMN-700已经支持了CXL和CCIX这样的互联标准,未来Arm期待给市场带来更多的灵活性,并支持更多像Grace这样的系统。
这样的异构趋势也囊括了FPGA,Arm基础设施事业部全球高级总监邹挺补充道,现在已经有合作伙伴将Neoverse N2和FPGA加速卡放在异构计算系统中使用。有的Arm合作伙伴还将FPGA加速器和N2放在一个芯片上做成SoC,通过Chiplet的技术来实现异构计算的灵活性。
公有云的广泛应用

腾讯云加码Arm生态 / Arm 腾讯云
Neoverse的广泛应用在公有云厂商中尤为明显,比如AWS、阿里云和腾讯云等。腾讯专项测试技术中心总监黄闻欣提到腾讯去年和Arm正式签署了一份合作协议,希望通过合作加速Arm Neoverse技术的测评和适配。通过TencentBench测试框架发现,得益于更多可扩展的CPU核心数,Arm服务器比传统的服务器性能表现更强劲,尤其是在AI推理和图片处理领域。
阿里巴巴首席工程师周经森(Kingsum Chow)谈道:Arm的CPU资源的话,在我们现有的软件里会有两个考虑的点,一个是我们有些软件是需要重新编译的,另外一种不需要重新编译,只需要我们把Java applications在JVM(Java Virtual Machine)上跑好就可以了。在这方面,一年之前,我们就跟Arm的员工一起合作,把JVM的性能提高。过去一年里,我们从JDK8到JDK11,通过OpenJDK, 通过阿里巴巴 Dragonwell(OpenJDK的一个发行版),就把我们现有一些Java应用的一些性能提高了50%。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
ARM
+关注
关注
135文章
9499浏览量
388549 -
HPC
+关注
关注
0文章
342浏览量
24820 -
高性能计算
+关注
关注
0文章
95浏览量
13760 -
Neoverse
+关注
关注
0文章
15浏览量
4930
发布评论请先 登录
相关推荐
热点推荐
Arm Neoverse平台集成NVIDIA NVLink Fusion
生态系统,实现全缓存一致性与高带宽互连。 随着 AI 数据中心对 Arm Neoverse 的需求持续增长,客户在将工作负载加速器连接至 Arm 平台时拥有更多选择。 人工智能 (A
RISC-V V扩展的指令代码
1.指令集V扩展的主要内容:
矢量指令:针对数据并行性,增加了一系列新的矢量指令,可以同时对多个数据进行操作,提高了计算效率。浮点指令:新增了一些浮点指令,支持更高精度的
发表于 10-21 13:11
全新Arm Lumex CSS平台实现两位数性能提升
及下一代个人电脑加速其人工智能 (AI) 体验的先进计算平台。Lumex CSS 平台集成了搭载第二代可伸缩矩阵扩展 (SME2) 技术的最高性能
西门子 Veloce CS 助力 Arm Neoverse 计算子系统验证与确认
西门子数字化工业软件近日宣布,Veloce Strato CS 与Veloce proFPGA CS 已被 Veloce 的长期合作伙伴 Arm 部署应用,作为Arm Neoverse 计算
知合计算:RISC-V架构创新,阿基米德系列剑指高性能计算
在2025 RISC-V中国峰会上,知合计算处理器设计总监刘畅就高性能RISC-V处理器架构探索与实践进行了精彩分享。 在以X86和ARM为
Arm Neoverse N2平台实现DeepSeek-R1满血版部署
颇具优势。Arm 携手合作伙伴,在 Arm Neoverse N2 平台上使用开源推理框架 llama.cpp 实现 DeepSeek-R
台安N2变频器与Modbus RTU转Profinet网关实现数据互换
在工业自动化领域,Modbus RTU协议与Profinet协议的转换需求日益凸显,尤其是当涉及到台安N2变频器等设备的应用时。本文将深入探讨Modbus RTU转Profinet网关与台安N2变频器通讯的相关知识,帮助读者更好地理解和应用这一技术。
AMD实现首个基于台积电N2制程的硅片里程碑
代号为“Venice”的新一代AMD EPYC CPU是首款基于台积电新一代N2制程的高性能计算产品。 AMD表示,其代号为“Venice”的新一代AMD EPYC™处理器是业界首款完成流片并
解读基于Arm Neoverse V2平台的Google Axion处理器
云计算需求在人工智能 (AI) 时代的爆发式增长,推动了开发者寻求性能优化且高能效的解决方案,以降低总体拥有成本 (TCO)。Arm 致力于通过 Arm
如何在基于Arm Neoverse平台的CPU上构建分布式Kubernetes集群
在本文中,我们将以 X(原 Twitter)为例,演示如何在基于 Arm Neoverse 平台的 CPU 上构建分布式 Kubernetes 集群,以根据推文实时监控情绪变化。如此一来,你可以充分利用
Banana Pi 发布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 计算与嵌入式开发
RZ/V2N——近期在嵌入式世界2025上新发布,为 AI 计算、嵌入式系统及工自动化提供强大支持。这款全新的计算平台旨在满足开发者和企业用户对高性
发表于 03-19 17:54
Banana Pi 发布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 计算与嵌入式开发
2025年3月19日——Banana Pi 今日正式发布 BPI-AI2N & BPI-AI2N Carrier,基于瑞萨电子(Renesas)同步发布的最新的高性能处理器RZ/V2N
采用双核Arm Cortex-A57 CPU的超高性能微处理器RZ/G2N数据手册
RZ/G2N凭借双核 Arm® Cortex®-A57(1.5GHz)处理器,具备更高规格的处理性能,同时拥有 3D 图形处理能力以及 4K 视频编码/ 解码功能。作为该产品的软件平台
英特尔18A与台积电N2工艺各有千秋
TechInsights与SemiWiki近日联合发布了对英特尔Intel 18A(1.8nm级别)和台积电N2(2nm级别)工艺的深度分析。结果显示,两者在关键性能指标上各有优势。
瑞萨电子RZ MPU家族精品RZ/N2L产品介绍
瑞萨生态合作伙伴RT-Thread推出了一款高性能、多功能以太网MPU开发板EtherKit,搭载瑞萨电子RZ/N2L,并携手瑞萨电子举办了产品发布会和产品研讨。瑞萨电子在本次活动中介绍了瑞萨明星

Arm Neoverse家族新增V1和N2两大平台,突破高性能计算瓶颈

评论