在Arm服务器处理器阵营中,鲜少有从开始一直挺立到现在的,Marvell算其中一个。
现在仍然可以查到Marvell发表于2010年的媒体简报,“Marvell今天发布新款ARM架构嵌入式处理器ARMADA XP,将主要用于云计算等企业应用领域,诸如高性能网络设备、网页服务器,以及家用NAS、媒体服务器等。运算内核包括四核心,频率最高1.6GHz,拥有2MB二级缓存,其运算性能可达16600DMIPS,而功耗低于10W。”
今天看来,当时的配置和愿景都过于朴素。
时间就这样过去了十年。
这期间,Marvell对旗下业务大刀阔斧地进行了整并,移动芯片和多媒体芯片业务对外出售,基础设施领域实力不断强化,直到现在成为一家专注于基础设施市场的半导体厂商,提供存储、处理、网络、无线连接和安全产品组合,服务器芯片地位越来越重。
今天,Marvell的服务器芯片主要聚焦三大应用市场:超算、云端、边缘,保持着两年一代的上新节奏。
一次咄咄逼人的上新
近日,Marvell基于第三代Arm的服务器处理器ThunderX3取得突破性进展。它专为当今云计算和HPC市场上较严苛的工作负载而设计,可提供高性能、低功耗、高内存带宽和低内存延迟,将于今年年中向客户提供样片。Marvell半导体公司副总裁及服务器处理器部总经理Gopal Hegde指出,如今数据中心已从对单线程性能的关注转向对机架级别性能的关注,其中性能功耗比、性能成本比和TCO(总拥有成本)是部署考虑的三大关键因素。因此,数据中心开始采用专为特定工作负载而定制的服务器。
相比上一代ThunderX2,ThunderX3实现了性能上的全面提升。据介绍,ThunderX3处理器采用台积电7P制程工艺制造,拥有高达96个核,4线程/核心,每个插槽的总计算能力达到384线程。内存接口支持8通道DDR4-3200,每个通道可搭载2个DIMM。I/O扩展提供了64个PCIe Gen 4.0通道,搭载16个控制器。该处理器支持单节点和双节点配置。在浮点运算方面,ThunderX3的每个核心搭载四个128位SIMD (Neon)单元。该设备完全符合SBSA/SBBR,并提供了企业级的RAS和虚拟化功能。
ThunderX3的性能改进如何实现?Marvell半导体公司服务器处理器部产品营销高级总监周立新告诉<电子发烧友>,主要来自于微架构的改进,使得IPC的整体性能较ThunderX2提高25%。结合处理器频率和DDR频率的提升,单线程总体性能较上一代提高了60%以上。在单颗处理器层面,相较于ThunderX2,ThunderX3的整数运算性能提升3倍以上,浮点运算性能提升5倍以上。
那么,对于HPC市场来说,需要什么样的性能?周立新表示,HPC需要很多并行处理,ThunderX3每一个核有4个线程,最多96个核,可以支持384个线程。他强调,单核支持四线程,不论是x86架构还是其它Arm处理器,目前都没有实现,ThunderX3在这方面实现了“数量级的差异”。
四线程跟单线程比,究竟有什么好处?可以主要从三方面来看,一是SPECCPU,这是最标准的衡量服务器的指标;二是MySQL数据库;三是Web搜索。根据测算,四线程比单线程有显著的性能提升,特别是MySQL,可以提高80%的性能。

当然,CPU不仅仅是计算指标,还涉及先进的DDR、PCIe。ThunderX3采用了PCIe 4.0,当年在ThunderX2,每个核里面有2个128bit SIMD (Neon) Units,而ThunderX3提升到4个,这对超算、AI和机器学习来说非常重要。
谈及对比于x86架构处理器的主要优势,Gopal Hegde表示,x86架构面向服务器、桌面等众多市场,而Armv8-A是专门面向服务器应用开发的核,在面积、性能、功耗层面更加优化。x86架构两大厂商:英特尔在工艺上相比台积电已落后一两代,这对其x86服务器CPU性能有一定的影响;AMD在架构上采用封装集成,64核有9个Die,相应地在延时、带宽方面存在不足,同时功耗偏高。
未来可能考虑Chiplet
各家由于情况不同,也有各自的实现路径。比如AMD,其EYPC系列的成功与Chiplet技术的采用密不可分,它作为一种解决物理瓶颈的方法,Marvell是否会予以考虑?Gopal Hegde谈到,当时AMD的EPYC,如果把32核放在同一芯片中,物理上首先难以量产,就算生产出良率会比较差,所以不得不用4个Die来做32核。Marvell每个核的尺寸比AMD的约小30%左右,所以在ThunderX3中还可以集成这么多核。他谈到了一些不采用chiplet的优势,比如内存带宽,而且延迟也比较短。不过,未来再往下走,就算核再小早晚也会碰到物理瓶颈,那时可能也会考虑Chiplet方案。
盘点Arm服务器阵营的底气
从Arm进入服务器市场的第一天起,整个业界就充满了怀疑的论调,这种唱衰一路贯穿,甚至在高通正式取消其服务器芯片项目时达到顶峰。不过,后面的故事越来越精彩,2017年,英特尔前高管离职创办了从事Arm 服务器芯片研发的Ampere公司;2018年,富士通公开介绍了业界首款支持基于ArmV8指令集扩展SVE(Scalable Vector Extension)的A64FX芯片,据称性能强悍到无需与GPU组合;2019年AWS推出的Graviton 2堪称惊艳……
事实上,也正是从去年开始,业界推出Arm服务器处理器的节奏明显加快,性能PK也更为激烈。国产阵营的代表有飞腾和华为,作为国内最早获得ARMv8指令集架构授权的设计厂商,飞腾的CPU产品近年来不论是性能还是生态都成果颇丰;还有华为鲲鹏,正在通过全生态体系和产业链的整合能力高歌猛进。
为什么Arm服务器生态开始呈现出前所未有的繁荣景象?Gopal Hegde认为,最显著的原因是最终用户发现Arm加速应用的时机已经成熟,才会有越来越多的人投入。
Arm框架的核心优势在于低能耗、移动市场的高占比。但是,服务器是一个跟生态密切相关的业务,现在整个市场x86架构还是占据了90%以上的份额。本文发布之时,英特尔刚刚公布了2020年第一季度财报,其中数据中心业务同比增长43%,个中原因这里不去深究,但足以见得Marvell等面临的是怎样的对手。
那么,Marvell竞争的底气来自哪里?
Gopal Hegde表示,生态层面其实是一种“滚雪球”效应,滚到一定地步就会自己越滚越大。自前两年推出ThunderX2之后,部署进度在不断加速,得到了诸多OEM厂商和平台、IHV硬件厂商、操作系统和固件、中间件、应用和工具的支持,目前生态系统覆盖已超过100家合作伙伴企业。微软正为Azure部署基于ThunderX2的量产级服务器,也公开表态未来可能有40%-50%的量迁移到Arm平台上。此外,ThunderX2系列服务器处理器已实现对NVIDIA GPU的支持,将进一步满足HPC 和游戏应用的需求。
比较聪明的一点是,正如Gopal Hegde在采访中所澄清的,Marvell并非全线与x86竞争,只主抓生态成熟、且成长非常快的领域,就是超算和云这两块,企业级的市场不会进入。
Arm架构在服务器市场进入了关键时期。诸多创新场景带来的海量数据计算、存储需求将孕育庞大的云服务市场,对基础计算架构产生了真正的多元化的需求。而先进算力的提升也确实需要多元化的构建,眼下这种繁荣的生态景象正是行业所需要的。
本文由电子发烧友网原创,未经授权禁止转载。如需转载,请添加微信号elecfans999.
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
ARM
+关注
关注
135文章
9611浏览量
394351 -
服务器
+关注
关注
14文章
10440浏览量
91849 -
X86
+关注
关注
5文章
300浏览量
45636 -
高性能计算
+关注
关注
0文章
97浏览量
13835 -
超算
+关注
关注
1文章
119浏览量
9561
发布评论请先 登录
相关推荐
热点推荐
全球首款RISC-V+AI智通融合CPU,蓝芯算力 LX500撕开x86/ARM铁幕
电子发烧友网报道(文/吴子鹏)在 AI 原生与算力自主可控的双重浪潮下,全球服务器 CPU 格局正迎来颠覆性变革。长期由 x86、ARM 架构垄断的高端算力赛道,因 RISC-V 的开源崛起与智算
PDA手持终端底层硬件架构大揭秘:Arm、x86、RISC-V谁才是未来?
目前 PDA 手持终端设备,多数走的是 Arm 体系,少量高性能或 Windows 机型会用 x86。先把概念说清楚:Android、Windows 是操作系统;真正决定底层指令集和芯片路线
STPC® ATLAS:强大的X86核心PC兼容片上系统
STPC® ATLAS:强大的X86核心PC兼容片上系统 在当今的电子设备领域,对于高性能、集成化的芯片需求日益增长。STPC® ATLAS作为一款专为终端设计的X86核心PC兼容片上系统,以其丰富
详解Arm AGI CPU 1OU双节点参考服务器
近日发布的Arm AGI CPU 是 Arm 首款面向人工智能 (AI) 数据中心的量产级芯片产品。与此同时,Arm 也同步推出一款模块化、基于标准的 1OU 双节点参考
全球首创!RISC-V+AI架构高性能服务器CPU成功点亮
电子发烧友网报道 长久以来,全球高端服务器CPU市场一直被x86和ARM架构所主导,我国在核心算力领域长期受制于人,高端芯片供应链安全面临重大挑战。 近日,蓝芯算力(深圳)科技有限
威盛入局!从X86 “老兵” 到RISC-V “先锋”
模块)。 威盛电子成立于 1987 年,在过去数十年间,始终是 x86 处理器市场的重要参与者。其产品广泛应用于个人电脑(PC)、
发表于 09-22 02:36
•3413次阅读
英特尔服务器CPU市场失守:从99.9%到50%以下
电子发烧友网综合报道,近日,市场调研机构 IDC 更新了全球服务器市场的最新情况。该机构预计,2025 年全球 x86 服务器的市场价值将同比增长 39.9%,达到 2839 亿美元;非 x8
KaihongOS桌面版成功适配x86设备,邀您抢先体验!
2025年6月30日,KaihongOS桌面版已成功适配x86设备,首次开启开发者Beta体验!我们诚邀您参与本次体验计划,共同探索国产操作系统的创新与潜力。您的反馈将帮助我们优化系统,打造更稳
打破X86/ARM垄断!国产全新自主架构CPU处理器重磅发布
3C6000系列、工控及移动终端处理器龙芯2K3000/3B6000M,以及相关整机和解决方案,标志着龙芯在自主芯片领域又迈出了坚实的一步。 龙芯中科董事长胡伟武在发布会上表示:“我国信息产业的根本出路在于构建独立于
高密度ARM服务器的散热设计
高密度ARM服务器的散热设计融合了硬件创新与系统级优化技术,以应对高集成度下的散热挑战,具体方案如下: 一、核心散热技术方案 高效散热架构 液冷技术主导:冷板式液冷方案通过直接接触CPU/GPU
聚徽厂家视角——X86 架构 vs. ARM 架构:工控一体机的算力、功耗与成本差异解析
在工业自动化不断发展的当下,工控一体机作为核心设备,其架构选择至关重要。X86 架构与 ARM 架构在工控领域各领风骚,它们在算力、功耗与成本上的显著差异,决定了其适用场景的不同。深入剖析两者特点
奇瑞瑞虎8L问鼎2025环塔T1.1组总冠军
当大漠黄沙退去,冠军光芒划破天际。近日,2025中国环塔(国际)拉力赛在新疆圆满落幕。赛事历经13天残酷鏖战,约5000多公里、4大营地与10个高强度赛段的正面交锋,T1、T2等各组别的冠军尘埃落定。
与x86正面交锋,Arm服务器芯片又掀狂澜
评论