0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Marvell推出ARM服务器芯片Thunder X3,IPC性能较上代提升超过25%

牵手一起梦 来源:电脑之家 作者:单亚凯 2020-05-07 17:35 次阅读

Marvell最新推出了新一代的ARM服务器芯片Thunder X3,使用台积电7nm工艺制造,核心数量达到96核,同时继续支持四线程,IPC性能比ThunderX2提升超过25%,是一次全面的革新与巨大的提升。

半导体领域,Marvell(美满电子公司略显低调,但又是那种遮不住光芒的实力型公司。Marvell成立于1995年,目前全球员工数量超过5000名,核心业务主要聚焦在基础设施半导体方案,包括存储、网络、计算三大领域,2020财年总收入高达27亿美元。

Mavell旗下拥有完整的CPU产品线,包括Armada、Octeon TX、ThunderX等多种类型的处理器。2017年Mavell收购了Cavium(凯为半导体)公司,Cavium此前拥有15年以上的高性能计算多核CPU的技术积累,在基于ARM架构的嵌入式服务器领域经验丰富,这帮助Marvell公司在该领域继续保持领先。

目前,Marvell已为客户交付上亿颗CPU芯片,旗下基于ARM架构的服务器处理器ThunderX在全球获得广泛部署,Marvell已经成为全球最大的ARM服务器处理器供应商。

前不久,Marvell推出了新一代的ARM服务器芯片Thunder X3,不仅使用了更先进的台积电7nm工艺制造,升级为ARM v8.3指令集,核心数量也达到了惊人的96核,同时继续支持四线程,带来可观的性能提升,令业界瞩目。

近日我们与Marvell半导体公司副总裁及服务器处理器部总经理Gopal Hegde以及Marvell半导体公司服务器处理器部产品营销高级总监周立新进行了在线访谈,就Thunder X3的产品信息以及Marvell在ARM服务市场方面的布局进行了交流。

·应用场景发生变化 ARM服务器工艺制程已经领先

在服务器领域,尤其是大规模数据中心市场,基于x86架构的处理器长久以来都占据绝对优势,但近年来随着云计算等应用的不断变化,基于ARM架构的服务器逐渐受到客户的青睐。

Marvell公司服务器处理器事业部产品营销高级总监周立新说到,“十几年前,数据中心的规模还比较小,用户数量相对来说比较少。传统的业务模式对CPU的要求只聚焦在单线程性能上,对于并行业务的要求不高。现在,除了继续强调单线程性能,同时还要强调并行处理能力,这点在今天尤为重要。而且由于数据中心的规模越来越大,很多客户都需要成本最低的解决方案,对成本、功耗非常敏感,这也是他们对ARM这样低功耗、低成本处理器感兴趣的原因。”

“另外,现在已经不是一个架构解决所有问题的时代。随着GPU、异构计算架构不断涌现,客户对基于ARM架构的服务器处理器的兴趣也是越来越高。之前传统的软件有很多都是由第三方提供的,比如Oracle提供数据库,很多客户没有源代码。但现在不一样,一些超大规模数据中心的工作负载、应用都是有源代码的,所以能够很快的解决问题,而且还允许改变源代码、改变程序来加速创新能力。这也对ARM服务器的引入带来方便,可以更轻松应对兼容性问题。”周立新说到。

“在X86架构几十年的历史中,它的单个CPU核心既要解决服务器市场的需求,也要解决笔记本市场需求,相当于一个架构要解决很多问题,并没有针对特定的应用有所优化。而ARM服务不同,它是专门为服务器所做的,不需要支持消费级产品,所以可以实现高度优化的方案。”

周立新还说:“另外,与x86相比,ARM服务在制程工艺方面已经领先。例如,英特尔虽然有自己的晶圆厂,但今天量产的仍然是14nm产品,而Marvell是TMSC台积电代工的7nm,整整领先了两代。而AMDRome还是非常成功的,但在架构方面采用chiplets设计,虽然核心数量多,但不是放在一个die上面做,die与die之间就会存在延迟、带宽方面的限制。而Marvell的ARM处理器单核面积与AMD、Intel相比小了许多,集成度更高,功耗、性能也比他们更强。”

·96核心ThunderX3性能大幅提升 并行计算优势明显

Marvell ThunderX3处理器采用台积电(TSMC)7nm制程工艺制造,拥有高达96个核,每个核心4个线程,每个插槽的总计算能力达到384线程。内存接口支持8通道DDR4-3200,每个通道可搭载2个DIMM。IO扩展方面提供了64个PCIe Gen 4.0通道,搭载 16个控制器

Marvell推出ARM服务器芯片Thunder X3,IPC性能较上代提升超过25%

Marvell Thunder X3相比Thunder X2性能大幅提升

Marvell官方表示,ThunderX3微架构的改进使得IPC性能比ThunderX2提升超过25%,结合处理器频率和DDR频率的提升,单线程性能提升超过60%,单个插槽整数运算性能提升最多3倍。在浮点运算方面,ThunderX3的每个核心搭载四个128位SIMD (Neon) 单元,相比ThunderX2翻倍,因此性能可以增加5倍多。因此,ThunderX3相比ThunderX2可以说是全面的革新与巨大的提升。

Marvell推出ARM服务器芯片Thunder X3,IPC性能较上代提升超过25%

关于单核四线程相比单线程的优势,周立新进一步说到:“我们从3个标准来看,一是SPECCPU,这是一个标准的衡量服务器的指标;第二是MySQL,大家都很熟悉的数据库;第三是Web搜索。从性能上看,在这三个应用中四个线程开了以后跟单线程比,都有明显提升,尤其在MySQL当中最高可以提高80%。所以,四线程对性能提升还是非常显著的,从这点来看,ThunderX3的性能有着比较大的领先。”

Marvell推出ARM服务器芯片Thunder X3,IPC性能较上代提升超过25%

Thunder X3的主要规格

“Marvell的ARM服务器处理器主要聚焦超算、云端计算和原生ARM应用这几个方面,这些应用场景大多要求高度并行、I/O密集、延迟敏感以及ARM原生(移动工作负载)。ThunderX3的目标工作负载(如大数据、数据库、流媒体、Web 层、弹性搜索和云存储)其本质上是高度并行。例如,ThunderX3的96颗核心最多可以支持384个线程,每个线程就可以作为一个操作系统运行一个虚拟机,这样一个芯片就可以支持384个虚机。在“安卓云”的部署中,需要边缘设备做加速、做CDN,此时ThunderX3的并行计算优势就体现出来了。”Gopal Hegde在访谈中这样说到。

“ThunderX3服务器非常适合在云端或边缘以容器或虚拟机的形式运行当前部署在手机和ARM终端上的原生ARM应用程序。这使得各种新兴的应用有机会成为现实,包括Android云游戏、云端Android和ARM软件/应用程序开发。由于很多APP就是为了ARM开发的,所以相比x86架构我们更有优势。”周立新说。

Marvell推出ARM服务器芯片Thunder X3,IPC性能较上代提升超过25%

还有Arm Native,国内主要是安卓云的业务。Marvell目前已经有了相应的解决方案,不仅能提供硬件设备,还可以提供包括软件在内的整套解决方案。

“另外,与云计算类似,超算任务也有很多都是并行的应用,包括天气预测、能源行业等等。所以多核、多线程是非常适合这些场景。然后超算里面还有很重要一点,就是对内存带宽、延时的要求非常高,同时超算的部署密度非常高,所以对功耗要求也很敏感,ARM处理器在这些方面也具有明显优势。在很多实验室、Oil Gas、CAE、Genomics、EDA等行业,我们都找到了适用性非常强,且与x86相比有着明显竞争优势的方案。”周立新说。

·完整生态支持 ARM服务器增长潜力巨大

要知道服务器市场是一个跟生态密切相关的业务,终端芯片只是一部分,客户需要的是从芯片、操作系统、到应用层等一整套的解决方案。任何一个服务器包括x86,都不是独立运作的,都需要系统厂商以及各种各样的硬体配合,包括Memory、HBA等很多外设,还有操作系统、应用软件等一系列的支持,这样的业态才会成功。

周立新说:“Marvell目前已经有超过100个生态伙伴,从系统厂商到硬件的外设,从软件到操作系统OS,以及中间的Middleware,这对我们而言非常重要,我们也很高兴看到ARM服务器生态还在持续成长。

Marvell推出ARM服务器芯片Thunder X3,IPC性能较上代提升超过25%

周立新在提到Marvell在ARM服务器领域所取得的成就时非常自豪,他表示:“五年前,我们只有三四个生态伙伴,刚开始是非常艰难的。过去两年,ThunderX2已经广泛部署在了云计算和HPC市场,主要客户包括Microsoft Azure、桑迪亚国家实验室中的 500强超级计算机Astra、美国能源部的国家实验室、英国莱斯特大学等等。”

微软公司Microsoft Azure资深工程师Leendert van Doorn博士曾表示:“微软Project Olympus云硬件与Marvell ThunderX2服务器处理器的结合是一个里程碑,提升了Azure云基础设施中ARM64产品的开发能力。微软致力于推动平台创新,我们对处理器架构的进一步支持是我们践行行业领导力与最佳实践的一部分。与Marvell和鸿佰科技的合作为我们的内部使用带来了最完整、性能最强的ARM服务器解决方案。”

Gopal Hegde说:“ThunderX2已经成为世界上应用最广泛的基于ARM架构的服务器处理器,而且是被一些业务规模非常大的客户所证明。我们刚才提到的包括美国和欧洲的超算实验室,业务要求都是非常高的,我们在实践中都已经证明。ThunderX3的性能比ThunderX2有更大的提升,目前公开的二十几个使用ThunderX2处理器的客户,已经表示将会继续升级至ThunderX3。”

三年前ARM曾经有过预测,大概在2020~2022年的时候,全球大概会有20%左右的服务器将是基于ARM架构运行的。近年来,包括Ampere、华为等数家厂商纷纷发力ARM服务器市场,也充分说明ARM生态的巨大潜力,ARM加速应用的时机逐渐成熟,生机勃勃的春天已经到来。

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    446

    文章

    47748

    浏览量

    409043
  • 计算机
    +关注

    关注

    19

    文章

    6644

    浏览量

    84478
  • 服务器
    +关注

    关注

    12

    文章

    8106

    浏览量

    82485
收藏 人收藏

    评论

    相关推荐

    【算能RADXA微服务器试用体验】Radxa Fogwise 1684X Mini 规格

    通过网络可以了解到,算能RADXA微服务器的具体规格: 处理:BM1684X 算力:高达32Tops INT8峰值算力 内存:16GB LPDDR4X 内存 存储:64GB eMMC
    发表于 02-28 11:21

    linux服务器和windows服务器

    ,这在满足个性化需求和增强服务器安全 性上具有优势。 Linux服务器还具有出色的性能和稳定性。相比之下,Windows服务器性能和稳定性
    发表于 02-22 15:46

    未来的Arm CPU路线图 :v8到v9服务器发展之路

    Arm谈到了移动市场在今年如何将带有X1的设备性能提升了2.4倍(此处我们仅指ISO流程设计的IPC),该性能是几年前
    发表于 12-13 13:58 357次阅读
    未来的<b class='flag-5'>Arm</b> CPU路线图 :v8到v9<b class='flag-5'>服务器</b>发展之路

    Marvell推出两款新型OCTEON 10 DPU为网络设备带来服务器级别的性能

    Marvell面向网络设备OEM和企业正式发布的两款新型OCTEN 10 DPU在将功耗降低50%的同时,其性能是现有Marvell解决方案的三倍。 两款新型Marvell OCTEO
    的头像 发表于 12-12 09:10 326次阅读
    <b class='flag-5'>Marvell</b><b class='flag-5'>推出</b>两款新型OCTEON 10 DPU为网络设备带来<b class='flag-5'>服务器</b>级别的<b class='flag-5'>性能</b>

    Arm Systemready认证加速,服务器系统和软件开箱即用

    。   为了加速基于Arm架构的系统在不同应用场景下的快速和广泛落地,Arm针对基于Arm v8和v9 CPU架构的设备推出了一系列Arm
    的头像 发表于 11-08 00:27 1163次阅读
    <b class='flag-5'>Arm</b> Systemready认证加速,<b class='flag-5'>服务器</b>系统和软件开箱即用

    2023年全年中国服务器市场ARM占比会超过10%

    ARM架构服务器已逐步成为通用计算领域新的选择。 国内ARM生态发展迅速,以鲲鹏为代表的ARM架构服务器,市场份额快速
    发表于 09-26 10:30 717次阅读
    2023年全年中国<b class='flag-5'>服务器</b>市场<b class='flag-5'>ARM</b>占比会<b class='flag-5'>超过</b>10%

    EDA在ARM服务器上的可拓展性

    amazefp的智能设计工具amazefp支持armv8服务器,以实现数字eda。如图2所示,arm cpu的多核心优点与amazefp的分布式计算技术相结合。对于采用arm架构服务器
    的头像 发表于 09-18 11:37 580次阅读
    EDA在<b class='flag-5'>ARM</b><b class='flag-5'>服务器</b>上的可拓展性

    EDA软件在ARM服务器的应用解析

    结合AmazeFP的分布式计算技术,可充分体现工具效率的提升,为采用ARM架构服务器芯片设计企业节约更多能耗和成本。
    发表于 09-15 12:25 489次阅读
    EDA软件在<b class='flag-5'>ARM</b><b class='flag-5'>服务器</b>的应用解析

    pc服务器服务器的区别是什么

    按上图指令架构分类,服务器可以分为: CISC复杂指令集 CISC服务器也称为 x86服务器,目前比较主流。主要是采用Intel、AMD处理器芯片。 iRISC精简指令集 RI
    发表于 08-25 09:48 1175次阅读
    pc<b class='flag-5'>服务器</b>和<b class='flag-5'>服务器</b>的区别是什么

    移植ARM DHCP服务器版本1程序员指南

    。 第四章 排除麻烦阅读本章, 描述在将ARM DHCP 服务器移植时可能出现的一些共同问题。 第二章 概述和要求阅读本章, 概述DHCP 和 系统移植系统要求概述 DHCP 。 3 分 , 学习如何跟踪 。
    发表于 08-18 06:46

    Arm Cortex‑X3核心加密扩展技术参考手册

    Cortex®-X3内核支持可选的ARMv8.0-A和ARM®v8.2-A加密扩展。 Armv8.0-A加密扩展向Advanced SIMD添加了A64指令,以加速高级加密标准(AES)加密和解
    发表于 08-17 06:25

    Arm许可证服务器22.1.3版用户指南

    Arm®许可证服务器Arm Forge提供许可支持。 Arm HPC产品有三种许可模式: •评估(试用)许可证•工作站(节点锁定)许可证?超级计算(浮动)许可证对于评估和工作站许可证
    发表于 08-10 07:24

    ARM服务器基础系统体系结构7.1平台设计文档

    服务器基本系统体系结构(SBSA)指定了基于ARM 64位体系结构的硬件系统体系结构,服务器系统软件(例如操作系统、管理程序和固件)可以依赖该体系结构。SBSA扩展了ARM BSA[
    发表于 08-09 07:49

    ARM Cortex-X3核心技术参考手册

    Cortex®-X3内核是一款实施ARM®v9.0-A架构的高性能低功耗产品。ARM®v9.0-A架构将ARMv8-A架构中定义的架构扩展至ARM
    发表于 08-09 07:39

    Arm Cortex-X4推进了CPU性能的前沿领域

    2和Cortex-X3 CPU的IPC性能提高到两位数,这些CPU是在Armv9架构上建立的。所有的Cortex-X CPU都是我们Cortex-X
    发表于 05-29 18:25