0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ARM服务器生态已成熟,80核CPU将冲击X86

独爱72H 来源:半导体投资联盟 作者:半导体投资联盟 2020-03-25 15:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(文章来源:半导体投资联盟)

Ampere公司是一家专注于ARM架构服务器芯片的新生公司。在2019年,甲骨文公司向Ampere公司投资4000万美元。此前,Ampere也获得了ARM公司的注资。能接连得到科技巨头的青睐,因为这家处理器新贵肩负一个重大使命,将代表ARM阵营继续挑战X86架构在服务器芯片领域的霸权。

Ampere的前身是Applied Micro公司旗下的ARM处理器部门,在2017年由私募股权投资公司Carlyle Group从Macom中收购而得。而Ampere的CEO Renee James在2016年2月离开英特尔后便加入Carlyle Group,最后促成Carlyle Group投资及创立Ampere公司。

成立后的Ampere很快就推出了产品:基于ARM v8.0架构的32核芯片eMAG 芯片,采用TSMC 台积电16FF +工艺构建,运行频率为3.3 GHz。该芯片已经交付了联想等一批客户。在一年半之后,2020年3月,Ampere的最新产品Altra诞生了,这款芯片被定义为世界上首款“云原生处理器”。

在介绍Altra的特性之前,要先谈到大背景:云计算。这个已经为人熟知的概念,是由企业级计算演进而来的。但是,云计算对处理器的需求已经相比原来发生了翻天覆地的变化。用Ampere 产品高级副总裁Jeff Wittich的话来说,光是从软件角度,现在的需求更多的是朝向云原生如容器、微服务这类的计算模型快速转变,而不是面向以前那种企业级内部的计算模型。

加之越来越多的边缘数据中心加入,带来了与以往不同的延时、散热、功耗等需求。“超大规模的云,包括边缘的云计算的需求的增长,使得我们对于像CPU的部署密度和能耗的要求越来越高。”Jeff Wittich表示。还有两个重要的变化:机器学习AI功能增强以及基础设施的定制化。前者使得算力的需求在各个地方都与日俱增,后者要求各种为客户定制的异构型基础设施也有云计算的能力。

“所以我们需要一种新型的计算能力,专门针对云的。”Jeff Wittich总结道:“我们需要很多非常高效的CPU的内核,需要整个基础设施都非常低的功耗,而且需要非常好的扩展性。”Altra就是这种新型计算能力的代表。这款芯片是从一开始设计、制造就面向云,为满足云计算需求而生的CPU。Jeff Wittich将当代云计算的要求归结为三种:可预测性、跨平台的可扩展性和高能效及部署密度。

Altra拥有80个64位ARM核,采用了Monolithic die(即单芯片设计)工艺,所有的核都在Mesh网络下连接在一起,具备了非常高的内存带宽和内存密度,能提供很高的可预测性。基于行业中最领先的每核功耗,Altra可以提供极大的可扩展性,在从边缘到超大规模云的不同部署环境下可提供多种处理器配置。同时,Altra还提供多路的支持,非常灵活的I/O连接及高带宽。

Jeff Wittich强调:“我们这个处理器最大一个优点是功耗非常低,同时单核功耗更低或者说每瓦性能是业内最高的。”“我们这款CPU,特别适用于现在云计算所需要的计算模型,包括像容器、微服务,函数即服务等这些计算模型当中。”Jeff Wittich表示。

Altra的一大特色是采用了单核单线程的设计,通过消除单物理核多线程设计中,多用户共享资源的争夺引起的“相邻干扰”问题,可以实现提供100%的可预测性能核心。Jeff Wittich认为,单核单线程的设计,能够保证在运算或者执行的时候有一个具备一致性的、可预测的性能。“从执行角度来说,设计单核单线程,第一能够降低延迟,第二能够保持可预测的性能一致性。”

Altra还具有两个128BT的SIMD单元用于浮点计算。现在推理越来越重要,并且在所有基础设施上都运行,所以Altra提供int8和FP16的支持,提高AI推理加速性能。缓存方面,Altra也“出手阔绰”。其具有单核64KB L1 I/D-cache,单核1MB L2 cache 和 32MB 系统级缓存。

内存子系统也经过精心设计。Altra拥有8个DDR4通道,频率3200Hz,每一个通道能插两个DIMM,运行的时候能够提供单路200GB/s的传输速度。“此外,我们还有非常好的I/O子系统,单路128条PCIe Gen4通道,两路是192条PCIe Gen4,这个是行业里最高的。X16的控制器可分为x8或者x4或者x2不同的设计选择。Altra可以连接高带宽GPU,还可以连接高fan-out及NVME存储设备。“Jeff Wittich补充道。

“我们的处理器除了拥有最多的80核以外,性能也是行业内最好的。我们要比AMD的64核EPYC处理器,28核的Intel 至强(Xeon)处理器的性能好。”Jeff Wittich指出,对于一些基于云特别多的这些应用,比如说像搜索、AI推理、解码、数据库等等,Altra不仅仅性能更高,功耗也更低,每瓦特的性能比AMD的EPYC和Intel至强要高。从Calxeda到Applied Micro再到高通,ARM体系冲击服务器CPU的尝试都折戟了,反而是Intel逐渐占据了90%的市场份额。

背后的原因是多方面的,主要一个就是过往的服务器生态对ARM不太友好。但是这个局面已经发生改变了。Jeff Wittich指出,ARM架构目前已经具有领先的数据中心的性能和能效。此外,ARM软件的生态现在基本上已经成熟了,所有运行数据中心的这些软件都是可以基于在ARM上进行运行的。更重要的一点,台积电现在已经有7纳米的先进工艺制程技术。

据Jeff Wittich介绍,所有大型的操作系统,如Linux、BSD、windows都可以得到ARM架构的支持。容器化,包括虚拟化工具如docker、VMware、KVM和Kubernetes都可以在ARM架构运行。编程语言,包如CUDA和Java也都可以得到ARM的支持。

重要的一点,现在有大概有1200亿左右ARM的设备在部署,主要分布在移动端、物联网以及消费电子领域中。这样的一个大规模的设备部署,使得ARM体系已经成为最大的处理器生态系统。从TCO考量来说,同样的总体应用成本下所带来的性能,Altra比AMD的EPYC高41%。“如果和Intel至强相比,包括与2月24号公布最新的版本相比较,我们单位的总体应用成本要比其高63%。”Jeff Wittich表示。

Ampere的团队经验非常丰富,做服务器这块已经平均干了二十多年了。Jeff Wittich认为这也是Altra的优势所在。“我们这个团队曾设计过很多代的服务器处理器,出货量在市场上都是非常大的。我们这个团队在整个行业当中有非常广泛的合作伙伴生态环境,包括IP供应商的,也包括软件供应商的。”

Jeff Wittich告诉记者,去年NVIDIA宣布完全支持ARM生态,这是一个大进展。“我们也在自己建设软件生态,和所有的开源社区包括软件开发商一起,进一步地完善我们的生态。”据Jeff Wittich透露,Ampere在过去一年和最主要的云服务商一直在合作,像微软、甲骨文(Oracle)等等,包括其他一些厂商,都在测试这款Altra处理器。他预计2020年下半年会有厂商进行部署,规模量产则将在年中进行。

对于未来的规划,Ampere已经制定完毕。“我们计划2021年推Mystique这个新的产品。Mystique核数更多,性能更好,和现在的Altra平台能够兼容。我们在2022年将推出叫做Siryn的新产品。Siryn要比之前的两款产品核数更多,性能更好,功耗更低,而且还有更多基于云的设计的特点。”Jeff Wittich最后表示。
(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9501

    浏览量

    388839
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11221

    浏览量

    222990
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RV生态又一里程碑:英伟达官宣CUDA兼容RISC-V架构!

    电子发烧友网报道(文/梁浩斌)英伟达生态护城河CUDA,从最初支持x86、Power CPU架构,到2019年宣布支持Arm CPU,不断拓
    的头像 发表于 07-19 00:04 6161次阅读
    RV<b class='flag-5'>生态</b>又一里程碑:英伟达官宣CUDA<b class='flag-5'>将</b>兼容RISC-V架构!

    英特尔服务器CPU市场失守:从99.9%到50%以下

    电子发烧友网综合报道,近日,市场调研机构 IDC 更新了全球服务器市场的最新情况。该机构预计,2025 年全球 x86 服务器的市场价值将同比增长 39.9%,达到 2839 亿美元;非 x8
    的头像 发表于 07-01 01:19 4039次阅读
    英特尔<b class='flag-5'>服务器</b><b class='flag-5'>CPU</b>市场失守:从99.9%到50%以下

    KaihongOS桌面版成功适配x86设备,邀您抢先体验!

    2025年6月30日,KaihongOS桌面版已成功适配x86设备,首次开启开发者Beta体验!我们诚邀您参与本次体验计划,共同探索国产操作系统的创新与潜力。您的反馈帮助我们优化系统,打造更稳
    的头像 发表于 06-30 22:57 1210次阅读
    KaihongOS桌面版成功适配<b class='flag-5'>x86</b>设备,邀您抢先体验!

    打破X86/ARM垄断!国产全新自主架构CPU处理器重磅发布

    3C6000系列、工控及移动终端处理龙芯2K3000/3B6000M,以及相关整机和解决方案,标志着龙芯在自主芯片领域又迈出了坚实的一步。   龙芯中科董事长胡伟武在发布会上表示:“我国信息产业的根本出路在于构建独立于X86ARM
    的头像 发表于 06-28 00:40 8448次阅读
    打破<b class='flag-5'>X86</b>/<b class='flag-5'>ARM</b>垄断!国产全新自主架构<b class='flag-5'>CPU</b>处理器重磅发布

    RISC-V架构CPU的RAS解决方案

    RISC-V架构以追赶者的姿态在多个应用领域与X86架构和ARM架构展开竞争。在服务器应用领域,RISC-V架构正在重新定义服务器芯片领域必备的安全、虚拟化和RAS等规格和规范。
    的头像 发表于 06-06 17:03 1574次阅读
    RISC-V架构<b class='flag-5'>CPU</b>的RAS解决方案

    ARM服务器解决方案

    ARM服务器解决方案已成为异构计算领域的重要技术路径,其核心优势与多元化场景适配性正加速产业渗透。以下为关键要点分析: 一、核心优势与架构设计 能效比优化‌ ARM架构基于RISC指令
    的头像 发表于 05-16 07:44 835次阅读
    <b class='flag-5'>ARM</b><b class='flag-5'>服务器</b>解决方案

    服务器CPU架构解析,从x86ARM:一文吃透其分类及对应品牌优势

    为什么你的服务器总在"喘气"?CPU架构才是关键。大家可能都遇到过这样的情况:公司刚采购的服务器用了不到半年,跑个数据库就像老牛拉车,加内存换硬盘都没用。这时候老工程师会叼着烟告诉你:"小伙子,问题出在
    的头像 发表于 04-30 15:11 1590次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>CPU</b>架构解析,从<b class='flag-5'>x86</b>到<b class='flag-5'>ARM</b>:一文吃透其分类及对应品牌优势

    龙芯3C6000服务器CPU,1632线程,国产CPU新标杆!

    服务器
    国产计算机小秦
    发布于 :2025年04月10日 11:10:04

    龙芯3C6000服务器CPU,1632线程,国产CPU新标杆!

    服务器
    jf_10805031
    发布于 :2025年04月09日 10:44:40

    为什么选择 Flexus 云服务器 X

    招聘的细水长流,它都能轻松应对,游刃有余。     性能卓越,精准筛选:搭载高性能 CPU 与高速存储,Flexus 云服务器 X 就像拥有火眼金睛的伯乐,能在海量简历中迅速识别出潜力股,助您精准锁定未来之星。     安全稳定
    的头像 发表于 02-06 16:42 514次阅读
    为什么选择 Flexus 云<b class='flag-5'>服务器</b> <b class='flag-5'>X</b>?

    ARMx86:架构对比及其应用

    典型的服务器架构的x86采用模块化方法,基于带有可更换组件的主板。CPU和其他组件(如显卡和GPU、内存控制、存储或处理核心)针对特定功能进行了优化,可以轻松更换或扩展。然而,这种便
    的头像 发表于 01-15 15:43 2020次阅读
    <b class='flag-5'>ARM</b>与<b class='flag-5'>x86</b>:架构对比及其应用

    Arm主板与x86主板的区别

    在当今数字化迅猛发展的时代,计算机硬件的架构选择对于系统的性能、能效以及适用性具有至关重要的影响。Arm架构与x86架构是目前主流的两种计算机体系结构,各自在个人计算机、服务器、嵌入式系统及移动设备
    的头像 发表于 01-07 12:21 1443次阅读
    <b class='flag-5'>Arm</b>主板与<b class='flag-5'>x86</b>主板的区别

    鼎盛智能推出基于Ampere的Arm服务器

    随着数字化、智能化转型的加速推进,服务器市场迎来更加广阔的发展空间,以Arm架构为代表的非X86服务器凭借功耗优势、高性能、支持大规模部署
    的头像 发表于 01-03 14:15 1185次阅读
    鼎盛智能推出基于Ampere的<b class='flag-5'>Arm</b><b class='flag-5'>服务器</b>

    服务器 Flexus X 实例,镜像切换与服务器压力测试

    服务器 Flexus X 压力测试 1、购买华为云 Flexus X 实例 Flexus云服务器X实例-华为云 (huaweicloud.
    的头像 发表于 01-03 09:23 813次阅读
    云<b class='flag-5'>服务器</b> Flexus <b class='flag-5'>X</b> 实例,镜像切换与<b class='flag-5'>服务器</b>压力测试

    采用 Flexus 云服务器 X 实例搭建 RTSP 直播服务器

    监控、直播和多媒体应用的核心组件。在当今高度互联的世界中,能够快速部署且稳定运行的 RTSP 服务器对于确保高质量的视频流体验至关重要。本文指导如何在华为云 Flexus X 实例上部署一款轻量级的 RTSP
    的头像 发表于 12-24 17:36 1017次阅读
    采用 Flexus 云<b class='flag-5'>服务器</b> <b class='flag-5'>X</b> 实例搭建 RTSP 直播<b class='flag-5'>服务器</b>