0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊的云服务器芯片为何性价比高出英特尔45%

mK5P_AItists 来源:cg 2018-12-24 09:34 次阅读

到目前为止,亚马逊和其他大型云运营商几乎全部使用英特尔的 Xeon 芯片。虽然在服务器芯片市场,英特尔市场占有率非常高,但亚马逊正使用折扣策略来赢得客户。亚马逊表示,基于 Graviton 的云服务比英特尔处理器上运行的现有产品「成本低得多」,具体在某些处理任务上,能够减少 45% 的成本。

智能网卡与服务器处理器有何区别?如果你指的是亚马逊云服务(Amazon Web Services),两者大概相差三年。在西雅图总部,公有云市场大佬亚马逊 re:Invent 2018 大会现场,亚马逊推出了基于 ARM 架构的 Graviton 服务器处理器。除去已经在 AWS 运行的 Intel Xeon 和 AMD Epyc 处理器,Annapurna Labs 表示 Graviton 还支持 EC2 虚拟计算服务。2015 年,亚马逊以 3.5 亿美元收购 Annapurna Labs。早些时候,亚马逊从 Calxeda 挖来了几名员工,Calxeda 是一家致力于开发基于 ARM 架构服务器系统的初创公司。

过去一年的 ARM 服务器市场波谲云诡:先是高通宣布放弃 Centriq 2400;Ampere(获得私募基金 The Carlyle Group 投资)抢先收购 X-Gene,让 Applied Micro 终于获得喘息之机。如此看来,AWS 创造了自己的服务器芯片,放弃使用目前 ARM 架构服务器市场最领先的 Marvell(前身为 Cavium)ThunderX2 芯片,就显得尤为重要。然而,这并不代表 Marvell 或者 Ampere──如果未来实现了超强浮点并行处理,拥有 A64FX 处理器(48 核且具备可伸缩矢量扩展)的富士通也将纵横 ARM 市场──ARM 芯片未来在 AWS 公有云市场一定毫无作为。我们认为 AWS 已经在 Annapurna Labs 中研发「Alpine」系列双核及四核 ARM 芯片,为自己的服务器集群创造 SmartNIC。SmartNIC 是服务器集群不可或缺的。除了 EC2 上的 Xeon、 Epyc 和现在的 Graviton 处理器的操作系统和应用之外,服务器集几乎能卸载所有功能,使得公有云计算核心可以极大程度上运行应用。虽然之前说过,但我们还是想再次强调:大部分 Hyperscaler 和云构建仍依赖 SmartNIC 的发展。由于 InfiniBand 网络具备搭配智能网卡 GeniusNIC(Mellanox Technology 的命名虽然有些玩笑意味,但能看得出企图心)的卸载模型,HPC 中心能够进一步提升价值。最终,Mellanox Technology 的落后也是由于相同的原因:Hyperscaler 和 HPC 中心经常采用卸载计算。核心计算十分昂贵,相对而言,卸载计算就不一样了。

2016 年 1 月,亚马逊与 Annapurna Labs 发布了 32 位 Armv7 与 64 位 Armv8 设计,两者已达到「企业级性能与特征」,如支持 DDR4 内存、2MB 二级缓存。自那以后,再没有透露好更多关于「Alpine」系列芯片的消息。Arm Holdings 生产的基于 Cortex-A15 核心的双核及四核 32 位元件,其主频分别达到 1.4 GHz 与 1.7 GHz;基于 Cortex-A57 设计的四核元件,主频达到 1.7 GHz。上述 Arm Cortex 核心支持超标量通道及乱序执行,但并不具备超线程。这些设备的进给量与速度并没有任何特别之处,由于 Amazon 并未公布任何细节,我们不展开讨论具体架构。但我们推测有两点非常不可思议:亚马逊如何生产这些廉价设备;亚马逊如何运用服务器卸载计算以使得服务器、网络及存储更加高效。主流厂商的策略确定无疑:Mellanox 主推 Bluefield 多核 ARM 处理器,微软在 Azure 公有云的服务器上使用 FPGA 作为网络加速及计算引擎,Netronome 主推 Agilio 网络适配器。

AWS 全球基础设施及客户支持业务副总裁 Peter DeSantis 在 re:Invent 2018 大会介绍了 Graviton Arm 服务器的工艺。虽然我们不清楚 Graviton 芯片,Graviton 看起来是一个更加实用的处理器,其与 Intel Skylake Xeon-D-2100 v2 类似,搭配 8 到 18 个核心,主频在 1.6 GHz 与 2.3 GHz 之间(通常核心数越多,时钟频率越低)。如果打开 AWS 网站,大家会发现一句申明「Gravitons 基于 64 位 Neoverse 核心」,这几乎能断定 Cosmos 核心是定制的。Cosmos 包含 ARM Cortex-A72 与 Cortex-A75 设计的微调版本,意图达到 16 纳米芯片工艺水平,其代工厂很可能是***半导体制造公司(Taiwan Semiconductor Manufacturing Corp)。大家回想下,Arm 发布的 Neoverse 正是 10 月曾发布的数据中心 Arm 芯片的翻版,其每年性能提高幅度达到 30%,并将在 2021 年前完成 7 纳米到 5 纳米制造工艺的升级。所有 AWS 的公开信息表示,通过 EC2 A1 让业界熟悉的 Graviton 处理器,最多支持 16 个虚拟 CPU、32GB 主内存,服务器适配器的网络带宽达到 10 Gb/秒,弹性块存储(EBS)带宽达到 3.5 Gb/秒。当我们想了解更多技术细节时,AWS 并未确认目前使用哪个 Cosmos 核心,亦未确认 Graviton 具备 16 个核心且无法通过同步多线程(SMT)为各个核心提供虚拟多线程。(SMT 支持通常由 ARM 许可证持有用户添加,尚未成为 ARM 基本内核许可证部分。随着 2019 年「Ares」内核到期,情况可能会改变。)AWS 向 The Next Platform 确认,EC2 A1 具备 Graviton 芯片,主频达 2.3 GHz。单就整数计算而言,Graviton 已能与 Xeon-D 抗衡,或许达到了 Xeon SP 的下限水平。不同 A1 的进给量和速度如下:

我们推断内存及内存带宽不多,可能只有一个内存控制器和两个内存通道,最高容量 512 GB,搭配十分昂贵的 128 GB 记忆棒,即便使用便宜的 8 GB 记忆棒也可轻松达到 32GB。Annapurna Labs 可能在芯片上放置了大量内存你控制器,我们认为其并不支持 SMT,推断芯片上具备 16 个内核。一个内存控制器搭配八个核心是很好的平衡选择,但如果大家想让计算能力和内存带宽恢复平衡,四个内存控制器的效果甚至会更好。(考虑到 AWS 并未大肆炫耀,该项可能仍未实现。)A1 采用 Amazon Linux 2 系统(红帽 Linux 与亚马逊 CentOS 克隆版结合的自研升级系统),亦支持 RHEL 和 Ubuntu 服务器系统,未来将支持其他操作系统──如果以后 AWS Arm 服务器芯片支持 Windows Server,应该十分有趣。基于 Arm 的 A1 EC2 目前在美国东部、西部及欧洲(爱尔兰)等区域可用,订购类型一般涵盖 On-Demand、 Reserved、Spot、Dedicated 及 Dedicated Host。AWS 特别提醒,上述 A1 实际应用于内存带宽不做特别限制的横向扩展工作负载,如 Web 服务器、开发环境、缓存服务器或容器化微服务等轻量化及无状态服务。AWS 表示与 EC2 上同等性能的 32 位服务相比,这些服务成本能降低到 45%。不过,AWS 并未说明具体的比较对象。划重点了。我们来看看 Arm 服务器之于基础设备的野心有多大。毫无疑问,A1 会有无数的衍生版本。对于支持极有可能成为下一代智能网卡处理器的发展来说,这是件好事。算上基于 Arm 的 A1,AWS 还在 EC2 主题上研发了一些其它基础设施变体。新一代 C5 服务在这些变体之间的以太网速率达到每秒 100Gb,适用于那些带宽依赖的 HPC 仿真建模、机器学习训练及密集数据分析工作。如同 C5 和 C5d,C5n 基于双插槽服务器节点,搭配定制 Skylake Xeon SP 8000 Platinum 系列处理器,各芯片可能具备 18 个内核且主频达到 3 GHz。

除了额外带宽之外,C5n 的数据队列是 C5 和 C5d 的数倍至多──32 比 8 的弹性网络接口(Elastic Network Interface,应用于 Annapurna 处理器,布置在网卡附近,使其更加智能──帮助网络适配器中数据更快的在内核中流转。无论是单个可用范围或区域内跨越多个可用范围,带宽在同一区域内都可用)。C5n 可用于 EC2 及其他服务器集群,与 S3 对象存储或 Elastic MapReduce、Relational Database Service 及 ElastiCache 等服务连接。C5n 与 A1 的可用区域一致,业务范围还附加美国政府私有云 GovCloud。

最后,去年 10 月 AWS 推出的 P3 GPU 加速服务使得以太网达到每秒 100 Gb,服务器链路上限达到每秒 25 Gb。具有更快网络的 P3dn 将于下周推出,其配备 32 GB HBM2 内存的 Volta Tesla V100 GPU 加速器,而初代 P3 配备 16 GB HBM2 内存的初代 Volta 加速器。上述服务基于一对定制 24 核 Xeon SP 处理器,机箱中最多配备 8 个 GPU。作为最大云计算提供商的 AWS 提供了 ARM,这对 ARM 来说是一次胜利。在过去五年里,Calxeda、Applied Micro、英伟达三星博通、、Cavium、Marvell、AMD 和高通等多家先驱投身到 Arm 服务器芯片的研发。但发展到今日,这些想去几乎全军覆没。

Moor Insight & Strategy 的行业分析师帕特里克·莫尔海德(Patrick Moorhead)上周五在给 CNBC 的邮件中写道:「AWS 接受 ARM 为 ARM 带来了可信度,将 ARM 的业务扩展到更多的云参与者和工作负载。」尽管亚马逊的大部分营收仍来自商品销售,但 AWS 已成为该公司财务健康的关键。第三季度,亚马逊超过一半的营业利润来自 AWS。亚马逊在线商店的收入本季度同比增长 10%,而 AWS 服务的营收增长了 46%。AWS 现在有超过 125 种服务可供客户使用,包括核心的 EC2 计算服务。在接下来的几年里,AWS 可以发布基于更强大 ARM 芯片的新实例。现有实例使用 ARM 于 2015 年推出的 Cortex-A72 系统。但更重要的是,其他云计算提供商将可能同样开始使用 ARM 技术发布实例。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    447

    文章

    47838

    浏览量

    409219
  • 英特尔
    +关注

    关注

    60

    文章

    9430

    浏览量

    168972
  • 亚马逊
    +关注

    关注

    8

    文章

    2480

    浏览量

    82385

原文标题:性价比高出英特尔45%,亚马逊的云服务器芯片如何做到?| 解读

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    通过STM32+ESP8266 Wifi模块 +服务器,做一个数据收发控制的板子服务器方面该如何选择?

    通过STM32+ESP8266 Wifi模块 +服务器 做一个数据收发控制的板子 服务器方面该如何选择?
    发表于 04-25 08:16

    英特尔:2025年全球AIPC将超1亿台占比20%

    英特尔行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年02月29日 09:15:26

    英特尔1nm投产时间曝光!领先于台积电

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月28日 16:28:32

    英特尔再创辉煌!1.4nm芯片工艺领航微电子时代,工业界的新里程碑?

    英特尔行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年02月26日 08:58:21

    海光双路服务器性价比高GITSTAR海光国产服务器# 海光服务器# 国产服务器

    计算机服务器
    jf_67464575
    发布于 :2024年02月02日 09:50:44

    如何远程登录服务器?登录失败是什么原因?

    我用Linux服务器,遇到了有关远程登录的一些问题,于是搜索了一些资料,整理了一篇文档,作为记录。如果你也遇到过 相似的问题,欢迎一起探讨! 一、Linux服务器的远程登录 远程登
    发表于 02-01 15:32

    英特尔登顶2023年全球半导体榜单之首

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月01日 11:55:16

    英特尔酷睿14代处理系列发布,Arrowlake/LunarLake24年问世

    处理英特尔
    looger123
    发布于 :2024年01月10日 17:44:38

    宝德服务器全面升级到第五代英特尔®至强®平台

    发布全新一代基于第五代英特尔®至强®可扩展处理器的宝德服务器。   卓越性能,新一代宝德服务器为计算用户提供更优选 第五代英特尔®至强®处理器具有更可靠的性能和更出色的能效,核心数量可
    的头像 发表于 12-21 16:12 345次阅读
    宝德<b class='flag-5'>服务器</b>全面升级到第五代<b class='flag-5'>英特尔</b>®至强®平台

    #高通 #英特尔 #Elite 高通X Elite芯片或终结苹果、英特尔芯片王朝

    高通英特尔苹果
    深圳市浮思特科技有限公司
    发布于 :2023年10月27日 16:46:07

    m3芯片相当于英特尔什么水平?

    芯片相当于英特尔什么水平呢?本文将对此进行探讨,希望为您解答疑惑。 1. 英特尔和ARM的差异 在讨论M3芯片的水平之前,我们需要先了解英特尔
    的头像 发表于 08-16 11:33 6715次阅读

    安装OpenVINO工具套件英特尔Distribution时出现错误的原因?

    安装OpenVINO™工具套件英特尔 Distribution时,出现错误: Python 3.10.0.ECHO is off. Unsupported Python version.
    发表于 08-15 08:14

    英特尔媒体加速参考软件Linux版用户指南

    英特尔媒体加速参考软件是用于数字标志、交互式白板(IWBs)和亭位使用模型的参考媒体播放应用软件,它利用固定功能硬件加速来提高媒体流速、改进工作量平衡和资源利用,以及定制的图形处理股(GPU)管道解决方案。该用户指南将介绍和
    发表于 08-04 06:34

    大模型算力新选择——宝德AI服务器采用8颗英特尔Gaudi®2加速器

    要的战略合作伙伴和中国AI服务器市场的TOP3.宝德计算积极携手英特尔,推出了支持8颗Gaudi®2加速器的AI加速计算服务器——PR8908WG,具有高性能、可扩展性强、高能效和开箱即用等优势,能够为AI客户尤其是大模型训练和
    的头像 发表于 07-19 14:43 499次阅读

    英特尔考虑成为Arm的锚定投资者,募资规模或达百亿

    高通、苹果等采用Arm架构的芯片设计大厂,以及采用Arm架构打造Grace CPU和服务器芯片Graviton3E的英伟达与亚马逊,都有望从英特尔
    的头像 发表于 06-27 15:23 277次阅读
    <b class='flag-5'>英特尔</b>考虑成为Arm的锚定投资者,募资规模或达百亿