0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

192个自研核心,AmpereOne的绝对性能压制

E4Life 来源:电子发烧友网原创 作者:周凯扬 2023-06-05 15:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)在亚马逊英伟达和阿里巴巴等厂商纷纷围绕Arm Neoverse架构打造服务器处理器之际,Ampere Computing选择了一条与众不同的路线,自研核心。近日,Ampere宣布推出全新的AmpereOne系列处理器,可配置多达192个核心,且这些都是基于Ampere自有IP打造的自研核心。

Ampere Altra到AmpereOne,Ampere的自研之路
凭借前两代Ampere Altra系列产品80核Ampere Altra和128核Ampere Altra Max,Ampere成了在Arm服务器CPU领域的先行者之一。主流的大型云服务厂商(CSP)都已经推出了基于这两款CPU的服务器,如京东云就在近日推出了其首款基于Arm架构的云主机,搭载的正是Ampere Altra Max CPU。

CSP厂商纷纷拥抱Arm的原因很简单,高并发、高算力和更低的价格,为上云提供了极具性价比的选择。但如何做好差异化,是每个Arm服务器CPU厂商都需要思考的问题,比如英伟达选择了与自己的GPU结合打造Grace Hopper这样的SuperChip。

而拥有Arm ISA架构授权的Ampere选择了从微架构上进一步创新,打造自研的Arm云原生核,从绝对性能和可扩展性上超越同类产品。单个AmpereOne CPU的可配置核心已经达到192个,比上一代的Ampere Altra Max多出了50%,内核数为业界最高。

这意味着基于AmpereOne CPU的单机架性能将再创新高,为了匹配新CPU强大计算能力,AmpereOne还采用了8通道DDR5、128通道PCIe 5.0和更大私有缓存的设计,断绝了内存带宽和I/O性能上出现瓶颈的可能。针对高速增长的云原生应用,AmpereOne还集成了一系列新特性,包括网格拥塞管理、细粒度电源管理和内存标签等。Ampere表示,AmpereOne将帮助该公司进一步扩大在每机架性能方面的优势。

Ampere首席产品官Jeff Wittich:“192 核是一个非常大的数字,比英特尔AMD 要多很多。用一个具体的场景来说明,在云环境中运行虚拟机时,用192核的AmpereOne对比96核的AMD Genoa,或者60核的英特尔Sapphire Rapids,AmpereOne每机架运行的虚拟机数量是AMD Genoa的2.9倍,是英特尔Sapphire Rapids的4.3倍。”

AmpereOne发力Chiplet与AI推理

得益于工艺的进步和架构的创新,AmpereOne能做到如此规格似乎并不意外,但能在Ampere Altra Max面世后的短时间内推出这样一个“性能怪兽”,其实也离不开在设计方法上的转变。从AmpereOne的架构可以看出,与此前Ampere Altra系列不同的是,新的处理器转为采用Chiplet设计。近来不少先进芯片设计中都采用了这一技术,电子发烧友网也就这一转变询问了Ampere,Chiplet究竟有何助力,是否加快了芯片设计周期?

Jeff Wittich指出:“综合而言,我们在Ampere中转为大量采用小芯片带来了许多的优势,其中第一点就是能够有更高的灵活度,第二点就是如问题中提到的,帮助我们加快了整个芯片设计周期。在采用了Chiplet架构之后,产品的TTM也会随之缩短,还可以提供更高的可扩展性,从而提供现代云原生CPU的最佳性能。第三,Chiplet拓扑的设计也可以使AmpereOne更轻易地实现内存到内核的访问,而不需要为处理器引入额外的HOPs。”

另外值得注意的一点是,在早前的Ampere Altra系列CPU中,虽然也可以用于AI推理,但从CSP已发布服务器的定位来看,其主要还是用于Web服务、视频编解码以及云游戏等非AI应用上。而此次发布的AmpereOne,则在AI计算上加大了力度。
 
AI推理性能对比 / Ampere

从性能对比上,我们可以看出AmpereOne在AI推理负载上的领先,比如在生成式AI和推荐算法上,AmpereOne的单机架性能是AMD EYPC 9654 Genoa的两倍或以上,但两者却有着近乎相同的系统功耗,AmpereOne的优势在此展现得一览无余。

这与Ampere自身的发展以及行业趋势也紧密相关,AI负载已经成为云端最大的算力需求之一。而Ampere除了解决了AI硬件的问题外,也在布局AI软件生态。比如2020年,Ampere收购了专注于打造AI软件的OnSpecta,通过软硬件协同优化,为AmpereOne提供卓越的AI性能,比如对BF16精度的支持等等。

解决性能与能效的矛盾
在Ampere公布今年的路线图时,创始人/董事长兼首席执行官Renée J. James表示:“Ampere已经向行业证明,击破单核性能与能耗之间的矛盾正是行业所有人都在寻找的新象限。在能耗与性能的坐标轴之中,朝坐标轴的右下方移动是行业发展的新常态,目的是实现更低的能耗和更高的性能。”

针对云计算的需求,在设计产品的过程中,Ampere借助Arm架构的优势,综合考量从核、SoC到等其他方面的因素,致力于实现每瓦性能、每机架性能的提升。对比x86架构的CPU,Ampere Altra系列的的云原生处理器可以实现每机架2.5倍的性能提升,降低能耗2.8倍,并仅占用1/3的空间。而新发布的AmpereOne将帮助Ampere进一步扩大领先优势。

Jeff Wittich表示:“其实我们Ampere Altra系列处理器已经提供了行业领先的单机架性能,在能效方面已经是行业标杆性的产品。不仅是在性能方面,在能效方面我们也是领先AMD和英特尔所有的产品,即使是他们近期发布的低功耗产品。”

写在最后
诚然,对于大部分服务器CPU而言,面向的客户都是CSP和服务器OEM厂商,而他们提高竞争力的方式之一即提供差异化的高质量方案。不少Arm服务器CPU,虽然都在设计上做了差异化,但计算核心的性能并未拉开太大差距。Ampere选择了自研云原生核的方式,既满足了更高性能的需求,也解决了他们的另一大痛点,可扩展性与规模化。

成立5年多来,Ampere,已经在x86垄断的服务器市场占领了一席之地。在一切背后,是Ampere 认为云需要一种从本质上而言完全不同的方法。随着所有的计算转移到云端,整个平台的云原生化趋势不可避免,而Ampere正在做的就是为云原生进行彻底的CPU创新。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9611

    浏览量

    394333
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11370

    浏览量

    226391
  • AI
    AI
    +关注

    关注

    91

    文章

    41964

    浏览量

    303057
  • Ampere
    +关注

    关注

    1

    文章

    81

    浏览量

    4927
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    成功点亮并上车!对标Orin X,Momenta芯片来了

    年时间,其芯片也终于接近落地。   对标Orin-X,接口兼容8650,目标快速上车   据透露,Momenta的智驾芯片性能上对标
    的头像 发表于 08-14 09:10 8803次阅读
    成功点亮并上车!对标Orin X,Momenta<b class='flag-5'>自</b><b class='flag-5'>研</b>芯片来了

    MCU vs 通用MCU:其利天下13万转暴力风扇驱动的性能与成本全面对比

    其利天下作为专业暴力风扇方案商、行业龙头企业,深耕高速无刷驱动领域多年,推出基于KY32DQ020高性能MCU打造的暴力风扇无刷电机驱动方案,历经破千万级成品验证,以无感方波+PID先进算法
    的头像 发表于 05-19 15:00 188次阅读
    <b class='flag-5'>自</b><b class='flag-5'>研</b>MCU vs 通用MCU:其利天下13万转暴力风扇驱动的<b class='flag-5'>性能</b>与成本全面对比

    电解液背后的技术逻辑——为什么电解液决定铝电解电容器的寿命与可靠性

    意味着什么? 对工程师和采购商而言,电解液能力转化为以下实际价值: ① 更稳定的长期供货质量 配方和原材料均在内部管控,批次间一致性高,不会出现\"同型号不同批次性能差异大\"
    发表于 05-14 10:41

    MAX192:低功耗8通道串行10位ADC的卓越性能与应用

    MAX192:低功耗8通道串行10位ADC的卓越性能与应用 一、引言 在电子设计领域,模拟信号到数字信号的转换是一关键环节。ADC(模拟 - 数字转换器)作为实现这一转换的核心器件,
    的头像 发表于 04-09 11:50 464次阅读

    实锤!比亚迪首次披露激光雷达进度,已量产上车!(将全民普及)

    ,比亚迪发布2025年度报告,尤其让我们关注的是,在年度【研发投入】中,比亚迪披露了“第二代刀片电池及闪充技术”等26年度重大研发项目,其中就包括“激光雷达”项目——这是比亚迪首次曝光激光雷达项目进度。   比亚迪在激光雷
    的头像 发表于 04-01 20:07 3140次阅读
    实锤!比亚迪首次披露<b class='flag-5'>自</b><b class='flag-5'>研</b>激光雷达进度,已量产上车!(将全民普及)

    比亚迪BMS AFE芯片护航第二代刀片电池

    刀片电池的性能突破背后,还有这样一关键的“隐形功臣”——比亚迪BF891X系列AFE模拟前端芯片,它不直接输出功率,却是闪充技术下电池能够安全、稳定、长效的
    的头像 发表于 03-18 15:20 904次阅读
    比亚迪<b class='flag-5'>自</b><b class='flag-5'>研</b>BMS AFE芯片护航第二代刀片电池

    京东电商数据库内核DongSQL简介

    团队于今年(2025.9)打磨出了深度优化的数据库内核——DongSQL V1.1.0。
    的头像 发表于 01-04 17:07 1262次阅读
    京东<b class='flag-5'>自</b><b class='flag-5'>研</b>电商数据库内核DongSQL简介

    1600TOPS!美国新势力车企5nm芯片,转用激光雷达硬刚特斯拉

    电子发烧友网报道(文/梁浩斌)新势力车企芯片似乎已经成为一共识,近年来,蔚来、小鹏陆续实现了自动驾驶芯片的上车,理想也预计2026
    的头像 发表于 12-22 08:02 1.1w次阅读
    1600TOPS!美国新势力车企<b class='flag-5'>自</b><b class='flag-5'>研</b>5nm芯片,转用激光雷达硬刚特斯拉

    亚马逊新一代服务器芯片Graviton5问世,性能提升25%

    ,基于Graviton5的全新EC2 M9g实例性能提升高达25%,其每个芯片配备192核及5倍扩容缓存,助力客户在扩展工作负载、提升应用性能的同时降低基础设施成本。   Graviton5
    的头像 发表于 12-09 08:33 5771次阅读

    季丰电子PCB管理系统的简单介绍

    季丰电子的PCB管理系统,整合报价+投板+Release三大核心模块,覆盖从设计发布、订单对接到生产交付的全业务流程。
    的头像 发表于 11-11 14:51 1452次阅读

    江波龙UFS4.1主控芯片,顺序读取速率高达4350MB/s,性能对标主流产品

    电子发烧友网报道(文/黄晶晶)近年来,江波龙主控芯片取得较大的进展。截止至2025年7月底,江波龙主控芯片全系列产品累计实现超过8000万颗的批量部署,并且部署规模仍在保持快速增长。   据了解
    的头像 发表于 09-04 09:15 1.2w次阅读
    江波龙<b class='flag-5'>自</b><b class='flag-5'>研</b>UFS4.1主控芯片,顺序读取速率高达4350MB/s,<b class='flag-5'>性能</b>对标主流产品

    东风风神L8搭载马赫动力电池

    近日,东风新旗舰东风风神L8正式开启预售,聚焦家庭用车核心需求,该车搭载东风“马赫动力电池”打造主流家庭的“质价比之王”。
    的头像 发表于 08-15 09:55 1846次阅读

    Arm CEO:公司正在芯片

    据外媒路透社报道,Arm CEO Rene Haas透露,Arm正在投资开发自有芯片,并计划将部分利润投资于制造自己的芯片和其他组件。与之对应的是Arm预测的下一财季经营业绩也会因为芯片而减低
    的头像 发表于 07-31 11:49 841次阅读

    国产真性能图形 GPU 重磅发布:跑分超 RTX4060,畅玩《黑神话・悟空》

    系列。   砺算科技创始人、CEO 宣以方表示,砺算 7G100 系列 GPU 从计算核心到指令集完全由自主设计,基于 “天图” 架构,并配备
    发表于 07-26 21:45 6292次阅读
    国产真<b class='flag-5'>自</b><b class='flag-5'>研</b>高<b class='flag-5'>性能</b>图形 GPU 重磅发布:跑分超 RTX4060,畅玩《黑神话・悟空》

    又一颗国产GPU芯片成功点亮!6nm制程,TrueGPU架构

    款GPU芯片G100采用6nm制程,基于的TrueGPU架构,这是全球首个融合高性能图形渲染与AI推理能力的GPU架构。其核心优势在于通过unified shader+tensor
    发表于 05-29 00:48 2849次阅读