0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD推出专为数据中心打造的首款7纳米CPU和GPU

电子工程师 来源:未知 作者:李倩 2018-11-19 10:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

超威半导体(Advanced Micro Devices;AMD)在近日举行的‘Next Horizon’大会上推出专为数据中心打造的首款7纳米CPUGPU。相形之下,英特尔(Intel)目前最新一代Xeon处理器仍采用14纳米,辉达(Nvidia)目前的Volta GPU则采用12纳米FFN技术工艺。

AMD并未透露太多该新芯片及其性能的相关细节。然而,业界分析师普遍看好该公司可望延续自2016年底推出首款14纳米Zen芯片以来的成长动能。

AMD总裁暨首席执行官苏姿丰(Lisa Su)在媒体和分析师活动上表示,AMD持续专注于高性能,并正全力投入数据中心的发展,着眼于未来主导这一领域。

她展示以一颗7纳米EPYC x86处理器进行渲染任务的性能,要比起采用双插槽的英特尔Skylake Xeon系统性能更强。此外,在一项推论任务展示中,AMD的7纳米Vega GPU基准检验比分也与Nvidia V100旗鼓相当。

新创公司Highwai展示采用AMD 7纳米Vega执行于其人工智能(AI)仿真软件,以实现自动驾驶出租车导航功能。该公司首席技术专家兼共同创办人Raul Diaz也表示,AMD的芯片大致上相当于Volta GPU。

但他说:“我们还没有时间进行任何系统级的比较。”他指出,AI训练才是最需要更高性能的应用。

EPYC (左)和Vega都采用多芯片封装技术(来源:AMD)

AMD于去年5月推出的现有14纳米EPYC,将该公司在x86服务器市场原本仅占0.5%的占有率提高到1.5%。市调机构国际数据公司(IDC)半导体研究副总裁Mario Morales表示,随着AMD的客户关系重新步入轨道,7纳米版本可望有助于AMD在2019年中期推动其x86服务器市占率更上层楼。

IDC运算半导体研究副总裁Shane Rao表示,今年第二季,基于Zen的x86芯片已经将AMD的整体微处理器单元(MPU)市占率提高到9.23%了,高于2016年第二季的7.43%。从营收来看,IDC估计AMD的处理器占有率在同期间也从2.64%成长到5.3%。不过,英特尔的x86业务仍持续主导这两类市场的所有架构,其市占率超过90%。

AMD持续积极利用创新封装技术,以提供更低成本的EPYC。单个模块包括多达8个7纳米处理器芯片,并以AMD的Infinity Fabric连接至带有内存控制器的单个14纳米I/O芯片。这一途径扩展了14纳米EPYC在单一封装上堆栈四颗芯片的封装方式。

AMD首席技术专家Mark Papermaster说:“对于14纳米EPYC而言,一颗较大芯片的成本将会增加1.7倍......模拟I/O的扩展性又不如数字逻辑,因此这部份持续沿用14纳米技术即可......其他的也将采取类似的方法。”

包括Moor Insights & Strategy的Patrick Moorhead等分析师均表示认同。

Moorhead说:“我认为这是整个芯片产业的未来,特别是当制造大型单芯片变得越来越困难,也越来越昂贵了。产业的下一步将是采用2.5D和3D封装,让这些芯片彼此堆栈在一起。”

7纳米EPYC代号为Rome,是第一款使用PCIe Gen 4的x86服务器处理器。相较于英特尔目前的高阶服务器芯片采用96信道,它可以支持多达128个互连通道。

Rome包含多达64个双线程Zen 2核心,数量是使用第一代Zen核心的14纳米Naples芯片的两倍。这些芯片和下一代Milan都将适用于相同插槽,因此厂商无需再设计新的主板。

AMD表示,Rome的传输速率是Naples的2倍,浮点性能更高4倍。然而,AMD并未提供目标数据速率、具体基准比分或有关该芯片的其他详细信息。不过,该芯片预计将在2019年正式推出。

AI运算:Vega vs Volta

AMD一方面以7纳米EPYC架构展示与英特尔Xeon服务器芯片的比较,同时也针对机器学习和商用绘图处理器提供直接竞争Nvidia Volta的替代方案。AMD Radeon绘图技术事业群工程部资深副总裁王启尚(David Wang)说:“产业需要竞争。”

7纳米Vega GPU包含132亿颗晶体管。与新款EPYC一样,AMD表示7纳米Vega的性能较上一代14纳米芯片提高了25%。这款高阶的MI60版本用于GPU运算,可支持64个运算单元、4,096个串流处理器,以及高达32GB的HBM2内存并支持PCIe Gen 4。

相较于其竞争对手Nvidia在其GPU上附加多重累积单元,AMD对于AI采取了不同的途径,主要是在其所有的运算单元中,支持从4位和8位整数器增加到16位、32位和64位浮点数学的格式,并使用混合精度的32位累加器。

AMD资深产品经理Evan Groenke说:“我们想要的是一款高度灵活的加速器,而不是专用于FP16。”其结果是使得这款芯片大约较Volta在优化之前的性能领先约7%,而面积还不到Volta的一半——Vega芯片尺寸331mm2 vs Volta芯片尺寸800+ mm2。Groenke强调,提高机器学习的性能并不需要使用大型专用芯片。

平均而言,7纳米Vega在AI任务中的性能领先Nvidia Volta约7%

AMD表示,Vega能够为AI训练提供29.5Tera FP16的每秒作业性能。针对推论作业,它可为8位整数提供59TOPS性能,针对4位整数任务则可达到118 TOPS。

此外,AMD还在芯片上增加了硬件虚拟化功能。因此,一个7纳米Vega能支持多达16个虚拟机,或者一个虚拟机可以将其工作分成八个以上的GPU。

王启尚说:“这就是我们差异化的一部份,而且是免费的。它搭配GPU一起推出,因而无需授权。”

云端巨擘预计可在今年年底之前取得MI60加速卡的早期版本。MI50版本的性能大约较MI60低10%,支持高达16GB的HBM2,将在明年4月之前推出。

Vega架构GPU加速卡的销售将取决于AMD为GPU运算发布的开放来源ROCm软件应用。该公司已经发布该程序代码的更新版本,现在可以支持更多的机器学习架构、数学库、Docker和Kubernetes。

拉拢AWS服务互别苗头?

在主题演讲中,Papermaster介绍了7纳米Zen x86核心的改进。他并表示,采用台积电(TSMC) 7nm+工艺的新芯片版本可望在2020年正式推出,它可能类似于AMD为其原始Zen组件提供的12纳米升级版。

Zen 2核心支持更新的分支预测器、更好的指令预取、更大的微指令(micro-op)快取和重新优化的指令快取。浮点缓存器和加载/储存单元还倍增到256位。

因此,AMD声称其7纳米x86芯片将在性能和上市时间方面领先英特尔的10纳米版本(英特尔预计要到明年底才能上市)。此外,该公司还增强其Infinity Fabric互连技术,但并未透露更多细节。

此外,由于AMD已经针对Spectre安全漏洞提供增补软件,Zen 2处理器核心将在硬件层面完全防堵Spectre侧信道攻击。Papermaster说,该芯片也不至于遭受Meltdown或Foreshadow的攻击。

AMD看好整体高达290亿美元的数据中心市场,并持续取得更多市场动能,除了EPYC如今已广泛用于百度(Baidu)、Dropbox、Microsoft Azure、Oracle和腾讯(Tencent),阿里巴巴(Alibaba)、百度和微软也使用了AMD的GPU。

Lisa Su展示将在明年正式上市的7纳米EPYC

亚马逊(Amazon)也成为AMD最新且最引人注目的客户,AWS并宣布采用EPYC的M5a、R5a和T5a计划。AWS运算服务副总裁Matt Garman说:“我们希望支持每一项工作负载,而AMD是客户感兴趣的目标之一。”

英特尔也很快地响应表示其Xeon芯片已用于大部份的AWS案例,其中包括54项基于其最新Skylake芯片的服务。

分析师Moorhead表示,全球最大的云端服务供应商提供EPYC,可说是当天活动的最大亮点,同时也证明了EPYC的实力。此外,他并补充说,从英特尔的快速反应也显示一场x86领域的竞赛将再次拉开。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5707

    浏览量

    140404
  • 英特尔
    +关注

    关注

    61

    文章

    10321

    浏览量

    181074
  • 半导体
    +关注

    关注

    339

    文章

    31236

    浏览量

    266493

原文标题:拳打英特尔脚踢英伟达,AMD抢先发布7纳米CPU/GPU

文章出处:【微信号:FPGAer_Club,微信公众号:FPGAer俱乐部】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm自研AGI CPU尽显Arm能效之优!单线程释放强大性能,同等机架塞更多CPU功耗还更低

    最近,Arm 发布自研的数据中心 CPU即Arm AGI CPU专为代理式 AI 基础设施
    的头像 发表于 03-27 09:12 256次阅读
    Arm<b class='flag-5'>首</b><b class='flag-5'>款</b>自研AGI <b class='flag-5'>CPU</b>尽显Arm能效之优!单线程释放强大性能,同等机架塞更多<b class='flag-5'>CPU</b>功耗还更低

    Arm亲自下场!自研数据中心AGI CPU发布!

    Arm今日发布由 Arm 设计的数据中心 CPU——Arm AGI CPU专为代理式 AI
    的头像 发表于 03-25 08:39 3008次阅读
    Arm亲自下场!自研<b class='flag-5'>首</b>款<b class='flag-5'>数据中心</b>AGI <b class='flag-5'>CPU</b>发布!

    Arm CPU推动数据中心业务正加速发展

    在过去十年中的大部分时间里,数据中心领域的话题都围绕着加速器展开。随着人工智能 (AI) 训练工作负载的爆炸式增长,GPU、TPU 等占据了新闻头条、投资者报告和基础设施路线图的核心位置。而如今
    的头像 发表于 03-24 10:15 471次阅读

    解析ISL62776:AMD CPU/GPU核心电源的理想之选

    解析ISL62776:AMD CPU/GPU核心电源的理想之选 在如今的电子设备中,CPUGPU的性能不断提升,对电源管理的要求也越来越高
    的头像 发表于 02-04 16:30 396次阅读

    1分钟带你了解数据中心供电架构 #电子元器件 #数据中心 #供电架构

    数据中心
    沛城芯动力
    发布于 :2026年02月03日 15:39:04

    数据中心UPS并机方案:公用电池组的优缺点深度分析

    数据中心
    上海优比施电子科技有限公司
    发布于 :2026年01月31日 09:32:34

    CPU 一脚油门电压猛跌?叠层超低ESR电容把“过山车”拉平 #数据中心#网关

    数据中心
    上海永铭电子股份有限公司
    发布于 :2025年12月22日 14:59:05

    伟创力重磅发布全球面向千兆瓦级数据中心的AI基础设施平台

    伟创力重磅发布全球面向千兆瓦级数据中心的AI基础设施平台,平台集成了电源和冷却产品、计算能力和服务,专为AI和高性能计算而设计,帮助数据中心
    的头像 发表于 10-23 15:08 941次阅读

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    引领AI时代网络变革:睿海光电的核心竞争力 在AI时代,数据中心正经历从传统架构向AI工厂与AI云的转型。AI工厂依赖超大规模GPU集群驱动大模型训练,要求网络具备超高带宽与超低延迟;AI云则为多
    发表于 08-13 19:01

    伟创力专为英伟达打造的电源架系统有何亮点

    GB300 NVL72平台设计,支持高达72颗Blackwell Ultra GPU。该系统不仅具备领先能效, 还面向未来 800VDC数据中心架构, 助力 AI 工厂迈向1兆瓦级机架部署。
    的头像 发表于 08-13 12:40 3814次阅读

    FLOW Digital Infrastructure宣布在东京市中心新建数据中心

    东京市中心规模最大的托管数据中心设施之一 栋建筑预计于2027年第一季度投入使用 东京2025年7月31日 /美通社/ -- 专注于亚太地区的另类投资公司太盟投资集团(PAG)旗下的
    的头像 发表于 07-31 17:31 784次阅读

    PCIe协议分析仪在数据中心中有何作用?

    数据中心的整体可靠性。以下是其核心作用及具体应用场景的详细分析:一、性能优化:突破带宽瓶颈,提升计算效率 链路带宽利用率分析 场景:在AI训练集群中,GPU通过PCIe与CPU交换数据
    发表于 07-29 15:02

    中型数据中心中的差分晶体振荡器应用与匹配方案

    RAID计算,FCO-7L抗干扰能力强,适用于全天候数据中心负载。 线路布置建议: 近端AC耦合,使用专用时钟线层,避免穿越电源隔离区域。 4. 光模块(QSFP+/OSFP) 匹配方案: FCO-2L
    发表于 07-01 16:33

    数据中心都在用的差分晶振,看完你就懂了

    数据中心
    FCom富士晶振
    发布于 :2025年05月30日 13:12:30

    纳微半导体推出12kW超大规模AI数据中心电源

    近日,纳微半导体宣布推出专为超大规模AI数据中心设计的最新12kW量产电源参考设计,可适配功率密度达120kW的高功率服务器机架。
    的头像 发表于 05-27 16:35 1741次阅读