0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD CPU之路-Chiplets

Linux阅码场 来源:杂谈与闲话 2023-06-30 09:27 次阅读

AMD的ZEN架构出现一开始,就是定义一个基本原则,一个core的架构,从laptop到desktop到server,这个也符合2015年AMD的股价,基本上没有钱做其他的路线了,而它的金主Intel的确风光呀,收购FPGAAI公司,架构上,mobile,laptop,desktop,server上面都是百花齐放,每个方向至少两个不同的方向。记得我刚进Xilinx的时候,大家说Intel的FPGA的PCIE Gen4一直出不来,主要原因是Intel内部至少有两个team在做PCIE,一个做4.0, 一个做5.0.

这个一招鲜吃遍天的做法,已经被ARM玩得炉火纯青了。一个架构的design,可以在mobile,也可以在server上。当年死在沙滩上的calxeda就是这样的。

因此。对于第一代的ZEN的架构,在Desktop上的确获得很大的成功,但是在server上面让中国的头号云计算玩家甚是失望。一个core的架构,来通吃整个市场,需要通过power和clocking的控制来实现。在下图中,基本也就在Desktop实现了突破。

d2444bf4-16d9-11ee-962d-dac502259ad0.png

通过小die来提升良率,使用CCX进行互联,这个是没有免费午餐的。但是,AMD因为比较专一,在CCX的设计上的确是翻身了。

d2d7546c-16d9-11ee-962d-dac502259ad0.png

架构上面,和传统的单die的CPU设计也有区别。使用ARM架构常用的Core和IO 分离的架构。

d35c0bc6-16d9-11ee-962d-dac502259ad0.png

通过IF互联的代价也很明确,就是天生NUMA。这个也是AMD的系统优化一直强调的NPS (NUMA Nodes per Socket)。local 和remote 之间的差距有点不忍直视。但是,既然走了这一步,AMD拼命加L3 cache的行为就说明他们还是明白“失之东隅 收之桑榆”的祖训的。

d3893146-16d9-11ee-962d-dac502259ad0.png

本文的重点是Chiplets,在AMD ISCA2021的paper 中,说明了Fabless公司面临的恶劣环境。

d3bfb360-16d9-11ee-962d-dac502259ad0.png

Mooer定律没死,但是的确老了,14nm之后的成本曲线变了。因此AMD早在14nm就开始改架构了。这个是AMD Zen成功的关键。

d3fe3d10-16d9-11ee-962d-dac502259ad0.png

Die的大小增加了10%,但是成本只有6成,漂亮。

这个时候,最大的32Core 已经被对手的28好不少了,但是AMD的已经看到了ARM 服务器那种夸张的数量。怎么才能拉垮等等呢?

TSMC的7nm是生逢其时。

d42b9c6a-16d9-11ee-962d-dac502259ad0.png

另一个关键的因素是剥离了IO,让IO 和Core独立发展。原因很简单,因为IO部分拿到的制成红利不多。

d4d28d18-16d9-11ee-962d-dac502259ad0.png

因此,在这个里面也充分说明了AMD精打细算的特质。在有人问到为什么要CPU上chiplets,而不是GPU时, 人家说了大实话,一个cpu的计算单元很大,8个少一个,就是损失了12%, 但是GPU里面的计算单元很很多,少几个没啥关系,不是有什么1080/1070/1060/1050/1040吗?

因此2代Zen真的是省上加省。

d56e1530-16d9-11ee-962d-dac502259ad0.png

同时,增加了IO Die,对于访存延时也有了改观。

d6006bc4-16d9-11ee-962d-dac502259ad0.png

虽然本地的延时大了4ns,但是remote的降低了,满足全世界人民的愿望:“不患寡,患不均”。大家都一起拉垮吧。

d67ece74-16d9-11ee-962d-dac502259ad0.png

因此,Zen2 在desktop,laptop和Server上做到了复兴,南海边的Hyperscale大获成功,据说他们的口号是“省一半”。

d6b8b918-16d9-11ee-962d-dac502259ad0.png

说到省,另一个没有想到的是Desktop 的io die也被拿去了做chipset。这个太高明了,以后ARM服务器出来之后,估计大部分的人IO Die可以直接做PCIE switch。

因此,在中国打压吃喝玩乐,单投硬科技的场景下,Chiplets成了一个香饽饽,这国人最迷信的“弯道超车”的白日梦中,chiplets一级本炒的火热了。好多没做过个芯片的,都要做先整个chiplets。但是chiplets真的好吗?请看AMD诚实的告白:

d7491a44-16d9-11ee-962d-dac502259ad0.png

What,你的Core不一样?

但是,AMD的用户和超市排队买便宜鸡蛋的大妈一样,我们有时间,有兴趣折腾。老板这个时候说了,便宜是硬道理,你们工程师自己去适配,这样不就锻炼了队伍吗? 同样,我这个系列就不放引用了,你们读了文章,还自己去找出处,也锻炼了大脑和翻墙的技巧。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1602

    文章

    21323

    浏览量

    593214
  • amd
    amd
    +关注

    关注

    25

    文章

    5200

    浏览量

    132638
  • TSMC
    +关注

    关注

    3

    文章

    176

    浏览量

    84031
  • chiplet
    +关注

    关注

    6

    文章

    379

    浏览量

    12418

原文标题:AMD CPU之路--Chiplets

文章出处:【微信号:LinuxDev,微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Nvidia与AMD新芯片,突破PCIe瓶颈

    AMD 和 Nvidia 的 GPU 都依赖 PCI 总线与 CPU 进行通信。CPU 和 GPU 有两个不同的内存域,数据必须通过 PCI 接口从 CPU 域移动到 GPU 域(并返
    的头像 发表于 03-08 14:15 234次阅读
    Nvidia与<b class='flag-5'>AMD</b>新芯片,突破PCIe瓶颈

    值得入手的AMD Radeon 显卡推荐—— AMD Radeon RX 7900 XT

    结合5nm和6nm工艺节点,采用先进的小芯片(Chiplets)设计,全新的计算单元和第二代AMD高速缓存技术,相比AMD RDNA 2架构的每瓦性能提高54%;
    的头像 发表于 01-04 16:27 600次阅读
    值得入手的<b class='flag-5'>AMD</b> Radeon 显卡推荐—— <b class='flag-5'>AMD</b> Radeon RX 7900 XT

    AMD扩展其第三代AMD EPYC处理器家族并推出6款全新产品

    AMD加强广受好评的第三代EPYC CPU产品组合,为支持主要业务基础设施的服务器提供性能和能效— —包括Cisco、Dell Technologies、Gigabyte、HPE、Lenovo
    的头像 发表于 11-11 10:37 988次阅读

    AMD Ryzen CPU发热的原因分析

    AMD 的高性能CPU 采小芯片(Chiplet) 设计结构,将CPU 核心与芯片的其余部分隔离开来,这使得CPU 产生的热量无法在通过散热器进入冷却器之前扩散到整个处理器。
    发表于 11-02 16:21 477次阅读

    AMD计划生产基于Arm架构的CPU

    英伟达已经开始设计基于 Arm 架构的 CPU。该处理器将运行微软 Windows 操作系统。此外,AMD 也计划生产基于 Arm 架构的 CPU
    的头像 发表于 10-27 10:53 674次阅读

    AMD扩展第四代EPYC CPU产品带来突破性的性能

    ,如今,技术计算可支持更快的设计迭代和更强大的模拟,以帮助企业设计新的引人注目的产品。 2023年6月,AMD 推出了采用 AMD 3D V-Cache技术的第四代 AMD EPYC处理器,这是一款性能更高且适用于技术计算的 x
    的头像 发表于 10-07 14:54 622次阅读

    AMD的Phoenix SoC核心技术详解

    AMD的移动和小型化之路曾一度艰辛。早在2010年代初期,英特尔在能效方面取得了巨大的进步,而AMD的基于Bulldozer的CPU核心在这方面没有机会。
    发表于 10-07 10:37 489次阅读
    <b class='flag-5'>AMD</b>的Phoenix SoC核心技术详解

    智原推出整合Chiplets的2.5D/3D先进封装服务

    此外,智原对于Interposer的需求会进行芯片大小、TSV、微凸块间距和数量、电路布局规划、基板、功率分析和热仿真等信息研究,深入了解Chiplets信息并评估Interposer制造及封装的可执行性。
    的头像 发表于 09-12 16:27 422次阅读

    无法在AMD Ryzen CPU上运行OpenVINO trade怎么解决?

    AMD Ryzen CPU 上运行OpenVINO™推理。 收到错误消息: libva error: vaGetDriverNameByIndex() failed with unknown libva error, driver_name (null)
    发表于 08-15 06:46

    AMD CPU在服务器市场份额已超25%

    这超过了分析家们预测的20%,意味着amd从2022年末开始将市场占有率快速提升了7~8个百分点。据mercury research称,到2022年末,amd的服务器cpu市场占有率从10.7%增加到17.6%,而英特尔从89.
    的头像 发表于 07-21 10:58 1125次阅读

    AMD在第四代EPYC CPU产品组合中增加两款新工作负载优化处理器

      -全新第4代AMD EPYC处理器在云原生和技术计算方面提供领先性能- -微软Azure和Meta在“数据中心和AI技术首映”上展示了对全新AMD EPYC CPU的支持- 近日,在“数据中心
    的头像 发表于 06-20 11:40 350次阅读

    总结一下AMD CPU的信息

    AMD的确无缘,在拿到Day1 的大礼包之后,我就上交了笔记本,只是在AMD connection中看了一些内网的信息,但是因为实在对AMDCPU不熟悉,也没搞明白啥。
    的头像 发表于 06-19 09:18 950次阅读
    总结一下<b class='flag-5'>AMD</b> <b class='flag-5'>CPU</b>的信息

    为什么Chiplets对处理器的未来如此重要?

    Chiplets的主导地位才刚刚开始。
    发表于 06-05 18:08 362次阅读
    为什么<b class='flag-5'>Chiplets</b>对处理器的未来如此重要?

    美国 Gel-Pak 芯片包装盒为 Chiplets 的运输安全性保驾护航

    上海伯东美国 Gel-Pak 以 Vertec® 技术开发了新一代专利的 BTXF 芯片盒, 使用了一种非粘性的微纹理弹性体, 将其涂覆在 JEDEC 托盘上, 可以将 Chiplets 产品固定其上, Gel-Pak BTXF 芯片盒可以广泛的应用在 Chiplets
    的头像 发表于 05-26 14:40 578次阅读
    美国 Gel-Pak 芯片包装盒为 <b class='flag-5'>Chiplets</b> 的运输安全性保驾护航

    CPU型号怎么看性能好坏

    装机之家台式机CPU天梯图包括了intel 4代、6代、7代、8代、9代、10代、11代、12代以及新推出的13代CPU,目前intel平台装机建议考虑12代,13代CPU。而AMD
    发表于 05-17 15:16 3029次阅读
    <b class='flag-5'>CPU</b>型号怎么看性能好坏