0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD从小芯片CPU走向小芯片GPU

lPCU_elecfans 来源:电子发烧友网 作者:周凯扬 2021-01-15 10:35 次阅读

在HPC应用上,对突破性能的追求是从未停歇的,尤其是在人工智能机器学习和大数据分析等新兴应用提出更高的性能要求后。但制程突破的速度已经逐渐放缓,每个工艺节点带来的频率红利也在慢慢变小。而为了减少生产和开发成本,提高良率,不少CPU制造商都开始看向小芯片。 2020年的最后一天,AMD公布了自己在小芯片GPU上的专利,引起了不少热议。大家都在猜测,小芯片是否能成为后摩尔时代芯片设计创新的利器呢?

AMD:从小芯片CPU走向小芯片GPU

AMD从很早开始就在小芯片上发力了,不管是EPYC服务器CPU还是线程撕裂者桌面CPU,都大量运用了小芯片设计。在AMD看来,传统的单片处理器将一个或多个CPU核心放置在单个裸片上,以此加速时钟频率和缓存读取,虽然这种策略对于需要重度CPU使用的工作来说非常合理,但仍有其限制。而小芯片设计可以带来更快的架构创新,尤其是在数据中心等应用上。 在去年的ISSCC 2020上,AMD重点提到了小芯片在第二代EPYC服务器CPU上带来的优势。运用Zen 2架构的EPYC服务器CPU上,AMD在CPU核心上运用了台积电代工的7nm小芯片,IOD仍然采用Global Foundries的14nm制程。AMD提到这种设计实现了更高的核心数和更高的性能,而且显著降低了成本。 而AMD近期公布的小芯片GPU专利同样掀起了不小的浪花,该专利展示了一种使用高带宽交联的小芯片GPU设计方案。

029ac4f2-5410-11eb-8b86-12bb97331649.png

小芯片GPU / AMD 在该专利中,AMD提到,由于多数应用是以单个GPU为前提写就的,所以为了保留现有的应用编程模型,将小芯片设计实现在GPU上向来都是一大挑战。而该专利利用一根总线将第一个GPU小芯片与CPU相连,余下的GPU用被动交联连接。 如今许多架构至少拥有一级缓存连贯分布在整个GPU裸片上,比如L3或其他最后一级缓存(LLC)。而这种设计中,这些物理资源被放置在不同的裸片上,并提供通信连接以保证其缓存连贯性。在工作过程中,内存地址请求从CPU发往一个GPU小芯片,后者与高带宽被动交联沟通以定位所需数据,因此从CPU的角度来看,仍然是在一个单独的GPU上寻址。

Intel:以小芯片打造客户2.0的芯片

芯片方案演化 / Intel Intel在去年的架构日上给出了他们在IP/SOC上的策略改变,在过去整合的单片SOC中,开发周期长达3到4年,而且在投入使用后,制造商和用户会在芯片上发现上百个Bug。而演化至多裸片的基本小芯片结构后,将GPU、CPU和IO放置在不同的裸片上,开发周期缩减至2-3年,Bug数目缩减至十数个,不仅如此,小芯片设计还可以重复使用。最后则是Intel对未来小芯片结构的展望,将不同的IP放在最优制程的小芯片上,比如内存、I/O或图形等,从IP或小芯片层面上来做验证,因此Bug数目不足十个,开发周期仅需1年。

033be7e2-5410-11eb-8b86-12bb97331649.png

客户2.0方案 / Intel 这样的设计也让Intel对芯片定位有了更多的自由,比如游戏玩家需要更多的图形性能,而开发者则更渴求高算力的和强大的AI性能等。这也就是Intel设想的客户2.0愿景,通过智能感知带给消费者无缝的高性能体验。 尽管GPU一直是Intel的弱项之一,但这并不代表Intel没有在显示领域上发力。自从Intel从AMD的图形部门挖走首席架构师Raja Koduri以来,Intel就开始在独立显卡上发力。Intel于2019年末公布了超算级别的GPU,代号名为Ponte Vecchio,该GPU基于7nm工艺和小芯片技术,将于2021年年内安装在Aurora超级计算机上作为图形加速器使用。

小芯片的后盾:新的互联与封装技术

如果没有创新的互联与封装技术,小芯片设计同样是无法立足的。在小芯片的封装上,Intel已经规划好了详细的封装路线图。

03f0b4a6-5410-11eb-8b86-12bb97331649.png

处理器封装路线图 / Intel 在Kaby Lake G处理器和Agilex FPGA上,Intel已经实现了EMIB这种2.5D的封装方式。而Intel在Lakefield系列处理器上使用的Foveros 3D封装技术则是对EMIB的进一步补充,该技术可将凸起高度进一步降低至50-25um,并实现接近1000 IO/mm2的密度。

Infinity架构 / AMD 但要想分解后的小芯片也能保持联通,这就是互联技术派上用场的地方,比如AMD在Zen架构CPU中引入的Infinity Fabric。AMD将Infinity Fabric视为连接各大产品线的基石,通过第三代Infinity框架,AMD得以为CPU与GPU之间提供大带宽和低延迟的连接、统一的内存访问,提升AMD产品的结合性能并简化编程。

小结

去年的全球硬科技创新大会上,芯动科技、紫光存储等成立了中国Chiplet产业联盟,推动国内的小芯片发展。芯动科技在2020年推出了国产自主Chiplet标准INNOLINK,让庞大的数据在小芯片之间低延迟传输。

INNOLINK解决方案 / 芯动科技 至于AMD的小芯片GPU,其实如此架构可能更有可能用于未来的CDNA数据中心GPU,而不是下一代RDNA消费级GPU。因为对于消费级GPU来说,很大一部分场景是对延迟极度敏感的游戏应用,这正是小芯片GPU必须要先突破的限制,如果小芯片GPU有着SLI和CrossFire一样大的延迟的话,无疑也会淡出人们的视野。

原文标题:在小芯片CPU尝到甜头,AMD向Chiplet GPU进发!

文章出处:【微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    447

    文章

    47775

    浏览量

    409076
  • amd
    amd
    +关注

    关注

    25

    文章

    5194

    浏览量

    132632
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10438

    浏览量

    206528
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4416

    浏览量

    126668

原文标题:在小芯片CPU尝到甜头,AMD向Chiplet GPU进发!

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    X-Silicon发布RISC-V新架构 实现CPU/GPU一体化

    X-Silicon 的芯片与其他架构不同,其设计将 CPUGPU 的功能整合到单核架构中。这与英特尔和 AMD 的典型设计不同,前者有独立的
    发表于 04-08 11:34 161次阅读
    X-Silicon发布RISC-V新架构 实现<b class='flag-5'>CPU</b>/<b class='flag-5'>GPU</b>一体化

    RISC-V芯片新突破:CPUGPU一体化核心设计

    X-Silicon 的芯片与其他架构不同,其设计将 CPUGPU 的功能结合到单核架构中。这与 Intel 和 AMD 的典型设计不同,后者有独立的
    发表于 04-07 10:41 120次阅读
    RISC-V<b class='flag-5'>芯片</b>新突破:<b class='flag-5'>CPU</b>与<b class='flag-5'>GPU</b>一体化核心设计

    Nvidia与AMD芯片,突破PCIe瓶颈

    AMD 和 Nvidia 的 GPU 都依赖 PCI 总线与 CPU 进行通信。CPUGPU 有两个不同的内存域,数据必须通过 PCI
    的头像 发表于 03-08 14:15 232次阅读
    Nvidia与<b class='flag-5'>AMD</b>新<b class='flag-5'>芯片</b>,突破PCIe瓶颈

    深入分析AMD MI300A的规格和设计方案

    MI300A 与 H100 SXM,同样是 APU(CPU + GPU)与仅 GPU 的比较,AMD 认为其芯片处于大致水平,但包含
    发表于 12-21 14:41 844次阅读
    深入分析<b class='flag-5'>AMD</b> MI300A的规格和设计方案

    解读AMD的“分布式几何”新专利(GPU的完全小芯片方法)

    AMD 的专利详细介绍了一种方法,即放弃中央处理器,用多个小芯片取代单个硅块,每个小芯片处理自己的任务。渲染指令以称为命令列表的长序列发送到 GPU,其中所有内容都称为绘制调用。
    发表于 12-06 10:44 226次阅读
    解读<b class='flag-5'>AMD</b>的“分布式几何”新专利(<b class='flag-5'>GPU</b>的完全小<b class='flag-5'>芯片</b>方法)

    AMD Ryzen CPU发热的原因分析

    AMD 的高性能CPU 采小芯片(Chiplet) 设计结构,将CPU 核心与芯片的其余部分隔离开来,这使得
    发表于 11-02 16:21 476次阅读

    苹果M3芯片有哪些升级?最高搭载40核GPU

    据悉,M3 系列芯片采用 3nm 制程工艺,在 CPUGPU 方面都有了重大改进。这三款 3nm 制程芯片能满足不同用户的需求。
    发表于 11-02 14:59 229次阅读
    苹果M3<b class='flag-5'>芯片</b>有哪些升级?最高搭载40核<b class='flag-5'>GPU</b>

    CPU+xPU的异构方案解析 cpugpu有啥区别

    CPU+xPU 的异构方案成为大算力场景标配,GPU为应用最广泛的 AI 芯片。目前业内广泛认同的AI 芯片类型包括GPU、FPGA、NPU
    的头像 发表于 09-03 11:47 1181次阅读
    <b class='flag-5'>CPU</b>+xPU的异构方案解析 <b class='flag-5'>cpu</b>和<b class='flag-5'>gpu</b>有啥区别

    cpu gpu npu的区别 NPU与GPU哪个好?gpu是什么意思?

    (CPU)、Graphics Processing Unit(GPU)和Neural Processing Unit(NPU)等处理器和芯片被广泛应用于各种领域。这些处理器和芯片在计算
    的头像 发表于 08-27 17:03 8159次阅读

    AMD野心勃勃打造20芯片合一的巨型GPU

    考虑到无论是RX 6950 XT,还是RX 7900 XTX,都被对手压制得抬不起头来,而高端大型GPU越来越复杂、昂贵,即便是Navi 31这样多芯片整合封装的做法看起来也效果一般,AMD战略性放弃一次似乎也不意外。
    的头像 发表于 08-17 15:41 386次阅读
    <b class='flag-5'>AMD</b>野心勃勃打造20<b class='flag-5'>芯片</b>合一的巨型<b class='flag-5'>GPU</b>!

    ai芯片gpu芯片有什么区别?

    ai芯片gpu芯片有什么区别? AI芯片GPU芯片是当今比较流行的
    的头像 发表于 08-08 18:02 4096次阅读

    ai芯片cpu有啥区别?

    ai芯片cpu有啥区别? AI芯片CPU有什么区别? 随着人工智能技术在各行各业的广泛应用,人们对于AI芯片
    的头像 发表于 08-08 18:00 5443次阅读

    ai芯片和传统芯片的区别 GPUCPU的架构对比

    AI芯片在处理大规模数据和复杂计算任务(例如深度学习算法)时具有更高的计算性能。它们通常集成了多个高性能的计算单元,如GPU(图形处理器)或专门的神经网络处理器(NPU)。
    的头像 发表于 08-05 16:11 4875次阅读
    ai<b class='flag-5'>芯片</b>和传统<b class='flag-5'>芯片</b>的区别 <b class='flag-5'>GPU</b>与<b class='flag-5'>CPU</b>的架构对比

    兆芯CPU+GPU+芯片组技术路线

    CPU“ 和“芯片组”分立模式,系统瓶颈在两者之间的主板总线, SOC变片外为片内、解决了这- -瓶颈;
    发表于 07-15 15:23 558次阅读
    兆芯<b class='flag-5'>CPU+GPU</b>+<b class='flag-5'>芯片</b>组技术路线

    下一代天玑旗舰移动芯片将采用 Arm 最新 CPUGPU IP

    MediaTek 下一代天玑旗舰移动芯片将采用 Arm 最新 CPUGPU IP — Cortex-X4、Cortex-A720 以及Immortalis-G720 GPU,通过
    的头像 发表于 05-29 22:30 456次阅读