0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

两种GPU之间的延迟对比 AMD RDNA2完胜NVIDIA安培

ss 来源:快科技 作者:快科技 2021-04-21 13:51 次阅读

CPU缓存与内存延迟测试,相信大家都有所耳闻,但是GPU同样的测试却几乎没人做过。

ChipsAndCheese就做了一次特别的测试,对比考察了AMD、NVIDIAGPU架构的缓存、显存迟问题。

首先是AMDRDNA2、NVIDIAAmpere两家最新架构的比拼,代表是RX6900XT、RTX3090,前者在几乎所有阶段都完胜。

RNDA2架构创新性地加入了InfinityCache无限缓存,提升带宽的同时,延迟也可圈可点,二级缓存命中率上只增加了大约20ns的延迟,明显低于Ampere。

更惊人的是,RDNA2显存延迟和Ampere几乎一模一样,但是别忘了,Ampere只有两个层级的缓存,RDNA2却有四个。

Ampere的缓存架构更加传统,SM阵列私有一级缓存到二级缓存要增加超过100ns的延迟,RDNA2从零级缓存到二级缓存则只增加了约66ns。看起来,GA102核心面积过大,也直接增加了延迟。

这正好可以解释AMDRDNA2架构在低分辨率下性能、能效更优秀,因为二级缓存、三级缓存延迟很低,更适合执行较小的负载。Ampere则相反,高负载下优势明显,比如说4K分辨率。

说完了GPU之间的对比,那么GPU、CPU放在一起怎么样呢?这里以RX6900XT、Intel四代酷睿i7-4770为例来看看。

CPU的缓存自然不是一个级别的,所以这里Y轴用了线性数据,可以看到全程大大低于RDNA2,搭配DDR3-1600CL9内存延迟只有63ns,RX6900XT、GDDR6的组合则有226ns,另外末级缓存平均延迟分别是53.42ns、123.2ns。

再看看前几代的NVIDIAGPU,包括Maxwell架构的GTX980Ti、Pascal架构的GTX1080、Turing架构的RTX2060Mobile。

Maxwell、Pascal其实差不多,前者整体略高一些,可能是受制于芯片面积较大、核心频率较低。

Turing则已经有了Ampere的样子,一级缓存延迟低得多,二级差不多,奇怪的是显存延迟在32MB之后偏高,原因未知。

AMD考察了TeraScale架构的HD5850/6950、GCN架构的HD7970,再加上RX6900XT,很明显在逐代降低,而且是各级缓存都在同时进步。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5182

    浏览量

    132624
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10412

    浏览量

    206465
  • 数据
    +关注

    关注

    8

    文章

    6509

    浏览量

    87555
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4402

    浏览量

    126562
收藏 人收藏

    评论

    相关推荐

    RTX 5880 Ada Generation GPU与RTX™ A6000 GPU对比

    NVIDIA RTX™ 5880 Ada Generation GPU 是目前国内重量级 GPU,基于全新 NVIDIA Ada Lovelace 架构构建,采用 4nm 制成工艺,拥
    的头像 发表于 04-19 10:20 46次阅读
    RTX 5880 Ada Generation <b class='flag-5'>GPU</b>与RTX™ A6000 <b class='flag-5'>GPU</b><b class='flag-5'>对比</b>

    NvidiaAMD新芯片,突破PCIe瓶颈

    AMDNvidiaGPU 都依赖 PCI 总线与 CPU 进行通信。CPU 和 GPU 有两个不同的内存域,数据必须通过 PCI 接口从 CPU 域移动到
    的头像 发表于 03-08 14:15 227次阅读
    <b class='flag-5'>Nvidia</b>与<b class='flag-5'>AMD</b>新芯片,突破PCIe瓶颈

    AMD Zen6架构继续飞跃!核显跨越下下代RDNA5

    AMD的下一代Zen5 CPU架构还没来,Zen6的消息就已经多次传出,现在又提到了所集成的GPU核显,居然将会搭配同样下下一代的RDNA5。
    的头像 发表于 02-22 09:53 281次阅读
    <b class='flag-5'>AMD</b> Zen6架构继续飞跃!核显跨越下下代<b class='flag-5'>RDNA</b>5

    AMD将推新GPU,效能媲美英伟达RTX 4080

    据悉,AMD正努力研制新品级GPU,性能堪比英伟达的RTX 4080,而售价却只有后者的一半。据多个在线社区反映,AMD即将发布的Radeon RX 8000系列GPU效能与
    的头像 发表于 01-31 10:00 400次阅读

    深入解读AMD最新GPU架构

    GCN 取代了 Terascale,并强调 GPGPU 和图形应用程序的一致性能。然后,AMD 将其 GPU 架构开发分为单独的 CDNA 和 RDNA 线路,分别专门用于计算和图形。
    发表于 01-08 10:12 441次阅读
    深入解读<b class='flag-5'>AMD</b>最新<b class='flag-5'>GPU</b>架构

    NVIDIA GPU的核心架构及架构演进

    在探讨 NVIDIA GPU 架构之前,我们先来了解一些相关的基本知识。GPU 的概念,是由 NVIDIA 公司在 1999 年发布 Geforce256 图形处理芯片时首先提出,从此
    发表于 11-21 09:40 421次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>的核心架构及架构演进

    常见的ARM架构分为两种是M系列另外一是A系列,这两种有什么区别啊?

    现在市面上常见的ARM架构分为两种是M系列另外一是A系列,这两种有什么区别啊,用的时候他们一般分别用在什么地方啊。
    发表于 10-26 07:00

    重磅!AMD GPU头号负责人宣布离职

    Scott Herkelman表示,在AMD工作了七年并推出了三代竞争力日益增强的RDNA图形架构后,他决定在今年年底离开AMD。Scott Herkelman没有提及他此时离开AMD
    的头像 发表于 09-27 16:44 388次阅读
    重磅!<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b>头号负责人宣布离职

    Arm Forge 22.1.3版用户指南

    、OpenPOWER、NVIDIA GPUAMD GPU硬件。 Arm Forge为您提供了在任何规模调试、修复和配置程序所需的一切。 在代码开发过程中,一个通用接口可以很容易地在A
    发表于 08-10 06:29

    NVIDIA虚拟GPU技术推动快速无痛的牙科治疗

    NVIDIA虚拟GPU技术推动快速无痛的牙科治疗
    的头像 发表于 08-01 14:46 287次阅读

    AMD将于今年秋季在部分RDNA 3 GPU上添加ROCm的支持

      AMD将于今年秋季在部分RDNA 3 GPU上添加ROCm的支持   人工智能是塑造下一代计算的决定性技术。近几个月来,我们都看到了生成式人工智能和大语言模型的爆炸式增长正在彻底改变我们与技术
    的头像 发表于 07-25 15:40 468次阅读

    AMD锐龙8000 APU浮出水面:Zen5、RDNA3.5绝配

    按照惯例,AMD将在明年初发布锐龙8000系列移动处理器,工艺、架构都会有全面提升,其中CPU用上Zen5、Zen5c的大小核组合,GPU则升级为RDNA3.5。
    发表于 07-18 09:28 671次阅读
    <b class='flag-5'>AMD</b>锐龙8000 APU浮出水面:Zen5、<b class='flag-5'>RDNA</b>3.5绝配

    NVIDIA Hopper GPU上的新cuBLAS12.0功能和矩阵乘法性能

    NVIDIA Hopper GPU 上的新 cuBLAS 12.0 功能和矩阵乘法性能
    的头像 发表于 07-05 16:30 1715次阅读
    <b class='flag-5'>NVIDIA</b> Hopper <b class='flag-5'>GPU</b>上的新cuBLAS12.0功能和矩阵乘法性能

    AMD带领GPU进入Chiplet时代 RDNA3架构深入解读

    11月3日,AMD 透露了其 RDNA 3 GPU 架构和 Radeon RX 7900 系列显卡的关键细节。
    的头像 发表于 06-12 10:14 765次阅读
    <b class='flag-5'>AMD</b>带领<b class='flag-5'>GPU</b>进入Chiplet时代 <b class='flag-5'>RDNA</b>3架构深入解读

    在PADS中怎么放置两种不同孔径的过孔啊?

    在PADS中怎么放置两种不同孔径的过孔啊?
    发表于 04-28 16:45