0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD RDNA2架构GPU采用全新图形缓存方法的原因是什么?

我快闭嘴 来源:半导体行业观察 作者:半导体行业观察 2020-11-23 10:44 次阅读

与RDNA 2架构一起引入的Infinity Cache是一个新的缓存系统,它与 RX 6800 XT 和RX 6800中 的GDDR6存储器接口一起运行。对于AMD来说,这也是一笔不小的数目,其工程师告诉我们,这是将游戏性能从1080p解锁到4K的关键,否则它将被庞大而耗电的选择所困扰。

Infinity Cache位于AMD Navi 21 GPU内主要的计算核心集群的旁边,本质上是一个小型而有效的内存存储。它位于较小的L1和L2高速缓存之间,也位于GPU本身,而位于片外,PCB和PC本身的较大GDDR6和DDR4内存之间。

以及采用这种全新的图形缓存方法的原因是什么?有人告诉我,这一切都是由于工程团队希望避免使用超贵且口渴的512位内存总线而产生的。大概就是保持Big Navi GPU与Nvidia竞争对手保持联系所需要的。事实证明,RX 6800 XT及其同类产品通常不仅仅与RTX 3080 和 RTX 3070相 匹敌,而Infinity Cache是其中一个重要原因。

在与开发人员的最初互动中,我们与他们讨论了一些方法,他们可能会更改其渲染方式,从而对缓存更友好”。

作为记录,所有RX 6000系列图形卡(包括即将推出的 RX 6900 XT )都具有相同的内存配置。16GB的GDDR6和256位内存总线-对于所有这些内存芯片来说,可能会有点小。那就是128MB片上Infinity缓存进来的地方。

AMD产品技术架构师Sam Naffzifer说:“我们正面临着必须放置512位接口以及与此相关的所有功能,面积和费用的令人生畏的前景。” “所以我们需要一个更好的解决方案。但是以前没有人做过。因此,没有多少数据可以确切说明我们获得了多少重用以及缓存的有效性。”

该团队进行了性能仿真,以帮助评估芯片上新缓存的前景,这些结果表明,在渲染复杂图像时,即使没有特殊说明,裸片上的大缓存确实也有助于重用时空数据,着色器将在游戏中多帧中多次访问同一数据。在物理上靠近GPU计算单元的某个地方存储所有数据以便快速访问,这从整体上提升了GPU的性能。

AMD的工程师预计对Infinity Cache的调用将达到60-80%的时间,这意味着它现在经常与现有的游戏引擎一起使用,存储有用的数据以渲染帧。而且,在这种情况下,AMD的工程师们正在吹捧有效内存带宽是直接256位解决方案的3.25倍。从512GB / s到有效的1,664GB / s。

但这不只是将缓存保留在GPU上并使之正常工作。多年来,我们已经看到了一些新颖且令人兴奋的基于硬件的解决方案,其中一些需要开发人员的支持才能完全集成和有效运行。这就是事情变得有些棘手的地方。

Radeon产品架构师Andrew Pomianowski在RDNA 2圆桌会议上对我们说:“我们希望我们的架构尽可能地与开发人员保持联系。” 的确,Infinity Cache对开发人员而言是相当透明的。无需特殊编程即可使其运行,因此无论您插入哪种游戏,它都可以正常工作。

“要意识到的重要一点是,当您将这样的新技术推向市场时,对开发人员起初要尽可能透明是非常非常重要的,对吧?” Pomianowski说。“您不能将这样的产品推向市场,这与GPU上的传统内存子系统背道而驰,并且对开发人员来说是一个很大的进入壁垒,开发人员必须以特定的方式进行编程才能从中受益。”

但是,如果一个开发商做项目专门为无限缓存?这是在RX 6800 XT和RX 6800发布日期之前的AMD圆桌讨论会上提出的一个问题,如果开发人员与红色团队合作以获取更多收益,AMD对未来的性能将保持沉默。

Pomianowski继续说:“提供更多直接控制有潜在的好处,我们拥有……可用于控制无限高速缓存的相当广泛的一组方法。

“这是我们将要看的东西。我的意思是,在与开发人员的最初互动中,我们与开发人员讨论了以下方式:如果他们了解缓存存在,他们可能会改变其渲染方式,从而更加友好。缓存-从中获得更多的好处,您知道,订购渲染和放置事物的方式可以实现一定的收益。”

对于 Xbox Series X ,Series S和 PlayStation 5而言, 通过使用RDNA 2芯片来利用Infinity Cache的开发者来说,或许还有更大的杠杆作用。现在有很多现代的红色团队芯片,这可能是AMD的帽子,因为它可以减轻Nvidia在显卡市场上的影响。要做到这一点,还有很长的路要走,因为Nvidia占据了四分之三的市场,但是RDNA 2感觉像是朝着正确方向的巨大飞跃。

“因此,我们将为此而努力。将来,我们将评估是否有理由探索提供对缓存的更多可见性。”也许这是古老的谚语“陈年佳酿”的观念,AMD显卡只有随着年龄的增长才能变得更好。

“但是现在,我认为它存在就好了,而且它可以提供好处,而开发人员无需付出大量工作来实现这些好处。”

这些潜在的好处只会为AMD图形团队锦上添花。Infinity缓存已经证明了自己的价值,正如您在我们对RX 6800 XT和RX 6800的评论中所看到的那样,这两款显卡能够很好地站立在自己的两只脚上,而不受每场比赛的聪明编程的支撑。

尽管RX 6800 XT可以提供更高的性能,但在与4K的Nvidia RTX 3080的战斗中它将大有帮助。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • pcb
    pcb
    +关注

    关注

    4220

    文章

    22472

    浏览量

    385741
  • amd
    amd
    +关注

    关注

    25

    文章

    5197

    浏览量

    132632
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4417

    浏览量

    126672
收藏 人收藏

    评论

    相关推荐

    AMD Zen6架构继续飞跃!核显跨越下下代RDNA5

    AMD的下一代Zen5 CPU架构还没来,Zen6的消息就已经多次传出,现在又提到了所集成的GPU核显,居然将会搭配同样下下一代的RDNA5。
    的头像 发表于 02-22 09:53 293次阅读
    <b class='flag-5'>AMD</b> Zen6<b class='flag-5'>架构</b>继续飞跃!核显跨越下下代<b class='flag-5'>RDNA</b>5

    深入解读AMD最新GPU架构

    GCN 取代了 Terascale,并强调 GPGPU 和图形应用程序的一致性能。然后,AMD 将其 GPU 架构开发分为单独的 CDNA 和 RD
    发表于 01-08 10:12 460次阅读
    深入解读<b class='flag-5'>AMD</b>最新<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>

    值得入手的AMD Radeon 显卡推荐—— AMD Radeon RX 7900 XT

    结合5nm和6nm工艺节点,采用先进的小芯片(Chiplets)设计,全新的计算单元和第二代AMD高速缓存技术,相比AMD
    的头像 发表于 01-04 16:27 597次阅读
    值得入手的<b class='flag-5'>AMD</b> Radeon 显卡推荐—— <b class='flag-5'>AMD</b> Radeon RX 7900 XT

    GPU占用率低的原因和解决方法

    GPU占用率低的原因和解决方法  随着计算机图形处理技术的发展,GPU (Graphics Processing Unit,
    的头像 发表于 12-09 14:32 7788次阅读

    重磅!AMD GPU头号负责人宣布离职

    Scott Herkelman表示,在AMD工作了七年并推出了三代竞争力日益增强的RDNA图形架构后,他决定在今年年底离开AMD。Scott
    的头像 发表于 09-27 16:44 397次阅读
    重磅!<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b>头号负责人宣布离职

    BM1684架构介绍

    FP32的MAC单周期可以做一个乘法加上一个加法; 每个EU有16个INT8 MAC,单周期可以做一个乘法加上一个加法。 FP32 MAC和INT8 MAC同时只能有一种在工作。 这里乘以2原因是每个周期可以做一个乘法加上一个加法,0.55是指工作频率是550MHz
    发表于 09-19 08:11

    开源图形驱动在OpenHarmony上的使用和落地

    的小厂商无法获得闭源GPU厂商的支持,导致视觉流畅体验较差,限制了非常多OpenHarmony产品的商用,在一定程度上也阻碍了OpenHarmony生态的推广。 02►开源图形驱动架构介绍 由于从驱动角度
    发表于 08-31 18:07

    ARM Cortex-A17 MPCore技术参考手册

    Cortex-A17 MPCore处理器是一款高性能、低功耗的处理器,采用ARMv7架构。 Cortex-A17 MPCore处理器在带有L1和L2高速缓存子系统的单个多处理器设备中具
    发表于 08-17 07:06

    带来全新多媒体体验!AMD全新发布Radeon RX 7900 GRE显卡

    AMD全新发布的Radeon RX 7900 GRE显卡,基于突破性的AMD RDNA 3架构和先进的A
    的头像 发表于 08-14 15:30 917次阅读

    Gaudi2架构和软件的全面解释

    ,Gaudi2以其架构为基础,为数据中心和云的深度学习带来了新的性能和效率。 Gaudi2由SynapseAI®软件套件支持,该软件套件与TensorFlow和PyTorch框架集成。我们在哈瓦那的GitHub
    发表于 08-04 06:15

    基于磁贴的GPU架构优缺点

    本指南介绍了基于磁贴的GPU架构的优缺点。它还将ARM马里基于瓷砖的GPU架构设计与台式PC或控制台中常见的更传统的即时模式GPU进行了比较
    发表于 08-02 12:54

    AMD Radeon RX 7900 GRE显卡特性和功能

    AMD RDNA 3架构 – 配备采用了统一的光线追踪和AI加速器且经过重新设计的计算单元,以及第二代AMD Infinity Cache(
    发表于 07-31 11:05 328次阅读
    <b class='flag-5'>AMD</b> Radeon RX 7900 GRE显卡特性和功能

    AMD将于今年秋季在部分RDNA 3 GPU上添加ROCm的支持

      AMD将于今年秋季在部分RDNA 3 GPU上添加ROCm的支持   人工智能是塑造下一代计算的决定性技术。近几个月来,我们都看到了生成式人工智能和大语言模型的爆炸式增长正在彻底改变我们与技术
    的头像 发表于 07-25 15:40 479次阅读

    AMD锐龙8000 APU浮出水面:Zen5、RDNA3.5绝配

    按照惯例,AMD将在明年初发布锐龙8000系列移动处理器,工艺、架构都会有全面提升,其中CPU用上Zen5、Zen5c的大小核组合,GPU则升级为RDNA3.5。
    发表于 07-18 09:28 680次阅读
    <b class='flag-5'>AMD</b>锐龙8000 APU浮出水面:Zen5、<b class='flag-5'>RDNA</b>3.5绝配

    AMD带领GPU进入Chiplet时代 RDNA3架构深入解读

    11月3日,AMD 透露了其 RDNA 3 GPU 架构和 Radeon RX 7900 系列显卡的关键细节。
    的头像 发表于 06-12 10:14 787次阅读
    <b class='flag-5'>AMD</b>带领<b class='flag-5'>GPU</b>进入Chiplet时代 <b class='flag-5'>RDNA</b>3<b class='flag-5'>架构</b>深入解读