0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD RDNA2架构GPU采用全新图形缓存方法的原因是什么?

我快闭嘴 来源:半导体行业观察 作者:半导体行业观察 2020-11-23 10:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

与RDNA 2架构一起引入的Infinity Cache是一个新的缓存系统,它与 RX 6800 XT 和RX 6800中 的GDDR6存储器接口一起运行。对于AMD来说,这也是一笔不小的数目,其工程师告诉我们,这是将游戏性能从1080p解锁到4K的关键,否则它将被庞大而耗电的选择所困扰。

Infinity Cache位于AMD Navi 21 GPU内主要的计算核心集群的旁边,本质上是一个小型而有效的内存存储。它位于较小的L1和L2高速缓存之间,也位于GPU本身,而位于片外,PCB和PC本身的较大GDDR6和DDR4内存之间。

以及采用这种全新的图形缓存方法的原因是什么?有人告诉我,这一切都是由于工程团队希望避免使用超贵且口渴的512位内存总线而产生的。大概就是保持Big Navi GPU与Nvidia竞争对手保持联系所需要的。事实证明,RX 6800 XT及其同类产品通常不仅仅与RTX 3080 和 RTX 3070相 匹敌,而Infinity Cache是其中一个重要原因。

在与开发人员的最初互动中,我们与他们讨论了一些方法,他们可能会更改其渲染方式,从而对缓存更友好”。

作为记录,所有RX 6000系列图形卡(包括即将推出的 RX 6900 XT )都具有相同的内存配置。16GB的GDDR6和256位内存总线-对于所有这些内存芯片来说,可能会有点小。那就是128MB片上Infinity缓存进来的地方。

AMD产品技术架构师Sam Naffzifer说:“我们正面临着必须放置512位接口以及与此相关的所有功能,面积和费用的令人生畏的前景。” “所以我们需要一个更好的解决方案。但是以前没有人做过。因此,没有多少数据可以确切说明我们获得了多少重用以及缓存的有效性。”

该团队进行了性能仿真,以帮助评估芯片上新缓存的前景,这些结果表明,在渲染复杂图像时,即使没有特殊说明,裸片上的大缓存确实也有助于重用时空数据,着色器将在游戏中多帧中多次访问同一数据。在物理上靠近GPU计算单元的某个地方存储所有数据以便快速访问,这从整体上提升了GPU的性能。

AMD的工程师预计对Infinity Cache的调用将达到60-80%的时间,这意味着它现在经常与现有的游戏引擎一起使用,存储有用的数据以渲染帧。而且,在这种情况下,AMD的工程师们正在吹捧有效内存带宽是直接256位解决方案的3.25倍。从512GB / s到有效的1,664GB / s。

但这不只是将缓存保留在GPU上并使之正常工作。多年来,我们已经看到了一些新颖且令人兴奋的基于硬件的解决方案,其中一些需要开发人员的支持才能完全集成和有效运行。这就是事情变得有些棘手的地方。

Radeon产品架构师Andrew Pomianowski在RDNA 2圆桌会议上对我们说:“我们希望我们的架构尽可能地与开发人员保持联系。” 的确,Infinity Cache对开发人员而言是相当透明的。无需特殊编程即可使其运行,因此无论您插入哪种游戏,它都可以正常工作。

“要意识到的重要一点是,当您将这样的新技术推向市场时,对开发人员起初要尽可能透明是非常非常重要的,对吧?” Pomianowski说。“您不能将这样的产品推向市场,这与GPU上的传统内存子系统背道而驰,并且对开发人员来说是一个很大的进入壁垒,开发人员必须以特定的方式进行编程才能从中受益。”

但是,如果一个开发商做项目专门为无限缓存?这是在RX 6800 XT和RX 6800发布日期之前的AMD圆桌讨论会上提出的一个问题,如果开发人员与红色团队合作以获取更多收益,AMD对未来的性能将保持沉默。

Pomianowski继续说:“提供更多直接控制有潜在的好处,我们拥有……可用于控制无限高速缓存的相当广泛的一组方法。

“这是我们将要看的东西。我的意思是,在与开发人员的最初互动中,我们与开发人员讨论了以下方式:如果他们了解缓存存在,他们可能会改变其渲染方式,从而更加友好。缓存-从中获得更多的好处,您知道,订购渲染和放置事物的方式可以实现一定的收益。”

对于 Xbox Series X ,Series S和 PlayStation 5而言, 通过使用RDNA 2芯片来利用Infinity Cache的开发者来说,或许还有更大的杠杆作用。现在有很多现代的红色团队芯片,这可能是AMD的帽子,因为它可以减轻Nvidia在显卡市场上的影响。要做到这一点,还有很长的路要走,因为Nvidia占据了四分之三的市场,但是RDNA 2感觉像是朝着正确方向的巨大飞跃。

“因此,我们将为此而努力。将来,我们将评估是否有理由探索提供对缓存的更多可见性。”也许这是古老的谚语“陈年佳酿”的观念,AMD显卡只有随着年龄的增长才能变得更好。

“但是现在,我认为它存在就好了,而且它可以提供好处,而开发人员无需付出大量工作来实现这些好处。”

这些潜在的好处只会为AMD图形团队锦上添花。Infinity缓存已经证明了自己的价值,正如您在我们对RX 6800 XT和RX 6800的评论中所看到的那样,这两款显卡能够很好地站立在自己的两只脚上,而不受每场比赛的聪明编程的支撑。

尽管RX 6800 XT可以提供更高的性能,但在与4K的Nvidia RTX 3080的战斗中它将大有帮助。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • pcb
    pcb
    +关注

    关注

    4418

    文章

    24013

    浏览量

    426826
  • amd
    amd
    +关注

    关注

    25

    文章

    5717

    浏览量

    140572
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5307

    浏览量

    136157
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    京东缓存中间件架构缓存内核优化

    一、京东缓存中间件架构 1、背景 在当今高并发、分布式的系统架构中,缓存已成为提升应用性能、降低数据库负载的核心组件。随着业务规模的扩大与系统复杂度的增加,
    的头像 发表于 04-03 16:18 1874次阅读
    京东<b class='flag-5'>缓存</b>中间件<b class='flag-5'>架构</b>与<b class='flag-5'>缓存</b>内核优化

    Infineon XC2734X微控制器:16/32位架构的强劲之选

    Infineon XC2734X微控制器:16/32位架构的强劲之选 作为电子工程师,在设计过程中,选择合适的微控制器至关重要。今天就来和大家聊聊英飞凌(Infineon)的XC2734X微控制器
    的头像 发表于 03-30 16:35 686次阅读

    如何在 VisionFive v2 上使用外部 GPU

    如果旧的 amd gpu 在 VisionFive V2 上运行,我想使用带有开源 amd 驱动程序的 amd
    发表于 03-13 06:38

    KV缓存黑科技!SK海力士“H³存储架构”,HBM和HBF技术加持!

    structure)”,同时采用了HBM和HBF两种技术。   在SK海力士设计的仿真实验中,H³架构将HBM和HBF显存并置于GPU旁,由GPU负责计算。该公司将8个HBM3E和8
    的头像 发表于 02-12 17:01 7884次阅读
    KV<b class='flag-5'>缓存</b>黑科技!SK海力士“H³存储<b class='flag-5'>架构</b>”,HBM和HBF技术加持!

    解析ISL62776:AMD CPU/GPU核心电源的理想之选

    AMD串行VID接口2.0(SVI2)标准,为微处理器和图形处理器的核心电源提供了完整的解决方案。它支持两个电压调节器(VR),其中核
    的头像 发表于 02-04 16:30 520次阅读

    40年首次,AMD Zen 6架构采用Intel FRED技术

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2026年02月03日 11:51:05

    摩尔线程公布全功能GPU架构路线图:以“花港”新架构与万卡训练集群,开启自主算力新时代

    MUSA统一架构为核心的全栈技术成果,全面展现公司在高端全功能GPU领域的关键突破与前瞻布局。 本次发布的核心成果包括: 1、新架构“花港”亮相:全功能GPU
    发表于 12-20 12:51 1181次阅读
    摩尔线程公布全功能<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>路线图:以“花港”新<b class='flag-5'>架构</b>与万卡训练集群,开启自主算力新时代

    基于蜂鸟E203架构的指令集K扩展

    向量操作指令,例如向量加法、向量乘法等。 在蜂鸟E203架构中,可以添加K扩展指令集,以处理大规模的数据集,可以添加以下指令: 1.VADD:向量加法指令,将两个向量相加并存储结果到一个向量寄存器中
    发表于 10-21 09:38

    迅为Hi3403V610开发板海思Cortex-A55架构核心板卡

    迅为电子重磅推出基于海思Hi3403处理器的高性能核心板,采用先进的四核Cortex-A55架构,主频高达1.4GHz,以强劲算力、超凡能效比与卓越的图像处理能力,为千行百业的智能化升级注入核心动力。无论是智能视觉、工业互联,还是AIoT边缘计算,它都能轻松驾驭,助您畅快
    的头像 发表于 09-30 14:18 963次阅读
    迅为Hi3403V610开发板海思Cortex-A55<b class='flag-5'>架构</b>核心板卡

    适应边缘AI全新时代的GPU架构

    电子发烧友网站提供《适应边缘AI全新时代的GPU架构.pdf》资料免费下载
    发表于 09-15 16:42 47次下载

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1
    发表于 07-25 08:18

    迅为iTOP-3588S开发板核心板引脚240PIN全部引出8GB内存32GBEMMC存储

    性能强 iTOP-3588S开发板采用瑞芯微RK3588S处理器,是全新一代AloT高端应用芯片,搭载八核64位CPU,四核Cortex-A76和四核Cortex-A55架构主频高达2.4GHZ
    发表于 06-23 11:19

    GPU架构深度解析

    、游戏娱乐等领域。本文将深入探讨GPU架构的演变历程、核心组件以及其在不同应用场景中的优势。1、GPU架构的演变早期的GPU
    的头像 发表于 05-30 10:36 2067次阅读
    <b class='flag-5'>GPU</b><b class='flag-5'>架构</b>深度解析

    又一颗国产GPU芯片成功点亮!6nm制程,自研TrueGPU架构

    GPU芯片G100采用6nm制程,基于自研的TrueGPU架构,这是全球首个融合高性能图形渲染与AI推理能力的GPU
    发表于 05-29 00:48 2838次阅读

    直击Computex2025:英特尔重磅发布新一代GPU图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系列GPU
    的头像 发表于 05-20 12:27 5753次阅读
    直击Computex2025:英特尔重磅发布新一代<b class='flag-5'>GPU</b>,<b class='flag-5'>图形</b>和AI性能跃升3.4倍