0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD RDNA2架构GPU采用全新图形缓存方法的原因是什么?

我快闭嘴 来源:半导体行业观察 作者:半导体行业观察 2020-11-23 10:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

与RDNA 2架构一起引入的Infinity Cache是一个新的缓存系统,它与 RX 6800 XT 和RX 6800中 的GDDR6存储器接口一起运行。对于AMD来说,这也是一笔不小的数目,其工程师告诉我们,这是将游戏性能从1080p解锁到4K的关键,否则它将被庞大而耗电的选择所困扰。

Infinity Cache位于AMD Navi 21 GPU内主要的计算核心集群的旁边,本质上是一个小型而有效的内存存储。它位于较小的L1和L2高速缓存之间,也位于GPU本身,而位于片外,PCB和PC本身的较大GDDR6和DDR4内存之间。

以及采用这种全新的图形缓存方法的原因是什么?有人告诉我,这一切都是由于工程团队希望避免使用超贵且口渴的512位内存总线而产生的。大概就是保持Big Navi GPU与Nvidia竞争对手保持联系所需要的。事实证明,RX 6800 XT及其同类产品通常不仅仅与RTX 3080 和 RTX 3070相 匹敌,而Infinity Cache是其中一个重要原因。

在与开发人员的最初互动中,我们与他们讨论了一些方法,他们可能会更改其渲染方式,从而对缓存更友好”。

作为记录,所有RX 6000系列图形卡(包括即将推出的 RX 6900 XT )都具有相同的内存配置。16GB的GDDR6和256位内存总线-对于所有这些内存芯片来说,可能会有点小。那就是128MB片上Infinity缓存进来的地方。

AMD产品技术架构师Sam Naffzifer说:“我们正面临着必须放置512位接口以及与此相关的所有功能,面积和费用的令人生畏的前景。” “所以我们需要一个更好的解决方案。但是以前没有人做过。因此,没有多少数据可以确切说明我们获得了多少重用以及缓存的有效性。”

该团队进行了性能仿真,以帮助评估芯片上新缓存的前景,这些结果表明,在渲染复杂图像时,即使没有特殊说明,裸片上的大缓存确实也有助于重用时空数据,着色器将在游戏中多帧中多次访问同一数据。在物理上靠近GPU计算单元的某个地方存储所有数据以便快速访问,这从整体上提升了GPU的性能。

AMD的工程师预计对Infinity Cache的调用将达到60-80%的时间,这意味着它现在经常与现有的游戏引擎一起使用,存储有用的数据以渲染帧。而且,在这种情况下,AMD的工程师们正在吹捧有效内存带宽是直接256位解决方案的3.25倍。从512GB / s到有效的1,664GB / s。

但这不只是将缓存保留在GPU上并使之正常工作。多年来,我们已经看到了一些新颖且令人兴奋的基于硬件的解决方案,其中一些需要开发人员的支持才能完全集成和有效运行。这就是事情变得有些棘手的地方。

Radeon产品架构师Andrew Pomianowski在RDNA 2圆桌会议上对我们说:“我们希望我们的架构尽可能地与开发人员保持联系。” 的确,Infinity Cache对开发人员而言是相当透明的。无需特殊编程即可使其运行,因此无论您插入哪种游戏,它都可以正常工作。

“要意识到的重要一点是,当您将这样的新技术推向市场时,对开发人员起初要尽可能透明是非常非常重要的,对吧?” Pomianowski说。“您不能将这样的产品推向市场,这与GPU上的传统内存子系统背道而驰,并且对开发人员来说是一个很大的进入壁垒,开发人员必须以特定的方式进行编程才能从中受益。”

但是,如果一个开发商做项目专门为无限缓存?这是在RX 6800 XT和RX 6800发布日期之前的AMD圆桌讨论会上提出的一个问题,如果开发人员与红色团队合作以获取更多收益,AMD对未来的性能将保持沉默。

Pomianowski继续说:“提供更多直接控制有潜在的好处,我们拥有……可用于控制无限高速缓存的相当广泛的一组方法。

“这是我们将要看的东西。我的意思是,在与开发人员的最初互动中,我们与开发人员讨论了以下方式:如果他们了解缓存存在,他们可能会改变其渲染方式,从而更加友好。缓存-从中获得更多的好处,您知道,订购渲染和放置事物的方式可以实现一定的收益。”

对于 Xbox Series X ,Series S和 PlayStation 5而言, 通过使用RDNA 2芯片来利用Infinity Cache的开发者来说,或许还有更大的杠杆作用。现在有很多现代的红色团队芯片,这可能是AMD的帽子,因为它可以减轻Nvidia在显卡市场上的影响。要做到这一点,还有很长的路要走,因为Nvidia占据了四分之三的市场,但是RDNA 2感觉像是朝着正确方向的巨大飞跃。

“因此,我们将为此而努力。将来,我们将评估是否有理由探索提供对缓存的更多可见性。”也许这是古老的谚语“陈年佳酿”的观念,AMD显卡只有随着年龄的增长才能变得更好。

“但是现在,我认为它存在就好了,而且它可以提供好处,而开发人员无需付出大量工作来实现这些好处。”

这些潜在的好处只会为AMD图形团队锦上添花。Infinity缓存已经证明了自己的价值,正如您在我们对RX 6800 XT和RX 6800的评论中所看到的那样,这两款显卡能够很好地站立在自己的两只脚上,而不受每场比赛的聪明编程的支撑。

尽管RX 6800 XT可以提供更高的性能,但在与4K的Nvidia RTX 3080的战斗中它将大有帮助。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • pcb
    pcb
    +关注

    关注

    4392

    文章

    23749

    浏览量

    420946
  • amd
    amd
    +关注

    关注

    25

    文章

    5652

    浏览量

    139059
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5102

    浏览量

    134487
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于蜂鸟E203架构的指令集K扩展

    向量操作指令,例如向量加法、向量乘法等。 在蜂鸟E203架构中,可以添加K扩展指令集,以处理大规模的数据集,可以添加以下指令: 1.VADD:向量加法指令,将两个向量相加并存储结果到一个向量寄存器中
    发表于 10-21 09:38

    适应边缘AI全新时代的GPU架构

    电子发烧友网站提供《适应边缘AI全新时代的GPU架构.pdf》资料免费下载
    发表于 09-15 16:42 36次下载

    迅为iTOP-3588S开发板核心板引脚240PIN全部引出8GB内存32GBEMMC存储

    性能强 iTOP-3588S开发板采用瑞芯微RK3588S处理器,是全新一代AloT高端应用芯片,搭载八核64位CPU,四核Cortex-A76和四核Cortex-A55架构主频高达2.4GHZ
    发表于 06-23 11:19

    GPU架构深度解析

    、游戏娱乐等领域。本文将深入探讨GPU架构的演变历程、核心组件以及其在不同应用场景中的优势。1、GPU架构的演变早期的GPU
    的头像 发表于 05-30 10:36 1367次阅读
    <b class='flag-5'>GPU</b><b class='flag-5'>架构</b>深度解析

    iTOP-3588S开发板四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    性能强 iTOP-3588S开发板采用瑞芯微RK3588S处理器,是全新一代AloT高端应用芯片,搭载八核64位CPU,四核Cortex-A76和四核Cortex-A55架构主频高达2.4GHZ
    发表于 05-15 10:36

    iTOP-3588开发板采用瑞芯微RK3588处理器四核心架构GPU内置独立NPU强大的视频编解码

    架构,主频高达2.4GHz。 四核心架构GPU 集成Mali G610 MP4四核GPU、支持OpenGLES 1.1.2.0、 3.2, OpenCL 2.2和Vulkan1.2。带
    发表于 04-09 16:09

    专访AMD Jack Huynh:重新定义异构AI计算的行业标准,坚守以用户为核心的AI适配战略

    2025年2月28日,AMD在珠海正式发布基于新一代RDNA 4架构的Radeon RX 9070系列显卡,包含RX 9070 XT与RX 9070两款型号,剑指主流4K游戏市场。会后
    的头像 发表于 03-06 12:28 849次阅读
    专访<b class='flag-5'>AMD</b> Jack Huynh:重新定义异构AI计算的行业标准,坚守以用户为核心的AI适配战略

    专访AMD王启尚 从RDNA 4到FSR 4,AMD GPU技术创新引领行业新发展

    在近日于珠海举办的AMD新一代Radeon RX 9070系列显卡发布会后,AMD GPU技术与工程研发副总裁王启尚接受了我们的专访。在本次交谈中,他详细分享了RDNA 4
    的头像 发表于 03-06 11:19 709次阅读
    专访<b class='flag-5'>AMD</b>王启尚 从<b class='flag-5'>RDNA</b> 4到FSR 4,<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b>技术创新引领行业新发展

    专访AMD GPU教父王启尚:卓越的RDNA 4架构,造就新一代性价比王者显卡

    在今年CES大会上首次公布定位4K游戏的RadeonRX9070系列显卡之后,AMD2月28日再次举办发布会并宣布了RadeonRX9070系列的技术细节与售价,其中RadeonRX9070首发
    的头像 发表于 03-06 10:21 878次阅读
    专访<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b>教父王启尚:卓越的<b class='flag-5'>RDNA</b> 4<b class='flag-5'>架构</b>,造就新一代性价比王者显卡

    RDNA 4显卡定在3月发售 AMD解释原因

    在CES 2025上,AMD展示了“RDNA 4”架构的Radeon RX 9000系列显卡,但发售时间定在今年3月。AMD公司副总裁兼客户渠道业务总经理David McAfee对此做
    的头像 发表于 01-23 17:48 1105次阅读

    芯原发布新一代Vitality架构GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架构图形处理器(GPU)IP系列。这一新一代GPU架构
    的头像 发表于 12-24 10:55 1296次阅读

    迅为RK3588与3588S开发板/核心板选型硬件的区别

    ,是全新一代AloT高端应用芯片,采用8nm LP制程,搭载八核64位CPU,四核Cortex-A76和四核Cortex-A55架构,主频高达2.4GHz,8GB内存,32GB EMMC。集成Mali
    发表于 12-20 15:40

    芯原推出新一代高性能Vitality架构GPU IP系列

    芯原股份(芯原,股票代码:688521.SH)今日宣布推出全新Vitality架构图形处理器(GPU)IP系列,具备高性能计算能力,广泛适用于云游戏、AI PC、独立显卡和集成显卡等
    的头像 发表于 12-19 15:55 733次阅读

    芯原发布全新Vitality架构GPU IP系列

    芯原股份(芯原,股票代码:688521.SH)今日宣布推出全新Vitality架构图形处理器(GPU)IP系列,具备高性能计算能力,广泛适用于云游戏、AI PC、独立显卡和集成显卡等
    的头像 发表于 12-19 15:26 1227次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    的各个方面,包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIA和AMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1. 硬件支持 - NVIDIA GPU
    发表于 12-16 14:25