0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么历代AMD显卡在ROP单元数量上都非常保守?

lhl545545 来源:快科技 作者:流云 2020-11-19 10:25 次阅读

当NVIDIA基于新一代Ampere安培架构的GeForce RTX 30系列显卡发布之时,几乎在所有玩家的内心都默默的宣判了AMD的死刑。

因为此前在流处理器数量相同的情况下,同时代的NVIDIA显卡性能是远强于AMD显卡,就算是RDNA构架也不能难幸免。RX 5700 XT无法战胜拥有相同2560个流处理器数量的RTX 2070 Super,前者是7nm,后者是12nm。

新一代RTX 3090一上来就宣告拥有10496个流处理器,带来的震撼可想而知!至于传说中的RDNA2,很早之前大家就知道了,它最多拥有5120个流处理器。恐怕那时没人会觉得RNDA2会威胁到RTX 3090,甚至RTX 3080都可以高枕无忧。

不过如同Zen3处理器带给大家的震撼一样,10月29日发布的RDNA2 GPU的实际性能表现几乎超出了所有人的预料!

RDNA 2虽然是RDNA架构的更新版本,并不是完全重新设计。但在RDNA原有的基础上,RDNA2性能提升1倍,能效提升至少50%,ROP单元翻倍,完整支持DX12 Ultimate等技术特性,支持硬件光线追踪。

可以发现整体布局没有太大变化,当然各个功能模块都是调整优化过的,而最突出的,一是增加了独立的Infinity Cache高速缓存,二是在每个计算单元内加入了专用的光追加速器Ray Accelerator。

至于RDNA 2架构的底层细节,比如说计算单元的变化,AMD这次没有给出更多资料,只是简单提到了几点,包括精简TLB以降低延迟、重新设计32位像素流水线并支持HDR格式、优化几何分派与曲面细分、全方位精细时钟门控、频率树分离与门控、最小化数据转移、重新平衡流水线、高性能库等等,但没有任何图示。

以下是RDNA2构架新技术解析:

1、Smart Access Memory (SAM)显存智取技术

在游戏运行的时候,CPU是不能一次性访问全部显存的,比如RTX 3090有24GB显存,而CPU只能访问其中的256MB。于是有大量数据会回到内存后给CPU处理器完成后再转移到显存,此时不仅浪费了带宽也造成了无谓的资源浪费。

Smart Access Memory (SAM)可以让搭载AMD 500系列芯片组在搭载Zen3 CPU和RDNA2 GPU的时候,让Zen3 CPU可以完整访问全部显存,而且带宽还是PCIe 4.0的速度,理论上最多可以让游戏性能提升13%。

2、Ray Accelerator单元

在RDNA2构架中,加入了硬件光追单元Ray Accelerator!与NVIDIA的完全专用RT Core相比,RDNA2的Ray Accelerator紧密集成到了RNDA2的CU之中,并可以共享很多在光追中通常未被充分利用到的现有HW。

这是AMD放出的RNA 2光追渲染效果图,可以看到RDNA2实时光线追踪效果与传统光栅化渲染的差别。

AMD声称,相比于软件方案,RDNA 2架构的硬件加速光追性能,可以提升10倍之多,同时给出了部分游戏的实际性能,2K分辨率下《使命召唤:现代战争》可以跑出95FPS,《孤岛危机重制版》可达90FPS,《战地5》能有70FPS。

3、全局Infinity Cache

在大容量三级缓存的加持下,Zen3的IPC性能获得了巨大的性能提升。如今AMD将这个理念带入了GPU领域。

传统的GPU构架中,一般只有1.5~4MB的缓存,RDNA2除了4MB的L2缓存之外,还加入了128MB的全局Infinity Cache缓存,所有的CU单元均可以访问。

AMD Infinity Cache 作为一个巨大的带宽放大器,其有效带宽可以达到256 位 16 Gbps GDDR6 显存的 4 倍。在Infinity Cache的带动下,512GB/s带宽的RX 6900 XT的性能表现足以媲美936GB/s带宽的RTX 3090。

4、Fidelity FX超分辨率抗锯齿技术

针对NVIDIA DLSS深度学习超采样抗锯齿技术,AMD也提出了超分辨率(FidelityFX Super Resolution),简称FSR。目前这个技术正在开发中,不久之后会在新驱动中提供支持

历代AMD显卡在ROP单元数量上都非常保守,最顶级型号的GPU最多就只有64个ROP。这一次AMD非常的激进,RX 6800 XT直接就配备了128个ROP,也是GPU历史上第一款拥有128个ROP的显卡。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18219

    浏览量

    221938
  • amd
    amd
    +关注

    关注

    25

    文章

    5182

    浏览量

    132624
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10412

    浏览量

    206467
收藏 人收藏

    评论

    相关推荐

    stm8L如何在ROP激活状态下,进行BootLoader的升级?

    求助:在stm8L如何在ROP激活状态下,进行BootLoader的升级。调试发现在ROP激活状态下,即使BOOTCLK_enable打开也无法进入boot模式,而是直接跳转进入USER CODE,不知道有什么办法可以在不解除读保护的情况下,进行mcu的boot升级
    发表于 04-17 07:16

    AMD宣布AMD Radeon RX 7900 GRE显卡全球发售

    今天,AMD宣布AMD Radeon RX 7900 GRE显卡在全球同步上市发售,该显卡致力于为玩家提供高刷新率的2K游戏及更佳的流媒体体验。
    的头像 发表于 03-07 10:25 267次阅读

    值得入手的AMD Radeon 显卡推荐—— AMD Radeon RX 7900 XT

    结合5nm和6nm工艺节点,采用先进的小芯片(Chiplets)设计,全新的计算单元和第二代AMD高速缓存技术,相比AMD RDNA 2架构的每瓦性能提高54%;
    的头像 发表于 01-04 16:27 586次阅读
    值得入手的<b class='flag-5'>AMD</b> Radeon <b class='flag-5'>显卡</b>推荐—— <b class='flag-5'>AMD</b> Radeon RX 7900 XT

    AMD Radeon RX 7000系列移动显卡介绍

    AMD Radeon RX 7000系列移动显卡是专门为移动游戏平台和高级内容创建打造的卓越笔记本电脑显卡,采用统一的AMD RDNA 3计算单元
    的头像 发表于 12-12 11:19 620次阅读

    传戴尔将停止在中国销售搭载多款AMD 7900显卡的产品

    戴尔在其营业咨询报告中集中介绍了目前在中国及其他22个国家禁止销售的一系列amd产品。咨询文件显示,amd的radeon rx 7900 xt、radeon rx 7900 xtx和radeon pro w7900显卡
    的头像 发表于 11-23 12:02 567次阅读

    集成显卡、核芯显卡和独立显卡的区别分析

    显卡行业是计算机硬件产业中的一个重要分支,主要涉及图形处理器(GPU)的研发、生产和销售。显卡行业的竞争极为激烈,主要厂商包括英伟达、AMD、英特尔等。
    发表于 10-26 09:44 428次阅读
    集成<b class='flag-5'>显卡</b>、核芯<b class='flag-5'>显卡</b>和独立<b class='flag-5'>显卡</b>的区别分析

    AMD或将于9月发布显卡一键性能提升技术

    据了解,AMD早在去年 RX 7900显卡发布会上就提到了 HYPR-RX显卡一键性能提升技术。而该技术结合了Radeon Super Resolution、Radeon Boost
    的头像 发表于 08-28 11:46 440次阅读

    AMD或将发布两款显卡,供电采用双8pin

    据了解,日前AMD方面发布RX 7800 XT 和 RX 7700 XT 显卡的相关信息。 而从相关图片可以看到,AMD RX 7800 XT 和 RX 7700 XT公版显卡采用了双
    的头像 发表于 08-28 10:03 467次阅读

    无法在AMD Ryzen CPU运行OpenVINO trade怎么解决?

    AMD Ryzen CPU 运行OpenVINO™推理。 收到错误消息: libva error: vaGetDriverNameByIndex() failed with unknown libva error, driver_name (null)
    发表于 08-15 06:46

    带来全新多媒体体验!AMD全新发布Radeon RX 7900 GRE显卡

    Radeon RX 7900 GRE 显卡配备16 GB GDDR6显存,可在最高设置下轻松渲染当下和未来的游戏。采用80个AMD RDNA 3统一计算单元,结合先进的 AI 技术和强大的光线追踪
    的头像 发表于 08-14 15:30 901次阅读

    AMD正式推出 Radeon PRO W7000系列两款新产品工作站显卡

    AMD Radeon PRO W7600工作站显卡相比前代产品可提供2倍的TFLOPS性能和1.5倍的显示器最大总数据传输率 AMD(超威)宣布了AMD Radeon PRO W700
    的头像 发表于 08-07 11:21 808次阅读
    <b class='flag-5'>AMD</b>正式推出 Radeon PRO W7000系列两款新产品工作站<b class='flag-5'>显卡</b>

    对标NVIDIA:AMD也要推中国特供AI显卡

    在今天凌晨的财报会议上,AMD CEO苏姿丰也提到他们考虑效仿NVIDIA的做法,面向中国市场推出特供版AI显卡以符合出口限制。
    的头像 发表于 08-03 17:04 984次阅读

    AMD Radeon RX 7900 GRE显卡特性和功能

    AMD RDNA 3架构 – 配备采用了统一的光线追踪和AI加速器且经过重新设计的计算单元,以及第二代AMD Infinity Cache(AMD高速缓存)技术,
    发表于 07-31 11:05 327次阅读
    <b class='flag-5'>AMD</b> Radeon RX 7900 GRE<b class='flag-5'>显卡</b>特性和功能

    AMD Radeon RX 7000系列移动显卡助力打造性能卓越的笔记本电脑平台

    RX 7000系列显卡基于AMD RDNA 3架构,提供多达32个全新的统一计算单元、32MB第二代AMD高速缓存技术、8GB高速GDDR6内存、高达128位的内存接口,以及专用的A
    的头像 发表于 06-29 15:18 638次阅读

    AMD Radeon PRO W7000系列工作站显卡赋能严苛的专业设计和创意应用

    AMD Radeon PRO W7000系列 当今的现代工作站用户需要性能、稳定性、图像质量和软件认证来提高生产力。全新AMD Radeon PRO W7000系列工作站显卡——AMD
    的头像 发表于 06-29 15:16 501次阅读