0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么历代AMD显卡在ROP单元数量上都非常保守?

lhl545545 来源:快科技 作者:流云 2020-11-19 10:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当NVIDIA基于新一代Ampere安培架构的GeForce RTX 30系列显卡发布之时,几乎在所有玩家的内心都默默的宣判了AMD的死刑。

因为此前在流处理器数量相同的情况下,同时代的NVIDIA显卡性能是远强于AMD显卡,就算是RDNA构架也不能难幸免。RX 5700 XT无法战胜拥有相同2560个流处理器数量的RTX 2070 Super,前者是7nm,后者是12nm。

新一代RTX 3090一上来就宣告拥有10496个流处理器,带来的震撼可想而知!至于传说中的RDNA2,很早之前大家就知道了,它最多拥有5120个流处理器。恐怕那时没人会觉得RNDA2会威胁到RTX 3090,甚至RTX 3080都可以高枕无忧。

不过如同Zen3处理器带给大家的震撼一样,10月29日发布的RDNA2 GPU的实际性能表现几乎超出了所有人的预料!

RDNA 2虽然是RDNA架构的更新版本,并不是完全重新设计。但在RDNA原有的基础上,RDNA2性能提升1倍,能效提升至少50%,ROP单元翻倍,完整支持DX12 Ultimate等技术特性,支持硬件光线追踪。

可以发现整体布局没有太大变化,当然各个功能模块都是调整优化过的,而最突出的,一是增加了独立的Infinity Cache高速缓存,二是在每个计算单元内加入了专用的光追加速器Ray Accelerator。

至于RDNA 2架构的底层细节,比如说计算单元的变化,AMD这次没有给出更多资料,只是简单提到了几点,包括精简TLB以降低延迟、重新设计32位像素流水线并支持HDR格式、优化几何分派与曲面细分、全方位精细时钟门控、频率树分离与门控、最小化数据转移、重新平衡流水线、高性能库等等,但没有任何图示。

以下是RDNA2构架新技术解析:

1、Smart Access Memory (SAM)显存智取技术

在游戏运行的时候,CPU是不能一次性访问全部显存的,比如RTX 3090有24GB显存,而CPU只能访问其中的256MB。于是有大量数据会回到内存后给CPU处理器完成后再转移到显存,此时不仅浪费了带宽也造成了无谓的资源浪费。

Smart Access Memory (SAM)可以让搭载AMD 500系列芯片组在搭载Zen3 CPU和RDNA2 GPU的时候,让Zen3 CPU可以完整访问全部显存,而且带宽还是PCIe 4.0的速度,理论上最多可以让游戏性能提升13%。

2、Ray Accelerator单元

在RDNA2构架中,加入了硬件光追单元Ray Accelerator!与NVIDIA的完全专用RT Core相比,RDNA2的Ray Accelerator紧密集成到了RNDA2的CU之中,并可以共享很多在光追中通常未被充分利用到的现有HW。

这是AMD放出的RNA 2光追渲染效果图,可以看到RDNA2实时光线追踪效果与传统光栅化渲染的差别。

AMD声称,相比于软件方案,RDNA 2架构的硬件加速光追性能,可以提升10倍之多,同时给出了部分游戏的实际性能,2K分辨率下《使命召唤:现代战争》可以跑出95FPS,《孤岛危机重制版》可达90FPS,《战地5》能有70FPS。

3、全局Infinity Cache

在大容量三级缓存的加持下,Zen3的IPC性能获得了巨大的性能提升。如今AMD将这个理念带入了GPU领域。

传统的GPU构架中,一般只有1.5~4MB的缓存,RDNA2除了4MB的L2缓存之外,还加入了128MB的全局Infinity Cache缓存,所有的CU单元均可以访问。

AMD Infinity Cache 作为一个巨大的带宽放大器,其有效带宽可以达到256 位 16 Gbps GDDR6 显存的 4 倍。在Infinity Cache的带动下,512GB/s带宽的RX 6900 XT的性能表现足以媲美936GB/s带宽的RTX 3090。

4、Fidelity FX超分辨率抗锯齿技术

针对NVIDIA DLSS深度学习超采样抗锯齿技术,AMD也提出了超分辨率(FidelityFX Super Resolution),简称FSR。目前这个技术正在开发中,不久之后会在新驱动中提供支持

历代AMD显卡在ROP单元数量上都非常保守,最顶级型号的GPU最多就只有64个ROP。这一次AMD非常的激进,RX 6800 XT直接就配备了128个ROP,也是GPU历史上第一款拥有128个ROP的显卡。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20148

    浏览量

    247101
  • amd
    amd
    +关注

    关注

    25

    文章

    5647

    浏览量

    139015
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222927
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AMD Vitis AI 5.1测试版发布

    AMD Vitis AI 5.1全新发布——新增了对 AMD Versal AI Edge 系列神经网络处理单元 (NPU) 的支持。Vitis AI 包含优化的 NPU IP、模型编译工具和部署 API,可在嵌入式平台上实现可
    的头像 发表于 10-31 12:46 489次阅读

    使用AMD Vitis Unified IDE创建HLS组件

    这篇文章在开发者分享|AMD Vitis HLS 系列 1 - AMD Vivado IP 流程(Vitis 传统 IDE) 的基础撰写,但使用的是 AMD Vitis Unifie
    的头像 发表于 06-20 10:06 1915次阅读
    使用<b class='flag-5'>AMD</b> Vitis Unified IDE创建HLS组件

    主板显卡的特点是什么?能用来干什么?

    在计算机硬件系统中,显卡是负责处理和输出图像的关键组件。安装在主板显卡主要分为集成显卡和独立显卡,它们各自具备独特的特点,并在不同场景下
    的头像 发表于 05-22 09:21 743次阅读

    如何在Ubuntu 22.04安装NVIDIA显卡驱动

    Ubuntu 22.04 安装 NVIDIA 显卡驱动完整步骤
    的头像 发表于 05-20 11:00 4937次阅读

    如何在Ubuntu安装NVIDIA显卡驱动?

    专有显卡驱动。本文将详细介绍在Ubuntu系统安装NVIDIA显卡驱动的多种方法,帮助用户根据自身情况选择最适合的安装方式。 二,硬件参数 平台:PX22_GPU CPU:I7-1165G7
    的头像 发表于 05-07 16:05 2058次阅读
    如何在Ubuntu<b class='flag-5'>上</b>安装NVIDIA<b class='flag-5'>显卡</b>驱动?

    专访AMD GPU教父王启尚:卓越的RDNA 4架构,造就新一代性价比王者显卡

    在今年CES大会上首次公布定位4K游戏的RadeonRX9070系列显卡之后,AMD于2月28日再次举办发布会并宣布了RadeonRX9070系列的技术细节与售价,其中RadeonRX9070首发
    的头像 发表于 03-06 10:21 859次阅读
    专访<b class='flag-5'>AMD</b> GPU教父王启尚:卓越的RDNA 4架构,造就新一代性价比王者<b class='flag-5'>显卡</b>

    国产显卡大集合来啦

      国产显卡品牌有那些?      一直以来国内计算机显卡依靠AMD、NVIDIA、Intel等这些外国厂家,但随着国家科学技术的进步,中国也拥有了自己的显卡厂家。今天就由集特智能来简
    的头像 发表于 02-27 17:40 3735次阅读

    DLPC350烧写的时候,总是卡在3%,为什么?

    之前烧写正常,有一次烧写的时候卡在了3%,等了5分钟左右依然卡在3%且界面卡死。然后断电,强制关闭LightCrafter4500。之后在上电,打开LightCrafter4500,这时候已经
    发表于 02-21 08:05

    hyper v 显卡,Hyper-V 显卡:提升Hyper-V的显卡性能

        在企业管理中,批量任务处理一直是一个令人头疼的问题。无论是批量生成报表、批量发送邮件,还是批量更新客户信息,需要耗费大量的人力和时间。然而,随着批量管理工具的出现,这一难题终于得到了有效
    的头像 发表于 02-07 10:22 2675次阅读
    hyper v <b class='flag-5'>显卡</b>,Hyper-V <b class='flag-5'>显卡</b>:提升Hyper-V的<b class='flag-5'>显卡</b>性能

    hyper v 显卡,hyper-v显卡:如何在虚拟机中配置和优化显卡性能

    在当今数字化时代,数据已成为企业的重要资产。然而,如何高效管理和利用这些数据,成为企业面临的重大挑战。批量管理工具以其强大的功能,为企业提供了全新的解决方案。今天就为大家介绍hyper-v显卡
    的头像 发表于 01-24 14:19 1.1w次阅读
    hyper v <b class='flag-5'>显卡</b>,hyper-v<b class='flag-5'>显卡</b>:如何在虚拟机中配置和优化<b class='flag-5'>显卡</b>性能

    RDNA 4显卡定在3月发售 AMD解释原因

    在CES 2025AMD展示了“RDNA 4”架构的Radeon RX 9000系列显卡,但发售时间定在今年3月。AMD公司副总裁兼客户渠道业务总经理David McAfee对此做
    的头像 发表于 01-23 17:48 1091次阅读

    hyper v 显卡,hyper v 显卡怎么样

    介绍hyperv显卡怎么样。    Hyper-V是微软推出的虚拟化平台,支持多种显卡虚拟化技术,能够显著提升虚拟机的图形处理能力。以下是关于Hyper-V显卡性能的分析及优化建议:    1.Hyper-V
    的头像 发表于 01-23 09:58 1043次阅读
    hyper v <b class='flag-5'>显卡</b>,hyper v <b class='flag-5'>显卡</b>怎么样

    AMD Versal自适应SoC器件Advanced Flow概览(

    在最新发布的 AMD Vivado Design Suite 2024.2 中,引入的新特性之一是启用了仅适用于 AMD Versal 自适应 SoC 器件的 Advanced Flow 布局布线
    的头像 发表于 01-17 10:09 1166次阅读
    <b class='flag-5'>AMD</b> Versal自适应SoC器件Advanced Flow概览(<b class='flag-5'>上</b>)

    技嘉CES 2025发布RTX 50系列显卡,升级散热缩小体积

    ™ 50系列显示芯片设计的散热系统,这一创新设计能够大幅提升显卡在高负载需求下的表现,确保游戏运行流畅无阻。 值得一提的是,技嘉此次发布的显卡系列以“Evolution of Ten”为设计概念,
    的头像 发表于 01-13 11:16 1185次阅读

    AI智能网卡在AI网络中的作用

    写在开头,本文主要介绍智能网卡在AI网络的作用并在一定场景下说明DPU和智能网卡在功能上的一些区别以理解两者的相似点和不同点。
    的头像 发表于 12-18 16:17 2376次阅读