0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

采用全新的7nm架构,AMD RDNA架构的解析

独爱72H 来源:中关村在线 作者:中关村在线 2019-12-10 17:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(文章来源:中关村在线)

随着AMD的全新7nm制程工艺的RDNA架构推出,代表着AMD在未来的GPU市场上将有一番大作为,在过去的几代中,AMD的GPU已经利用了很久的基于GCN架构的计算单元。GCN多年来一直很好地服务于AMD,并且非常适合各种工作负载,但是对于Radeon RX 5700系列和Navi核心,AMD的GCN架构已经不能继续满足了,因此他们推出了全新的RDNA(Radeon DNA)架构。

RDNA架构采用台积电的7nm制程工艺,GDDR6显存,支持PCI Express 4.0接口。GPU还采用了新的Radeon Media和Radeon Display引擎,以更好地满足流媒体和内容创作者的需求,并引入一系列新的显示技术。

Navi核心中的新COMPUTE UNIT(CU单元)设计具有多级缓存层次结构和简化的图形管道,不仅可以提高每时钟性能,还可以提高时钟频率。新的CU提供双倍的GCN指令速率,并且具有两倍的标量单位数和调度程序数。通过资源池,两个CU可以协调并充当工作组处理器。例如,64个线程可以分组为两个Wave32指令,并在单个时钟中执行。CU的灵活性和集中资源的能力提高了单线程性能,GPU利用率和效率。

Navi还具有新的缓存层次结构。AMD为其增加了一个新的L1缓存,并将L0缓存的负载带宽加倍到ALU。新的缓存层次结构减少了每个级别的缓存延迟,并提高了有效带宽。

Navi中的DCC(Delta Color Compression,增强色彩压缩)算法也得到了改进,并且也可用于缓存子系统的更广泛部分。使用Navi,着色器现在可以读取和写入压缩的颜色数据。新的显示单元还可以读取帧缓冲器中的压缩数据,而无需先对其进行解压缩。最终结果是整个GPU的有效带宽更高。

Navi核心中的整个图形管道也已得到改进,可提高效率,实现更好的每时钟性能,并且GPU还具有更高效的时钟门控功能,可提高整体电源效率。相对于GCN,RDNA提供超过50%的每瓦性能提升和25%更好的整体性能提升。据AMD称,超过50%的改进来自架构优化; GPU的7nm工艺和频率改进也得到了提升。

根据AMD的说法,Navi的40 CU设计性能比Vega64提高了约14%,功耗降低了23%。并且具有小得多的芯片尺寸。(Navi 10的面积为251平方毫米,作为对比Vega 64上面的那颗为495平方毫米。)

最后,我们来看看采用完整完整的RDNA架构的GPU核心里面都有什么呢?40个RDNA计算单元,包括80个标量处理器,2560个流处理器和160个64位双线性滤波器单元。GPU具有4MB L2缓存,512K L1和双倍VSL0负载带宽,支持整个芯片的DCC(Delta Color Compression,增强色彩压缩)。简化的图形引擎具有新的几何引擎,64像素单位和4个异步计算引擎。

而在未来,当RDNA架构的显卡核心从251mm2扩大、乃至翻倍后,带来更多的流处理器和晶体管,想必会让AMD在高端乃至旗舰市场上大发神威。而在入门级显卡上,RDNA架构则拥有较GCN架构更好的能耗比,能够更好的控制功耗与发热,移植到移动端上也非常有可能,从而打破竞争对手在移动端显卡上的一家独霸!

(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5647

    浏览量

    139013
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222915
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    芯源MCU架构是不是基本都是ARM架构?还有其他的架构吗?

    芯源MCU架构是不是基本都是ARM架构?还有其他的架构吗?
    发表于 11-20 06:21

    国产AI芯片真能扛住“算力内卷”?海思昇腾的这波操作藏了多少细节?

    最近行业都在说“算力是AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思昇腾910B,实测下来有点超出预期——7nm工艺下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    发表于 10-27 13:12

    分布式光伏环境监测站的技术架构与应用实践

    分布式光伏环境监测站的技术架构与应用实践 柏峰【BF-GFQX】一、系统技术架构解析 分布式光伏环境监测站采用“感知层-传输层-应用层”三层架构
    的头像 发表于 10-13 10:05 250次阅读
    分布式光伏环境监测站的技术<b class='flag-5'>架构</b>与应用实践

    五大电磁频谱管理系统:原理、架构与应用全景解析

    五大电磁频谱管理系统:原理、架构与应用全景解析
    的头像 发表于 09-26 10:21 334次阅读
    五大电磁频谱管理系统:原理、<b class='flag-5'>架构</b>与应用全景<b class='flag-5'>解析</b>

    AMD 7nm Versal系列器件NoC的使用及注意事项

    AMD 7nm Versal系列器件引入了可编程片上网络(NoC, Network on Chip),这是一个硬化的、高带宽、低延迟互连结构,旨在实现可编程逻辑(PL)、处理系统(PS)、AI引擎(AIE)、DDR控制器(DDRMC)、CPM(PCIe/CXL)等模块之间
    的头像 发表于 09-19 15:15 2148次阅读
    <b class='flag-5'>AMD</b> <b class='flag-5'>7nm</b> Versal系列器件NoC的使用及注意事项

    适应边缘AI全新时代的GPU架构

    电子发烧友网站提供《适应边缘AI全新时代的GPU架构.pdf》资料免费下载
    发表于 09-15 16:42 36次下载

    基于AMD Versal器件实现PCIe5 DMA功能

    Versal是AMD 7nm的SoC高端器件,不仅拥有比16nm性能更强的逻辑性能,并且其PS系统中的CPM PCIe也较上一代MPSoC PS硬核PCIe单元强大得多。本节将基于AMD
    的头像 发表于 06-19 09:44 1448次阅读
    基于<b class='flag-5'>AMD</b> Versal器件实现PCIe5 DMA功能

    GPU架构深度解析

    GPU架构深度解析从图形处理到通用计算的进化之路图形处理单元(GPU),作为现代计算机中不可或缺的一部分,已经从最初的图形渲染专用处理器,发展成为强大的并行计算引擎,广泛应用于人工智能、科学计算
    的头像 发表于 05-30 10:36 1300次阅读
    GPU<b class='flag-5'>架构</b>深度<b class='flag-5'>解析</b>

    解锁未来汽车电子技术:软件定义车辆与区域架构深度解析

    解锁未来汽车电子技术:软件定义车辆与区域架构深度解析 ——立即下载白皮书,抢占智能汽车发展先机 *附件:解锁未来汽车电子技术:软件定义车辆与区域架构深度解析.pdf 为什么这份白皮书值
    的头像 发表于 04-27 11:58 1086次阅读

    Xilinx Ultrascale系列FPGA的时钟资源与架构解析

    Ultrascale是赛灵思开发的支持包含步进功能的增强型FPGA架构,相比7系列的28nm工艺,Ultrascale采用20nm的工艺,主
    的头像 发表于 04-24 11:29 2078次阅读
    Xilinx Ultrascale系列FPGA的时钟资源与<b class='flag-5'>架构</b><b class='flag-5'>解析</b>

    NVIDIA Blackwell数据手册与NVIDIA Blackwell架构技术解析

    NVIDIA Blackwell数据手册与NVIDIA Blackwell 架构技术解析
    的头像 发表于 03-20 17:19 1695次阅读

    宝马发布全新一代智能电子电气架构

    "超级大脑"赋能宝马新世代车型智能驾驶乐趣 全新一代电子电气架构搭载新世代车型,覆盖全动力系统和全细分车型 全新一代电子电气架构集成算力提升20倍,支持AI用户体验和场景
    的头像 发表于 03-13 15:42 545次阅读

    专访AMD王启尚 从RDNA 4到FSR 4,AMD GPU技术创新引领行业新发展

    在近日于珠海举办的AMD新一代Radeon RX 9070系列显卡发布会后,AMD GPU技术与工程研发副总裁王启尚接受了我们的专访。在本次交谈中,他详细分享了RDNA 4架构的设计理
    的头像 发表于 03-06 11:19 694次阅读
    专访<b class='flag-5'>AMD</b>王启尚 从<b class='flag-5'>RDNA</b> 4到FSR 4,<b class='flag-5'>AMD</b> GPU技术创新引领行业新发展

    电鸿系统技术架构解析,触觉智能推出多款电鸿适配硬件方案

    电鸿系统技术架构解析,触觉智能推出多款电鸿适配硬件方案
    的头像 发表于 02-26 16:21 1442次阅读
    电鸿系统技术<b class='flag-5'>架构</b><b class='flag-5'>解析</b>,触觉智能推出多款电鸿适配硬件方案

    RDNA 4显卡定在3月发售 AMD解释原因

    在CES 2025上,AMD展示了“RDNA 4”架构的Radeon RX 9000系列显卡,但发售时间定在今年3月。AMD公司副总裁兼客户渠道业务总经理David McAfee对此做
    的头像 发表于 01-23 17:48 1090次阅读