0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

采用全新的7nm架构,AMD RDNA架构的解析

独爱72H 来源:中关村在线 作者:中关村在线 2019-12-10 17:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(文章来源:中关村在线)

随着AMD的全新7nm制程工艺的RDNA架构推出,代表着AMD在未来的GPU市场上将有一番大作为,在过去的几代中,AMD的GPU已经利用了很久的基于GCN架构的计算单元。GCN多年来一直很好地服务于AMD,并且非常适合各种工作负载,但是对于Radeon RX 5700系列和Navi核心,AMD的GCN架构已经不能继续满足了,因此他们推出了全新的RDNA(Radeon DNA)架构。

RDNA架构采用台积电的7nm制程工艺,GDDR6显存,支持PCI Express 4.0接口。GPU还采用了新的Radeon Media和Radeon Display引擎,以更好地满足流媒体和内容创作者的需求,并引入一系列新的显示技术。

Navi核心中的新COMPUTE UNIT(CU单元)设计具有多级缓存层次结构和简化的图形管道,不仅可以提高每时钟性能,还可以提高时钟频率。新的CU提供双倍的GCN指令速率,并且具有两倍的标量单位数和调度程序数。通过资源池,两个CU可以协调并充当工作组处理器。例如,64个线程可以分组为两个Wave32指令,并在单个时钟中执行。CU的灵活性和集中资源的能力提高了单线程性能,GPU利用率和效率。

Navi还具有新的缓存层次结构。AMD为其增加了一个新的L1缓存,并将L0缓存的负载带宽加倍到ALU。新的缓存层次结构减少了每个级别的缓存延迟,并提高了有效带宽。

Navi中的DCC(Delta Color Compression,增强色彩压缩)算法也得到了改进,并且也可用于缓存子系统的更广泛部分。使用Navi,着色器现在可以读取和写入压缩的颜色数据。新的显示单元还可以读取帧缓冲器中的压缩数据,而无需先对其进行解压缩。最终结果是整个GPU的有效带宽更高。

Navi核心中的整个图形管道也已得到改进,可提高效率,实现更好的每时钟性能,并且GPU还具有更高效的时钟门控功能,可提高整体电源效率。相对于GCN,RDNA提供超过50%的每瓦性能提升和25%更好的整体性能提升。据AMD称,超过50%的改进来自架构优化; GPU的7nm工艺和频率改进也得到了提升。

根据AMD的说法,Navi的40 CU设计性能比Vega64提高了约14%,功耗降低了23%。并且具有小得多的芯片尺寸。(Navi 10的面积为251平方毫米,作为对比Vega 64上面的那颗为495平方毫米。)

最后,我们来看看采用完整完整的RDNA架构的GPU核心里面都有什么呢?40个RDNA计算单元,包括80个标量处理器,2560个流处理器和160个64位双线性滤波器单元。GPU具有4MB L2缓存,512K L1和双倍VSL0负载带宽,支持整个芯片的DCC(Delta Color Compression,增强色彩压缩)。简化的图形引擎具有新的几何引擎,64像素单位和4个异步计算引擎。

而在未来,当RDNA架构的显卡核心从251mm2扩大、乃至翻倍后,带来更多的流处理器和晶体管,想必会让AMD在高端乃至旗舰市场上大发神威。而在入门级显卡上,RDNA架构则拥有较GCN架构更好的能耗比,能够更好的控制功耗与发热,移植到移动端上也非常有可能,从而打破竞争对手在移动端显卡上的一家独霸!

(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5708

    浏览量

    140426
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11331

    浏览量

    225908
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    STR71xF ARM7TDMI™ 32位MCU深度解析:特性、架构与应用指南

    STR71xF ARM7TDMI™ 32位MCU深度解析:特性、架构与应用指南 在电子工程师的日常工作中,选择一款合适的微控制器(MCU)至关重要。ST公司的STR71xF系列ARM7
    的头像 发表于 04-17 15:15 205次阅读

    深入剖析AT91FR4081微控制器:功能、架构与应用全解析

    的处理器内核 AT91FR4081采用ARM7TDMI ARM® Thumb®处理器核心,具备高性能32位RISC架构和高密度16位指令集,在
    的头像 发表于 04-06 10:40 303次阅读

    2022全新版!Java分布式架构设计与开发实战(完结)

    2022全新版!Java分布式架构设计与开发实战(完结) 分库分表实战:Java海量数据存储架构设计 在现代互联网应用中,随着业务规模的指数级增长,数据库性能瓶颈已成为制约系统发展的关键因素。当单
    发表于 03-30 15:20

    如何突破AI存储墙?深度解析ONFI 6.0高速接口与Chiplet解耦架构

    Timing Group 及SCA(独立指令地址)架构,具备基于固件的训练能力,能够完美适配全球主流厂商的存储颗粒。 3. 技术规格参数核心指标技术参数行业价值 最高速率4800Mbps (ONFI
    发表于 01-29 17:32

    Windows平台EtherCAT实时控制:从抖动抑制到虚拟化架构解析

    Windows平台EtherCAT实时控制:从抖动抑制到虚拟化架构解析
    的头像 发表于 01-29 15:26 426次阅读
    Windows平台EtherCAT实时控制:从抖动抑制到虚拟化<b class='flag-5'>架构</b><b class='flag-5'>解析</b>

    AMD UltraScale架构:高性能FPGA与SoC的技术剖析

    AMD UltraScale架构:高性能FPGA与SoC的技术剖析 在当今的电子设计领域,高性能FPGA和MPSoC/RFSoC的需求日益增长。AMD的UltraScale架构凭借其创
    的头像 发表于 12-15 14:35 748次阅读

    采用Prefetch+Cache架构有什么优势?

    我看官方说,采用Prefetch+Cache架构同频CoreMark 计算力/功耗比超越同类产品,这优势就是低功耗么?要是具体芯片比较的话,应该怎么比?
    发表于 12-11 07:35

    商汤科技正式发布并开源全新多模态模型架构NEO

    商汤科技正式发布并开源了与南洋理工大学S-Lab合作研发的全新多模态模型架构 —— NEO,为日日新SenseNova 多模态模型奠定了新一代架构的基石。
    的头像 发表于 12-08 11:19 1169次阅读
    商汤科技正式发布并开源<b class='flag-5'>全新</b>多模态模型<b class='flag-5'>架构</b>NEO

    芯源MCU架构是不是基本都是ARM架构?还有其他的架构吗?

    芯源MCU架构是不是基本都是ARM架构?还有其他的架构吗?
    发表于 11-20 06:21

    国产AI芯片真能扛住“算力内卷”?海思昇腾的这波操作藏了多少细节?

    最近行业都在说“算力是AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思昇腾910B,实测下来有点超出预期——7nm工艺下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    发表于 10-27 13:12

    五大电磁频谱管理系统:原理、架构与应用全景解析

    五大电磁频谱管理系统:原理、架构与应用全景解析
    的头像 发表于 09-26 10:21 682次阅读
    五大电磁频谱管理系统:原理、<b class='flag-5'>架构</b>与应用全景<b class='flag-5'>解析</b>

    AMD 7nm Versal系列器件NoC的使用及注意事项

    AMD 7nm Versal系列器件引入了可编程片上网络(NoC, Network on Chip),这是一个硬化的、高带宽、低延迟互连结构,旨在实现可编程逻辑(PL)、处理系统(PS)、AI引擎(AIE)、DDR控制器(DDRMC)、CPM(PCIe/CXL)等模块之间
    的头像 发表于 09-19 15:15 3138次阅读
    <b class='flag-5'>AMD</b> <b class='flag-5'>7nm</b> Versal系列器件NoC的使用及注意事项

    适应边缘AI全新时代的GPU架构

    电子发烧友网站提供《适应边缘AI全新时代的GPU架构.pdf》资料免费下载
    发表于 09-15 16:42 47次下载

    基于AMD Versal器件实现PCIe5 DMA功能

    Versal是AMD 7nm的SoC高端器件,不仅拥有比16nm性能更强的逻辑性能,并且其PS系统中的CPM PCIe也较上一代MPSoC PS硬核PCIe单元强大得多。本节将基于AMD
    的头像 发表于 06-19 09:44 2026次阅读
    基于<b class='flag-5'>AMD</b> Versal器件实现PCIe5 DMA功能

    GPU架构深度解析

    GPU架构深度解析从图形处理到通用计算的进化之路图形处理单元(GPU),作为现代计算机中不可或缺的一部分,已经从最初的图形渲染专用处理器,发展成为强大的并行计算引擎,广泛应用于人工智能、科学计算
    的头像 发表于 05-30 10:36 2027次阅读
    GPU<b class='flag-5'>架构</b>深度<b class='flag-5'>解析</b>