0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RX 6800与RDNA 2架构的设计与特性

lhl545545 来源:快科技 作者:上方文Q 2020-11-23 09:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

RX 6800正式解禁上市的时候,我们曾经解析过其幕后的RDNA 2架构的设计与特性。现在,国外大神又根据RNDA 2的内核图,绘制了各个模块的分布。

RDNA 2架构的研发由AMD Radeon技术事业部工程研发高级副总裁David Wang(王启尚)主导,大名鼎鼎的GCN架构就是他的杰作。

王启尚早年供职于ATI,后随着收购加入AMD,前些年曾一度离开AMD前往Synaptics新思科技。

2018年,王启尚在苏姿丰的邀请下回归AMD,再次出手不凡,RDNA 2架构一举让AMD显卡回到了与NVIDIA在高端旗鼓相当的地位。

正是在王启尚的领导下,RDNA 2架构历时16个月研发完成,顺利实现了当初的设计目标:性能提升1倍、能效提升至少50%、完整支持DX12U和光线追踪等技术特性。

AMD曾明确表示,RNA 2架构的设计借鉴了Zen CPU架构的先进思想,还有报道称Zen开发团队直接介入了RDNA 2的设计,而在RDNA 2架构的布局上,也明显能看到Zen的影子,确切地说是Zen 2/3。

RDNA 2架构共有80组计算单元,分为两组,旁边则是两组各64MB容量的Infinity Cache无限缓存,其作用有些类似三级缓存,是不是像极了Zen 2/3上的两组CCX模块加两组三级缓存的设计?

RDNA 2架构的大核心Big Navi(Nvai 21)采用台积电7nm工艺制造,集成晶体管268亿个,核心面积519平方毫米,相比之下上代7nm Navi 10集成103亿个晶体管、核心面积251平方毫米。

也就是说,Navi 21核心在晶体管增加1.61倍的情况下,面积只增加了1.07倍,就实现了计算规模翻番、性能提升1倍以上、能效提升50%。

以下是RDNA 2不同模块的简介:

红色:WGP,也就是Work Group Processor(工作组处理器),由两个计算单元(CU)组成,共计40组,包含5120个ALU单元,也就是常说的流处理器。

蓝色:Infinity Cach无限缓存,共有两组,每组容量64MB,总容量128MB。

灰色:Infinity Fabric互连总线、无限缓存控制器

青色:二级缓存,每组256KB,共有16组,总容量4MB。

橘色:指令前端、几何处理器(存疑)。

黄色:ROP光栅单元,每组8个,共有128个。

粉色:光栅着色器、原语单元。

橙色:GDDR6显存控制器物理层,每组32-bit,总位宽256-bit。

绿色:XGMI/Infinity连接控制器、PCIe控制器、显示控制器、编解码控制器等。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5647

    浏览量

    139009
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109073
  • RX
    RX
    +关注

    关注

    0

    文章

    64

    浏览量

    19133
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    上能电气储能系统的十大核心网功能(2

    近期国内和欧洲密切出台网技术相关政策法规,再次点燃了网技术的全球关注热度。上能电气以第二代增强混动网技术的“刚性支撑”和“柔性调节”特性曲线,勾勒出基于新能源和电力电子为主体的新
    的头像 发表于 11-25 18:15 1502次阅读

    架构全覆盖,德思特ALifecom基站模拟器精准赋能eSIM测试

    面对eSIM在M2M、Consumer和IoT三大架构下的测试挑战,德思特ALifecom基站模拟器提供完整解决方案。支持核心网参数配置与多场景eSIM部署验证,助力车载通信与物联网设备实现精准、高效的连接测试。
    的头像 发表于 11-20 17:40 4651次阅读
    三<b class='flag-5'>架构</b>全覆盖,德思特ALifecom基站模拟器精准赋能eSIM测试

    基于蜂鸟E203架构的指令集K扩展

    向量操作指令,例如向量加法、向量乘法等。 在蜂鸟E203架构中,可以添加K扩展指令集,以处理大规模的数据集,可以添加以下指令: 1.VADD:向量加法指令,将两个向量相加并存储结果到一个向量寄存器中
    发表于 10-21 09:38

    迅为Hi3403V610开发板海思Cortex-A55架构核心板卡

    迅为电子重磅推出基于海思Hi3403处理器的高性能核心板,采用先进的四核Cortex-A55架构,主频高达1.4GHz,以强劲算力、超凡能效比与卓越的图像处理能力,为千行百业的智能化升级注入核心动力。无论是智能视觉、工业互联,还是AIoT边缘计算,它都能轻松驾驭,助您畅快开发!
    的头像 发表于 09-30 14:18 370次阅读
    迅为Hi3403V610开发板海思Cortex-A55<b class='flag-5'>架构</b>核心板卡

    RISC-V架构CPU的RAS解决方案

    RISC-V架构以追赶者的姿态在多个应用领域与X86架构和ARM架构展开竞争。在服务器应用领域,RISC-V架构正在重新定义服务器芯片领域必备的安全、虚拟化和RAS等规格和规范。服务器
    的头像 发表于 06-06 17:03 1564次阅读
    RISC-V<b class='flag-5'>架构</b>CPU的RAS解决方案

    AI人工智能崛起:高性能MOSFET如何重塑能效架构

    本文将聚焦AI对数据中心架构的影响,以及这些变化对服务器和机架技术的意义。具体而言,我们将探讨转向48V架构如何提升数据中心能效,以及高性能硅基MOSFET如何应用于服务器、机架及相关设备以支持这一架构
    的头像 发表于 05-06 14:03 513次阅读
    AI人工智能崛起:高性能MOSFET如何重塑能效<b class='flag-5'>架构</b>

    《FDTD Solutions仿真全面教程:超表面与光束操控的前沿探索》

    FDTD基础入门 FDTD基础入门 1、FDTD Solutions 求解物理问题的方法 1.1 FDTD与麦克斯韦方程 1.2 FDTD中的网格化 2、FDTD Solutions 特点与应用 3
    发表于 04-22 11:59

    如何在Linux内核5.18版本之后和64位架构中从内核空间调用ioctl?

    我尝试在最近的内核中重新构建以前版本 (4.19) 的 Linux 设备驱动程序,即嵌入式平台上的 6.1.22,ARM64 架构。 驱动程序管理 tty 设备。 当我调用类似于用户空间
    发表于 04-02 06:06

    专访AMD Jack Huynh:重新定义异构AI计算的行业标准,坚守以用户为核心的AI适配战略

    2025年2月28日,AMD在珠海正式发布基于新一代RDNA 4架构的Radeon RX 9070系列显卡,包含RX 9070 XT与
    的头像 发表于 03-06 12:28 832次阅读
    专访AMD Jack Huynh:重新定义异构AI计算的行业标准,坚守以用户为核心的AI适配战略

    专访AMD王启尚 从RDNA 4到FSR 4,AMD GPU技术创新引领行业新发展

    在近日于珠海举办的AMD新一代Radeon RX 9070系列显卡发布会后,AMD GPU技术与工程研发副总裁王启尚接受了我们的专访。在本次交谈中,他详细分享了RDNA 4架构的设计理念、FSR 4
    的头像 发表于 03-06 11:19 694次阅读
    专访AMD王启尚 从<b class='flag-5'>RDNA</b> 4到FSR 4,AMD GPU技术创新引领行业新发展

    专访AMD GPU教父王启尚:卓越的RDNA 4架构,造就新一代性价比王者显卡

    在今年CES大会上首次公布定位4K游戏的RadeonRX9070系列显卡之后,AMD于2月28日再次举办发布会并宣布了RadeonRX9070系列的技术细节与售价,其中RadeonRX9070首发
    的头像 发表于 03-06 10:21 859次阅读
    专访AMD GPU教父王启尚:卓越的<b class='flag-5'>RDNA</b> 4<b class='flag-5'>架构</b>,造就新一代性价比王者显卡

    Arm发布基于Armv9架构的Cortex-A320处理器

    边缘 AI 需要更卓越的计算性能、更强大的安全性,以及更出色的软件灵活性。随着软件愈发复杂化,Armv9 架构应运而生,以提供先进的机器学习 (ML) 和 AI 功能,并具备增强的安全特性。该架构现已在 Cortex-A3xx
    的头像 发表于 02-27 17:10 1152次阅读

    HC6800-EM3 V30原理图

    HC6800-EM3 V30原理图
    发表于 02-19 15:38 20次下载

    字节豆包大模型团队推出UltraMem稀疏架构

    字节跳动豆包大模型Foundation团队近期在稀疏模型架构领域取得了新突破,提出了一种名为UltraMem的新型架构。这一架构通过将计算和参数解耦,成功解决了模型推理过程中的访存问题,为大规模模型
    的头像 发表于 02-13 11:17 1060次阅读

    迅为RK3588与3588S开发板/核心板选型硬件的区别

    ,是全新一代AloT高端应用芯片,采用8nm LP制程,搭载八核64位CPU,四核Cortex-A76和四核Cortex-A55架构,主频高达2.4GHz,8GB内存,32GB EMMC。集成Mali
    发表于 12-20 15:40