0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPU微架构及生态研究框架(2023)

架构师技术联盟 来源:架构师技术联盟 2023-07-09 10:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

GPU的核心竞争力在于架构等因素决定的性能先进性和计算生态壁垒。国内GPU厂商纷纷大力投入研发快速迭代架构,推动产业开放构建自主生态,加速追赶全球头部企业。国产替代需求持续释放叠加国际局势不确定性加剧,AI&数据中心、智能汽车、游戏等GPU需求有望高增,国产GPU迎来发展黄金期,我们看好国产GPU公司的发展与投资机遇。

第一,我们从性能和生态2个维度构建了GPU完整的研究体系。1)性能:决定GPU是否“高效”,其中微架构/制程是影响GPU性能的核心要素。2)生态:CUDA构筑通用计算坚固壁垒。

第二,提出在评估GPU性能的指标的重要性上:微架构、制程、流处理器数量、核心频率对GPU性能影响较大。我们详细梳理了GPU的微架构、制程、显存容量/位宽/带宽/频率、核心频率等各类性能参数及重要性程度,并利用“核心数*核心频率*2”公式对性能算力进行量化,揭示可用3DMark、MLPerf 等GPU软件跑分进行相关性能测试评估。

第三,详细拆解了NVIDIA Fermi和Hopper两大典型微架构的具体硬件实现,在顶点处理、光栅化计算、纹理贴图、像素处理的图形渲染流水线上对Fermi架构进行了拆分;在指令接收、调度、分配、计算执行的通用计算流水线上对Hopper架构进行了简单易懂的描述,并指明更多、更专、更智能等未来架构升级迭代的方向。

第四,明晰了生态是构建通用计算壁垒的基石。提出GPU研发难度在图形渲染硬件和通用计算软件生态层面,在IP、软件栈方面研发门槛较高,需要较长的积累,先发者优势明显。CUDA生态从2006年推出至今,经过不断发展完善,几乎已在行业生态内处于垄断地位。

第五,深度复盘Nvidia/AMD(ATI)的产品迭代和竞争发展史,通过对NVIDIA长期保持领先和AMD(ATI)反超进行总结得出结论:架构创新升级和新兴领域前瞻探索是领跑GPU行业的关键。

第六,梳理和测算了国内GPU在AI&数据中心、智能汽车、游戏行业的市场空间和发展趋势。

以下为报告原文,节选部分内容,更多内容请参看原报告“GPU研究框架(2023)”,以及“服务器基础知识全解(终极版)-182页PPT”,“服务器基础知识全解(终极版)-182页PDF”。


607bd42c-1ded-11ee-962d-dac502259ad0.png

60c56b32-1ded-11ee-962d-dac502259ad0.png

61e55220-1ded-11ee-962d-dac502259ad0.png

625485e6-1ded-11ee-962d-dac502259ad0.png

62aef526-1ded-11ee-962d-dac502259ad0.png

62d046cc-1ded-11ee-962d-dac502259ad0.png

6329c7e2-1ded-11ee-962d-dac502259ad0.png

63b6c840-1ded-11ee-962d-dac502259ad0.png

641ce6e8-1ded-11ee-962d-dac502259ad0.png

646b5800-1ded-11ee-962d-dac502259ad0.png

64e791ea-1ded-11ee-962d-dac502259ad0.png

6504cbde-1ded-11ee-962d-dac502259ad0.png

65379a5a-1ded-11ee-962d-dac502259ad0.png

656cbc4e-1ded-11ee-962d-dac502259ad0.png

65bd848a-1ded-11ee-962d-dac502259ad0.png

66344444-1ded-11ee-962d-dac502259ad0.png

66acc202-1ded-11ee-962d-dac502259ad0.png

6716a546-1ded-11ee-962d-dac502259ad0.png

6744b7ba-1ded-11ee-962d-dac502259ad0.png

67a659a2-1ded-11ee-962d-dac502259ad0.png

67dee434-1ded-11ee-962d-dac502259ad0.png

680e5462-1ded-11ee-962d-dac502259ad0.png

6874b6b2-1ded-11ee-962d-dac502259ad0.png

690c3212-1ded-11ee-962d-dac502259ad0.png

69814a48-1ded-11ee-962d-dac502259ad0.png

69de2628-1ded-11ee-962d-dac502259ad0.png

6a1329cc-1ded-11ee-962d-dac502259ad0.png

6a7a779e-1ded-11ee-962d-dac502259ad0.png

6b03de8a-1ded-11ee-962d-dac502259ad0.png

6b43685c-1ded-11ee-962d-dac502259ad0.png

6b7dced4-1ded-11ee-962d-dac502259ad0.png

6bc97780-1ded-11ee-962d-dac502259ad0.png

6c2c9a90-1ded-11ee-962d-dac502259ad0.png

6c6d063e-1ded-11ee-962d-dac502259ad0.png

6c89631a-1ded-11ee-962d-dac502259ad0.png

6cc9e322-1ded-11ee-962d-dac502259ad0.png

6d04e76a-1ded-11ee-962d-dac502259ad0.png

6d721326-1ded-11ee-962d-dac502259ad0.png

6de6331e-1ded-11ee-962d-dac502259ad0.png

6e1d5308-1ded-11ee-962d-dac502259ad0.png

6e4ec212-1ded-11ee-962d-dac502259ad0.png

6e983dc0-1ded-11ee-962d-dac502259ad0.png

6eff89d0-1ded-11ee-962d-dac502259ad0.png

6f720e38-1ded-11ee-962d-dac502259ad0.png

6fa62a38-1ded-11ee-962d-dac502259ad0.png

6fe7effe-1ded-11ee-962d-dac502259ad0.png

702e26f4-1ded-11ee-962d-dac502259ad0.png

7058dfca-1ded-11ee-962d-dac502259ad0.png

70d5eff6-1ded-11ee-962d-dac502259ad0.png

70fd79cc-1ded-11ee-962d-dac502259ad0.png

以上内容节选部分内容,更多内容请参看原报告“GPU研究框架(2023)”,以及“服务器基础知识全解(终极版)-182页PPT”,“服务器基础知识全解(终极版)-182页PDF”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136060
  • 智能汽车
    +关注

    关注

    30

    文章

    3311

    浏览量

    109678
  • 微架构
    +关注

    关注

    0

    文章

    22

    浏览量

    7347

原文标题:GPU微架构及生态研究框架(2023)

文章出处:【微信号:架构师技术联盟,微信公众号:架构师技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    内存要取代GPU?HBM之父警告:以英伟达GPU为核心的架构要被颠覆

    主板和CPU成为了主角。   而最近“HBM之父”金正浩教授也语出惊人,提出未来内存将成为主角:“GPU和CPU将会被集成到内存(HBM和HBF)里,沦为内存中的一个组件”。   倒反天罡,在内存里装GPU?   目前AI计算的架构
    的头像 发表于 04-03 09:54 6917次阅读
    内存要取代<b class='flag-5'>GPU</b>?HBM之父警告:以英伟达<b class='flag-5'>GPU</b>为核心的<b class='flag-5'>架构</b>要被颠覆

    电网集中式架构vs分布式架构:设计差异与选型依据

    电网作为整合“源、储、荷、网”的新型能源系统,其架构设计直接决定系统的运行效率、可靠性、扩展性与经济性,是电网规划建设的核心环节。在电网主流
    的头像 发表于 04-02 11:40 420次阅读
    <b class='flag-5'>微</b>电网集中式<b class='flag-5'>架构</b>vs分布式<b class='flag-5'>架构</b>:设计差异与选型依据

    沐曦股份GPU产品正式接入华佗开源生态

    沐曦股份坚持“自主创新与开放兼容”双轨战略,以自研MXMACA软件栈为核心,构建硬件与应用的桥梁,并承载开源核心使命。该栈于2025年2月正式开源,致力于打造开放的GPU编程接口标准,大幅降低开发门槛,有效破解跨平台兼容难题,驱动AI算力生态协同创新。
    的头像 发表于 03-16 14:40 1367次阅读
    沐曦股份<b class='flag-5'>GPU</b>产品正式接入华佗开源<b class='flag-5'>生态</b>

    OrangePi RV2 深度技术评测:RISC-V AI融合架构的先行者

    丰富接口,定价229元起。本文将从第三方技术视角,全面剖析其硬件规格、性能表现、软件生态、适用场景及潜在局限,帮助开发者与决策者客观评估此产品。 1.核心硬件规格 1.1 SoC:KY X1 架构
    发表于 03-03 20:19

    景嘉JM1100生态合作推介会南京站圆满收官

    当秦淮风月邂逅 “中国芯” 力量,当紫金山色映照生态共建之路,一场聚焦国产 GPU 创新的行业盛会圆满落幕!12 月 4 日,2025 景嘉 JM1100 生态推介会收官之战 ——
    的头像 发表于 12-11 10:40 728次阅读

    瑞芯这几年为啥那么火?

    还支持8K视频编解码。 异构计算架构:瑞芯很多CPU采用“CPU+GPU+NPU”异构计算架构,例如旗舰芯片RK3588集成8核CPU、高性能GP
    发表于 10-20 15:50

    景嘉JM1100生态合作推介会北京站圆满落幕

    10 月 16 日,以 “自主创芯 生态共建” 为主题的景嘉 JM1100 生态合作推介会第二站在北京圆满落幕。大会汇聚专业协会与行业伙伴,围绕 JM1100 技术落地、场景应用及生态
    的头像 发表于 10-18 11:41 1816次阅读

    如何看懂GPU架构?一分钟带你了解GPU参数指标

    GPU架构参数如CUDA核心数、显存带宽、TensorTFLOPS、互联方式等,并非“冰冷的数字”,而是直接关系设备能否满足需求、如何发挥最大价值、是否避免资源浪费等问题的核心要素。本篇文章将全面
    的头像 发表于 10-09 09:28 1523次阅读
    如何看懂<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>?一分钟带你了解<b class='flag-5'>GPU</b>参数指标

    景嘉JM1100生态合作推介会长沙站圆满结束

    近日,以 “自主创芯 生态共建” 为主题的景嘉JM1100 生态合作推介会(长沙站)圆满结束。本次推介会汇聚了产业链各级领导、知名学者以及上下游企业代表,大家围绕景嘉自主全新一代
    的头像 发表于 09-16 17:53 1949次阅读

    适应边缘AI全新时代的GPU架构

    电子发烧友网站提供《适应边缘AI全新时代的GPU架构.pdf》资料免费下载
    发表于 09-15 16:42 47次下载

    双重驱动的新型直线电机研究

    摘罢:大行程、高精度,同时易于小型化的移动机构是先进制造业等领域要解决的关键问题之一,综述了现有宏/双重驱动机构和直线超声电机的研究进展和存在问题,提出了一种宏双重驱动新型直线压电电机,使其既能
    发表于 06-24 14:17

    【「算力芯片 | 高性能 CPU/GPU/NPU 架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知识,但该部分知识比较晦涩难懂,或许是由于我一
    发表于 06-18 19:31

    GPU架构深度解析

    GPU架构深度解析从图形处理到通用计算的进化之路图形处理单元(GPU),作为现代计算机中不可或缺的一部分,已经从最初的图形渲染专用处理器,发展成为强大的并行计算引擎,广泛应用于人工智能、科学计算
    的头像 发表于 05-30 10:36 2017次阅读
    <b class='flag-5'>GPU</b><b class='flag-5'>架构</b>深度解析

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP 核,凭借其异构计算架构、能效优化和生态协同,
    的头像 发表于 05-29 10:12 4904次阅读

    iTOP-3588S开发板四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    性能强 iTOP-3588S开发板采用瑞芯RK3588S处理器,是全新一代AloT高端应用芯片,搭载八核64位CPU,四核Cortex-A76和四核Cortex-A55架构主频高达2.4GHZ
    发表于 05-15 10:36