0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPU微架构及生态研究框架(2023)

架构师技术联盟 来源:架构师技术联盟 2023-07-09 10:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

GPU的核心竞争力在于架构等因素决定的性能先进性和计算生态壁垒。国内GPU厂商纷纷大力投入研发快速迭代架构,推动产业开放构建自主生态,加速追赶全球头部企业。国产替代需求持续释放叠加国际局势不确定性加剧,AI&数据中心、智能汽车、游戏等GPU需求有望高增,国产GPU迎来发展黄金期,我们看好国产GPU公司的发展与投资机遇。

第一,我们从性能和生态2个维度构建了GPU完整的研究体系。1)性能:决定GPU是否“高效”,其中微架构/制程是影响GPU性能的核心要素。2)生态:CUDA构筑通用计算坚固壁垒。

第二,提出在评估GPU性能的指标的重要性上:微架构、制程、流处理器数量、核心频率对GPU性能影响较大。我们详细梳理了GPU的微架构、制程、显存容量/位宽/带宽/频率、核心频率等各类性能参数及重要性程度,并利用“核心数*核心频率*2”公式对性能算力进行量化,揭示可用3DMark、MLPerf 等GPU软件跑分进行相关性能测试评估。

第三,详细拆解了NVIDIA Fermi和Hopper两大典型微架构的具体硬件实现,在顶点处理、光栅化计算、纹理贴图、像素处理的图形渲染流水线上对Fermi架构进行了拆分;在指令接收、调度、分配、计算执行的通用计算流水线上对Hopper架构进行了简单易懂的描述,并指明更多、更专、更智能等未来架构升级迭代的方向。

第四,明晰了生态是构建通用计算壁垒的基石。提出GPU研发难度在图形渲染硬件和通用计算软件生态层面,在IP、软件栈方面研发门槛较高,需要较长的积累,先发者优势明显。CUDA生态从2006年推出至今,经过不断发展完善,几乎已在行业生态内处于垄断地位。

第五,深度复盘Nvidia/AMD(ATI)的产品迭代和竞争发展史,通过对NVIDIA长期保持领先和AMD(ATI)反超进行总结得出结论:架构创新升级和新兴领域前瞻探索是领跑GPU行业的关键。

第六,梳理和测算了国内GPU在AI&数据中心、智能汽车、游戏行业的市场空间和发展趋势。

以下为报告原文,节选部分内容,更多内容请参看原报告“GPU研究框架(2023)”,以及“服务器基础知识全解(终极版)-182页PPT”,“服务器基础知识全解(终极版)-182页PDF”。


607bd42c-1ded-11ee-962d-dac502259ad0.png

60c56b32-1ded-11ee-962d-dac502259ad0.png

61e55220-1ded-11ee-962d-dac502259ad0.png

625485e6-1ded-11ee-962d-dac502259ad0.png

62aef526-1ded-11ee-962d-dac502259ad0.png

62d046cc-1ded-11ee-962d-dac502259ad0.png

6329c7e2-1ded-11ee-962d-dac502259ad0.png

63b6c840-1ded-11ee-962d-dac502259ad0.png

641ce6e8-1ded-11ee-962d-dac502259ad0.png

646b5800-1ded-11ee-962d-dac502259ad0.png

64e791ea-1ded-11ee-962d-dac502259ad0.png

6504cbde-1ded-11ee-962d-dac502259ad0.png

65379a5a-1ded-11ee-962d-dac502259ad0.png

656cbc4e-1ded-11ee-962d-dac502259ad0.png

65bd848a-1ded-11ee-962d-dac502259ad0.png

66344444-1ded-11ee-962d-dac502259ad0.png

66acc202-1ded-11ee-962d-dac502259ad0.png

6716a546-1ded-11ee-962d-dac502259ad0.png

6744b7ba-1ded-11ee-962d-dac502259ad0.png

67a659a2-1ded-11ee-962d-dac502259ad0.png

67dee434-1ded-11ee-962d-dac502259ad0.png

680e5462-1ded-11ee-962d-dac502259ad0.png

6874b6b2-1ded-11ee-962d-dac502259ad0.png

690c3212-1ded-11ee-962d-dac502259ad0.png

69814a48-1ded-11ee-962d-dac502259ad0.png

69de2628-1ded-11ee-962d-dac502259ad0.png

6a1329cc-1ded-11ee-962d-dac502259ad0.png

6a7a779e-1ded-11ee-962d-dac502259ad0.png

6b03de8a-1ded-11ee-962d-dac502259ad0.png

6b43685c-1ded-11ee-962d-dac502259ad0.png

6b7dced4-1ded-11ee-962d-dac502259ad0.png

6bc97780-1ded-11ee-962d-dac502259ad0.png

6c2c9a90-1ded-11ee-962d-dac502259ad0.png

6c6d063e-1ded-11ee-962d-dac502259ad0.png

6c89631a-1ded-11ee-962d-dac502259ad0.png

6cc9e322-1ded-11ee-962d-dac502259ad0.png

6d04e76a-1ded-11ee-962d-dac502259ad0.png

6d721326-1ded-11ee-962d-dac502259ad0.png

6de6331e-1ded-11ee-962d-dac502259ad0.png

6e1d5308-1ded-11ee-962d-dac502259ad0.png

6e4ec212-1ded-11ee-962d-dac502259ad0.png

6e983dc0-1ded-11ee-962d-dac502259ad0.png

6eff89d0-1ded-11ee-962d-dac502259ad0.png

6f720e38-1ded-11ee-962d-dac502259ad0.png

6fa62a38-1ded-11ee-962d-dac502259ad0.png

6fe7effe-1ded-11ee-962d-dac502259ad0.png

702e26f4-1ded-11ee-962d-dac502259ad0.png

7058dfca-1ded-11ee-962d-dac502259ad0.png

70d5eff6-1ded-11ee-962d-dac502259ad0.png

70fd79cc-1ded-11ee-962d-dac502259ad0.png

以上内容节选部分内容,更多内容请参看原报告“GPU研究框架(2023)”,以及“服务器基础知识全解(终极版)-182页PPT”,“服务器基础知识全解(终极版)-182页PDF”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134420
  • 智能汽车
    +关注

    关注

    30

    文章

    3230

    浏览量

    109134
  • 微架构
    +关注

    关注

    0

    文章

    22

    浏览量

    7304

原文标题:GPU微架构及生态研究框架(2023)

文章出处:【微信号:架构师技术联盟,微信公众号:架构师技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    瑞芯这几年为啥那么火?

    还支持8K视频编解码。 异构计算架构:瑞芯很多CPU采用“CPU+GPU+NPU”异构计算架构,例如旗舰芯片RK3588集成8核CPU、高性能GP
    发表于 10-20 15:50

    景嘉JM1100生态合作推介会北京站圆满落幕

    10 月 16 日,以 “自主创芯 生态共建” 为主题的景嘉 JM1100 生态合作推介会第二站在北京圆满落幕。大会汇聚专业协会与行业伙伴,围绕 JM1100 技术落地、场景应用及生态
    的头像 发表于 10-18 11:41 1264次阅读

    如何看懂GPU架构?一分钟带你了解GPU参数指标

    GPU架构参数如CUDA核心数、显存带宽、TensorTFLOPS、互联方式等,并非“冰冷的数字”,而是直接关系设备能否满足需求、如何发挥最大价值、是否避免资源浪费等问题的核心要素。本篇文章将全面
    的头像 发表于 10-09 09:28 564次阅读
    如何看懂<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>?一分钟带你了解<b class='flag-5'>GPU</b>参数指标

    景嘉JM1100生态合作推介会长沙站圆满结束

    近日,以 “自主创芯 生态共建” 为主题的景嘉JM1100 生态合作推介会(长沙站)圆满结束。本次推介会汇聚了产业链各级领导、知名学者以及上下游企业代表,大家围绕景嘉自主全新一代
    的头像 发表于 09-16 17:53 1409次阅读

    适应边缘AI全新时代的GPU架构

    电子发烧友网站提供《适应边缘AI全新时代的GPU架构.pdf》资料免费下载
    发表于 09-15 16:42 36次下载

    双重驱动的新型直线电机研究

    摘罢:大行程、高精度,同时易于小型化的移动机构是先进制造业等领域要解决的关键问题之一,综述了现有宏/双重驱动机构和直线超声电机的研究进展和存在问题,提出了一种宏双重驱动新型直线压电电机,使其既能
    发表于 06-24 14:17

    【「算力芯片 | 高性能 CPU/GPU/NPU 架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知识,但该部分知识比较晦涩难懂,或许是由于我一
    发表于 06-18 19:31

    GPU架构深度解析

    GPU架构深度解析从图形处理到通用计算的进化之路图形处理单元(GPU),作为现代计算机中不可或缺的一部分,已经从最初的图形渲染专用处理器,发展成为强大的并行计算引擎,广泛应用于人工智能、科学计算
    的头像 发表于 05-30 10:36 1215次阅读
    <b class='flag-5'>GPU</b><b class='flag-5'>架构</b>深度解析

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP 核,凭借其异构计算架构、能效优化和生态协同,
    的头像 发表于 05-29 10:12 2969次阅读

    iTOP-3588S开发板四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    性能强 iTOP-3588S开发板采用瑞芯RK3588S处理器,是全新一代AloT高端应用芯片,搭载八核64位CPU,四核Cortex-A76和四核Cortex-A55架构主频高达2.4GHZ
    发表于 05-15 10:36

    iTOP-3588开发板采用瑞芯RK3588处理器四核心架构GPU内置独立NPU强大的视频编解码

    架构,主频高达2.4GHz。 四核心架构GPU 集成Mali G610 MP4四核GPU、支持OpenGLES 1.1.2.0、 3.2, OpenCL 2.2和Vulkan1.2。带
    发表于 04-09 16:09

    微服务器架构几种典型的基础框架,你了解吗?

    SpringCloud、Dubbo、Dropwizard、Akka等是常见微服务框架。SpringCloud基于SpringBoot,生态丰富;Dropwizard轻量且继承SpringBoot优点
    的头像 发表于 03-04 11:05 782次阅读

    芯原发布新一代Vitality架构GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架构的图形处理器(GPU)IP系列。这一新一代GPU架构以其卓越的计算性能和广泛的应用领域,吸引了业界的广泛关注。 Vitality
    的头像 发表于 12-24 10:55 1279次阅读

    华为推动中国人工智能框架生态高速发展

    近日,昇思人工智能框架峰会在北京中关村国际创新中心召开,本次大会以“创新源动力,框架新选择”为主题,由昇思MindSpore开源社区、中国人工智能学会及AITISA联合主办,旨在汇聚AI产业界、学术界力量,共建人工智能框架开源
    的头像 发表于 12-17 11:06 1172次阅读

    名单公布!【书籍评测活动NO.53】鸿蒙操作系统设计原理与架构

    呈现鸿蒙系统的原理与架构。 有利于纠正研究者、学生、开发者和行业从业者对鸿蒙技术理解的偏差,建立一个更好的鸿蒙生态环境。 整体概述:HarmonyOS 的基本设计理念 计算机硬件厂商需要按照操作系统
    发表于 12-16 15:10