0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPU技术、生态及算力分析

架构师技术联盟 来源:架构师技术联盟 2024-01-14 10:06 次阅读

本文来自“GPGPU研究框架及算力分析(2023)”,GPGPU的核心壁垒是高精度浮点计算及CUDA生态。从高精度浮点计算能力来看,国内GPU产品与国外产品的计算性能仍或有一代以上差距;在软件和生态层面与英伟达CUDA生态的差距则更为明显。

AI计算GPU领域,国内壁仞科技发布的BR100产品在FP32单精度计算性能上实现超越NVIDIA A100芯片,但是不支持FP64双精度计算;天数智芯推出的天垓100的FP32单精度计算性能实现超越A100芯片,但是在INT8整数计算性能方面却低于A100;海光推出的DCU实现了FP64双精度浮点计算,但是其性能为A100的60%左右,大概相当于其4年前水平。因此,从高精度浮点计算能力来看,国内GPU产品与国外产品的计算性能仍或有一代以上差距。

但是,GPU不仅在硬件上需要提升算力,软件层面对于GPU的应用和生态布局尤其重要,英伟达凭借CUDA构建生态壁垒占领全球GPU市场90%的份额。目前国内企业多采用开源的OpenCL进行自主生态建设,但这需要大量的时间进行布局;

对比AMD从2013年开始建设GPU生态,近10年时间后用于通用计算的ROCm开放式软件平台才逐步有影响力,且还是在兼容CUDA的基础上。因此我们认为国内厂商在软件和生态层面与英伟达CUDA生态的差距较计算性能更为明显。

虽然目前国内产品的计算性能和软件生态实力与国际厂商还有差距,但是,国内厂商依然在奋起直追,努力实现GPGPU的国产化突破。

长久来看,美国对中国高端GPU的禁售令反而给国产GPGPU和AI芯片厂商带来快速发展的机会。 短期来看,我们认为对高端通用计算GPU的禁令可能会影响英伟达和AMD的GPU产品在中国的销售,中国AI计算、超级计算和云计算产业进步受到一定的阻碍。可使用英伟达和AMD还没有被禁止的及国产厂商的中高计算性能CPU、GPU、ASIC芯片等替代。

长期来看,国产CPU、GPU、AI芯片厂商受益于庞大的国内市场,叠加国内信创市场带来国产化需求增量,我们预期国内AI芯片的国产化比例将显著提升,借此机会进行产品升级,逐渐达到国际先进水平,突破封锁。对于国内厂商,建议重点关注实现自主创新,打造自主生态体系,国内企业:

1)芯片:龙芯中科(国内PC CPU龙头,自主研发GPGPU产品)、海光信息(国内服务器CPU龙头,推出深度计算处理器DCU)、景嘉微(国内图形渲染GPU龙头)、寒武纪(国内ASIC芯片龙头)、澜起科技(国内服务器内存接口芯片龙头);

2)PCB:胜宏科技、兴森科技、沪电股份;

3)先进封装:通富微电、甬矽电子、长电科技、长川科技等。

4)海外企业:英伟达(全球GPU龙头)、AMD(全球CPU/GPU领先厂商)、英特尔(全球CPU龙头)、美光(全球存储芯片龙头)。

更多GPU内容请参考文章“全球GPU呈现“一超一强”竞争格局”,“2023年GPU显卡词条报告”,“HBM崛起:从GPU到CPU”,“英伟达GPU龙头稳固,国内逐步追赶(2023)”,“GPU微架构、性能指标、场景、生态链及竞争格局(2023)”,“AI芯片第一极:GPU性能、技术全面分析”,“2023年CPU&GPU天梯图(最新版)”,“主流国产GPU产品及规格概述(2023)”,“新型GPU云桌面发展白皮书”,“十大国产GPU产品及规格概述”等等。


65827ea4-b275-11ee-8b88-92fbcf53809c.png

65a36fe2-b275-11ee-8b88-92fbcf53809c.png

65c2a736-b275-11ee-8b88-92fbcf53809c.png

65dbc996-b275-11ee-8b88-92fbcf53809c.png

65e88d3e-b275-11ee-8b88-92fbcf53809c.png

6605f400-b275-11ee-8b88-92fbcf53809c.png

66212090-b275-11ee-8b88-92fbcf53809c.png

6659501e-b275-11ee-8b88-92fbcf53809c.png

66731d00-b275-11ee-8b88-92fbcf53809c.png

668e52e6-b275-11ee-8b88-92fbcf53809c.png

66a5243a-b275-11ee-8b88-92fbcf53809c.png

66a9ee8e-b275-11ee-8b88-92fbcf53809c.png

66bf7254-b275-11ee-8b88-92fbcf53809c.png

66ddf440-b275-11ee-8b88-92fbcf53809c.png

66f48e9e-b275-11ee-8b88-92fbcf53809c.png

67091648-b275-11ee-8b88-92fbcf53809c.png

670f50b2-b275-11ee-8b88-92fbcf53809c.png

67414bc6-b275-11ee-8b88-92fbcf53809c.png

6746694e-b275-11ee-8b88-92fbcf53809c.png

675dedda-b275-11ee-8b88-92fbcf53809c.png

6774b588-b275-11ee-8b88-92fbcf53809c.png

678f23b4-b275-11ee-8b88-92fbcf53809c.png

67abdee6-b275-11ee-8b88-92fbcf53809c.png

67c9f49e-b275-11ee-8b88-92fbcf53809c.png

67e77d66-b275-11ee-8b88-92fbcf53809c.png

67fd474a-b275-11ee-8b88-92fbcf53809c.png

681b0370-b275-11ee-8b88-92fbcf53809c.png

683e9a1a-b275-11ee-8b88-92fbcf53809c.png

68539708-b275-11ee-8b88-92fbcf53809c.png

6868194e-b275-11ee-8b88-92fbcf53809c.png

686e18d0-b275-11ee-8b88-92fbcf53809c.png

688bc1dc-b275-11ee-8b88-92fbcf53809c.png

689a3b68-b275-11ee-8b88-92fbcf53809c.png

68b182c8-b275-11ee-8b88-92fbcf53809c.png

68ccf152-b275-11ee-8b88-92fbcf53809c.png

68e11c5e-b275-11ee-8b88-92fbcf53809c.png

692d5ae2-b275-11ee-8b88-92fbcf53809c.png

697330bc-b275-11ee-8b88-92fbcf53809c.png

69cc8c0c-b275-11ee-8b88-92fbcf53809c.png

6a114892-b275-11ee-8b88-92fbcf53809c.png

6a8ffc1e-b275-11ee-8b88-92fbcf53809c.png

6aba52a2-b275-11ee-8b88-92fbcf53809c.png

6b58acfe-b275-11ee-8b88-92fbcf53809c.png

6b734be0-b275-11ee-8b88-92fbcf53809c.png

6b8fc766-b275-11ee-8b88-92fbcf53809c.png

6b96262e-b275-11ee-8b88-92fbcf53809c.png

6bab5e90-b275-11ee-8b88-92fbcf53809c.png

6bd49206-b275-11ee-8b88-92fbcf53809c.png

6c144fa4-b275-11ee-8b88-92fbcf53809c.png

6c546e22-b275-11ee-8b88-92fbcf53809c.png

6c64130e-b275-11ee-8b88-92fbcf53809c.png

6c7f7ee6-b275-11ee-8b88-92fbcf53809c.png

6cb1bbfe-b275-11ee-8b88-92fbcf53809c.png

6d0a99b8-b275-11ee-8b88-92fbcf53809c.png

6d3b0ae4-b275-11ee-8b88-92fbcf53809c.png

6da0a980-b275-11ee-8b88-92fbcf53809c.png

6e01f1d6-b275-11ee-8b88-92fbcf53809c.png

6e2de26e-b275-11ee-8b88-92fbcf53809c.png

6e73452a-b275-11ee-8b88-92fbcf53809c.png

6e8f0c42-b275-11ee-8b88-92fbcf53809c.png

6eb1aa40-b275-11ee-8b88-92fbcf53809c.png

6ed19ff8-b275-11ee-8b88-92fbcf53809c.png

6ef22bf6-b275-11ee-8b88-92fbcf53809c.png

6f172668-b275-11ee-8b88-92fbcf53809c.png

70efe434-b275-11ee-8b88-92fbcf53809c.png

710c54de-b275-11ee-8b88-92fbcf53809c.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4424

    浏览量

    126724
  • 英伟达
    +关注

    关注

    22

    文章

    3332

    浏览量

    87801
  • AI芯片
    +关注

    关注

    17

    文章

    1657

    浏览量

    34406

原文标题:GPU技术、生态及算力分析

文章出处:【微信号:架构师技术联盟,微信公众号:架构师技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    iBeLink KS MAX 10.5T大领跑KAS新领域

    —KHeavyHash。在市场上,有一款挖掘机可以满足这个要求,那就是iBeLink ks max 10.5T。 iBeLink ks max 10.5T是一款专为Kaspa挖掘而设计的挖掘机,它的
    发表于 02-20 16:11

    请问用强大的SOC来控制汽车是不是能够大幅减少MCU的使用数量?

    来自一位用户的咨询,麻烦帮忙解答,越详细越好,有图有真相,可以适当提供一些英飞凌解决方案和产品推荐。 用强大的SOC来控制汽车是不是能够大幅减少MCU的使用数量? 未来电动汽车会使用SOC来代替大量MCU?
    发表于 02-02 07:16

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    FPGA和CPU、GPU有什么区别?为什么越来越重要?

    的单元?本质上是由于 CPU 的到达瓶颈了,背后是通用计算时代的终结。从发明 以来, CPU 的提升主要依靠两大法宝:一是提高时钟频率,但时钟频率提升面临瓶颈了。 因为越高的时
    发表于 11-09 14:09

    2023 第二届 OpenHarmony 技术大会硬件分论坛演讲材料

    的OpenHarmony适配移植及工控领域实践 *附件:07 基于嵌入式龙芯的OpenHarmony适配移植及工控领域实践.pdf 8、NPU在OpenHarmony上的适配及应用赋能 *附件:08
    发表于 11-08 12:01

    陈海波:OpenHarmony技术领先,产学研深度协同,生态蓬勃发展

    。 根深叶茂,OpenHarmony四大技术架构竞争领先,生态蓬勃发展 OpenHarmony以“面向万物智联世界,构建分布式全场景协同的开源操作系统基座与生态系统”为
    发表于 11-06 14:35

    技术生态 智联赢未来,第二届OpenHarmony技术大会圆满举行

    ,OpenHarmony一直聚焦技术创新,持续迭代升级技术版本,并通过开源生态共建,不断提升数字经济“根技术”在万物智联时代的影响,让Op
    发表于 11-04 14:59

    英码科技精彩亮相火爆的IOTE 2023,多面赋能AIoT产业发展!

    产品,包括覆盖多层次的智能工作站(边缘计算盒子)、AI加速卡等;同时向大家展示自研的AI技术服务——“深元”0代码移植工具链和创新性的行业解决方案,赋能更多AIoT产业生态企业快速
    发表于 09-25 10:03

    聊聊GPU通信技术

    最近人工智能大火,AI 应用所涉及的技术能力包括语音、图像、视频、NLP 等多方面,而这些都需要强大的计算资源支持。AI 技术对算力的需求是非常庞大的,虽然 GPU 的计算能力在持续提升,但是对于
    发表于 09-21 10:05 448次阅读
    聊聊<b class='flag-5'>GPU</b>通信<b class='flag-5'>技术</b>

    Wasm软件生态系统安全分析

    本文转载自 OpenHarmony TSC 官方《峰会回顾第12期 | Wasm软件生态系统安全分析》 演讲嘉宾 | 王浩宇 回顾整理 | 廖涛 排版校对 | 李萍萍 嘉宾简介 王浩宇,华中科技
    发表于 09-05 15:29

    Mali GPU性能分析工具

    本文档描述了马里GPU性能分析工具2.2版中的已知勘误表。 这是一个贯穿整个产品生命周期的工作文档,因此,随着新信息的发现,其内容可能会被修改。 本文中包含的信息是ARM有限公司的财产,对错误或遗漏
    发表于 09-05 07:08

    STM32Cube生态系统助力开发者释放创造

    STM32Cube生态系统,助力开发者释放创造,本片文档主要介绍选型、原型评估、配置、编译、软件包、调试、烧录、监测和总结。
    发表于 09-05 06:10

    新型 GPU 云桌面的准确定义

        本文来自“ 新型GPU云桌面发展白皮书(2023) ”,“ GPU原理及在云桌面中的应用 ”。给出了新型 GPU 云桌面的准确定义,深入分析了其相较传统云桌面的核心价值,同时描
    的头像 发表于 06-29 09:57 1797次阅读
    新型 <b class='flag-5'>GPU</b> 云桌面的准确定义

    GPU平台生态:英伟达CUDA和AMD ROCm对比分析

    成熟且完善的平台生态GPU 厂商的护城河。相较于持续迭代的微架构带来的技术壁垒硬实力,成熟的软件生态形成的强大用户粘性将在长时间内塑造 GPU
    的头像 发表于 06-06 14:36 1224次阅读
    <b class='flag-5'>GPU</b>平台<b class='flag-5'>生态</b>:英伟达CUDA和AMD ROCm对比<b class='flag-5'>分析</b>

    GPU平台生态,英伟达CUDA和AMD ROCm对比分析

    CUDA 除了是并行计算架构外,还是 CPU 和 GPU 协调工作的通用语言。在CUDA 编程模型中,主要有 Host(主机)和 Device(设备)两个概念,Host 包含 CPU 和主机内存,Device 包含 GPU 和显存
    的头像 发表于 05-18 09:57 1696次阅读
    <b class='flag-5'>GPU</b>平台<b class='flag-5'>生态</b>,英伟达CUDA和AMD ROCm对比<b class='flag-5'>分析</b>