0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPU技术、生态及算力分析

架构师技术联盟 来源:架构师技术联盟 2024-01-14 10:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文来自“GPGPU研究框架及算力分析(2023)”,GPGPU的核心壁垒是高精度浮点计算及CUDA生态。从高精度浮点计算能力来看,国内GPU产品与国外产品的计算性能仍或有一代以上差距;在软件和生态层面与英伟达CUDA生态的差距则更为明显。

AI计算GPU领域,国内壁仞科技发布的BR100产品在FP32单精度计算性能上实现超越NVIDIA A100芯片,但是不支持FP64双精度计算;天数智芯推出的天垓100的FP32单精度计算性能实现超越A100芯片,但是在INT8整数计算性能方面却低于A100;海光推出的DCU实现了FP64双精度浮点计算,但是其性能为A100的60%左右,大概相当于其4年前水平。因此,从高精度浮点计算能力来看,国内GPU产品与国外产品的计算性能仍或有一代以上差距。

但是,GPU不仅在硬件上需要提升算力,软件层面对于GPU的应用和生态布局尤其重要,英伟达凭借CUDA构建生态壁垒占领全球GPU市场90%的份额。目前国内企业多采用开源的OpenCL进行自主生态建设,但这需要大量的时间进行布局;

对比AMD从2013年开始建设GPU生态,近10年时间后用于通用计算的ROCm开放式软件平台才逐步有影响力,且还是在兼容CUDA的基础上。因此我们认为国内厂商在软件和生态层面与英伟达CUDA生态的差距较计算性能更为明显。

虽然目前国内产品的计算性能和软件生态实力与国际厂商还有差距,但是,国内厂商依然在奋起直追,努力实现GPGPU的国产化突破。

长久来看,美国对中国高端GPU的禁售令反而给国产GPGPU和AI芯片厂商带来快速发展的机会。 短期来看,我们认为对高端通用计算GPU的禁令可能会影响英伟达和AMD的GPU产品在中国的销售,中国AI计算、超级计算和云计算产业进步受到一定的阻碍。可使用英伟达和AMD还没有被禁止的及国产厂商的中高计算性能CPU、GPU、ASIC芯片等替代。

长期来看,国产CPU、GPU、AI芯片厂商受益于庞大的国内市场,叠加国内信创市场带来国产化需求增量,我们预期国内AI芯片的国产化比例将显著提升,借此机会进行产品升级,逐渐达到国际先进水平,突破封锁。对于国内厂商,建议重点关注实现自主创新,打造自主生态体系,国内企业:

1)芯片:龙芯中科(国内PC CPU龙头,自主研发GPGPU产品)、海光信息(国内服务器CPU龙头,推出深度计算处理器DCU)、景嘉微(国内图形渲染GPU龙头)、寒武纪(国内ASIC芯片龙头)、澜起科技(国内服务器内存接口芯片龙头);

2)PCB:胜宏科技、兴森科技、沪电股份;

3)先进封装:通富微电、甬矽电子、长电科技、长川科技等。

4)海外企业:英伟达(全球GPU龙头)、AMD(全球CPU/GPU领先厂商)、英特尔(全球CPU龙头)、美光(全球存储芯片龙头)。

更多GPU内容请参考文章“全球GPU呈现“一超一强”竞争格局”,“2023年GPU显卡词条报告”,“HBM崛起:从GPU到CPU”,“英伟达GPU龙头稳固,国内逐步追赶(2023)”,“GPU微架构、性能指标、场景、生态链及竞争格局(2023)”,“AI芯片第一极:GPU性能、技术全面分析”,“2023年CPU&GPU天梯图(最新版)”,“主流国产GPU产品及规格概述(2023)”,“新型GPU云桌面发展白皮书”,“十大国产GPU产品及规格概述”等等。


65827ea4-b275-11ee-8b88-92fbcf53809c.png

65a36fe2-b275-11ee-8b88-92fbcf53809c.png

65c2a736-b275-11ee-8b88-92fbcf53809c.png

65dbc996-b275-11ee-8b88-92fbcf53809c.png

65e88d3e-b275-11ee-8b88-92fbcf53809c.png

6605f400-b275-11ee-8b88-92fbcf53809c.png

66212090-b275-11ee-8b88-92fbcf53809c.png

6659501e-b275-11ee-8b88-92fbcf53809c.png

66731d00-b275-11ee-8b88-92fbcf53809c.png

668e52e6-b275-11ee-8b88-92fbcf53809c.png

66a5243a-b275-11ee-8b88-92fbcf53809c.png

66a9ee8e-b275-11ee-8b88-92fbcf53809c.png

66bf7254-b275-11ee-8b88-92fbcf53809c.png

66ddf440-b275-11ee-8b88-92fbcf53809c.png

66f48e9e-b275-11ee-8b88-92fbcf53809c.png

67091648-b275-11ee-8b88-92fbcf53809c.png

670f50b2-b275-11ee-8b88-92fbcf53809c.png

67414bc6-b275-11ee-8b88-92fbcf53809c.png

6746694e-b275-11ee-8b88-92fbcf53809c.png

675dedda-b275-11ee-8b88-92fbcf53809c.png

6774b588-b275-11ee-8b88-92fbcf53809c.png

678f23b4-b275-11ee-8b88-92fbcf53809c.png

67abdee6-b275-11ee-8b88-92fbcf53809c.png

67c9f49e-b275-11ee-8b88-92fbcf53809c.png

67e77d66-b275-11ee-8b88-92fbcf53809c.png

67fd474a-b275-11ee-8b88-92fbcf53809c.png

681b0370-b275-11ee-8b88-92fbcf53809c.png

683e9a1a-b275-11ee-8b88-92fbcf53809c.png

68539708-b275-11ee-8b88-92fbcf53809c.png

6868194e-b275-11ee-8b88-92fbcf53809c.png

686e18d0-b275-11ee-8b88-92fbcf53809c.png

688bc1dc-b275-11ee-8b88-92fbcf53809c.png

689a3b68-b275-11ee-8b88-92fbcf53809c.png

68b182c8-b275-11ee-8b88-92fbcf53809c.png

68ccf152-b275-11ee-8b88-92fbcf53809c.png

68e11c5e-b275-11ee-8b88-92fbcf53809c.png

692d5ae2-b275-11ee-8b88-92fbcf53809c.png

697330bc-b275-11ee-8b88-92fbcf53809c.png

69cc8c0c-b275-11ee-8b88-92fbcf53809c.png

6a114892-b275-11ee-8b88-92fbcf53809c.png

6a8ffc1e-b275-11ee-8b88-92fbcf53809c.png

6aba52a2-b275-11ee-8b88-92fbcf53809c.png

6b58acfe-b275-11ee-8b88-92fbcf53809c.png

6b734be0-b275-11ee-8b88-92fbcf53809c.png

6b8fc766-b275-11ee-8b88-92fbcf53809c.png

6b96262e-b275-11ee-8b88-92fbcf53809c.png

6bab5e90-b275-11ee-8b88-92fbcf53809c.png

6bd49206-b275-11ee-8b88-92fbcf53809c.png

6c144fa4-b275-11ee-8b88-92fbcf53809c.png

6c546e22-b275-11ee-8b88-92fbcf53809c.png

6c64130e-b275-11ee-8b88-92fbcf53809c.png

6c7f7ee6-b275-11ee-8b88-92fbcf53809c.png

6cb1bbfe-b275-11ee-8b88-92fbcf53809c.png

6d0a99b8-b275-11ee-8b88-92fbcf53809c.png

6d3b0ae4-b275-11ee-8b88-92fbcf53809c.png

6da0a980-b275-11ee-8b88-92fbcf53809c.png

6e01f1d6-b275-11ee-8b88-92fbcf53809c.png

6e2de26e-b275-11ee-8b88-92fbcf53809c.png

6e73452a-b275-11ee-8b88-92fbcf53809c.png

6e8f0c42-b275-11ee-8b88-92fbcf53809c.png

6eb1aa40-b275-11ee-8b88-92fbcf53809c.png

6ed19ff8-b275-11ee-8b88-92fbcf53809c.png

6ef22bf6-b275-11ee-8b88-92fbcf53809c.png

6f172668-b275-11ee-8b88-92fbcf53809c.png

70efe434-b275-11ee-8b88-92fbcf53809c.png

710c54de-b275-11ee-8b88-92fbcf53809c.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5350

    浏览量

    136329
  • 英伟达
    +关注

    关注

    23

    文章

    4147

    浏览量

    99870
  • AI芯片
    +关注

    关注

    17

    文章

    2188

    浏览量

    36903

原文标题:GPU技术、生态及算力分析

文章出处:【微信号:架构师技术联盟,微信公众号:架构师技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    浅谈大GPU电源架构设计及器件选型

    针对大GPU,如当前主流的AI加速卡、大模型训练集群节点,电源管理已经从“配套边缘”变成了决定上限的“核心瓶颈”。
    的头像 发表于 06-04 11:11 397次阅读

    中微电科技打造AI时代全栈服务生态

    随着大模型训练、高性能计算蓬勃发展,数据中心算供给、智能调度、场景化落地与高效散热已成为行业刚需,企业对自主可控、调度灵活、能效稳定、安全可控提出更高要求。中微电科技以自主研发GPU
    的头像 发表于 05-27 15:50 174次阅读

    科通技术与英特尔联合举办AI与产业创新生态研讨会深圳站

    近日,由科通技术与英特尔联合主办的“芯・新生态・深融合--AI与产业创新
    的头像 发表于 05-21 09:58 334次阅读

    企业如何突破AI困局?2026 年异构管理平台推荐

    随着 AI 大模型爆发式增长,异构管理已成为企业 AI 基础设施建设的核心挑战。本文从行业现状出发,分析异构管理的核心痛点与选型要点
    的头像 发表于 05-20 12:53 194次阅读

    摩尔线程深耕国产生态,共促科技和产业融合创新

    未来产业、量子科技、人工智能等多个平行论坛。同时,摩尔线程重点展示了与生态伙伴在量子计算等前沿领域的最新合作进展,并携全栈自主解决方案亮相“人工智能+”展区,以自主可控的底层
    发表于 03-29 18:52 1651次阅读
    摩尔线程深耕国产<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>生态</b>,共促科技和产业融合创新

    沐曦股份GPU产品正式接入华佗开源生态

    沐曦股份坚持“自主创新与开放兼容”双轨战略,以自研MXMACA软件栈为核心,构建硬件与应用的桥梁,并承载开源核心使命。该栈于2025年2月正式开源,致力于打造开放的GPU编程接口标准,大幅降低开发门槛,有效破解跨平台兼容难题,驱动AI
    的头像 发表于 03-16 14:40 1811次阅读
    沐曦股份<b class='flag-5'>GPU</b>产品正式接入华佗开源<b class='flag-5'>生态</b>

    GPU 利用率<30%?这款开源智云平台让不浪费 1%

    作为 AI 开发者,你是否早已受够这些困境:花数百万采购的 GPU 集群,利用率常年低于 30%,闲置如同烧钱;跨 CPU/GPU/NPU 异构资源调度难如登天,模型训练卡在资源分
    的头像 发表于 01-26 14:20 356次阅读

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    从CPU、GPU到NPU,美格智能持续优化异构计算效能

    前言AI已成为数字经济时代的核心生产,但全球AI产业正面临“供给不足、成本高企、生态待建”三重挑战。据行业统计,行业
    的头像 发表于 11-21 16:05 1447次阅读
    从CPU、<b class='flag-5'>GPU</b>到NPU,美格智能持续优化异构<b class='flag-5'>算</b><b class='flag-5'>力</b>计算效能

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    反而压到了310W。更有意思的是它的异构架构:NPU+CPU+DVPP的组合,居然能同时扛住训练和推理场景,之前做自动驾驶算法时,用它跑模型时延直接降了20%。 但疑惑也有:这种密度下,散热怎么解决?而且昇腾的生态适配速度能
    发表于 10-27 13:12

    如何看懂GPU架构?一分钟带你了解GPU参数指标

    分析GPU核心参数体系:、显存大小、显存带宽、热门架构特性等关键指标,旨在帮您理解不同应用场景下,如何选择最合适的GPU
    的头像 发表于 10-09 09:28 1736次阅读
    如何看懂<b class='flag-5'>GPU</b>架构?一分钟带你了解<b class='flag-5'>GPU</b>参数指标

    中科曙光以生态赋能行业创新

    的特点。“橘洲”背后则是由湖南汇视威科技依托中科曙光长沙人工智能创新中心国产自主研发。在人工智能国产化浪潮中,中科曙光正以硬核技术构建国产
    的头像 发表于 09-24 09:26 1506次阅读

    摩尔线程副总裁王华:AI工厂全栈技术重构基建,开启国产 GPU 黄金时代

    摩尔线程在世界人工智能大会(WAIC 2025)前夕举办以“进化,精度革命”为主题的技术分享会,创新性提出“AI工厂” 理念。这一系统性工程通过全功能 GPU、自研架构、集群
    的头像 发表于 08-02 14:21 5975次阅读
    摩尔线程副总裁王华:AI工厂全栈<b class='flag-5'>技术</b>重构<b class='flag-5'>算</b><b class='flag-5'>力</b>基建,开启国产 <b class='flag-5'>GPU</b> 黄金时代

    热插拔集群

    热插拔集群指在无需停机的情况下,动态增减计算节点或硬件的基础设施,其核心价值在于实现资源的弹性伸缩和业务连续性。以下从关键技术、应用
    的头像 发表于 06-26 09:20 1349次阅读

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    。。) 原理学习 在「芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中,作者详解了从帕斯卡架构到40系的Hopper架构的技术
    发表于 06-18 19:31