0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ChatGPT对GPU算力的需求测算与分析

智能计算芯世界 来源:智能计算芯世界 2023-02-21 09:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

GPGPU的核心壁垒是高精度浮点计算及CUDA生态。从高精度浮点计算能力来看,国内GPU产品与国外产品的计算性能仍或有一代以上差距;在软件和生态层面与英伟达CUDA生态的差距则更为明显。

AI计算GPU领域,国内壁仞科技发布的BR100产品在FP32单精度计算性能上实现超越NVIDIA A100芯片,但是不支持FP64双精度计算;天数智芯推出的天垓100的FP32单精度计算性能实现超越A100芯片,但是在INT8整数计算性能方面却低于A100;海光推出的DCU实现了FP64双精度浮点计算,但是其性能为A100的60%左右,大概相当于其4年前水平。因此,从高精度浮点计算能力来看,国内GPU产品与国外产品的计算性能仍或有一代以上差距。

虽然目前国内产品的计算性能和软件生态实力与国际厂商还有差距,但是,国内厂商依然在奋起直追,努力实现GPGPU的国产化突破。长久来看,美国对中国高端GPU的禁售令反而给国产GPGPU和AI芯片厂商带来快速发展的机会。

短期来看,我们认为对高端通用计算GPU的禁令可能会影响英伟达和AMD的GPU产品在中国的销售,中国AI计算、超级计算和云计算产业进步受到一定的阻碍。可使用英伟达和AMD还没有被禁止的及国产厂商的中高计算性能CPU、GPU、ASIC芯片等替代。

长期来看,国产CPU、GPU、AI芯片厂商受益于庞大的国内市场,叠加国内信创市场带来国产化需求增量,我们预期国内AI芯片的国产化比例将显著提升,借此机会进行产品升级,逐渐达到国际先进水平,突破封锁。

252d9224-b179-11ed-bfe3-dac502259ad0.png

25601a32-b179-11ed-bfe3-dac502259ad0.png

25c4ce14-b179-11ed-bfe3-dac502259ad0.png

26200658-b179-11ed-bfe3-dac502259ad0.png

26702eee-b179-11ed-bfe3-dac502259ad0.png

269a6c2c-b179-11ed-bfe3-dac502259ad0.png

26e77c10-b179-11ed-bfe3-dac502259ad0.png

2734b1e2-b179-11ed-bfe3-dac502259ad0.png

27a7ff58-b179-11ed-bfe3-dac502259ad0.png

2818d76e-b179-11ed-bfe3-dac502259ad0.png

2871b690-b179-11ed-bfe3-dac502259ad0.png

28bdec54-b179-11ed-bfe3-dac502259ad0.png

2904abf8-b179-11ed-bfe3-dac502259ad0.png

292f6e1a-b179-11ed-bfe3-dac502259ad0.png

29829590-b179-11ed-bfe3-dac502259ad0.png

29baab24-b179-11ed-bfe3-dac502259ad0.png

29f2e7b4-b179-11ed-bfe3-dac502259ad0.png

2a2451f0-b179-11ed-bfe3-dac502259ad0.png

2a734e4a-b179-11ed-bfe3-dac502259ad0.png

2aaf76d6-b179-11ed-bfe3-dac502259ad0.png

2af9dece-b179-11ed-bfe3-dac502259ad0.png

2b16e636-b179-11ed-bfe3-dac502259ad0.png

2b695d94-b179-11ed-bfe3-dac502259ad0.png

2ba82718-b179-11ed-bfe3-dac502259ad0.png

2bdfcee8-b179-11ed-bfe3-dac502259ad0.png

2c1b7f56-b179-11ed-bfe3-dac502259ad0.png

2c82d1ba-b179-11ed-bfe3-dac502259ad0.png

2cc716fe-b179-11ed-bfe3-dac502259ad0.png

2d2c8066-b179-11ed-bfe3-dac502259ad0.png

2d710cb8-b179-11ed-bfe3-dac502259ad0.png

2db79ebc-b179-11ed-bfe3-dac502259ad0.png

2df3a6e6-b179-11ed-bfe3-dac502259ad0.png

本文选自“ChatGPT对GPU算力的需求测算与相关分析”,以上为部分内容,完整报告请参看原文。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54422

    浏览量

    469255
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136068
  • ChatGPT
    +关注

    关注

    31

    文章

    1600

    浏览量

    10392

原文标题:ChatGPT对GPU算力的需求测算与分析

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英伟达失守中国区!推理需求爆发,国产GPU抢滩上市

    亿元。而在此前,另一家国产GPU公司摩尔线程已于9月26日率先过会。这两大GPU企业接连冲刺IPO,背后是中国AI需求爆发式增长与全球供
    的头像 发表于 10-22 09:09 8574次阅读
    英伟达失守中国区!推理<b class='flag-5'>需求</b>爆发,国产<b class='flag-5'>GPU</b>抢滩上市

    登临科技以创新GPU+架构深度赋能华北区域智中心

    苏州登临科技股份有限公司(以下简称“登临科技”)近日宣布,其以创新GPU+架构为核心的创新产品,正深度赋能华北区域智中心,特别是石家庄地区的产业升级与数字经济发展。该项目突破了传
    的头像 发表于 03-25 14:20 785次阅读

    飞腾主板:D3000M八核强芯贴合高需求应用场景

    在数字化浪潮持续席卷全球的今天,已成为数字经济发展的核心生产,从人工智能推理、大数据分析到金融政务处理、工业智能控制,各行业对高
    的头像 发表于 03-24 11:21 213次阅读
    飞腾主板:D3000M八核强芯贴合高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>需求</b>应用场景

    GPU 利用率<30%?这款开源智云平台让不浪费 1%

    作为 AI 开发者,你是否早已受够这些困境:花数百万采购的 GPU 集群,利用率常年低于 30%,闲置如同烧钱;跨 CPU/GPU/NPU 异构资源调度难如登天,模型训练卡在资源分
    的头像 发表于 01-26 14:20 281次阅读

    将AI送上太空,是终极方案还是疯狂幻想?评论区说出你的阵营!

    AI
    江苏易安联
    发布于 :2026年01月06日 09:43:34

    从云端集中到边缘分布:边缘智如何重塑网络布局

    随着大模型推理延迟进入毫秒级时代,整个科技行业都意识到:网络的规则正在被改写。这场变革的核心,正是从云端集中式计算向边缘分布式智能的范式转移。据行业多家分析机构综合预测,全球AI基础设施正面
    的头像 发表于 12-25 11:34 606次阅读
    从云端集中到边缘分布:边缘智<b class='flag-5'>算</b>如何重塑<b class='flag-5'>算</b><b class='flag-5'>力</b>网络布局

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    从CPU、GPU到NPU,美格智能持续优化异构计算效能

    前言AI已成为数字经济时代的核心生产,但全球AI产业正面临“供给不足、成本高企、生态待建”三重挑战。据行业统计,行业资源平均利用率
    的头像 发表于 11-21 16:05 1309次阅读
    从CPU、<b class='flag-5'>GPU</b>到NPU,美格智能持续优化异构<b class='flag-5'>算</b><b class='flag-5'>力</b>计算效能

    AI中心的能耗挑战:CM5A 2000 H01霍尔闭环电流传感器在AI中心(AIDC)的应用分析

    随着DeepSeek、ChatGPT、Sora等大模型的迭代升级,全球AI中心正经历前所未有的扩张。据统计,单次大模型训练的耗电量相当于数万户家庭一个月的用电总和,而AI
    的头像 发表于 11-05 17:43 1058次阅读
    AI<b class='flag-5'>算</b><b class='flag-5'>力</b>中心的能耗挑战:CM5A 2000 H01霍尔闭环电流传感器在AI<b class='flag-5'>算</b><b class='flag-5'>力</b>中心(AIDC)的应用<b class='flag-5'>分析</b>

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    最近行业都在说“是AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思昇腾910B,实测下来有点超出预期——7nm工艺下
    发表于 10-27 13:12

    如何看懂GPU架构?一分钟带你了解GPU参数指标

    分析GPU核心参数体系:、显存大小、显存带宽、热门架构特性等关键指标,旨在帮您理解不同应用场景下,如何选择最合适的GPU
    的头像 发表于 10-09 09:28 1531次阅读
    如何看懂<b class='flag-5'>GPU</b>架构?一分钟带你了解<b class='flag-5'>GPU</b>参数指标

    与电力的终极博弈,填上了AIDC的“电力黑洞”

    ),专注于提供人工智能训练与推理所需的服务、数据服务和算法服务。AIDC采用异构计算架构,结合GPU、FPGA、ASIC等多种AI加速芯片,形成高并发分布式系统,以满足大模型训练和推理的极高
    的头像 发表于 09-22 02:43 9002次阅读

    市场上的工控机改如何选择?接口与扩展性需求分析

    在边缘计算时代,工控机的选择需紧密围绕实时性、可靠性、环境适应性三大工业核心需求,同时兼顾、接口与扩展性的平衡。以下是关键考量因素及选型策略: 一、
    的头像 发表于 08-06 16:52 872次阅读
    市场上的工控机改如何选择?接口与扩展性<b class='flag-5'>需求</b><b class='flag-5'>分析</b>

    热插拔集群

    热插拔集群指在无需停机的情况下,动态增减计算节点或硬件的基础设施,其核心价值在于实现资源的弹性伸缩和业务连续性。以下从关键技术、应用场景及优势三个维度
    的头像 发表于 06-26 09:20 1244次阅读

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知识,但该部分知识比较晦涩难懂,或许是由于我一
    发表于 06-18 19:31