0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2024年,GPU还会维持天价吗?

AI芯天下 来源:AI芯天下 2024-01-14 11:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

前言: 错过了GPU,也就错过了第四次工业革命的入场券? ChatGPT横空出世,大模型风起云涌,在算力激增的背景下,英伟达的GPU100/H100成为“抢手货”。 GPU成为新的王者

云厂商作为AI算力需求的主要承载方,一场由GPU主导的变革正在悄然兴起,这场变革的突出表现在云厂商纷纷下场造芯,结合GPU的短缺、高昂成本、应对云服务更加智能化、自主化、灵活化和可扩展化的需求和广阔前景。

微软、Meta、Google、亚马逊特斯拉以及国内的阿里、百度、腾讯等都在投入更多资源研发AI芯片,甚至OpenAI都开始筹备芯片项目。

从时间节点来看,谷歌TPU v5e于2023年8月发布,成为人工智能硬件领域的强大力量,专为大型语言模型和生成式人工智能量身定制。

11月初,微软也采取了类似的思路,首款人工智能芯片Maia 100问世。随后亚马逊宣布推出最新的Trainium2,其性能是其前一代的四倍,能源效率是其两倍。

国内华为、阿里、百度等云巨头在自研AI芯片方面也在倾力押注,逐级迭代。

英伟达GPU全球货源紧张

据Verified Market Research数据统计,2027年全球GPU市场规模有望达到1853.1亿美元,年平均增速高达32.82%,千亿级赛道风口已至。

据行业曝料,2023年第四季度,NVIDIA GPU供应量在全球范围内都被严格限制,导致全球市场都出现了明显的供不应求。

在这种情况下,无论是欧美还是中国,厂商和销售渠道都在拼命抢货。

对于中国市场来说,情况更加不乐观,尤其是1月份属于季度末期,2月份又有春节假期。

因此,预计近期NVIDIA GPU和显卡的供应量都会非常有限,不排除部分产品价格上涨。

至于NVIDIA为何会控制供应量,确切原因不得而知,猜测很大可能是优先将产能供给加速计算卡所用的高性能GPU。

毕竟,计算GPU的利润要比游戏GPU丰厚得多,尤其是眼下AI需求一浪高过一浪,而计算GPU规模庞大、技术复杂,对于产能的要求也更高。

2024年英伟达市场

在AIGC浪潮爆发下,英伟达可以说是2023年半导体市场最大赢家,该公司营收也跃居全球最大半导体公司。

据媒体猜测,GPT-4至少需要8192张H100芯片,以每小时2美元的价格,在约55天内可以完成预训练,成本约为1.5亿元人民币。

而且 ,ChatGPT所需要的AI芯片并不是固定的,而是逐次递增。ChatGPT越聪明,背后的代价是所需算力越来越多。

据摩根士丹利预测,到了GPT-5大概需要使用2.5万个GPU,约是GPT-4的三倍之多。

英伟达正在经历一场比“挖矿时代”更疯狂的市场浪潮,一方面英伟达产能受限于台积电、HBM、CoWos封装等产能,H100的“严重缺货问题”至少会持续到2024年底。

另一方面,巨大缺口也导致英伟达H100暴涨,有报道称,英伟达的H100 AI加速卡的物料成本约为3000美元,而在年中售价已经达到了3.5万美元左右,甚至在eBay上卖出了超过4w美元的价格。

研究机构Omdia披露,英伟达在2023年第二季度的H100出货量为900吨。按照单片H100GPU的重量约为3千克,那么英伟达在二季度售出了约30万片H100。

到了三季度,英伟达大约卖出了50万台H100和A100 GPU。每家能够分到的GPU数量有限,Meta和微软各自采购了15万个H100GPU,谷歌、亚马逊、甲骨文和腾讯则各采购了5万片。

如此庞大的GPU需求量,导致基于H100的服务器需要36~52周的时间才能交付。按照英伟达官方的说法,2024年一季度之前的GPU芯片早已全部售罄。业内预估,明年英伟达的出货量将达到150万-200万颗。

735503ae-b210-11ee-8b88-92fbcf53809c.png

国产GPU2024年表现

国产GPU正迅速走过进入“从可用到好用”的迭代阶段。华为海思、燧原科技、壁仞、天数智芯、沐曦、珠海芯动力、摩尔线程、海光等厂商在GPU产品、集群、生态和应用层面全面发力,表现可圈可点。

深存科技创始人&CEO袁静丰总结,2023年国产GPU厂商面对国内市场,在更加务实地在做产品、建生态、推应用,在这些层面各家都有一定的优势,而准确定位是关键。

去年9月28日,燧原科技宣布完成D轮融资,总额为20 亿元,超过15家机构参与,成为AI芯片领域最大规模的融资事件之一。

摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式举办,宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地。

展望2024年,无论是禁运以及供应缺口等问题,国产GPU的机遇依旧“在线”。

结尾:

总而言之,2024年的GPU还充满变数。

从市场的角度看,无论是当下多先进的技术,到最后终将会越来越普世,就看在2024年如何进攻战场了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5324

    浏览量

    136214
  • AI芯片
    +关注

    关注

    17

    文章

    2184

    浏览量

    36888
  • 摩尔线程
    +关注

    关注

    2

    文章

    299

    浏览量

    6690

原文标题:趋势丨2024年,GPU还会维持天价吗?

文章出处:【微信号:World_2078,微信公众号:AI芯天下】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何在 VisionFive v2 上使用外部 GPU

    如果旧的 amd gpu 在 VisionFive V2 上运行,我想使用带有开源 amd 驱动程序的 amd gpu。我需要什么以及如何将 GPU 连接到 VisionFive v2?
    发表于 03-13 06:38

    又一家GPU厂商IPO!

    GPU芯片量产的公司,也是首家采用先进7nm工艺技术达成该等里程碑的公司。   营收方面,天数智芯于2022、20232024及截至
    的头像 发表于 12-20 07:35 1.1w次阅读
    又一家<b class='flag-5'>GPU</b>厂商IPO!

    汽车中的GPU是如何使用的?

    (HMI)的发展尤为迅猛。随着电子电气架构(EEA)的集中化,车辆对高性能计算能力的需求显著提升,GPU(图形处理单元)的灵活性、可扩展性以及高效并行计算能力,使其成为支持这些创新应用的核心组件
    的头像 发表于 12-03 14:45 9770次阅读
    汽车中的<b class='flag-5'>GPU</b>是如何使用的?

    沐曦GPU与龙蜥操作系统完成适配

    沐曦集成电路(上海)股份有限公司(以下简称"沐曦")于 2020 9 月成立于上海,其拥有技术完备、设计和产业化经验丰富的团队,曾主导过十多款世界主流高性能 GPU 产品研发
    的头像 发表于 10-17 15:06 1495次阅读

    商汤科技位居2024中国大模型平台市场份额第三

    近日,国际数据公司(IDC)发布《中国大模型平台市场份额,2024》报告。
    的头像 发表于 08-22 14:00 1447次阅读

    航盛电子荣获广汽丰田2024度品质改善先锋奖

    广汽丰田2024度整体纳入品质提升显著,经过广汽丰田评选审核,航盛凭借持续的质量体系建设与卓越的质量改善成果,荣获广汽丰田“2024度品质改善先锋”奖,这也是航盛连续两
    的头像 发表于 08-12 18:12 1945次阅读

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1
    发表于 07-25 08:18

    TLE9893最高可以维持多少电压?

    TLE989x 数据表中提到 VS 引脚可以维持 40v 的负载转储 400mSec。 我们有以下问题: 1.根据标准 16750-2:2023,电压可根据严重程度在 27V 至 35V 之间
    发表于 07-21 08:09

    华域汽车召开2024年年度股东大会并选举产生新一届董事会

    20256月27日,华域汽车系统股份有限公司(证券代码:600741)召开2024年年度股东大会,审议通过公司2024度董事会工作报告、
    的头像 发表于 06-30 11:17 1234次阅读

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    自家GPU 提出的多卡算力互连技术,是早期为了应对深度学习对超高算力需求而单卡算力不足的局面的解决方案,当然这都是官方用来吹牛的话术。我自己在2019左右第一次接触到多卡交火的GIY玩法(从学生到
    发表于 06-18 19:31

    Claroty-2024全球CPS安全状况:中断对业务的影响

    2024 全球 CPS 安全状况: 中断对业务的影响 网络攻击影响关键任务型基础设施,分析其造成的财务损失和运营后果
    发表于 06-17 17:29 9次下载

    广汽埃安2024年年度股东会顺利召开

    近日,广汽埃安新能源汽车股份有限公司2024年年度股东会在广州顺利召开,60家股东单位代表出席会议,会议回顾了广汽埃安2024的经营情况,并提出了2025
    的头像 发表于 06-04 14:37 1352次阅读

    GPU架构深度解析

    GPU架构深度解析从图形处理到通用计算的进化之路图形处理单元(GPU),作为现代计算机中不可或缺的一部分,已经从最初的图形渲染专用处理器,发展成为强大的并行计算引擎,广泛应用于人工智能、科学计算
    的头像 发表于 05-30 10:36 2084次阅读
    <b class='flag-5'>GPU</b>架构深度解析

    中微公司举办2024度暨2025第一季度业绩说明会 2024营收约90.65亿

    5月27日,中微公司2024度暨2025第一季度业绩说明会于临港产业化基地成功举办,众多机构投资人、证券分析师及媒体等嘉宾莅临现场,还有广大投资者通过上证路演、价值在线等平台远程线上参会。中微
    的头像 发表于 05-28 19:16 1577次阅读
    中微公司举办<b class='flag-5'>2024</b><b class='flag-5'>年</b>度暨2025<b class='flag-5'>年</b>第一季度业绩说明会 <b class='flag-5'>2024</b><b class='flag-5'>年</b>营收约90.65亿