0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2024年,GPU能降价吗?

半导体产业纵横 来源:半导体产业纵横 2024-01-03 15:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2023过去,当我们回顾这一年的最受产业关注的芯片,相信大多数人会将票投向GPU。2023年中,我们总能听到“GPU紧缺”、“英伟达狂飙”、“黄仁勋分享成功秘诀”。

无可否认,2023年生成式AI的热潮无边无际,全球高科技公司都涌入了AI的军备竞赛。随之带来的是算力告急、全球疯抢GPU。

01 全球最火的GPU

2023年层出不穷地传出,人工智能AI大模型的消息。OpenAI、百度、谷歌、腾讯都在搭建属于自己的大模型。对于这些五花八门的大模型,我们不多赘述,但大模型的搭建,最需要的就是GPU,而2023年需求量最大的GPU不外乎:A100/H100。

首当其冲的就是A100GPU。OpenAI使用的是3,617台HGXA100服务器,包含近3万块英伟达GPU。国内云计算相关专家认为,做好AI大模型的算力最低门槛是1万枚英伟达A100芯片。

TrendForce研究则显示,以A100的算力为基础,GPT-3.5大模型需要高达2万枚GPU,未来商业化后可能需要超过3万枚。

H100也是业内追求的对象。H100于去年9月量产,由台积电4N工艺代工。相较于前任A100,H100单卡在推理速度上提升3.5倍,在训练速度上提升2.3倍;如果用服务器集群运算的方式,训练速度更是能提高到9倍,原本一个星期的工作量,现在只需要20个小时。

63728dbc-a955-11ee-8b88-92fbcf53809c.png

考虑到整体系统成本,H100每美元产生的性能比A100还要高4到5倍之多。与A100相比,H100的单卡价格更贵,但是由于其训练、推理效率增加,成为了最具性价比的产品。

正因如此,科技大厂各个都抢着要买英伟达H100GPU,或者更准确地说,是英伟达的8-GPU HGX H100SXM服务器。

英伟达成为了最受关注的卖铲人。针对中国市场,还按照A800操作模式(A100芯片的降维版本),推出了完全符合出口规定的H100的降维版本芯片。

02 热情的买家

“GPU就是新时代的比特币。”OpenAI首席科学家IlyaSutskever将这句话写在他个人的X账号上。在算力激增的背景下,英伟达的GPU成为了“硬通货”。

夸张的是,甚至有海外初创企业开始利用GPU进行抵押融资,一家硅谷的创业公司使用H100拿到了23亿美元的债务融资。

购买H100和A100的公司有三种。第一种,是需要超过1000张的公司,包括训练LLM的创业公司,如OpenAI、Anthropic;云服务提供商,如谷歌云、AWS、腾讯云;其他大公司,如特斯拉。第二种,是需要超过100张的公司,也就是对开源模型进行大量微调的初创公司。第三种,需要10张的公司,就是大部分创业公司和开源势力,热衷使用大模型的输出微调小模型。

这些买家需要多少GPU呢?OpenAI可能需要5万张、Inflection要2.2万张、Meta需要2.5万张、大型云厂商(Azure、GoogleCloud、AWS、Oracle),每家可能需要3万张,Lambda和CoreWeave以及其他私有云可能总共需要10万张,Anthropic、Helsing、Mistral、Character,每家可能要1万张。

仅仅这几家公司,就已经需要43.2万张H100,如果以每块约3.5万美元计算,GPU的价值约为150亿美元。而这还没有包括字节、百度、腾讯等国内公司。

在AI大模型竞争上,榜上有名的几个国家:中国、美国、沙特阿拉伯、阿联酋,都是英伟达的座上宾。

沙特阿拉伯已通过公共研究机构阿卜杜拉国王科技大学(Kaust)购买了至少3000块英伟达的H100芯片。这些芯片将于2023年底全部交付,总价值约为1.2亿美元,用于训练AI大模型。

阿联酋也获得了数千颗英伟达芯片的使用权,并已推出自己的开源大语言模型“Falcon40B”,“Falcon40B”使用了384个A100芯片进行训练。

03 GPU的出货量

英伟达H100的出货量也备受关注。研究机构Omdia披露,英伟达在2023年第二季度的H100出货量为900吨。按照单片H100GPU的重量约为3千克,那么英伟达在二季度售出了约30万片H100。

到了三季度,英伟达大约卖出了50万台H100和A100 GPU。每家能够分到的GPU数量有限,Meta和微软各自采购了15万个H100GPU,谷歌、亚马逊、甲骨文和腾讯则各采购了5万片。

642da8fe-a955-11ee-8b88-92fbcf53809c.png

如此庞大的GPU需求量,导致基于H100的服务器需要36~52周的时间才能交付。按照英伟达官方的说法,2024年一季度之前的GPU芯片早已全部售罄。

业内预估,明年英伟达的出货量将达到150万-200万颗。

04 2024,GPU能降价吗?

GPU能否降价,还要看明年的供需情况。上图是GPUUtils列出的目前对GPU市场供需变化最有直接影响的科技公司,包括了:开发出Chat-GPT的OpenAI、台积电、微软、Meta以及成立仅仅一年便募得13亿美元资金的AI新创Inflection。

买方

有的人不想买。谷歌、Meta都觉得英伟达的GPU太贵了。

Meta最近已经宣布构建了自己的DLRM推理芯片,并且得到广泛部署。Meta大大方方承认,自己即将发布的AI芯片并不能直接替代英伟达的芯片,但是自研芯片可以降低成本。

就算在谷歌I/O开发者大会两个小时的演讲中,谷歌方面一直在赞赏英伟达的H100GPU芯片。这也不妨碍,谷歌开始“骑驴找马”,谷歌的云服务器上已经用上了自家TPU。

Google TPU v5e于2023年8月发布,成为人工智能硬件领域的强大力量,专为大型语言模型和生成式人工智能量身定制。与前代产品相比,TPUv5e的每美元训练性能显著提高2倍,每美元推理性能显著提高2.5倍,可大幅节省成本。其突破性的多片架构可实现数万个芯片的无缝连接,突破了以往的限制,为处理海量人工智能任务开辟了途径。

有的人不能买。中国是英伟达的第三大市场,占据其收入的1/5以上。随着美国政府宣布进一步禁止中国销售英伟达H800和A800芯片,卖不出去的GPU,必然会对英伟达产生负面影响。

此外,明年AI或许迎来退潮。2023年的AI热潮,除了大模型震惊业界外,炒作的因素也不在少数。毫无疑问,ChatGPT是2023年的世界顶流。因为它,OpenAI网站的流量在4月份就超过了18亿,进入了全球流量排名前20。然而,网络分析公司Similarweb公布的数据显示,在狂飙半年后,ChatGPT的访问量首次出现负增长,6月份的访问量环比下滑9.7%。

在大模型创业狂飙200多天后,探索者们的心态,从理想亢奋来到现实落地。大模型的维护依赖大量的高性能芯片,而单要建构、维护生成式AI工具的成本就非常巨大。这对于大公司而言还好,但是对于许多组织与创作者而言,这却是一笔难以负担的支出。

对于生产式AI,2024年还会再次迎来大众的检验。行业分析师认为,2023年关于生成式人工智能的炒作非常大,AI被过度吹捧,因为相关技术需要克服许多障碍才能将其推向市场。

退潮之后,能够剩下的高性能GPU需求还能有多少?

卖方

我们先来看看英伟达这个最大的卖家。优先关注两个方面:能不能供应足够的GPU,明年是否有新品刺激市场需求。

第一个供货方面,众所周知,英伟达只与台积电合作生产H100,台积电一共有4个生产节点是为5nm芯片提供产能:N5、N5P、N4、N4P。而H100只在N5或者是N5P的中的4N节点上生产,这是一个5nm芯片的增强型节点,同时英伟达还必须与苹果、AMD高通共享这个节点的产能,至于A100显卡则是在台积电的N7生产线制作的。从短期的情况看,三星英特尔都因为制程技术的问题,无法替英伟达缓解供应紧张的问题。因此,预计明年市场,英伟达的GPU供应仍会紧缺。

6572f584-a955-11ee-8b88-92fbcf53809c.png

第二个新品方面,英伟达在2023年11月底时,发布了H100的下一代继承者——H200。表示在处理Llama2等LLM时,H200的推理速度比H100GPU提高了近2倍。从2024年开始,亚马逊网络服务、谷歌云、微软Azure和甲骨文云基础设施将成为首批部署基于H200实例的云服务提供商。尽管还没有公布H200的价格,但一定比H100目前每台2.5万美元至4万美元的价格更加昂贵。

从两个方面看,英伟达的GPU供需还存在较大的不确定性。不过。卖家市场,会有更多厂商加入。

明年GPU的另一大卖家,就是回过神来的AMD。

从最近的财报来看,AMD预计四季度GPU收入将达到4亿美元,到2024年底将超过10亿美元。其CEO苏姿丰对明年充满期待:“MI300将成为自2020年后,销售额达到10亿美元最快的产品。”

2023年11月,AMD正式发布了对标H100的产品——MI300。据AMD展示,由8块MI300X组成的服务器在大模型推理方面的表现,要比同样规模的H100速度最高提升1.6倍之多。对于AMD来说,这种直接对标,实属罕见。

有意思的是,Meta、微软和OpenAI公司在AMD投资者活动上表态,未来他们将会使用AMD最新的人工智能(AI)芯片InstinctMI300X。

不过,英伟达对AMD的对标也态度强硬,官方发布博客,驳斥AMD的评测不客观。英伟达表示,如果H100GPU使用了优化过的软件进行正确的基准测试,它的性能将大大超过MI300X。

由于MI300还未正式应用,对于我们对于AMD和英伟达之间的“官司”很难分说,但不论如何,AMD已经走到了高性能GPU的起跑线。

总而言之,2024年的GPU还充满变数。在AI大模型冷静后、在买家不想当冤大头后、在卖家越来越多后,GPU还会维持天价吗?相信各位看官心中自有答案。从市场的角度看,无论是当下多先进的技术,到最后终将会越来越普世。就看GPU玩家们,在2024年如何进攻战场了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5100

    浏览量

    134477
  • 人工智能
    +关注

    关注

    1813

    文章

    49747

    浏览量

    261612
  • OpenAI
    +关注

    关注

    9

    文章

    1238

    浏览量

    9816
  • 大模型
    +关注

    关注

    2

    文章

    3447

    浏览量

    4973

原文标题:2024年,GPU能降价吗?

文章出处:【微信号:ICViews,微信公众号:半导体产业纵横】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为2024营收8621亿净利润626亿 华为2024年年报完整版免费下载

    华为2024营收8621亿净利润626亿 华为2024年年报完整版免费下载
    的头像 发表于 03-31 18:01 5426次阅读
    华为<b class='flag-5'>2024</b><b class='flag-5'>年</b>营收8621亿净利润626亿  华为<b class='flag-5'>2024</b><b class='flag-5'>年年</b>报完整版免费下载

    2024risc-v的发展总结

    新的一已经来临,请问有人能将risc-v在2024的发展做一个比较全面的总结?
    发表于 02-01 18:27

    晒奖品——2024度优秀版主

    感谢电子发烧友论坛,给予我2024度优秀版主的光荣称号。今天收到了奖杯,分享如下: 在2025里,我奖继续努力为论坛做贡献。 祝咱电子发烧友论坛2025人气多多,红红火火!
    发表于 01-19 11:20

    2024GPU出货量增长显著,超越CPU

    近日,根据知名市场研究机构Jon Peddie Research(JPR)最新发布的报告,2024全球GPU(包括集成显卡和独立显卡)市场呈现出强劲的增长态势。报告显示,该年度GPU
    的头像 发表于 01-17 14:12 830次阅读

    榜样力量,智领未来——2024度电子发烧友社区表彰

    2024 年里,电子发烧友汇聚了超过670万名用户,他们在这里分享、学习并探索最新的技术内容。 这一,电子发烧友平台累计产生超过120000篇文章、36000篇帖子、21000个资料、22000个
    发表于 01-16 13:36

    紫光国微发布2024度业绩快报

    1月13日晚间,紫光国微(002049.SZ)发布2024度业绩快报,公司2024实现营业收入55.11亿元,归母净利润11.91亿元。截止20
    的头像 发表于 01-14 13:55 1180次阅读

    2024Thread的重要亮点

    Thread Group近期通过本篇博文来总结2024取得的惊人进步和成就。目前,Thread会员基础已近 200 家公司,从去年1月份参加CES 2024,到7月份庆祝成立 10 周年,再到
    的头像 发表于 01-14 09:30 1035次阅读

    2024智慧路灯国内外应用案例(节选)智慧路灯案例

    2024智慧路灯国内外应用案例(节选)智慧路灯案例
    的头像 发表于 01-03 10:06 1253次阅读
    <b class='flag-5'>2024</b><b class='flag-5'>年</b>智慧路灯国内外应用案例(节选)智慧路灯案例

    理想汽车202412月交付58513辆

    近日,理想汽车公布202412月交付数据。202412月,理想汽车交付新车58,513辆,同比增长16.2%。截至2024
    的头像 发表于 01-02 16:56 1177次阅读

    中航光电2024度大事记回顾

    中航光电2024度大事记回顾
    的头像 发表于 01-02 16:10 1459次阅读

    盘点NVIDIA 2024的创新成果

    2024,AI 的影响力已经扩展到加速计算和数据科学等多个关键领域,成为驱动各行各业技术革新和产业升级的关键因素。在这一里,NVIDIA 又带来了哪些创新成果,实现了哪些突破?跟随本文一起盘点 NVIDIA
    的头像 发表于 01-02 14:32 1096次阅读

    爱普生2024度精彩回顾

    2024,是爱普生公司成立并坚持践行“环保DNA”的第82,比联合国全球契约组织提出ESG理念早了整整62。可持续发展,是爱普生保有企业强韧性与源源活力的立身之本!
    的头像 发表于 01-02 14:11 1256次阅读

    飞腾荣获“2024度十佳卓越课题”及“2024度优秀课题”奖项

    近日,北京金融科技产业联盟2024度会员代表大会在京成功召开,飞腾公司凭借在金融行业产业研究、课题攻关方面的专业能力和突出成果荣获 “2024度十佳卓越课题” 及 “
    的头像 发表于 12-19 13:59 999次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH发布的有关CST Studio Suite 2024GPU计算指南。涵盖GP
    发表于 12-16 14:25