0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPU的巨大压力即将到来

半导体产业纵横 来源:半导体产业纵横 2023-07-20 11:41 次阅读

GPU涨的不仅是价格。

今年以来,直线上升的AIGC市场带热了GPU。TrendForce集邦咨询表示,2023年AI服务器出货量(包含搭载GPU、FPGAASIC等)出货量预估近120万台,年增率近38%,AI芯片出货量同步看涨,可望成长突破五成。

然而,供应短时间难以跟上需求的爆发。“一切都在等英伟达”,李平是某AI公司高管,他向记者透露,其公司在4月下单了服务器产品,但是因为服务器公司的GPU尚未到货,至今没有准确交货期,“现在再签服务器合同都是没有违约条款,不签货期的,只能选择等或者直接取消订单”。

对 GPU 硬件或更好的加速器的需求从未如此之大,如果这种趋势持续下去,当前的高需求可能会延续到不久的将来。就HPC领域而言,这一趋势表明 GPU 未来将会变得昂贵且难以找到,除非是购买的数量足以直接向供应商购买。

GPU非常适合加速矩阵运算,通常这也是许多 HPC 应用程序的核心。它们提供 SIMD(单指令多数据)处理单元,可以加速复杂的并行数组操作。正如人们经常指出的那样,HPCGPU 市场在一定程度上要归功于规模大得多(约 7 倍)的游戏市场,它帮助支付了硬件成本,让游戏玩家能够飞越星系,同时允许科学家模拟星系。

加密货币市场改变了这种低端动态。就加密货币而言,游戏 GPU 非常擅长快速查找唯一数字并产生热量。市场需求相当高,但由于加密市场的不断发展,需求似乎正在下降。

在高端市场,情况就完全不同了。根据雅虎财经的一篇文章,Reports Insights 的一份报告预测:“受图形处理器 (GPU) 科学模拟、数据分析和人工智能需求不断增长的推动,全球图形处理器 (GPU) 市场预计在 2022 年至2030 年期间复合年增长率为 33.5%。”

然而,对于 GPU 市场供应商来说,这是个好消息,对于最终用户来说,LLM(大型语言模型,如 ChatGPT)的增长创造了对 GPU 的新需求,而严格意义上来说,GPU 并不属于传统 HPC 市场的一部分。

以 Inflection AI 为例,该公司正在开发一种名为“Pi”的“个人人工智能”聊天机器人。为了实现这一目标,该公司建造了一台配备 22,000 个英伟达 H100 GPU 的超级计算机。为了提供一些背景信息,Frontier 是 6 月 23 日 TOP500 列表中排名第一的系统,拥有37,632 个 GPU。

Inflection AI 的情况并非独一无二。SemiAnalysis报告的另外两个数据点也支持同样的趋势。

“即使 OpenAI 也无法获得足够的 GPU,这严重阻碍了其近期路线图。由于 GPU 短缺,OpenAI 无法部署其多模态模型。“

正在寻找 FLOPS?

幸运的是,GPU 对于 HPC 来说并不是必需的。然而,最新的 TOP500 系统统计表明,37% 的机器使用 GPU。这个数字正在增加,并且随着系统进入 exaFLOPS 领域,加速器的使用将继续。

如前所述,GPU 不是必需的,但对于许多 HPC 应用程序来说通常是可取的。由于生成式 AI 行业爆炸式增长的巨大需求,许多 HPC 现场采购和/或云场景的担忧是GPU 的全面可用性(短缺)。“任何 GPU”(英伟达、AMD英特尔)的高市场需求可能会促使 HPC 从业者考虑仅使用 CPU 的解决方案来帮助加速其代码(例如,众核、AVX-512、HBM、3D V-Cache 等) 。

对“GPU 周期”的搜索也可能会带来一些新颖的方法。回想一下,HPC 中的一些原始 GPU 应用程序始于标准 GPU 卡和一种名为“Brook ”的新语言,该语言是 CUDA 的前身,并在第一段中提到的一些早期 GPU 卡上运行。一开始,这种方法似乎有点“尴尬”,但速度的提高是不容忽视的,结果重塑了 HPC 领域。

最近,一个有趣的消息是,最新版本的 AMD ROCm GPU 库(V5.6) 提供了对移动和桌面级 iGPU(集成 GPU)的支持。在LinkedIn 上的一篇简短帖子中,HPC 专家 JamesCuff 能够使用 Ryzen 9 6900HX 桌面处理器在CPU 和 CPU/iGPU 上运行 TensorFlow 基准测试。同样的基准测试在 CPU 上运行需要 13 秒,在CPU/iGPU 组合上运行需要 3 秒。当然,还需要更多的测试,但正如对 FLOPS 的搜索将目光转向了早期基于 GPU 的显卡一样,寻找内部 GPU 可能会为 HPC 组合添加一些未使用和可用的 FLOPS。GPU 的巨大压力已经到来。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5197

    浏览量

    132632
  • 机器人
    +关注

    关注

    206

    文章

    27033

    浏览量

    201407
  • HPC
    HPC
    +关注

    关注

    0

    文章

    279

    浏览量

    23418
  • 图形处理器
    +关注

    关注

    0

    文章

    185

    浏览量

    24899
  • ChatGPT
    +关注

    关注

    27

    文章

    1408

    浏览量

    4743

原文标题:GPU 的巨大压力即将到来

文章出处:【微信号:ICViews,微信公众号:半导体产业纵横】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    人类智慧水平AI即将到来,AI芯片已提前布局

    拥有人类智慧水平的AI即将出现,但不必恐惧,Altman认为这种AI对世界的影响远没有人们想象得那么严重。   人类水平AI即将到来   从过去的许多影视作品中其实不难发现,人们对于AI的心态是矛盾的。一方面认识到AI超强的实力,能够让我们的生活过的更加美好;另
    的头像 发表于 01-22 06:44 2185次阅读

    KLA即将亮相半导体行业盛会SEMICON China 2024

    即将到来的一周,一年一度的半导体行业盛会SEMICON China 2024 将于上海再次揭幕。
    的头像 发表于 03-13 09:59 408次阅读

    苹果公司为应对中国市场销量下滑,罕见推出iPhone折扣

    据苹果中国官方网站发布信息,1月18日至21日该公司针对部分iPhone进行了5%的降价,其主要目的是为了迎接即将到来的农历新年大促。值得注意的是,苹果最新的iPhone 15系列在华销售表现不佳,其面临着华为和小米等本地品牌带来的巨大竞争
    的头像 发表于 01-16 09:46 1523次阅读

    NVIDIA发布中国定制版RTX 4090D

    刚刚,NVIDIA官网发布了针对中国市场定制的RTX 4090D——D就是传说中的Dragon,对应即将到来的中国龙年。
    的头像 发表于 12-29 10:42 392次阅读
    NVIDIA发布中国定制版RTX 4090D

    2023年奖杯收到

    今天非常高兴收到了论坛发送的2023年“年度优秀版主”奖杯,今年不知不觉间就将结束,期待即将到来的2024年。加油论坛,加油各位坛友!
    发表于 12-09 22:26

    聊聊即将到来的MySQL5.7停服事件

    实际上数据库EOL的问题并不是在MySQL 5.7上第一次出现,Oracle用户都很清楚每个版本EOL的时间表。只不过Oracle官方依然会对付费用户提供延长期服务,还会在数年时间里继续为这些用户发布安全补丁包,因此EOL的Oracle版本依然可以通过各种渠道找到安全补丁包。
    的头像 发表于 10-18 15:35 452次阅读
    聊聊<b class='flag-5'>即将到来</b>的MySQL5.7停服事件

    天合储能即将发布新一代天合工商储解决方案

    工商业储能作为新型能源变革中,推动电力交易市场化的关键一环,承担着余量调度与灵活释放的重要作用。面对即将到来的工商储爆发,安全、降本、智能化正成为新一轮竞争下,各家储能系统角逐突围的核心因素
    的头像 发表于 10-13 10:22 627次阅读

    高效D类多媒体音频功率放大器

    /A或AD变换,减少失真以组成理想的数字化音响设备。目前,某些D类放大器的性能已达到HI-FI级的水平,可以预见到,音响领域的一个新时代即将到来。 这里介绍的是一种高效节能的小功率(5~10W,视电源
    发表于 09-19 07:17

    iPhone15四款机型相机曝光

    苹果每次迭代升级 iPhone,都会增强相机系统,即将到来的 iPhone 15也不例外。
    的头像 发表于 09-06 14:36 623次阅读

    基于磁贴的GPU架构优缺点

    本指南介绍了基于磁贴的GPU架构的优缺点。它还将ARM马里基于瓷砖的GPU架构设计与台式PC或控制台中常见的更传统的即时模式GPU进行了比较。 马里GPU使用基于平铺的渲染体系结构。
    发表于 08-02 12:54

    10路迷你A/B偏甲类汽车功放即将到来

    功放
    YS YYDS
    发布于 :2023年06月23日 00:53:39

    人工智能军事变革尚未到来

    但人工智能真的预示着军事变革即将到来吗?它为什么重要?就军事变革的概念而言,其要素包括技术变革、军事系统演变、作战创新和组织适应,是评估人工智能是否能够改变战争性质的自然视角,因为人工智能的价值目前处在狭窄的应用领域。
    的头像 发表于 06-20 11:28 349次阅读

    华为鸿蒙HarmonyOS 4即将到来

      第五届华为开发者大会2023 (together)将于2023年8月4日至8月6日在东莞松山湖举行,可能会发布harmonyos4.0。
    的头像 发表于 06-14 10:50 963次阅读

    新品预告 | 安信可Ai-Thinker高性价比Ai-WB3系列模组即将发售!

    安信可新品即将到来
    的头像 发表于 05-22 11:25 451次阅读
    新品预告 | 安信可Ai-Thinker高性价比Ai-WB3系列模组<b class='flag-5'>即将</b>发售!

    如何获取GPU vivante这些文件和目录?

    我必须对 GPU vivante 进行一些测试。我可以在文档中看到它提到了 /unit_tests/GPUgpu.sh 和 gpu_info.sh 以及一些示例 /opt/viv_
    发表于 05-22 06:27