0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPU的巨大压力即将到来

半导体产业纵横 来源:半导体产业纵横 2023-07-20 11:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

GPU涨的不仅是价格。

今年以来,直线上升的AIGC市场带热了GPU。TrendForce集邦咨询表示,2023年AI服务器出货量(包含搭载GPU、FPGAASIC等)出货量预估近120万台,年增率近38%,AI芯片出货量同步看涨,可望成长突破五成。

然而,供应短时间难以跟上需求的爆发。“一切都在等英伟达”,李平是某AI公司高管,他向记者透露,其公司在4月下单了服务器产品,但是因为服务器公司的GPU尚未到货,至今没有准确交货期,“现在再签服务器合同都是没有违约条款,不签货期的,只能选择等或者直接取消订单”。

对 GPU 硬件或更好的加速器的需求从未如此之大,如果这种趋势持续下去,当前的高需求可能会延续到不久的将来。就HPC领域而言,这一趋势表明 GPU 未来将会变得昂贵且难以找到,除非是购买的数量足以直接向供应商购买。

GPU非常适合加速矩阵运算,通常这也是许多 HPC 应用程序的核心。它们提供 SIMD(单指令多数据)处理单元,可以加速复杂的并行数组操作。正如人们经常指出的那样,HPCGPU 市场在一定程度上要归功于规模大得多(约 7 倍)的游戏市场,它帮助支付了硬件成本,让游戏玩家能够飞越星系,同时允许科学家模拟星系。

加密货币市场改变了这种低端动态。就加密货币而言,游戏 GPU 非常擅长快速查找唯一数字并产生热量。市场需求相当高,但由于加密市场的不断发展,需求似乎正在下降。

在高端市场,情况就完全不同了。根据雅虎财经的一篇文章,Reports Insights 的一份报告预测:“受图形处理器 (GPU) 科学模拟、数据分析和人工智能需求不断增长的推动,全球图形处理器 (GPU) 市场预计在 2022 年至2030 年期间复合年增长率为 33.5%。”

然而,对于 GPU 市场供应商来说,这是个好消息,对于最终用户来说,LLM(大型语言模型,如 ChatGPT)的增长创造了对 GPU 的新需求,而严格意义上来说,GPU 并不属于传统 HPC 市场的一部分。

以 Inflection AI 为例,该公司正在开发一种名为“Pi”的“个人人工智能”聊天机器人。为了实现这一目标,该公司建造了一台配备 22,000 个英伟达 H100 GPU 的超级计算机。为了提供一些背景信息,Frontier 是 6 月 23 日 TOP500 列表中排名第一的系统,拥有37,632 个 GPU。

Inflection AI 的情况并非独一无二。SemiAnalysis报告的另外两个数据点也支持同样的趋势。

“即使 OpenAI 也无法获得足够的 GPU,这严重阻碍了其近期路线图。由于 GPU 短缺,OpenAI 无法部署其多模态模型。“

正在寻找 FLOPS?

幸运的是,GPU 对于 HPC 来说并不是必需的。然而,最新的 TOP500 系统统计表明,37% 的机器使用 GPU。这个数字正在增加,并且随着系统进入 exaFLOPS 领域,加速器的使用将继续。

如前所述,GPU 不是必需的,但对于许多 HPC 应用程序来说通常是可取的。由于生成式 AI 行业爆炸式增长的巨大需求,许多 HPC 现场采购和/或云场景的担忧是GPU 的全面可用性(短缺)。“任何 GPU”(英伟达、AMD英特尔)的高市场需求可能会促使 HPC 从业者考虑仅使用 CPU 的解决方案来帮助加速其代码(例如,众核、AVX-512、HBM、3D V-Cache 等) 。

对“GPU 周期”的搜索也可能会带来一些新颖的方法。回想一下,HPC 中的一些原始 GPU 应用程序始于标准 GPU 卡和一种名为“Brook ”的新语言,该语言是 CUDA 的前身,并在第一段中提到的一些早期 GPU 卡上运行。一开始,这种方法似乎有点“尴尬”,但速度的提高是不容忽视的,结果重塑了 HPC 领域。

最近,一个有趣的消息是,最新版本的 AMD ROCm GPU 库(V5.6) 提供了对移动和桌面级 iGPU(集成 GPU)的支持。在LinkedIn 上的一篇简短帖子中,HPC 专家 JamesCuff 能够使用 Ryzen 9 6900HX 桌面处理器在CPU 和 CPU/iGPU 上运行 TensorFlow 基准测试。同样的基准测试在 CPU 上运行需要 13 秒,在CPU/iGPU 组合上运行需要 3 秒。当然,还需要更多的测试,但正如对 FLOPS 的搜索将目光转向了早期基于 GPU 的显卡一样,寻找内部 GPU 可能会为 HPC 组合添加一些未使用和可用的 FLOPS。GPU 的巨大压力已经到来。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5647

    浏览量

    139023
  • 机器人
    +关注

    关注

    213

    文章

    30580

    浏览量

    219577
  • HPC
    HPC
    +关注

    关注

    0

    文章

    342

    浏览量

    24825
  • 图形处理器
    +关注

    关注

    0

    文章

    202

    浏览量

    27442
  • ChatGPT
    +关注

    关注

    31

    文章

    1596

    浏览量

    10074

原文标题:GPU 的巨大压力即将到来

文章出处:【微信号:ICViews,微信公众号:半导体产业纵横】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    搭建万卡GPU集群,小米AI大模型即将全力启动

    电子发烧友网报道(文/黄山明)近日,有媒体报道,小米正在着手搭建自家的GPU万卡集群,将对AI大模型加大投入。该计划已进行数月,据悉小米大模型团队在成立之初便已拥有6500张GPU资源,小米创始人兼
    的头像 发表于 12-29 00:02 3530次阅读
    搭建万卡<b class='flag-5'>GPU</b>集群,小米AI大模型<b class='flag-5'>即将</b>全力启动

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1
    发表于 07-25 08:18

    压力开关的压力该怎么调整?

    压力开关
    jzyb
    发布于 :2025年07月14日 13:56:47

    可以手动构建imx-gpu-viv吗?

    使用 imx-gpu-viv-6.4.3.p4.2.aarch64.bin。 https://www.nxp.com/lgfiles/NMG/MAD/YOCTO//imx-gpu-viv-6.4.3.p4.2-aarch64.bin 我需要
    发表于 03-28 06:35

    驿路通OFC 2025亮点抢先看

    激动人心的时刻即将到来!驿路通科技将于2025年4月1日至3日参加荣耀亮相美国旧金山的 OFC 2025 盛会,作为光电领域的领军企业,我们期待在这场盛会与您与您一同探索光通信的无限可能。
    的头像 发表于 03-26 10:30 896次阅读

    无法在GPU上运行ONNX模型的Benchmark_app怎么解决?

    在 CPU 和 GPU 上运行OpenVINO™ 2023.0 Benchmark_app推断的 ONNX 模型。 在 CPU 上推理成功,但在 GPU 上失败。
    发表于 03-06 08:02

    OpenVINO™检测到GPU,但网络无法加载到GPU插件,为什么?

    OpenVINO™安装在旧的 Windows 10 版本 Windows® 10 (RS1) 上。 已安装 GPU 驱动程序版本 25.20.100.6373,检测到 GPU,但网络无法加载
    发表于 03-05 06:01

    华邦电子2024年度大事件回顾

    新春佳节即将到来,在此辞旧迎新之际,邦博士和大家一起回顾 2024 年精彩纷呈、收获颇丰的“芯”路历程。
    的头像 发表于 01-22 14:11 1071次阅读

    2024年GPU出货量增长显著,超越CPU

    6%的同比增长,总量超过2.51亿颗,这一数据不仅彰显了GPU市场的繁荣,也反映了当前市场对于图形处理能力的巨大需求。 尤为值得一提的是,与同样作为计算机核心部件的CPU相比,GPU在2024年的出货量上占据了明显优势。据JPR
    的头像 发表于 01-17 14:12 825次阅读

    GPU按需计费的优势

    GPU按需计费,是指用户根据实际使用的GPU资源和时间进行费用结算,而非传统的一次性购买或固定租赁模式。以下,是对GPU按需计费优势的总结,由AI部落小编整理。
    的头像 发表于 01-14 10:43 628次阅读

    赣锋锂业2024年度精彩回顾

    岁序更替,华章日新。2025年即将到来,在这辞旧迎新的美好时刻,赣锋锂业向您致以诚挚的问候和新年祝福。
    的头像 发表于 01-02 16:07 891次阅读

    富士通预测2025年AI领域的发展趋势

    过去一年中,人工智能技术飞速发展,在各行各业都收获了巨大进展。面对即将到来的2025年,富士通技术研发团队的专家对AI领域的发展趋势进行了展望,让我们来看看未来一年,有哪些重要趋势值得关注。
    的头像 发表于 12-27 11:23 1392次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH发布的有关CST Studio Suite 2024的GPU计算指南。涵盖GPU计算
    发表于 12-16 14:25

    400G 网络如何测试

    。FTBx-88480提供G级的以太网测试功能,包括前向纠错监测和验证。RFC 2544随着400G从实验室走向现场(首批400G部署即将到来),在开通服务时确保其质量变得非常关键。借助便携的1G至400G 测试设备
    发表于 12-12 10:56