0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何解决GPU短缺和成本飙升问题?

sakobpqhz 来源:算力基建 2023-09-14 11:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

9月14-15日,2023全球AI芯片峰会将在深圳湾万丽酒店举行。清华大学教授、中国半导体行业协会副理事长魏少军领衔50+位演讲嘉宾,NVIDIA高通英特尔AMD齐聚,近30家中国AI芯片与算力企业登台交锋,4家Chiplet创业创新团队亮相,6位分析师和投资人带来报告分享。峰会最终议程已公布,欢迎大家报名,线下参会交流。

由 GPT-4 等大型语言模型 (LLM) 支持的生成式人工智能在科技界引起了巨大震动。ChatGPT 的迅速崛起引发了全球科技行业对人工智能的重新评估和优先考虑,实时重塑了产品战略。

LLM 的整合为产品开发人员提供了一种简便的方法,将人工智能驱动的功能融入到他们的产品中。但并非一帆风顺。产品领导者面临着一个巨大的挑战:GPU 短缺和成本飙升。

01.LLMs的兴起和GPU短缺

越来越多的人工智能初创公司和服务导致对 A100 和 H100 等高端 GPU 的高需求,从而压垮了 Nvidia 及其制造合作伙伴台积电,两者都在努力满足供应。Reddit 等在线论坛上充斥着对 GPU 可用性的不满,这呼应了整个技术社区的情绪。情况变得如此可怕,AWS 和 Azure 都别无选择,只能实施配额系统。

这个瓶颈不仅挤压了初创企业,也挤压了初创企业的发展。对于 OpenAI 这样的科技巨头来说,这是一个绊脚石。最近在伦敦举行的一次非正式会议上,OpenAI 首席执行官 Sam Altman坦诚承认,计算机芯片短缺正在阻碍 ChatGPT 的进步。据报道,Altman 感叹计算能力的缺乏导致 API 可用性低于标准,并阻碍 OpenAI 为 ChatGPT 推出更大的“上下文窗口”。

推荐一场会议。2023全球AI芯片峰会将于9月14-15日在深圳湾万丽酒店举行,NVIDIA 解决方案与架构技术总监张瑞华首次参会,将围绕《生成式 AI 与大语言模型时代的 NVIDIA GPU 生态》这一主题带来演讲。欢迎大家报名参会~

02.优先考虑AI功能

一方面,产品领导者发现自己陷入了不懈的创新之中,面临着利用新一代人工智能的力量提供尖端功能的期望。另一方面,他们还要应对 GPU 容量限制的严峻现实。这是一个复杂的杂耍行为,无情的优先顺序不仅成为战略决策,而且成为必要。 鉴于 GPU 可用性在可预见的未来仍将是一个挑战,产品领导者必须战略性地考虑 GPU 分配。传统上,产品领导者依赖于优先级划分技术,例如客户价值/需求与努力矩阵。无论这种方法在计算资源丰富的世界中多么合乎逻辑,现在都需要进行一些重新评估。 在我们当前的范式中,计算是限制因素,而不是软件人才,产品领导者必须重新定义如何确定各种产品或功能的优先级,将 GPU 的限制带到战略决策的最前沿。 对于科技行业来说,围绕容量限制进行规划似乎不寻常,但在其他行业却是一种常见策略。基本概念很简单:最有价值的因素是在受限资源上花费的时间,目标是优化在该约束上花费的每单位时间的价值。

03.技术成功指标

作为一名前顾问,我已成功地将这个框架应用于各个行业。我相信,在 GPU 限制存在的情况下,科技产品领导者也可以使用类似的方法来确定产品或功能的优先级。应用此框架时,最直接的价值衡量标准是盈利能力。 然而,在科技领域,盈利能力可能并不总是合适的衡量标准,特别是在涉足新市场或新产品时。因此,我调整了该框架,以与技术中普遍使用的成功指标保持一致,概述了一个简单的四个步骤过程:

1.贡献 首先也是最重要的,确定你的北极星指标。这是每个产品或功能的贡献,概括了其价值的本质。一些具体的例子可能包括:

收入和利润增加

市场份额的增长

日/月活跃用户数增长

2. 所需GPU数量 衡量每个产品或功能所需的 GPU 数量。重点关注关键因素,包括:

每个用户每天的查询数

日活跃用户数

查询的复杂性(每个查询消耗多少令牌)

3.计算每个GPU的贡献

把它分解到具体细节。每个 GPU 对总体目标有何贡献?了解这一点将使您清楚地了解 GPU 的最佳分配位置。 根据每个 GPU 的贡献确定产品的优先级 现在,是时候做出艰难的决定了。根据每个 GPU 的贡献对您的产品进行排名,然后进行相应的排列。首先关注每 GPU 贡献最高的产品,确保将有限的资源投入到能够产生最大影响的领域。 由于GPU 限制不再是盲点,而是决策过程中的可量化因素,您的公司可以更有策略地应对 GPU 短缺问题。为了使这个框架变得生动起来,让我们想象一个场景,在这个场景中,作为产品领导者,您正在努力应对在四种不同产品之间确定优先级的挑战:

b244f470-4f8c-11ee-a25d-92fbcf53809c.png

尽管产品 A 具有最高的收入潜力,但它并没有为每个 GPU 带来最高的贡献。令人惊讶的是,产品 D 的收入潜力最小,但每个 GPU 的回报却最高。通过根据此指标确定优先级,您可以最大化总潜在收入。 假设您总共有 1,000 个 GPU 可供使用。一个简单的选择可能会让您选择产品 A,从而产生 1 亿美元的潜在收入。但是,通过应用上述优先级策略,您可以获得 1.55 亿美元的收入:

b2775e92-4f8c-11ee-a25d-92fbcf53809c.png

同样的方法可以应用于其他贡献指标,例如市场份额增益:

b2a03420-4f8c-11ee-a25d-92fbcf53809c.png

同样,选择产品 A 会导致市场份额增加 5%。然而,应用上述优先级策略,您可以获得 7.75% 的市场份额增益:

b2bff120-4f8c-11ee-a25d-92fbcf53809c.png

04.优点和限制

这种替代的优先级框架引入了一种更加细致和更具战略性的方法。通过专注于每个 GPU 的贡献,您可以战略性地调整资源,使其能够发挥最大的作用,无论是在收入、市场份额还是任何其他定义指标方面。 但优点还不止于此。这种方法还可以增强产品团队的清晰度和客观性。根据我的经验,包括我早期在一家医疗保健公司领导数字化转型以及后来与麦肯锡的各种客户合作时,这种方法在容量限制是关键因素的情况下改变了游戏规则。它使我们能够以更加数据驱动和理性的方式确定计划的优先顺序,从而将传统政治边缘化,否则决策可能会落在房间里最响亮的声音的手中。 然而,不存在一刀切的解决方案,并且值得承认这种方法的潜在局限性。例如,这种方法可能并不总是体现某些投资的战略重要性。因此,虽然可以而且应该对框架做出例外,但应该仔细考虑例外情况,而不是规范。这样可以保持流程的完整性,并确保任何偏差都是在考虑到更广泛的战略背景的情况下做出的。

05.结论

产品领导者面临着前所未有的GPU 短缺局面,因此需要寻找新的资源管理方法。用伟大的军事家孙子的话来说,“混乱之中也蕴藏着机遇”。 GPU 短缺确实是一个挑战,但如果采取正确的方法,它也可能成为差异化和成功的催化剂。所提出的优先级框架侧重于每个 GPU 的贡献,提供了一种确定优先级的战略方法。通过专注于每个 GPU 的贡献,公司可以最大限度地提高投资回报,将资源调整到能够产生最大影响的地方,并专注于对公司长期成功最重要的事情。

编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5685

    浏览量

    110111
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136060
  • 人工智能
    +关注

    关注

    1820

    文章

    50314

    浏览量

    266887
  • AI芯片
    +关注

    关注

    17

    文章

    2164

    浏览量

    36865
  • ChatGPT
    +关注

    关注

    31

    文章

    1600

    浏览量

    10391

原文标题:GPU短缺和成本问题,如何破?

文章出处:【微信号:算力基建,微信公众号:算力基建】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国产来袭!2nm AI GPU

    的时间和成本内实现。   近日,据媒体报道,上海棣山科技有限公司(以下简称“棣山科技”)对外披露其2nm高端AI GPU芯片最新研发进展。据悉,该公司自主攻关的这款芯片已达到国际前沿设计水平,目前核心研发工作仍处于原型验证关键阶段。   国产 2n
    的头像 发表于 04-15 07:02 8316次阅读

    “芯片短缺 2.0”时代,正在到来

    全球汽车行业曾以为芯片短缺最糟糕的时期已经过去。疫情扰乱了供应链,导致生产线停工,许多人认为半导体危机终将随着时间的推移而缓解。然而,一个被称为“芯片短缺2.0”的新阶段正在到来,而且与以往截然不同
    的头像 发表于 04-20 13:06 147次阅读
    “芯片<b class='flag-5'>短缺</b> 2.0”时代,正在到来

    AI爆款应用驱动需求增长,英伟达H100租赁费用飙升40%

    2025年10月的每小时1.7美元,在今年3月涨至每小时每块GPU 2.35美元。   H100租赁费用飙升的背后   SemiAnalysis的指数基于对100多家云服务提供商、算力资源买家和卖家的直接调查数据构建,每月采集一次。最新报告指出,按需租用的
    的头像 发表于 04-05 07:05 1.3w次阅读

    如何在 VisionFive v2 上使用外部 GPU

    如果旧的 amd gpu 在 VisionFive V2 上运行,我想使用带有开源 amd 驱动程序的 amd gpu。我需要什么以及如何将 GPU 连接到 VisionFive v2?
    发表于 03-13 06:38

    全球半导体短缺下,海翔科技的二手射频电源如何激活成熟制程产能?

    一、引言 全球半导体短缺已持续多年,汽车电子、物联网等下游领域需求激增与晶圆产能不足形成尖锐矛盾,成熟制程(28nm及以上)作为支撑终端产品生产的核心产能,其激活与释放成为破解短缺困境的关键。射频
    的头像 发表于 03-02 11:02 246次阅读
    全球半导体<b class='flag-5'>短缺</b>下,海翔科技的二手射频电源如何激活成熟制程产能?

    AI芯片内存短缺,中小企业靠「智芯谷」国产替代破局

    企业而言,供应链稳定性受到严重冲击——关键物料断供、替代方案难寻、采购成本攀升,正倒逼企业寻找新的生存路径。短缺背后的深层动因此次短缺潮并非偶然。一方面,AI应用全
    的头像 发表于 01-06 18:01 1948次阅读
    AI芯片内存<b class='flag-5'>短缺</b>,中小企业靠「智芯谷」国产替代破局

    因芯片短缺,本田在华工厂将停产

    半导体短缺的阴影,依然笼罩着全球汽车制造业。最新消息称,本田汽车因核心芯片供应紧张,不得不再次调整生产计划。本田公司于12月17日对外透露,由于持续性的半导体短缺,计划从12月下旬至明年1月上旬,对位于日本和中国的整车工厂采取暂停生产或减产措施。
    的头像 发表于 12-24 18:09 1297次阅读

    汽车中的GPU是如何使用的?

    (HMI)的发展尤为迅猛。随着电子电气架构(EEA)的集中化,车辆对高性能计算能力的需求显著提升,GPU(图形处理单元)的灵活性、可扩展性以及高效并行计算能力,使其成为支持这些创新应用的核心组件
    的头像 发表于 12-03 14:45 9700次阅读
    汽车中的<b class='flag-5'>GPU</b>是如何使用的?

    如何看懂GPU架构?一分钟带你了解GPU参数指标

    GPU架构参数如CUDA核心数、显存带宽、TensorTFLOPS、互联方式等,并非“冰冷的数字”,而是直接关系设备能否满足需求、如何发挥最大价值、是否避免资源浪费等问题的核心要素。本篇文章将全面
    的头像 发表于 10-09 09:28 1523次阅读
    如何看懂<b class='flag-5'>GPU</b>架构?一分钟带你了解<b class='flag-5'>GPU</b>参数指标

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell GPU,可提高工程、内容创作和 3D 可视化等应用的性能。
    的头像 发表于 08-18 11:50 1635次阅读

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1
    发表于 07-25 08:18

    GPU架构深度解析

    GPU架构深度解析从图形处理到通用计算的进化之路图形处理单元(GPU),作为现代计算机中不可或缺的一部分,已经从最初的图形渲染专用处理器,发展成为强大的并行计算引擎,广泛应用于人工智能、科学计算
    的头像 发表于 05-30 10:36 2017次阅读
    <b class='flag-5'>GPU</b>架构深度解析

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP 核,凭借其异构计算架构、能效优化和生态协同,成为全球移动
    的头像 发表于 05-29 10:12 4904次阅读

    中国为何同时面临算力过剩与短缺

    中国为何同时面临算力过剩与短缺
    的头像 发表于 04-24 15:02 1549次阅读
    中国为何同时面临算力过剩与<b class='flag-5'>短缺</b> ?