0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

“网红”芯片Groq让英伟达蒸发5600亿

AI芯天下 来源:AI芯天下 2024-02-27 15:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

前言: 鉴于ChatGPT的广泛应用,引发了AI算力需求的迅猛增长,使得英伟达的AI芯片供不应求,出现大规模短缺。如今,英伟达似乎在面对更多挑战。

比英伟达GPU快10倍的LPU

近两天,一家名为Groq的美国人工智能公司受到了广泛关注,其主要原因在于其自主研发的LPU芯片在人工智能推理技术上取得了突破。

通过优化架构和减少内存瓶颈,Groq的LPU芯片在大模型处理方面展现出高效率和低延迟的特点,速度远超英伟达GPU,每秒生成速度接近500 tokens,而GPT-4仅40 tokens。

因此,Groq LPU被誉为[史上最快的大模型技术]。

81f18d12-d4a5-11ee-a297-92fbcf53809c.png

Groq LPU的工作原理与英伟达的GPU不同,它采用了名为时序指令集计算机(Temporal Instruction Set Computer)架构,使用存储器为静态随机存取存储器(SRAM),其速度比GPU所用的高带宽存储器(HBM)快约20倍。

据Groq在2024年1月的第一个公开基准测试,由Groq LPU驱动的Meta Llama 2-70B模型,推理性能比其他顶级云计算供应商快18倍。

artificialanalysis.ai给出的测评结果也显示,Groq的吞吐量速度称得上是[遥遥领先]。

总结起来,Groq的架构建立在小内存,大算力上,因此有限的被处理的内容对应着极高的算力,导致其速度非常快。

有分析人士称,在A100和H100相对紧缺的时代,LPU或许会成为大模型开发商的新选择。

820d6802-d4a5-11ee-a297-92fbcf53809c.png

Grop部署起来甚至比英伟达要贵

当初Groq以其闪电般的速度令AI行业为之震撼。

然而,在震撼之余,许多业界人士核算后发现,这种速度背后的代价可能过于高昂。

Groq的LPU芯片摒弃了HBM,仅依赖SRAM进行计算。

尽管这种方式确实带来了令人瞩目的计算速度,但其成本效益问题却备受质疑。

值得关注的是,尽管Groq在速度上表现出色,但其背后的成本却相当高昂。

若以未来三年运行成本计算,Groq的硬件采购成本高达1144万美元,而运营成本至少为76.2万美元。

据此估算,在同等吞吐量下,Groq的硬件成本约为H100的40倍,能耗成本则是10倍。

若考虑运营三年,Groq硬件的购买成本为114.4万美元,运营成本为76.2万。

另一方面,对于一个8卡的H100盒子,硬件购买成本为30万美元,运营成本约为7.2万或稍低。

由于Groq内存容量相对较小(230MB),在运行Llama-270b模型时,需配备305张Groq卡才能满足需求,而使用H100仅需8张卡。

因此,从当前价格来看,在同等吞吐量下,Groq的硬件成本是H100的40倍,能耗成本是10倍。

换言之,Groq的高速性能是建立在有限的单卡吞吐能力基础之上的。

为实现与H100相同的吞吐量,Groq需采用更多张显卡。

在此背景下,[速度]成为了Groq的一把双刃剑。

8222e222-d4a5-11ee-a297-92fbcf53809c.png

Groq喊话[三年内赶超英伟达]

近期,一位自称为Groq员工的用户在与网络用户互动时表示,Groq致力于成为最快速的大规模模型硬件,并誓言在三年内超越英伟达。

然而,截至2月20日美股收盘,英伟达股价单日跌幅达4.35%,创下去年10月以来最大单日跌幅,市值一夜之间缩水780亿美元(约合5600亿元人民币)。

尽管Groq速度迅猛,但价格较高,目前尚不能与英伟达抗衡。SRAM技术面积大、功耗高,早已以IP内核形式集成至系统级芯片(SoC),而非单独应用,其未来发展潜力远不及HBM(高带宽内存)。

在单位容量价格、性能及功耗方面,英伟达GPU所采用的HBM技术均优于SRAM。

从技术和性能角度看,Groq目前尚无法撼动英伟达的地位。

原因在于,英伟达GPU产品具有通用性,而Groq产品为ASIC(专用集成电路),并非通用产品,而是定制产品。

换言之,任何人工智能算法均可使用英伟达的H200,但仅Mixtral和Llama2能采用Groq的LPU。

欲使用Groq产品,大模型公司需先明确需求、指定规格,然后进行功能验证,最终生产出的产品方可投入使用。

英伟达财报再次印证了其在人工智能浪潮中成为最大赢家的地位。

英伟达于北京时间2月22日发布截至2024年1月28日的四季度业绩报告。

报告显示,公司季度营收创纪录达到221亿美元,远超英伟达自身及华尔街预期,同比增长265%。

全年营收同样创下新高,达到609亿美元,同比增长126%。

英伟达预计本季度营收将进一步攀升至240亿美元。财报发布后,其股价盘后一度涨超10%。

82387736-d4a5-11ee-a297-92fbcf53809c.png

结尾:

Groq架构的特点是小内存和大算力,适合频繁数据搬运的场景,速度快但单卡吞吐能力有限,需要更多卡来保证同等吞吐量,速度既是优势也是劣势。

此外,由于GPU的生态极为发达,其中英伟达的GPU不仅性能强大,在性能卓越的同时,还聚集了大量用户和丰富的生态环境。

相比之下,Groq 目前仅能为少数大型模型提供服务,想要在低延迟领域建立持续优势,需要拓宽服务范围并进一步减少总体成本。


审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    39

    文章

    7715

    浏览量

    170887
  • 英伟达
    +关注

    关注

    23

    文章

    4044

    浏览量

    97716
  • HBM
    HBM
    +关注

    关注

    2

    文章

    426

    浏览量

    15706
  • GPU芯片
    +关注

    关注

    1

    文章

    306

    浏览量

    6405
  • ChatGPT
    +关注

    关注

    31

    文章

    1596

    浏览量

    10077

原文标题:热点丨“网红”芯片Groq让英伟达蒸发5600亿

文章出处:【微信号:World_2078,微信公众号:AI芯天下】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    套现413亿!软银清仓英伟,AI硬件泡沫破裂?

    电子发烧友报道(文/黄山明)前几天,全球知名的科技投资公司日本软银集团(SBG)突然宣布,公司已经在今年10月出售了所持有的全部英伟股票,共计3210万股,套现58亿美元(约合人民
    的头像 发表于 11-13 09:19 5254次阅读

    英伟 Q3 狂揽 308 亿

    厂商季度合计 500 亿美元资本支出中,约 30% 流向了英伟。 新一代 Blackwell 芯片已全面投产,Q3 交付 1.3 万个 GPU 样品,H200 GPU 理论性能较 H
    的头像 发表于 11-20 18:11 1073次阅读

    黄仁勋:英伟AI芯片订单排到2026年 英伟上季营收加速增长62%再超预期

    AI芯片总龙头英伟的财报终于带来了惊喜;英伟公司发布财报数据显示,上季营收加速增长62%;再超华尔街预期。业界都比较振奋,
    的头像 发表于 11-20 11:36 868次阅读

    NVIDIA新闻:英伟10亿美元入股诺基亚 英伟推出全新量子设备

    给大家分享一些NVIDIA新闻: 英伟10亿美元入股诺基亚 在当地时间10月28日,英伟正式宣布将以10
    的头像 发表于 10-29 17:12 1320次阅读

    英伟斥资50亿美元入股英特尔,芯片巨头携手重塑行业格局

    在科技行业引发广泛关注的重大事件中,当地时间9月18日,全球知名的芯片企业英伟宣布,将斥资50亿美元入股英特尔,双方还达成合作协议,共同致力于人工智能基础设施和个人计算产品的联合开发
    的头像 发表于 09-22 17:35 627次阅读

    国家信办约谈英伟

    近日,英伟算力芯片被曝出存在严重安全问题。此前,美议员呼吁要求美出口的先进芯片必须配备“追踪定位”功能。美人工智能领域专家透露,英伟
    的头像 发表于 07-31 13:56 2555次阅读
    国家<b class='flag-5'>网</b>信办约谈<b class='flag-5'>英伟</b><b class='flag-5'>达</b>

    英伟2026财年Q1营收公布 一季度营收441亿美元 英伟Q1净利润187.8亿美元

    英伟的业绩暴涨神话依然在继续,在5月29日英伟公司发布了2026财年第一季度财报。财报数据显示,该季度英伟
    的头像 发表于 05-29 17:58 747次阅读

    特朗普要叫停英伟对华特供版 英伟H20出口限制 或损失55亿美元

    据外媒报道,英伟公司发布了一项通知称,美国政府于9日告知英伟公司;特供版的H20芯片出口到中国需要许可证,紧接着在14日又告知
    的头像 发表于 04-16 16:59 1894次阅读

    新思科技携手英伟加速芯片设计,提升芯片电子设计自动化效率

    解决方案在英伟 GPU和英伟 CUDA-X库上所实现的加速 基于英伟 GB200 Grac
    发表于 03-19 17:59 438次阅读

    英伟市值一夜蒸发近2万亿 英伟股价下跌超8%

    在美东时间周一,美股三大指数集体收跌,截至收盘,英伟股价下跌超8%,英伟市值一夜蒸发2650亿
    的头像 发表于 03-04 10:19 999次阅读

    英伟财报发布!Q4净利润220.91亿美元

    %。 英伟首席财务官克莱特·克雷斯披露,2025财年第四季度公司交付了110亿美元的Blackwell芯片。2025财年英伟
    的头像 发表于 02-27 15:30 898次阅读

    英伟四季度营收393亿美元 英伟第四财季净利润增80%

    根据全球AI龙头英伟公司发布的截至1月26日的2025财年第四财季营业数据报告显示;第四财季营收达到393.31亿美元,较去年同期增长78%,高于分析师事前预期的380.5亿美元;其
    的头像 发表于 02-27 15:18 1087次阅读

    突发!英伟H20芯片在华订单大增,买家曝光

    人们对 DeepSeek 可能致使人工智能芯片需求下滑的担忧。 此前,DeepSeek 爆火给英伟带来了不小的冲击。2025 年 1 月,DeepSeek 发布 R1 模型的开源版本,英伟
    的头像 发表于 02-26 00:10 3903次阅读

    Groq获沙特15亿美元投资,加速AI芯片全球布局

    近日,美国AI芯片初创公司Groq宣布了一项重大融资进展。2月10日,该公司透露已从沙特阿拉伯获得高达15亿美元的投资承诺,旨在扩大其先进的AI芯片向沙特市场的交付规模。
    的头像 发表于 02-13 16:20 846次阅读

    微软大手笔采购英伟AI芯片

    据全球知名市场调研机构Omdia的最新估计,微软在2024年的英伟Hopper架构芯片采购计划上展现出了惊人的手笔。这一举动旨在帮助微软在构建下一代人工智能(AI)系统的激烈竞争中抢占先机。 据悉
    的头像 发表于 12-20 15:50 962次阅读