0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌最强大的定制设计人工智能加速器—TPU v5p芯片

Qxwdz168 来源:计算机视觉芯片设计 2023-12-26 09:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谷歌正迅速成为 BFF Nvidia 的强大对手——为其超级计算机提供动力的 TPU v5p AI 芯片速度更快,内存和带宽比以往任何时候都多,甚至击败了强大的 H100

TPU v5p——谷歌最强大的定制设计人工智能加速器——已被部署为该公司的“人工智能超级计算机”提供动力。 这是一种专门为运行人工智能应用程序而构建的超级计算架构,而不是通常运行科学工作负载的超级计算机,因为 TPU 不适合于此。

最新版本的 TPU 每个 Pod 有 8,960 个芯片(构成系统),而 v4 中有 4,096 个芯片,并且就每个 Pod 的 FLOP 总可用性而言,其可扩展性是其四倍。 这些新 Pod 提供 4,800Gbps 的吞吐量。 新 Pod 还配备 95GB 高带宽内存 (HBM),而 TPU v4 中则配备 32GB HBM RAM。​

与Nvidia 提供 GPU 供其他公司购买不同,谷歌的定制 TPU 仍保留在内部,供其自己的产品和服务使用。 谷歌的 TPU 长期以来一直用于为其 Gmail、YouTube 和 Android 等服务提供支持,最新版本也用于训练 Gemini。

它的功能甚至足以与 Nvidia 广受欢迎的 H100 GPU 相媲美,后者是处理 AI 工作负载的最佳显卡之一。 根据该公司自己的数据,该组件在训练工作负载方面比 Nvidia 的 A100 GPU 快四倍。

与此同时,根据 4 月份发布的研究显示,谷歌 TPU v4 的速度预计比 A100 快 1.2 至 1.7 倍。 因此,令人难以置信的粗略计算表明,TPU v5p 的速度大约是 A100 的 3.4 到 4.8 倍,这使其与 H100 相当!







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    841

    浏览量

    40305
  • RAM
    RAM
    +关注

    关注

    8

    文章

    1404

    浏览量

    121218
  • TPU
    TPU
    +关注

    关注

    0

    文章

    176

    浏览量

    21734
  • HBM
    HBM
    +关注

    关注

    2

    文章

    437

    浏览量

    15908
  • 人工智能芯片

    关注

    1

    文章

    124

    浏览量

    31150

原文标题:TPU v5p人工智能芯片

文章出处:【微信号:计算机视觉芯片设计,微信公众号:计算机视觉芯片设计】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌发布第八代TPU,训练推理分离,搭载自研CPU

    电子发烧友网报道(文/李弯弯)在2026年4月22日举行的谷歌云Next大会上,谷歌正式发布了第八代张量处理单元(TPU)。此次发布的产品包含两款独立的芯片
    的头像 发表于 04-24 09:03 6409次阅读
    <b class='flag-5'>谷歌</b>发布第八代<b class='flag-5'>TPU</b>,训练推理分离,搭载自研CPU

    嵌入式人工智能课程(华清远见)

    嵌入式 AI 编译优化:华清远见课程,解锁极致端侧性能 随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着一个巨大的技术鸿沟:在算力受限
    发表于 04-16 18:47

    浅谈人工智能(2)

    接前文《浅谈人工智能(1)》。 (5)什么是弱人工智能、强人工智能以及超人工智能? 弱人工智能
    的头像 发表于 02-22 08:24 440次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    后摩智能M50芯片亮相联想集团首届创新加速器开放日

    2月5日,联想集团在京举办首届创新加速器开放日暨“新商业创新生态路演”,本次活动聚焦于AI算力、核心部件及软硬件应用等领域的技术及产品。作为联想创投旗下企业,后摩智能集中展示了如何通过端边大模型AI
    的头像 发表于 02-09 15:59 763次阅读

    自然智能与人工智能融合如何重塑芯片设计

    人类大脑是所有处理中最复杂的,能够构思出不可思议的创意,解决复杂、微妙的问题。相比之下,人工智能擅长快速分析海量数据并高效执行任务。当自然智能人工智能融合的结果,就是
    的头像 发表于 01-15 13:58 787次阅读

    奇异摩尔参编人工智能加速器互联芯粒技术要求团体标准发布

    》标准(编号T/CESA 1457-2025)已获批准,并予以近日正式实施。此项标准是构建高性能“人工智能超节点服务”的关键底层技术规范,旨在统一和规范加速器间的互联接口,促进不同AI芯片
    的头像 发表于 01-09 11:20 898次阅读
    奇异摩尔参编<b class='flag-5'>人工智能</b><b class='flag-5'>加速器</b>互联芯粒技术要求团体标准发布

    AI芯片大单!Anthropic从博通采购100万颗TPU v7p芯片

    Anthropic供应基于TPU v7p的机架级 AI 系统,绕过TPU芯片的另一开发参与方谷歌。不过
    的头像 发表于 01-06 08:38 1.1w次阅读

    谷歌云发布最强自研TPU,性能比前代提升4倍

    电子发烧友网报道(文/李弯弯)近日,谷歌云在官方博客上正式宣布,公司成功推出第七代TPU(张量处理)“Ironwood”,该芯片预计在未来几周内正式上市。   “Ironwood”由
    的头像 发表于 11-13 07:49 9165次阅读
    <b class='flag-5'>谷歌</b>云发布<b class='flag-5'>最强</b>自研<b class='flag-5'>TPU</b>,性能比前代提升4倍

    边缘计算中的AI加速器类型与应用

    人工智能正在推动对更快速、更智能、更高效计算的需求。然而,随着每秒产生海量数据,将所有数据发送至云端处理已变得不切实际。这正是边缘计算中AI加速器变得不可或缺的原因。这种专用硬件能够直接在边缘设备上
    的头像 发表于 11-06 13:42 1130次阅读
    边缘计算中的AI<b class='flag-5'>加速器</b>类型与应用

    创客总部加入MathWorks加速器计划

    全球领先的数学计算软件开发商 MathWorks 日前宣布,创客总部已加入 MathWorks 加速器计划。作为中关村科创孵化,创客总部致力于为人工智能创业企业、高校院所技术精英搭建推动与实体经济
    的头像 发表于 08-22 10:00 1466次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:23

    关于人工智能处理的11个误解

    本文转自:TechSugar编译自ElectronicDesign人工智能浪潮已然席卷全球,将人工智能加速器和处理整合到各类应用中也变得愈发普遍。然而,围绕它们是什么、如何运作、能如
    的头像 发表于 08-07 13:21 1337次阅读
    关于<b class='flag-5'>人工智能</b>处理<b class='flag-5'>器</b>的11个误解

    是德示波器DSOX6002A在人工智能芯片测试中的应用

    功能,在AI芯片的研发、验证和量产测试中扮演着关键角色。本文将从信号完整性、电源完整性、时序分析、调试优化及一致性测试等方面深入探讨其应用。 一、AI芯片测试的核心挑战与示波器的关键作用 人工智能
    的头像 发表于 07-31 17:30 1098次阅读
    是德示波器DSOX6002A在<b class='flag-5'>人工智能</b><b class='flag-5'>芯片</b>测试中的应用

    AI芯片加速人工智能计算的专用硬件引擎

    人工智能(AI)的快速发展离不开高性能计算硬件的支持,而传统CPU由于架构限制,难以高效处理AI任务中的大规模并行计算需求。因此,专为AI优化的芯片应运而生,成为推动深度学习、计算机视觉、自然语言
    的头像 发表于 07-09 15:59 2082次阅读