0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌TPU3.0的四大亮点

DPVg_AI_era 来源:未知 作者:胡薇 2018-05-14 08:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Google在I/O大会上发布了TPU3,虽然目前详细信息不多,但下面几点还是值得讨论:8倍性能;快速迭代;云服务和Benchmark。TPU3到底哪里厉害?

8倍性能

今天的新闻中我们都可以看到如下描述“Google CEO Sundar Pichai said the new TPU is eight times more powerful than last year per pod, with up to 100 petaflops in performance.”也就是说一个TPU3 pod的总处理能力100 PFLOPS是TPU2 pod的8倍。

从下图我们可以看一下TPU3 pod和TPU2 pod的对比。

TPU2的一个pod包括4个rack,两个CPU rack(左右两边),两个TPU rack(中间两个)。每个rack有32个computing unit (板卡),每个TPU板卡有4颗TPU芯片。因此一个pod总共有64 x 4颗TPU2芯片。每颗TPU2芯片的处理能力是45TFLOPS,因此一个pod总的处理能力是45 x 4 x 64 = 11.5 PFLOPS.

对比来看,TPU3的板卡仍然包括4颗芯片。但目测TPU3 pod的rack数量和板卡的密度(这个看的不是很清楚)和TPU2相比都增加了一倍。因此,一个pod中的TPU3芯片的数量应该是之前4倍。如果pod的总处理能力是TPU2的8倍,那么TPU3单芯片的处理能力则为TPU2的2倍。

根据Google的说法,这次他们第一次在Data center采用水冷的散热方式,这可能和芯片功耗以及板卡密度增加有关系。

Google also said this is the first time the company has had to include liquidcooling in its data centers, CEO Sundar Pichai said.

总得来说,如上图所描述(来自Google I/O大会的talk:Effective Machine Learning with Google TPU,可以在YouTube上搜索Google io 18 stage 8观看),TPU3实现的超过100 PFLOPS的处理能力是来自“新的芯片架构和大规模系统”。

快速迭代

从去年I/O大会发布TPU2到今天不过一年时间,Google的芯片迭代速度还是非常惊人的。“为什么Google能够实现这样的快速迭代?”这也是一个非常值得探讨的话题。

我先简单谈几点个人看法:

第一,TPU是一个Domain-specific Architecture(参考当我们设计一个专用处理器的时候我们在干什么?(上)),定位准确,架构简单,容易扩展。相比之下,传统的通用处理器必须考虑灵活性和兼容性,有太重的包袱。当然,TPU这种特点也决定它只能用于有限的应用场景,可能只有Google的体量以及云服务能够所提供的应用需求才能充分利用TPU这种专用芯片,这一点是得天独厚的。这也是目前几乎所有科技巨头都开始自研芯片的一个基本考量。而传统的芯片厂商在这一点上就有些尴尬了。

第二,Google的软件和系统能力超强,TPU以Cloud service出现,提高给客户的是整体服务。芯片硬件可做的tradeoff空间比较大,芯片本身的弱点可以在系统层面弥补。从目前得到的信息分析的,TPU3的处理能力是TPU2的8倍,其中芯片换代的贡献只有2倍,大部分改进在系统层面。另一方面,目前芯片开发离不开相关软件工具,Google的软件能力和生态也是其能够实现芯片快速迭代的一个重要因素。

第三,钱很重要。Google不差钱,在芯片实现上可以通过花钱换取时间。

总得来说,Google TPU的意义可能远远超过芯片本身。它背后的芯片设计逻辑,实现方法,应用模式和生态环境,相较传统芯片开发有很大区别,也许会成为趋势。

云服务和Benchmark

Google在发布TPU3的时候同时提到了新的云服务,在之前的Cloud TPU基础上,今年晚些时候还会发布Cloud TPU pod(不知道谁能用的起?),可以看出TPU对于Goolge的云端战略的重要意义。

有意思的是,在Google的talk中强调了cost的问题,每个例子都给出了相应的training cost,画风是这样的。

这里颇有广告的感觉,不禁让人想起黄教主的”The more GPUs you buy, The more money you save“。结合最近Microsoft对Brainwave项目的宣传,感觉云端机器学习的价格战马上就要开始了。

另外,Google也强调了Benchmark的重要性,还专门展示了他们最近力推的MLPerf。

最近不同平台之间的对比很多,有比性能的,也有拼成本的。相信随着越来越多的厂商加入,刷榜应该会非常热闹。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6259

    浏览量

    111996
  • TPU
    TPU
    +关注

    关注

    0

    文章

    173

    浏览量

    21719

原文标题:谷歌TPU 3.0到底厉害在哪里?

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌发布第八代TPU,训练推理分离,搭载自研CPU

    电子发烧友网报道(文/李弯弯)在2026年4月22日举行的谷歌云Next大会上,谷歌正式发布了第八代张量处理单元(TPU)。此次发布的产品包含两款独立的芯片:TPU 8t和
    的头像 发表于 04-24 09:03 6115次阅读
    <b class='flag-5'>谷歌</b>发布第八代<b class='flag-5'>TPU</b>,训练推理分离,搭载自研CPU

    直击英伟达腹地?谷歌TPU v7开放部署,催生OCS产业链红利

    Processing Unit, TPU)构建了一套完整的AI算力基础设施体系。   11月,谷歌宣布第七代 TPU v7(代号 Ironwood)将在后续几周大规模上市。与此消息同步出来的还有:允许客户在自有数据中心部署Ir
    的头像 发表于 11-27 08:53 9771次阅读
    直击英伟达腹地?<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b> v7开放部署,催生OCS产业链红利

    谷歌将新一代TPU,专用于推理

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2026年04月21日 11:19:52

    技术干货 | 锂电池保护芯片工作原理详解:四大机制守护电池安全

    锂电池为何“娇贵”?保护芯片如何24小时防止过充、过放和短路?本文深入浅出解析锂电池保护IC的四大核心职责与技术原理。
    的头像 发表于 03-20 10:54 603次阅读
    技术干货 | 锂电池保护芯片工作原理详解:<b class='flag-5'>四大</b>机制守护电池安全

    谷歌评论卡,碰一碰即可完成谷歌评论 #谷歌评论卡 #NFC标签 #nfc卡

    谷歌
    深圳市融智兴科技有限公司
    发布于 :2026年01月15日 17:02:00

    什么是TPU?万协通带你看懂AI算力的“变形金刚”

    ”——TPU(Tensor Processing Unit)。 今天,作为国产可重构TPU芯片的先行者,万协通将带你剥开晦涩的技术外壳,看懂这块决定AI未来的核心硬件,以及中国芯片如何换道超车,上演一场精彩的“变形记”。 AI时代的“偏科生”——读懂
    的头像 发表于 01-13 13:22 471次阅读
    什么是<b class='flag-5'>TPU</b>?万协通带你看懂AI算力的“变形金刚”

    AI芯片大单!Anthropic从博通采购100万颗TPU v7p芯片

    Anthropic供应基于TPU v7p的机架级 AI 系统,绕过TPU芯片的另一开发参与方谷歌。不过谷歌预计仍可从 Anthropic 同博通的交易中取得 IP授权收入。   博通
    的头像 发表于 01-06 08:38 1.1w次阅读

    TUSB8041:端口 USB 3.0 集线器的卓越之选

    TUSB8041:端口 USB 3.0 集线器的卓越之选 在电子设备高度互联的今天,USB 接口的拓展需求日益增长。TUSB8041 作为一款端口 USB 3.0 集线器,为我们提
    的头像 发表于 12-22 18:10 1468次阅读

    SN75LVPE3410:通道PCI - Express 3.0线性转接驱动器的深度剖析

    SN75LVPE3410:通道PCI - Express 3.0线性转接驱动器的深度剖析 在电子设计领域,高速数据传输的需求日益增长,PCI - Express技术作为其中的关键力量,不断推动着
    的头像 发表于 12-16 10:55 500次阅读

    谷歌云发布最强自研TPU,性能比前代提升4倍

    电子发烧友网报道(文/李弯弯)近日,谷歌云在官方博客上正式宣布,公司成功推出第七代TPU(张量处理器)“Ironwood”,该芯片预计在未来几周内正式上市。   “Ironwood”由谷歌自主
    的头像 发表于 11-13 07:49 9048次阅读
    <b class='flag-5'>谷歌</b>云发布最强自研<b class='flag-5'>TPU</b>,性能比前代提升4倍

    和而泰发布四大自研核心技术平台

    从智能家电到工业机器人,从新能源汽车到低空经济,和而泰的四大技术平台正在重新定义智能设备的"生命系统"。
    的头像 发表于 10-13 16:08 1462次阅读

    汇川技术四大架构重磅发布

    2025 汇川技术爆品发布会上,FA、运控、传动、机器人四大 IPMT 主任携覆盖 “设计 - 制造 - 传动 - 执行” 的全栈架构登场,为中国制造业智能化转型破局。这不是简单产品升级,而是重构智能制造底层逻辑的革命。
    的头像 发表于 09-02 15:54 4990次阅读
    汇川技术<b class='flag-5'>四大</b>架构重磅发布

    空气是如何“钻空子”的?压铸件气密检测泄漏的四大元凶

    压铸件泄漏是制造业常见质量难题,看似偶然,实则是设计、工艺、材料、检测四大环节的“漏洞”共同导致。空气通过这些薄弱点侵入产品,引发质量事故。下面深度剖析四大元凶,并提供实战解决方案。1.设计缺陷隐形
    的头像 发表于 08-29 15:39 1428次阅读
    空气是如何“钻空子”的?压铸件气密检测泄漏的<b class='flag-5'>四大</b>元凶

    0.1-3.0 GHz 位数字衰减器 (1 dB LSB) skyworksinc

    电子发烧友网为你提供()0.1-3.0 GHz 位数字衰减器 (1 dB LSB)相关产品参数、数据手册,更有0.1-3.0 GHz 位数字衰减器 (1 dB LSB)的引脚图、接
    发表于 05-26 18:29
    0.1-<b class='flag-5'>3.0</b> GHz <b class='flag-5'>四</b>位数字衰减器 (1 dB LSB) skyworksinc

    英飞凌碳化硅产品创新的四大支柱综述(二)

    本文是作者2024年“第十八届中国半导体行业协会半导体分立器件年会”演讲稿第二部分,第一部分请见《英飞凌碳化硅SiC技术创新的四大支柱综述(一)》。英飞凌SiC技术创新到丰富产品的四大支柱SiC
    的头像 发表于 05-19 17:32 914次阅读
    英飞凌碳化硅产品创新的<b class='flag-5'>四大</b>支柱综述(二)