0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解析:为何TPU比CPU快80倍

人工智能 2018-09-06 11:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我们生活在一个技术推动整个文明基石的时代。但是,尽管拥有所有辉煌的发明和技术进步,今天世界比以往更倾向于速度和敏捷性。我们已经从传统的有线拨号互联网连接转移到第四代无线网络。光纤的广泛分布使得连接到互联网并以快速的速度访问数据成为可能。同样,当涉及到处理器GPU时,我们已经从仅包含6000个晶体管的传统8位8080微处理器芯片转变为时钟速度高达1.7 GHz的最先进的Octa核心处理器。



人工智能的发展越来越抽象,越来越复杂。从早期简单的是与否的判断,到后来精准的识别,可以在复杂的场景里找出特定的目标,再到后来,出现 AlphaGo 这样可以做出主动的决策的 AI,甚至智能如 AlphaGo Zero,可以完全依靠自学实现快速成长。

人工智能经过这么长时间的发展,在网络的种类、复杂程度和处理的信息量上都发生了天翻地覆的变化。网络种类上,从早期的 AlexNet 和 GoogleNet 到现在各种各样的 GAN(生成对抗网络)以及各种深度强化学习的网络,它们各自网络结构都有不同,开发者在适应最新的网络上常常会遇到一些麻烦。



处理的信息量也在成倍地增长,算力需求越来越高的情况下,对搭载处理单元的体积有更多限制的机器人实际上存在着在智能水平上升级的障碍。这就是为什么人工智能芯片不断升级迭代的原因。

人工智能的终极目标是模拟人脑,人脑大概有1000亿个神经元,1000万亿个突触,能够处理复杂的视觉、听觉、嗅觉、味觉、语言能力、理解能力、认知能力、情感控制、人体复杂机构控制、复杂心理和生理控制,而功耗只有10~20瓦。

可能有很多人会问,目前在人工智能领域,NVidia GPU为什么具有无可撼动的霸主地位,为什么AMD的GPU和NVidia GPU性能相差不多,但是在人工智能领域的受欢迎的程度却有天壤之别。

2011年,负责谷歌大脑的吴恩达通过让深度神经网络训练图片,一周之内学会了识别猫,他用了12片GPU代替了2000片CPU,这是世界上第一次让机器认识猫。

2016年,谷歌旗下Deepmind团队研发的机器人AlphaGo以4比1战胜世界围棋冠军职业九段棋手李世石(AlphaGo的神经网络训练用了50片GPU,走棋网络用了174片GPU),引发了围棋界的轩然大波,因为围棋一直被认为是人类智力较量的巅峰,这可以看做是人工智能史上的又一个重大里程碑事件。

谷歌并不是唯一一家为这种设备上的AI任务设计芯片的公司。 ARM,Qualcomm,Mediatek和其他公司都制造了自己的AI加速器,而Nvidia制造的GPU在培训算法市场上占据了主导地位。

然而,Google的竞争对手并没有控制整个AI堆栈。 客户可以将他们的数据存储在Google的云端; 使用TPU训练他们的算法; 然后使用新的Edge TPU进行设备上推断。而且,他们很可能会使用TensorFlow创建他们的机器学习软件--TensorFlow是由Google创建和运营的编码框架。

这种垂直整合具有明显的好处。 Google可以确保所有这些不同的部分尽可能高效,顺畅地相互通信,使客户更容易在公司的生态系统中玩游戏。

2016年5月的谷歌I/O大会,谷歌首次公布了自主设计的TPU,2017年谷歌I/O大会,谷歌宣布正式推出第二代TPU处理器,在今年的Google I/0 2018大会上,谷歌发布了新一代TPU处理器——TPU 3.0。TPU 3.0的性能相比目前的TPU 2.0有8倍提升,可达10亿亿次。

TPU全名为Tensor Processing Unit,是谷歌研发的一种神经网络训练的处理器,主要用于深度学习、AI运算。在7月份的Next 云端大会,谷歌又发布了 Edge TPU 芯片抢攻边缘计算市场。虽然都是 TPU,但边缘计算用的版本与训练机器学习的 Cloud TPU 不同,是专门用来处理AI预测部分的微型芯片。Edge TPU可以自己运行计算,而不需要与多台强大计算机相连,因此应用程序可以更快、更可靠地工作。它们可以在传感器或网关设备中与标准芯片或微控制器共同处理AI工作。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222912
  • TPU
    TPU
    +关注

    关注

    0

    文章

    164

    浏览量

    21531
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    解析 onsemi SiC 功率MOSFET模块NVXK2PR80WXT2

    作为一名电子工程师,在为电动汽车(xEV)应用设计 DC - DC 转换器和车载充电器时,合适的功率 MOSFET 模块至关重要。今天就为大家详细解析 onsemi 的 SiC 功率 MOSFET 模块 NVXK2PR80WXT2。
    的头像 发表于 12-03 16:13 428次阅读
    <b class='flag-5'>解析</b> onsemi SiC 功率MOSFET模块NVXK2PR<b class='flag-5'>80</b>WXT2

    谷歌云发布最强自研TPU,性能前代提升4

    电子发烧友网报道(文/李弯弯)近日,谷歌云在官方博客上正式宣布,公司成功推出第七代TPU(张量处理器)“Ironwood”,该芯片预计在未来几周内正式上市。   “Ironwood”由谷歌自主
    的头像 发表于 11-13 07:49 8100次阅读
    谷歌云发布最强自研<b class='flag-5'>TPU</b>,性能<b class='flag-5'>比</b>前代提升4<b class='flag-5'>倍</b>

    电能表会 “爆表” 吗?机械 / 家用 / 充桩场景的计量真相拆解

    一文理清:为何家用电表难 “爆表”,充桩却会?
    的头像 发表于 11-12 09:25 891次阅读
    电能表会 “爆表” 吗?机械 / 家用 / <b class='flag-5'>快</b>充桩场景的计量真相拆解

    谷歌芯片实现量子计算新突破,超算13000

    在特定任务上的运行速度传统超级计算机13000,并且这种算法可以在类似平台上得到重现。   量子比特极易受到环境干扰,导致计算错误,这成为量子计算走向实用的一大阻碍。而谷歌的Willow芯片成功实现了低于表面码阈值的量子纠
    的头像 发表于 10-27 06:51 9125次阅读

    今日看点:谷歌芯片实现量子计算经典超算13000;NFC 技术突破:读取距离从 5 毫米提升至 20 毫米

    谷歌芯片实现量子计算经典超算13000 近日,谷歌在《自然》杂志披露与Willow芯片相关的量子计算突破性研究成果。该公司称这是历史上首次证明量子计算机可以在硬件上成功运行一项可验证算法,其
    发表于 10-23 10:20 1226次阅读

    基于碳纳米材料的TPU导电长丝制备与性能研究

    、金属材料与复合材料等各领域的研究开发、工艺优化与质量监控.基于碳纳米材料的TPU导电长丝制备与性能研究【江南大学赵树强】基于碳纳米材料的TPU导电长丝制备与性能研究上海
    的头像 发表于 07-11 10:21 334次阅读
    基于碳纳米材料的<b class='flag-5'>TPU</b>导电长丝制备与性能研究

    TPU处理器的特性和工作原理

    张量处理单元(TPU,Tensor Processing Unit)是一种专门为深度学习应用设计的硬件加速器。它的开发源于对人工智能(AI)和机器学习应用的需求,尤其是深度学习中的神经网络计算。
    的头像 发表于 04-22 09:41 3315次阅读
    <b class='flag-5'>TPU</b>处理器的特性和工作原理

    Google推出第七代TPU芯片Ironwood

    在 Google Cloud Next 25 大会上,我们隆重推出第 7 代 Tensor Processing Unit (TPU) — Ironwood。这不仅是我们迄今为止性能最高、扩展性最佳的定制 AI 加速器,更是第一款专为推理而设计的 TPU
    的头像 发表于 04-16 11:20 1325次阅读
    Google推出第七代<b class='flag-5'>TPU</b>芯片Ironwood

    谷歌第七代TPU Ironwood深度解读:AI推理时代的硬件革命

    谷歌第七代TPU Ironwood深度解读:AI推理时代的硬件革命 Google 发布了 Ironwood,这是其第七代张量处理单元 (TPU),专为推理而设计。这款功能强大的 AI 加速器旨在处理
    的头像 发表于 04-12 11:10 2885次阅读
    谷歌第七代<b class='flag-5'>TPU</b> Ironwood深度解读:AI推理时代的硬件革命

    M3 Ultra 苹果最强芯片 80 核 GPU,32 核 NPU

    设计(24 性能核 + 8 能效核),对比前代 M2 Ultra,多核性能提升 30%,单核性能提升约 16%。苹果官方称其 CPU 性能 M2 Ultra 1.5
    的头像 发表于 03-10 10:42 4303次阅读
    M3 Ultra 苹果最强芯片 <b class='flag-5'>80</b> 核 GPU,32 核 NPU

    为什么Tim2自动装载定时的首次中断时间总是设定时间的2

    为何Tim2自动装载定时的首次中断时间总是设定时间的2?而后续中断均正常。反复修改了Tim2->CR1中各控制位也没解决。
    发表于 03-07 06:23

    请问为什么模型加载时间CPU长?

    为什么模型加载时间 CPU 长?
    发表于 03-06 06:03

    TPU编程竞赛系列|第九届集创赛“算能杯”火热报名中!

    第九届全国大学生集成电路创新创业大赛(以下简称“集创赛”)正式开始报名。算能在处理器应用方向特别设立了“TPU赋能的边缘计算架构优化与创新应用设计”赛题,诚邀各校参赛队伍充分发挥TPU的算力优势
    的头像 发表于 02-06 13:41 1591次阅读
    <b class='flag-5'>TPU</b>编程竞赛系列|第九届集创赛“算能杯”火热报名中!

    光缆用tpu外护套用在哪些型号光缆上

    光缆用TPU(热塑性聚氨酯)外护套因其耐磨、抗拉、柔性好以及优良的防潮和阻燃性能,被广泛应用于多种型号的光缆上,特别是需要较高机械保护和恶劣环境适应性的光缆。以下是一些可能使用TPU外护套的光缆
    的头像 发表于 01-10 10:05 1360次阅读

    思氮化镓充电器分享:Super GaN伸缩线充35W

    快节奏的时代,在旅游、办公等场景下,一款高效、便捷的充电器可以让我们的生活更便捷、高效。今天就给大家推荐一款思氮化镓充电器——Super GaN伸缩线充35W。它具备多重亮点,可以满足我们在许多场景下的充电需求,成为我们的得力助手。
    的头像 发表于 01-04 09:41 1094次阅读