0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解析:为何TPU比CPU快80倍

人工智能 2018-09-06 11:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我们生活在一个技术推动整个文明基石的时代。但是,尽管拥有所有辉煌的发明和技术进步,今天世界比以往更倾向于速度和敏捷性。我们已经从传统的有线拨号互联网连接转移到第四代无线网络。光纤的广泛分布使得连接到互联网并以快速的速度访问数据成为可能。同样,当涉及到处理器GPU时,我们已经从仅包含6000个晶体管的传统8位8080微处理器芯片转变为时钟速度高达1.7 GHz的最先进的Octa核心处理器。



人工智能的发展越来越抽象,越来越复杂。从早期简单的是与否的判断,到后来精准的识别,可以在复杂的场景里找出特定的目标,再到后来,出现 AlphaGo 这样可以做出主动的决策的 AI,甚至智能如 AlphaGo Zero,可以完全依靠自学实现快速成长。

人工智能经过这么长时间的发展,在网络的种类、复杂程度和处理的信息量上都发生了天翻地覆的变化。网络种类上,从早期的 AlexNet 和 GoogleNet 到现在各种各样的 GAN(生成对抗网络)以及各种深度强化学习的网络,它们各自网络结构都有不同,开发者在适应最新的网络上常常会遇到一些麻烦。



处理的信息量也在成倍地增长,算力需求越来越高的情况下,对搭载处理单元的体积有更多限制的机器人实际上存在着在智能水平上升级的障碍。这就是为什么人工智能芯片不断升级迭代的原因。

人工智能的终极目标是模拟人脑,人脑大概有1000亿个神经元,1000万亿个突触,能够处理复杂的视觉、听觉、嗅觉、味觉、语言能力、理解能力、认知能力、情感控制、人体复杂机构控制、复杂心理和生理控制,而功耗只有10~20瓦。

可能有很多人会问,目前在人工智能领域,NVidia GPU为什么具有无可撼动的霸主地位,为什么AMD的GPU和NVidia GPU性能相差不多,但是在人工智能领域的受欢迎的程度却有天壤之别。

2011年,负责谷歌大脑的吴恩达通过让深度神经网络训练图片,一周之内学会了识别猫,他用了12片GPU代替了2000片CPU,这是世界上第一次让机器认识猫。

2016年,谷歌旗下Deepmind团队研发的机器人AlphaGo以4比1战胜世界围棋冠军职业九段棋手李世石(AlphaGo的神经网络训练用了50片GPU,走棋网络用了174片GPU),引发了围棋界的轩然大波,因为围棋一直被认为是人类智力较量的巅峰,这可以看做是人工智能史上的又一个重大里程碑事件。

谷歌并不是唯一一家为这种设备上的AI任务设计芯片的公司。 ARM,Qualcomm,Mediatek和其他公司都制造了自己的AI加速器,而Nvidia制造的GPU在培训算法市场上占据了主导地位。

然而,Google的竞争对手并没有控制整个AI堆栈。 客户可以将他们的数据存储在Google的云端; 使用TPU训练他们的算法; 然后使用新的Edge TPU进行设备上推断。而且,他们很可能会使用TensorFlow创建他们的机器学习软件--TensorFlow是由Google创建和运营的编码框架。

这种垂直整合具有明显的好处。 Google可以确保所有这些不同的部分尽可能高效,顺畅地相互通信,使客户更容易在公司的生态系统中玩游戏。

2016年5月的谷歌I/O大会,谷歌首次公布了自主设计的TPU,2017年谷歌I/O大会,谷歌宣布正式推出第二代TPU处理器,在今年的Google I/0 2018大会上,谷歌发布了新一代TPU处理器——TPU 3.0。TPU 3.0的性能相比目前的TPU 2.0有8倍提升,可达10亿亿次。

TPU全名为Tensor Processing Unit,是谷歌研发的一种神经网络训练的处理器,主要用于深度学习、AI运算。在7月份的Next 云端大会,谷歌又发布了 Edge TPU 芯片抢攻边缘计算市场。虽然都是 TPU,但边缘计算用的版本与训练机器学习的 Cloud TPU 不同,是专门用来处理AI预测部分的微型芯片。Edge TPU可以自己运行计算,而不需要与多台强大计算机相连,因此应用程序可以更快、更可靠地工作。它们可以在传感器或网关设备中与标准芯片或微控制器共同处理AI工作。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11339

    浏览量

    226022
  • TPU
    TPU
    +关注

    关注

    0

    文章

    173

    浏览量

    21721
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌发布第八代TPU,训练推理分离,搭载自研CPU

    电子发烧友网报道(文/李弯弯)在2026年4月22日举行的谷歌云Next大会上,谷歌正式发布了第八代张量处理单元(TPU)。此次发布的产品包含两款独立的芯片:TPU 8t和TPU 8i。这是谷歌首次
    的头像 发表于 04-24 09:03 6213次阅读
    谷歌发布第八代<b class='flag-5'>TPU</b>,训练推理分离,搭载自研<b class='flag-5'>CPU</b>

    深入解析 onsemi FQP3N80C 和 FQPF3N80C N 沟道 MOSFET

    深入解析 onsemi FQP3N80C 和 FQPF3N80C N 沟道 MOSFET 在电子设计领域,MOSFET 是不可或缺的关键元件,它广泛应用于各种电源管理和开关电路。今天,我们将深入探讨
    的头像 发表于 03-30 14:50 232次阅读

    深入解析FQP8N80C/FQPF8N80C/FQPF8N80CYDTU N - 通道QFET® MOSFET

    深入解析FQP8N80C/FQPF8N80C/FQPF8N80CYDTU N - 通道QFET® MOSFET 一、引言 在电子工程师的日常设计工作中,MOSFET是一种常见且关键的电
    的头像 发表于 03-29 15:45 559次阅读

    Onsemi FQP3N80C与FQPF3N80C MOSFET深度解析

    Onsemi FQP3N80C与FQPF3N80C MOSFET深度解析 在电子电路设计中,MOSFET(金属 - 氧化物 - 半导体场效应晶体管)是一个至关重要的元件,广泛应用于各种电源和功率
    的头像 发表于 03-29 15:40 484次阅读

    FQP6N80C / FQPF6N80C N-Channel QFET® MOSFET的技术解析与应用指南

    FQP6N80C / FQPF6N80C N-Channel QFET® MOSFET的技术解析与应用指南 Fairchild Semiconductor已成为ON Semiconductor
    的头像 发表于 03-29 15:30 542次阅读

    样板!揭秘嘉立创64层 PCB板 与HDI工艺

    、成本低50%”的显著优势,成为高端板领域的代表企业。 一、64层超高层PCB制造服务 嘉立创超高层PCB服务打破了行业垄断,可以满足复杂电路集成化设计,提供更大的布线层次和空间。 在交付周期方面,嘉立创样板交期仅为10-15天,传统同行交期1
    的头像 发表于 02-03 14:38 581次阅读

    固件烧录速度实测:JTAGUART6.8

    在批量生产场景中,固件烧录效率直接影响产线节拍与交付能力。如何选择最优烧录方式?本文以ZLG致远电子MR6450系列核心板为例,通过实测数据为您解析。MR6450核心板MR6450是ZLG致远电子
    的头像 发表于 01-27 11:34 463次阅读
    固件烧录速度实测:JTAG<b class='flag-5'>比</b>UART<b class='flag-5'>快</b>6.8<b class='flag-5'>倍</b>

    LPDDR5X在AI数据中心多能打?10.7Gbps速率、互连7、推理吞吐高5、延迟低80%!

    厂商们包括三星、美光、SK海力士以及长鑫存储等也不断拉高LPDDR5X的规格,有望拓展继智能终端之后AI数据中心这类新应用。   三星电子   三星发布的前代1.25、功耗效率提升25%的高端低功耗DRAM LPDDR5X
    的头像 发表于 01-27 09:35 6497次阅读
    LPDDR5X在AI数据中心多能打?10.7Gbps速率、互连<b class='flag-5'>快</b>7<b class='flag-5'>倍</b>、推理吞吐高5<b class='flag-5'>倍</b>、延迟低<b class='flag-5'>80</b>%!

    什么是TPU?万协通带你看懂AI算力的“变形金刚”

    当我们在感叹ChatGPT的妙语连珠时,你是否好奇过:究竟是什么样的“心脏”,在支撑这些超级AI没日没夜地思考?答案不是你熟悉的CPU,也不仅仅是显卡GPU,而是一位更专注、更硬核的“特种兵
    的头像 发表于 01-13 13:22 482次阅读
    什么是<b class='flag-5'>TPU</b>?万协通带你看懂AI算力的“变形金刚”

    AI硬件全景解析CPU、GPU、NPU、TPU的差异化之路,一文看懂!​

    CPU作为“通用基石”,支撑所有设备的基础运行;GPU凭借并行算力,成为AI训练与图形处理的“主力”;TPU在Google生态中深耕云端大模型训练;NPU则让AI从“云端”走向“身边”(手机、手表
    的头像 发表于 12-17 17:13 2399次阅读
    AI硬件全景<b class='flag-5'>解析</b>:<b class='flag-5'>CPU</b>、GPU、NPU、<b class='flag-5'>TPU</b>的差异化之路,一文看懂!​

    提高系统效率几个误解解析

    频率为50M时,必须设为4个周期,实际存取时间却放慢到了 80ns。 误解五:一个CPU处理不过来,就用两个分布处理,处理能力可提高一 点评:对于搬砖头来说,两个人应该一个人的效
    发表于 12-15 06:09

    谷歌云发布最强自研TPU,性能前代提升4

    电子发烧友网报道(文/李弯弯)近日,谷歌云在官方博客上正式宣布,公司成功推出第七代TPU(张量处理器)“Ironwood”,该芯片预计在未来几周内正式上市。   “Ironwood”由谷歌自主
    的头像 发表于 11-13 07:49 9067次阅读
    谷歌云发布最强自研<b class='flag-5'>TPU</b>,性能<b class='flag-5'>比</b>前代提升4<b class='flag-5'>倍</b>

    电能表会 “爆表” 吗?机械 / 家用 / 充桩场景的计量真相拆解

    一文理清:为何家用电表难 “爆表”,充桩却会?
    的头像 发表于 11-12 09:25 3480次阅读
    电能表会 “爆表” 吗?机械 / 家用 / <b class='flag-5'>快</b>充桩场景的计量真相拆解

    谷歌芯片实现量子计算新突破,超算13000

    在特定任务上的运行速度传统超级计算机13000,并且这种算法可以在类似平台上得到重现。   量子比特极易受到环境干扰,导致计算错误,这成为量子计算走向实用的一大阻碍。而谷歌的Willow芯片成功实现了低于表面码阈值的量子纠
    的头像 发表于 10-27 06:51 1w次阅读

    今日看点:谷歌芯片实现量子计算经典超算13000;NFC 技术突破:读取距离从 5 毫米提升至 20 毫米

    谷歌芯片实现量子计算经典超算13000 近日,谷歌在《自然》杂志披露与Willow芯片相关的量子计算突破性研究成果。该公司称这是历史上首次证明量子计算机可以在硬件上成功运行一项可验证算法,其
    发表于 10-23 10:20 1779次阅读