0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于主流深度学习芯片的优缺点分析

454398 作者:工程师吴畏 2018-06-12 09:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

深度学习全称深度神经网络,本质上是多层次的人工神经网络算法,即模仿人脑的神经网络,从最基本的单元上模拟了人类大脑的运行机制。近年来,其所取得的前所未有的突破掀起了人工智能新一轮的发展热潮。

最早的神经网络的思想起源于1943年的MCP人工神经元模型,当时是希望能够用计算机来模拟人的神经元反应的过程,但直到最近,它才真正让人工智能火起来。主要原因在于:算法的突破、数据量的激增和计算机能力/成本的下降。其中计算能力的提升的作为人工智能实现的物理基础,对人工智能发展的意义不言而喻。

本文我们就来分析目前主流的深度学习芯片的优缺点。

CPU不适合深度学习

深度学习与传统计算模式最大的区别就是不需要编程,它是从输入的大量数据中自发地总结出规律,而传统计算模式更多都需要人为提取所需解决问题的特征或者总结规律来进行编程。也正因为如此,深度学习对计算能力要求非常高,以至于有人将深度学习称之为“暴力计算”。

因此,传统的CPU并不适用于深度学习。

从内部结构上来看,CPU中70%晶体管都是用来构建Cache(高速缓冲存储器)和一部分控制单元,负责逻辑运算的部分(ALU模块)并不多。控制单元等模块的存在都是为了保证指令能够一条接一条的有序执行。

这种通用性结构对于传统的编程计算模式非常适合,但对于并不需要太多的程序指令,却需要海量数据运算的深度学习的计算需求,这种结构就显得有心无力了。

GPU,深度学习主流芯片

与CPU少量的逻辑运算单元相比,GPU整个就是一个庞大的计算矩阵,GPU具有数以千计的计算核心、可实现10-100倍应用吞吐量,而且它还支持对深度学习至关重要的并行计算能力,可以比传统处理器更加快速,大大加快了训练过程。GPU是目前最普遍采用的深度学习运算单元之一。

目前,谷歌、Facebook、微软、Twitter和百度等互联网巨头,都在使用GPU作为其深度学习载体,让服务器学习海量的照片、视频、声音文档,以及社交媒体上的信息,来改善搜索和自动化照片标记等各种各样的软件功能。而某些汽车制造商也在利用这项技术开发无人驾驶汽车。

不过,由于GPU的设计初衷是为了应对图像处理中需要大规模并行计算。因此,根据乐晴智库介绍,其在应用于深度学习算法时有数个方面的局限性:

第一,应用过程中无法充分发挥并行计算优势。深度学习包含训练和应用两个计算环节,GPU在深度学习算法训练上非常高效,但在应用时一次性只能对于一张输入图像进行处理,并行度的优势不能完全发挥。

第二,硬件结构固定不具备可编程性。深度学习算法还未完全稳定,若深度学习算法发生大的变化,GPU无法灵活的配置硬件结构。

另外,在能耗上面,虽然GPU要好于CPU,但其能耗仍旧很大。

备受看好的FPGA

FPGA,即现场可编辑门阵列,是一种新型的可编程逻辑器件,由于其具有静态可重复编程和动态在系统重构的特性,使得硬件的功能可以像软件一样通过编程来修改。

FPGA作为人工智能深度学习方面的计算工具,主要原因就在于其本身特性:可编程专用性,高性能,低功耗。

北京大学与加州大学的一个关于FPGA加速深度学习算法的合作研究。展示了FPGA与CPU在执行深度学习算法时的耗时对比。在运行一次迭代时,使用CPU耗时375毫秒,而使用FPGA只耗时21毫秒,取得了18倍左右的加速比。

根据瑞士苏黎世联邦理工学院(ETHZurich)研究发现,基于FPGA的应用加速比CPU/GPU方案,单位功耗性能可提升25倍,而时延则缩短了50到75倍,与此同时还能实现出色的I/O集成。而微软的研究也表明,FPGA的单位功耗性能是GPU的10倍以上,由多个FPGA组成的集群能达到GPU的图像处理能力并保持低功耗的特点。

根据英特尔预计,到2020年,将有1/3的云数据中心节点采用FPGA技术。

不可估量的ASIC

ASIC(Application Specific Integrated Circuits,专用集成电路),是指应特定用户要求或特定电子系统的需要而设计、制造的集成电路。ASIC用于专门的任务,比如去除噪声的电路,播放视频的电路,但是ASIC明显的短板是不可更改任务。但与通用集成电路相比,具有以下几个方面的优越性:体积更小、功耗更低、可靠性提高、性能提高、保密性增强、成本降低。

从算力上来说,ASIC产品的计算能力是GK210的2.5倍。功耗上,ASIC功耗做到了GK210的1/15。

当然ASIC是能效最高的,但目前,都在早期阶段,算法变化各异。想搞一款通用的ASIC适配多种场景,还是有很多路需要走的。但从比特币挖矿机经历的从CPU、GPU、FPGA到最后ASIC的四个阶段来推论,ASIC将是人工智能发展的重要趋势之一。另外,在通信领域,FPGA曾经也是风靡一时,但是随着ASIC的不断发展和蚕食,FPGA的份额和市场空间已经岌岌可危。

据了解,谷歌最近曝光的专用于人工智能深度学习计算的TPU,其实也是一款ASIC。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1656

    文章

    22304

    浏览量

    630761
  • 芯片
    +关注

    关注

    462

    文章

    53592

    浏览量

    459812
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5110

    浏览量

    134511
  • 人工智能
    +关注

    关注

    1813

    文章

    49783

    浏览量

    261873
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商业云手机核心优缺点分析

    商业云手机核心优缺点分析,综合技术性能、成本效率及场景适配性等多维度对比: 核心优势‌ 成本革命‌ 硬件零投入‌:免除实体手机采购(旗舰机均价6000元),企业百台规模可省60万+ CAPEX
    的头像 发表于 06-16 08:11 701次阅读
    商业云手机核心<b class='flag-5'>优缺点</b><b class='flag-5'>分析</b>

    PCBA 表面处理:优缺点大揭秘,应用场景全解析

    的表面处理工艺,不仅能提升PCBA板的焊接质量,还能延长其使用寿命。以下将详细介绍几种常见的PCBA表面处理工艺,分析它们的优缺点及应用场景,帮助您做出最佳的工艺选择。 PCBA表面处理优缺点与应用场景 1. HASL(热风整平
    的头像 发表于 05-05 09:39 1152次阅读
    PCBA 表面处理:<b class='flag-5'>优缺点</b>大揭秘,应用场景全解析

    CMOS,Bipolar,FET这三种工艺的优缺点是什么?

    在我用photodiode工具选型I/V放大电路的时候,系统给我推荐了AD8655用于I/V,此芯片为CMOS工艺 但是查阅资料很多都是用FET工艺的芯片,所以请教下用于光电信号放大转换(主要考虑信噪比和带宽)一般我们用哪种工艺的芯片
    发表于 03-25 06:23

    浅谈汽车系统电压优缺点分析

    以下是12V、24V、48V系统的简单介绍,包括技术特点、优缺点及典型应用场景。汽车电气系统的发展随着车辆电子设备的增多和对能效要求的提高,电压等级也在逐步提升,从传统的12V电
    的头像 发表于 03-06 08:04 1376次阅读
    浅谈汽车系统电压<b class='flag-5'>优缺点</b><b class='flag-5'>分析</b>

    RCA接口的优缺点分析

    RCA接口的优缺点分析如下: 优点 兼容性强 : RCA接口广泛应用于各种音视频设备,包括电视机、音响系统、DVD播放器、游戏机等。这种广泛的兼容性使得用户能够轻松地将不同品牌、不同型号的设备
    的头像 发表于 02-17 15:57 3084次阅读

    惠斯通电桥的优缺点分析

    惠斯通电桥作为一种经典的电阻测量工具,具有其独特的优缺点。以下是对惠斯通电桥优缺点的详细分析: 优点 高精度 : 惠斯通电桥通过比较电压差来精确测量电阻值,对于微小的电阻变化也能迅速作出反应,因此
    的头像 发表于 02-13 15:26 2069次阅读

    BP神经网络的优缺点分析

    BP神经网络(Back Propagation Neural Network)作为一种常用的机器学习模型,具有显著的优点,同时也存在一些不容忽视的缺点。以下是对BP神经网络优缺点分析
    的头像 发表于 02-12 15:36 1629次阅读

    硅谷物理服务器的优缺点分析

    硅谷物理服务器因其高性能、高质量和先进的技术支持而在全球范围内享有很高的声誉。硅谷物理服务器的优缺点分析如下,主机推荐小编为您整理发布硅谷物理服务器的优缺点分析
    的头像 发表于 02-12 09:30 572次阅读

    香港主机托管和国内主机的优缺点比较

    香港主机托管和国内主机(以大陆主机为例)的优缺点比较,主机推荐小编为您整理发布香港主机托管和国内主机的优缺点比较,希望对您有帮助。
    的头像 发表于 02-05 17:42 698次阅读

    东京站群服务器有哪些优缺点

    东京站群服务器,作为部署在东京地区的服务器集群,专为站群优化而建,其优缺点如下,主机推荐小编为您整理发布东京站群服务器有哪些优缺点
    的头像 发表于 02-05 17:39 604次阅读

    光谱传感器的优缺点

    光谱传感器是一种能够检测并响应光谱范围内不同波长光线的传感器。以下是对其优缺点的详细分析
    的头像 发表于 01-27 15:28 1284次阅读

    DFT的优缺点比较 DFT在机器学习中的应用

    DFT(离散傅里叶变换)的优缺点比较 优点 频域分析 :DFT能够将信号从时域转换到频域,这对于分析信号的频率成分非常有用。 线性和时不变性 :DFT是线性和时不变的,这意味着它满足叠加原理,对于
    的头像 发表于 12-20 09:22 3432次阅读

    zeta在机器学习中的应用 zeta的优缺点分析

    在探讨ZETA在机器学习中的应用以及ZETA的优缺点时,需要明确的是,ZETA一词在不同领域可能有不同的含义和应用。以下是根据不同领域的ZETA进行的分析: 一、ZETA在机器学习
    的头像 发表于 12-20 09:11 1639次阅读

    mac和windows的区别 mac的优缺点分析

    Mac和Windows的区别 Mac和Windows是两种主流的操作系统,它们各自有着不同的设计理念和用户群体。以下是对Mac和Windows操作系统的一些基本区别和Mac的优缺点分析。 1.
    的头像 发表于 12-19 15:01 1.5w次阅读

    SSM框架的优缺点分析 SSM在移动端开发中的应用

    SSM框架的优缺点分析 SSM框架,即Spring、Spring MVC和MyBatis的整合,是当前比较流行的Java开源框架之一。以下是对SSM框架优缺点的详细分析: 优点 成本低
    的头像 发表于 12-16 18:18 3051次阅读