CPU是一个有多种功能的优秀领导者。它的优点在于调度、管理、协调能力强,计算能力则位于其次。而GPU相当于一个接受CPU调度的“拥有大量计算能力”的员工。
下图是处理器内部结构图:

DRAM即动态随机存取存储器,是常见的系统内存。
Cache存储器:电脑中作高速缓冲存储器,是位于CPU和主存储器DRAM之间,规模较小,但速度很高的存储器。
算术逻辑单元ALU是能实现多组算术运算和逻辑运算的组合逻辑电路。
当需要对大数据bigdata做同样的事情时,GPU更合适,当需要对同一数据做很多事情时,CPU正好合适。
GPU能做什么?关于图形方面的以及大型矩阵运算,如机器学习算法等方面,GPU就能大显身手。
简而言之,CPU擅长统领全局等复杂操作,GPU擅长对大数据进行简单重复操作。CPU是从事复杂脑力劳动的教授,而GPU是进行大量并行计算的体力劳动者。
深度学习是模拟人脑神经系统而建立的数学网络模型,这个模型的最大特点是,需要大数据来训练。因此,对电脑处理器的要求,就是需要大量的并行的重复计算,GPU正好有这个专长,时势造英雄,因此,GPU就出山担当重任了。
GPU具有如下特点:
提供了多核并行计算的基础结构,且核心数非常多,可以支撑大量数据的并行计算。 并行计算或称平行计算是相对于串行计算来说的。它是一种一次可执行多个指令的算法,目的是提高计算速度,及通过扩大问题求解规模,解决大型而复杂的计算问题。
拥有更高的访存速度。
更高的浮点运算能力。浮点运算能力是关系到处理器的多媒体、3D图形处理的一个重要指标。现在的计算机技术中,由于大量多媒体技术的应用,浮点数的计算大大增加了,比如3D图形的渲染等工作,因此浮点运算的能力是考察处理器计算能力的重要指标。
这三个特点,非常适合深度学习了。
三、怎样发挥GPU的大数据处理能力
GPU只是显卡上的一个核心元件,又不能单独工作,它还需要缓存来辅助工作。独立显卡是直接焊死了GPU在显卡电路板上,上面有一个散热风扇供它单独使用。集成显卡是把GPU与CPU放在一起,共用缓存来工作,并且共用一个散热风扇。
电脑处理一大块数据比处理一个一个数据更有效,执行指令开销也会大大降低,因为要处理大块数据,意味着需要更多的晶体管来并行工作,现在旗舰级显卡都是百亿以上的晶体管。
因此,要利用GPU做大数据处理工作,至少目前来说,还没有单独的GPU板卡可购。只能购买GPU性能优越的超级独立显卡,或集成集卡中GPU性能优秀的主板。
相关推荐
随着科技迅速的发展,市场上的高科技先进电子产品日新月异,而且很受消者朋友们的青睐,而且电子产品的安装....
发表于 04-16 16:36 •
37次
阅读
而且Cache往往分几个层级,与内存以及其它外部存储器共同构成计算机系统的存储器层次结构(Memor....
这次我们准备聊下决定系统计算性能的两大关键指标,1. 浮点运算能力(FLOPS), 2. 内存带宽(....
言归正状,万事开头难,现在骑虎难下,也只好勉力为之。在这里想先介绍些今后文章经常会涉及的一些指标概念....
本期案例将介绍 BroadBand 与 Skreens 的合作,双方基于赛灵思提供的实时计算平台打造....
FB651 用于 多语言转换 用于在三种语言之间切换消息视图(数据库视图)和消息归档(数据库归档)中....
也能够用一外索引来存取CPU的内存区域。与绝对地址比较,此方式的优点是能够用变量索引动态寻址。例如,....
我最近看中了一款CPU,结果被价格劝退。 想提前练练手速,等有活动了再冲。 结果被来我家玩的....
电子发烧友网为你提供V模式的设计方法及自动代码生成资料下载的电子资料下载,更有其他相关的电路图、源代....
发表于 04-16 08:54 •
5次
阅读
电子发烧友网为你提供什么程序适合在GPU上运行?什么时候用CPU资料下载的电子资料下载,更有其他相关....
发表于 04-16 08:53 •
5次
阅读
工业设备、汽车电子及仪器仪表中普遍使用LED显示器,原因是LED显示器成本低廉、使用灵活、封装体积小。开发这类设备时,常...
发表于 04-16 07:27 •
0次
阅读
十年转瞬,Armv9架构终于露出庐山真面目,适用于Arm全系列芯片的Armv9架构,这次的升级瞄准的....
量子计算使用亚原子粒子的物理学领域来执行复杂的并行计算,从而取代了当今计算机系统中更简单的晶体管。量....
Les 发表于 04-15 15:04
•
225次
阅读
IC卡技术已经大量应用于与城市居民生活息息相关的方方面面,基于IC卡技术的城市信息化平台建设,已经成....
消费用户市场,普通用户都能用上16核甚至64核处理器的PC。这可不是单纯堆核心就完事儿的。以当前CP....
SOPC技术,即软核处理器,最早是由Altera公司提出来的,它是基于FPGA的SOC片上系统设计技....
FPGA之家 发表于 04-15 09:48
•
110次
阅读
电子发烧友网为你提供电子设计实施有效的安全认证方法资料下载的电子资料下载,更有其他相关的电路图、源代....
发表于 04-15 08:48 •
8次
阅读
电子发烧友网为你提供如何实现声音隔离?工程师可用哪些技术资料下载的电子资料下载,更有其他相关的电路图....
发表于 04-15 08:40 •
5次
阅读
如何在复杂IC上设计测试与测量仪器?
在IC中设计测试仪器的潮流开始于什么?
如何在高速I/O块中建立分析仪器?...
发表于 04-15 07:06 •
0次
阅读
电子发烧友网为你提供单片机基础及应用|80C51单片机的结构及信号引脚资料下载的电子资料下载,更有其....
发表于 04-14 08:47 •
16次
阅读
BlueField-3是首款为AI和加速计算而设计的DPU,助力各企业在任何规模的应用上都能实现业内....
发表于 04-13 16:53 •
758次
阅读
X86指令集是美国Intel公司为其第一块16位CPU(i8086)专门开发的,美国IBM公司198....
发表于 04-13 15:49 •
21次
阅读
业界唯一内置AI的数据中心CPU来了。4月6日,英特尔在北京首钢园推出第三代至强可扩展处理器(代号I....
手持PDA是指具备信息传输处理功能的手持终端设备,配有操作系统、内存、CPU、显卡、屏幕,键盘和电池....
发表于 04-13 10:09 •
111次
阅读
北京时间4月8日晚,美国商务部再次以所谓“威胁国家安全”为由,将包括天津飞腾信息技术有限公司(下称:....
旺材芯片 发表于 04-13 09:48
•
574次
阅读
据外媒报道,英特尔可能将其7纳米制程重命名为5纳米以匹配代工厂的营销计划。在SemiAccurate....
旺材芯片 发表于 04-13 09:31
•
463次
阅读
设置访问等级和密码后,需输入密码才能访问功能和存储区。将在 CPU 的对象属性中指定各种访问级别及其....
在爆料Up主Moore’s Law Is Dead的最新视频中,他探听到了Intel神秘新项目,隶属....
FPGA之家 发表于 04-12 14:31
•
264次
阅读
2021年4月8日,上海——澜起科技,国际领先的高性能处理器和全互连芯片设计公司,正式对外发布其全新....
无到有(make something from scratch)一直是工程师的浪漫,例如自行调配出操....
微处理器体系结构说明。
发表于 04-12 11:42 •
7次
阅读
我自己写的程序中有一个模块功能是这样的:
1.先是一个等待通知,超时设置为450ms(正常情况下没有通知,等待450ms后超时);
...
发表于 04-12 10:47 •
113次
阅读
方案采用了NXP i.MXRT1010高性能低功耗跨界MCU作为主控,该产品采用Cortex-M7內....
发表于 04-12 10:20 •
198次
阅读
声子玻尔兹曼输运方程(BTE)可以有效地模拟介观尺度下的导热问题,相比于随机性方法,以有限体积法为代....
发表于 04-12 09:50 •
35次
阅读
FPGA的应用原理是什么?主要应用于哪些领域?
正交扩频码的解扩解调是什么?
...
发表于 04-12 06:40 •
0次
阅读
LM86报警输出有哪几种不同的使用方式?
LM86在CPU测温中有哪些应用?
...
发表于 04-12 06:36 •
0次
阅读
请没有大佬可以分享一下8086CPU汇编指令速查手册?...
发表于 04-12 06:13 •
0次
阅读
X86嵌入式主板是嵌入式主板的一种,主要特点源于体积小巧、参数稳定,其还能分为多个类型,它们分别对应....
发表于 04-11 10:15 •
32次
阅读
科技是强国之基,创新是发展之魂,在全球经济增长持续放缓、国际形势错综复杂的形势下,科技创新能力不足、....
科技观察者 发表于 04-10 11:34
•
190次
阅读
相对人的感官来说CPU跑的太快了——即便是人们常常用来描述时间短暂的“一眨眼功夫”对CPU来说也是及....
FPGA之家 发表于 04-09 18:19
•
438次
阅读
今天,作为Arm的Vision Day活动的一部分,该公司正式发布了该公司的新一代Armv9架构的首....
安芯教育科技 发表于 04-09 16:19
•
856次
阅读
调用一个系统功能 (SFC24):当调用系统功能 SFC 24 “TEST_DB”(测试数据块) ....
谷歌近日公布了其对自定义计算的愿景,并透露他们计划采用“片上系统”基础架构来取代传统主板作为关键集成....
现代CPU成为处理器(processor)芯片的核心组件之一,而不仅仅是唯一组件。在过去50多年间,....
旺材芯片 发表于 04-09 10:19
•
1356次
阅读
多核处理器是指在一枚处理器中集成两个或多个完整的计算引擎(内核)。多核技术的开发源于工程师们认识到,....
发表于 04-09 09:33 •
27次
阅读
Intel的代号分别为Alderwood和Grantsdale系列芯片组,自从它们在媒体露面之始就受....
发表于 04-09 09:30 •
26次
阅读
ARM嵌入式系统ARM芯片的应用和选型说明。
发表于 04-09 09:22 •
27次
阅读
数字锁相环频率合成系统的工作原理
CPU控制数字锁相环频率合成系统FPGA实现
...
发表于 04-09 06:20 •
0次
阅读
十年来首次大更新!日前,Arm v9架构发布的消息炸开了锅,这是继Arm v8十年前推出后的首次重大....
传感器技术 发表于 04-08 15:01
•
269次
阅读
今天主要分享一个shell脚本,用来获取linux系统CPU、内存、磁盘IO等信息。
单片机 01 什么是单片机 单片机已广泛称作微控制器(MCU),单片机是一块类似PC的芯片,它不是完....
成都亿佰特 发表于 04-08 14:10
•
290次
阅读
基于嵌入式系统理论和容错系统体系结构,怎样利用FPGA去设计二乘二取二安全系统?
二乘二取二系统是什么?由什么组成?
...
发表于 04-08 06:17 •
0次
阅读
要用什么方式才能使AD7543发挥作用?以此提高系统的抗干扰能力和可靠性。...
发表于 04-07 06:04 •
0次
阅读
芯片的速度取决于哪几个方面?
CPU和GPU擅长和不擅长的地方看了就知道
...
发表于 04-06 09:05 •
0次
阅读
TMS320VC5501(5501)定点数字信号处理器(DSP)基于TMS320C55x™DSP生成CPU处理器内核。 C55x™DSP架构通过增加并行性和全面关注降低功耗来实现高性能和低功耗。 CPU支持内部总线结构,该结构由一个程序总线,三个数据读总线,两个数据写总线以及专用于外设和DMA活动的附加总线组成。这些总线能够在一个周期内执行最多三次数据读取和两次数据写入。并行,DMA控制器可以独立于CPU活动执行数据传输。
C55x™CPU提供两个乘法累加(MAC)单元,每个单元能够进行17位×17位乘法运算。单循环。额外的16位ALU支持中央40位算术/逻辑单元(ALU)。 ALU的使用受指令集控制,提供优化并行活动和功耗的能力。这些资源在C55x CPU的地址单元(AU)和数据单元(DU)中进行管理。
C55x DSP代支持可变字节宽度指令集,以提高代码密度。指令单元(IU)从内部或外部存储器执行32位程序提取,并为程序单元(PU)排队指令。程序单元解码指令,将任务指向AU和DU资源,并管理完全受保护的管道。预测分支功能可避免执行条件指令时的管道刷新。
5501外设...
发表于 10-09 14:55 •
305次
阅读
评论