侵权投诉

GPU与CPU间的比较

2019-08-26 15:32 次阅读

一、CPUGPU对比

CPU是一个有多种功能的优秀领导者。它的优点在于调度、管理、协调能力强,计算能力则位于其次。而GPU相当于一个接受CPU调度的“拥有大量计算能力”的员工。

下图是处理器内部结构图:

DRAM即动态随机存取存储器,是常见的系统内存。

Cache存储器:电脑中作高速缓冲存储器,是位于CPU和主存储器DRAM之间,规模较小,但速度很高的存储器。

算术逻辑单元ALU是能实现多组算术运算和逻辑运算的组合逻辑电路

当需要对大数据bigdata做同样的事情时,GPU更合适,当需要对同一数据做很多事情时,CPU正好合适。

GPU能做什么?关于图形方面的以及大型矩阵运算,如机器学习算法等方面,GPU就能大显身手。

简而言之,CPU擅长统领全局等复杂操作,GPU擅长对大数据进行简单重复操作。CPU是从事复杂脑力劳动的教授,而GPU是进行大量并行计算的体力劳动者。

二、机器深度学习

深度学习是模拟人脑神经系统而建立的数学网络模型,这个模型的最大特点是,需要大数据来训练。因此,对电脑处理器的要求,就是需要大量的并行的重复计算,GPU正好有这个专长,时势造英雄,因此,GPU就出山担当重任了。

GPU具有如下特点:

提供了多核并行计算的基础结构,且核心数非常多,可以支撑大量数据的并行计算。 并行计算或称平行计算是相对于串行计算来说的。它是一种一次可执行多个指令的算法,目的是提高计算速度,及通过扩大问题求解规模,解决大型而复杂的计算问题。

拥有更高的访存速度。

更高的浮点运算能力。浮点运算能力是关系到处理器的多媒体、3D图形处理的一个重要指标。现在的计算机技术中,由于大量多媒体技术的应用,浮点数的计算大大增加了,比如3D图形的渲染等工作,因此浮点运算的能力是考察处理器计算能力的重要指标。

这三个特点,非常适合深度学习了。

三、怎样发挥GPU的大数据处理能力

GPU只是显卡上的一个核心元件,又不能单独工作,它还需要缓存来辅助工作。独立显卡是直接焊死了GPU在显卡电路板上,上面有一个散热风扇供它单独使用。集成显卡是把GPU与CPU放在一起,共用缓存来工作,并且共用一个散热风扇。

电脑处理一大块数据比处理一个一个数据更有效,执行指令开销也会大大降低,因为要处理大块数据,意味着需要更多的晶体管来并行工作,现在旗舰级显卡都是百亿以上的晶体管。

因此,要利用GPU做大数据处理工作,至少目前来说,还没有单独的GPU板卡可购。只能购买GPU性能优越的超级独立显卡,或集成集卡中GPU性能优秀的主板。

收藏 人收藏
分享:

评论

相关推荐

利用导热硅胶片解决散热问题

随着科技迅速的发展,市场上的高科技先进电子产品日新月异,而且很受消者朋友们的青睐,而且电子产品的安装....
发表于 04-16 16:36 37次 阅读
利用导热硅胶片解决散热问题

浅谈GPU: 衡量计算效能的正确姿势(3)

而且Cache往往分几个层级,与内存以及其它外部存储器共同构成计算机系统的存储器层次结构(Memor....
的头像 Linuxer 发表于 04-16 11:16 135次 阅读
浅谈GPU: 衡量计算效能的正确姿势(3)

浅谈GPU: 衡量计算效能的正确姿势(2)

这次我们准备聊下决定系统计算性能的两大关键指标,1. 浮点运算能力(FLOPS), 2. 内存带宽(....
的头像 Linuxer 发表于 04-16 11:12 132次 阅读
浅谈GPU: 衡量计算效能的正确姿势(2)

浅谈GPU: 衡量计算效能的正确姿势(1)

言归正状,万事开头难,现在骑虎难下,也只好勉力为之。在这里想先介绍些今后文章经常会涉及的一些指标概念....
的头像 Linuxer 发表于 04-16 11:05 156次 阅读
浅谈GPU: 衡量计算效能的正确姿势(1)

基于赛灵思提供的实时计算平台的超低时延视频流解决方案

本期案例将介绍 BroadBand 与 Skreens 的合作,双方基于赛灵思提供的实时计算平台打造....
的头像 FPGA开发圈 发表于 04-16 10:56 154次 阅读
基于赛灵思提供的实时计算平台的超低时延视频流解决方案

剖析MELD报警信息提示/存储-解读FB651

FB651 用于 多语言转换 用于在三种语言之间切换消息视图(数据库视图)和消息归档(数据库归档)中....
的头像 机器人及PLC自动化应用 发表于 04-16 10:54 102次 阅读
剖析MELD报警信息提示/存储-解读FB651

简述SCL -CPU内存区域的索引存取

也能够用一外索引来存取CPU的内存区域。与绝对地址比较,此方式的优点是能够用变量索引动态寻址。例如,....
的头像 机器人及PLC自动化应用 发表于 04-16 10:45 52次 阅读
简述SCL -CPU内存区域的索引存取

学会Python全网资源任意爬 简直太强大了!

我最近看中了一款CPU,结果被价格劝退。   想提前练练手速,等有活动了再冲。   结果被来我家玩的....
的头像 机器人及PLC自动化应用 发表于 04-16 10:10 217次 阅读
学会Python全网资源任意爬 简直太强大了!

V模式的设计方法及自动代码生成资料下载

电子发烧友网为你提供V模式的设计方法及自动代码生成资料下载的电子资料下载,更有其他相关的电路图、源代....
发表于 04-16 08:54 5次 阅读
V模式的设计方法及自动代码生成资料下载

什么程序适合在GPU上运行?什么时候用CPU资料下载

电子发烧友网为你提供什么程序适合在GPU上运行?什么时候用CPU资料下载的电子资料下载,更有其他相关....
发表于 04-16 08:53 5次 阅读
什么程序适合在GPU上运行?什么时候用CPU资料下载

工业设备中LED显示和键盘扫描设计资料推荐

工业设备、汽车电子及仪器仪表中普遍使用LED显示器,原因是LED显示器成本低廉、使用灵活、封装体积小。开发这类设备时,常...
发表于 04-16 07:27 0次 阅读
工业设备中LED显示和键盘扫描设计资料推荐

浅谈Armv9的三个技术特性及引发的市场竞争力

十年转瞬,Armv9架构终于露出庐山真面目,适用于Arm全系列芯片的Armv9架构,这次的升级瞄准的....
的头像 beanxyy 发表于 04-15 18:08 559次 阅读
浅谈Armv9的三个技术特性及引发的市场竞争力

一文带你深入了解量子计算

量子计算使用亚原子粒子的物理学领域来执行复杂的并行计算,从而取代了当今计算机系统中更简单的晶体管。量....
的头像 Les 发表于 04-15 15:04 225次 阅读
一文带你深入了解量子计算

简述IC卡技术的城市信息平台的建设

IC卡技术已经大量应用于与城市居民生活息息相关的方方面面,基于IC卡技术的城市信息化平台建设,已经成....
的头像 电子发烧友网工程师 发表于 04-15 14:37 177次 阅读
简述IC卡技术的城市信息平台的建设

​GPU越做越大 到极限了怎么办?

消费用户市场,普通用户都能用上16核甚至64核处理器的PC。这可不是单纯堆核心就完事儿的。以当前CP....
的头像 电子发烧友网工程师 发表于 04-15 11:35 162次 阅读
​GPU越做越大 到极限了怎么办?

详解硬核与软核处理器的区别及联系

SOPC技术,即软核处理器,最早是由Altera公司提出来的,它是基于FPGA的SOC片上系统设计技....
的头像 FPGA之家 发表于 04-15 09:48 110次 阅读
详解硬核与软核处理器的区别及联系

电子设计实施有效的安全认证方法资料下载

电子发烧友网为你提供电子设计实施有效的安全认证方法资料下载的电子资料下载,更有其他相关的电路图、源代....
发表于 04-15 08:48 8次 阅读
电子设计实施有效的安全认证方法资料下载

如何实现声音隔离?工程师可用哪些技术资料下载

电子发烧友网为你提供如何实现声音隔离?工程师可用哪些技术资料下载的电子资料下载,更有其他相关的电路图....
发表于 04-15 08:40 5次 阅读
如何实现声音隔离?工程师可用哪些技术资料下载

请问如何在复杂IC上设计测试与测量仪器?

如何在复杂IC上设计测试与测量仪器? 在IC中设计测试仪器的潮流开始于什么? 如何在高速I/O块中建立分析仪器?...
发表于 04-15 07:06 0次 阅读
请问如何在复杂IC上设计测试与测量仪器?

单片机基础及应用|80C51单片机的结构及信号引脚资料下载

电子发烧友网为你提供单片机基础及应用|80C51单片机的结构及信号引脚资料下载的电子资料下载,更有其....
发表于 04-14 08:47 16次 阅读
单片机基础及应用|80C51单片机的结构及信号引脚资料下载

NVIDIA BlueField-3,引领数据中心基础设施新潮

BlueField-3是首款为AI和加速计算而设计的DPU,助力各企业在任何规模的应用上都能实现业内....
发表于 04-13 16:53 758次 阅读
NVIDIA BlueField-3,引领数据中心基础设施新潮

x86主板有什么特点,它的优势有哪些

X86指令集是美国Intel公司为其第一块16位CPU(i8086)专门开发的,美国IBM公司198....
发表于 04-13 15:49 21次 阅读
x86主板有什么特点,它的优势有哪些

业界唯一内置AI的数据中心CPU来了

业界唯一内置AI的数据中心CPU来了。4月6日,英特尔在北京首钢园推出第三代至强可扩展处理器(代号I....
的头像 机器人创新生态 发表于 04-13 11:34 383次 阅读
业界唯一内置AI的数据中心CPU来了

手持PDA操作系统有哪些,其区别是什么

手持PDA是指具备信息传输处理功能的手持终端设备,配有操作系统、内存、CPU、显卡、屏幕,键盘和电池....
发表于 04-13 10:09 111次 阅读
手持PDA操作系统有哪些,其区别是什么

美媒造谣台积电为大陆制造军用芯片,台当局紧急回应

北京时间4月8日晚,美国商务部再次以所谓“威胁国家安全”为由,将包括天津飞腾信息技术有限公司(下称:....
的头像 旺材芯片 发表于 04-13 09:48 574次 阅读
美媒造谣台积电为大陆制造军用芯片,台当局紧急回应

据外媒报道 英特尔要将其7nm改名为5nm

据外媒报道,英特尔可能将其7纳米制程重命名为5纳米以匹配代工厂的营销计划。在SemiAccurate....
的头像 旺材芯片 发表于 04-13 09:31 463次 阅读
据外媒报道 英特尔要将其7nm改名为5nm

关于组态CPU的访问保护浅析

设置访问等级和密码后,需输入密码才能访问功能和存储区。将在 CPU 的对象属性中指定各种访问级别及其....
的头像 机器人及PLC自动化应用 发表于 04-12 14:36 128次 阅读
关于组态CPU的访问保护浅析

Sapphire Rapids对应第四代至强可扩展处理器预计今年底登场

在爆料Up主Moore’s Law Is Dead的最新视频中,他探听到了Intel神秘新项目,隶属....
的头像 FPGA之家 发表于 04-12 14:31 264次 阅读
Sapphire Rapids对应第四代至强可扩展处理器预计今年底登场

澜起科技重磅发布全新第三代津逮CPU!

2021年4月8日,上海——澜起科技,国际领先的高性能处理器和全互连芯片设计公司,正式对外发布其全新....
的头像 电子发烧友网工程师 发表于 04-12 14:26 309次 阅读
澜起科技重磅发布全新第三代津逮CPU!

揭秘古法制作CPU 你见过吗

无到有(make something from scratch)一直是工程师的浪漫,例如自行调配出操....
的头像 Linux爱好者 发表于 04-12 13:36 217次 阅读
揭秘古法制作CPU 你见过吗

微处理器体系结构

微处理器体系结构说明。
发表于 04-12 11:42 7次 阅读
微处理器体系结构

Labview的超时和等待函数时间精度和电脑配置有关吗?

我自己写的程序中有一个模块功能是这样的: 1.先是一个等待通知,超时设置为450ms(正常情况下没有通知,等待450ms后超时); ...
发表于 04-12 10:47 113次 阅读
Labview的超时和等待函数时间精度和电脑配置有关吗?

大联大世平集团推出基于NXP i.MXRT1010的音乐播放器解决方案

方案采用了NXP i.MXRT1010高性能低功耗跨界MCU作为主控,该产品采用Cortex-M7內....
发表于 04-12 10:20 198次 阅读
大联大世平集团推出基于NXP i.MXRT1010的音乐播放器解决方案

声子BTE方程迭代求解在GPU上的并行加速方案

声子玻尔兹曼输运方程(BTE)可以有效地模拟介观尺度下的导热问题,相比于随机性方法,以有限体积法为代....
发表于 04-12 09:50 35次 阅读
声子BTE方程迭代求解在GPU上的并行加速方案

多进制扩频编码是如何实现的?

FPGA的应用原理是什么?主要应用于哪些领域? 正交扩频码的解扩解调是什么? ...
发表于 04-12 06:40 0次 阅读
多进制扩频编码是如何实现的?

LM86温度传感器工作原理及特点是什么?

LM86报警输出有哪几种不同的使用方式? LM86在CPU测温中有哪些应用? ...
发表于 04-12 06:36 0次 阅读
LM86温度传感器工作原理及特点是什么?

求大佬分享关于8086CPU汇编指令速查手册

请没有大佬可以分享一下8086CPU汇编指令速查手册?...
发表于 04-12 06:13 0次 阅读
求大佬分享关于8086CPU汇编指令速查手册

x86嵌入式主板的相关知识

X86嵌入式主板是嵌入式主板的一种,主要特点源于体积小巧、参数稳定,其还能分为多个类型,它们分别对应....
发表于 04-11 10:15 32次 阅读
x86嵌入式主板的相关知识

ACM中国-国际并行计算挑战赛已经正式启动

科技是强国之基,创新是发展之魂,在全球经济增长持续放缓、国际形势错综复杂的形势下,科技创新能力不足、....
的头像 科技观察者 发表于 04-10 11:34 190次 阅读
ACM中国-国际并行计算挑战赛已经正式启动

关于CPU运行速度计算详解

相对人的感官来说CPU跑的太快了——即便是人们常常用来描述时间短暂的“一眨眼功夫”对CPU来说也是及....
的头像 FPGA之家 发表于 04-09 18:19 438次 阅读
关于CPU运行速度计算详解

关于Arm发布的V9架构详细解析

今天,作为Arm的Vision Day活动的一部分,该公司正式发布了该公司的新一代Armv9架构的首....
的头像 安芯教育科技 发表于 04-09 16:19 856次 阅读
关于Arm发布的V9架构详细解析

如何理解FCSFC的输出参数RET_VAL(返回值)?

调用一个系统功能 (SFC24):当调用系统功能 SFC 24 “TEST_DB”(测试数据块) ....
的头像 机器人及PLC自动化应用 发表于 04-09 15:22 137次 阅读
如何理解FCSFC的输出参数RET_VAL(返回值)?

浅谈Google将尝试用SoC替代传统CPU主板的方式

谷歌近日公布了其对自定义计算的愿景,并透露他们计划采用“片上系统”基础架构来取代传统主板作为关键集成....
的头像 ssdfans 发表于 04-09 15:16 247次 阅读
浅谈Google将尝试用SoC替代传统CPU主板的方式

关于CPU指令集架构详细讲解

现代CPU成为处理器(processor)芯片的核心组件之一,而不仅仅是唯一组件。在过去50多年间,....
的头像 旺材芯片 发表于 04-09 10:19 1356次 阅读
关于CPU指令集架构详细讲解

Intel多核微处理器技术

多核处理器是指在一枚处理器中集成两个或多个完整的计算引擎(内核)。多核技术的开发源于工程师们认识到,....
发表于 04-09 09:33 27次 阅读
Intel多核微处理器技术

Intel 915/925芯片组详细介绍

Intel的代号分别为Alderwood和Grantsdale系列芯片组,自从它们在媒体露面之始就受....
发表于 04-09 09:30 26次 阅读
Intel 915/925芯片组详细介绍

ARM嵌入式系统ARM芯片的应用和选型

ARM嵌入式系统ARM芯片的应用和选型说明。
发表于 04-09 09:22 27次 阅读
ARM嵌入式系统ARM芯片的应用和选型

求一种使用CPU控制数字锁相环频率合成系统FPGA实现方法

数字锁相环频率合成系统的工作原理 CPU控制数字锁相环频率合成系统FPGA实现 ...
发表于 04-09 06:20 0次 阅读
求一种使用CPU控制数字锁相环频率合成系统FPGA实现方法

CPU自主可控之路是否可行?

十年来首次大更新!日前,Arm v9架构发布的消息炸开了锅,这是继Arm v8十年前推出后的首次重大....
的头像 传感器技术 发表于 04-08 15:01 269次 阅读
CPU自主可控之路是否可行?

如何用脚本来获取linux系统CPU、内存、磁盘IO,及原理解释

今天主要分享一个shell脚本,用来获取linux系统CPU、内存、磁盘IO等信息。
的头像 Linux爱好者 发表于 04-08 14:40 383次 阅读
如何用脚本来获取linux系统CPU、内存、磁盘IO,及原理解释

深度剖析单片机、ARM、DSP、模块、CPU 之间的区别对比

单片机 01 什么是单片机 单片机已广泛称作微控制器(MCU),单片机是一块类似PC的芯片,它不是完....
的头像 成都亿佰特 发表于 04-08 14:10 290次 阅读
深度剖析单片机、ARM、DSP、模块、CPU 之间的区别对比

怎样利用FPGA去设计二乘二取二安全系统?

基于嵌入式系统理论和容错系统体系结构,怎样利用FPGA去设计二乘二取二安全系统? 二乘二取二系统是什么?由什么组成? ...
发表于 04-08 06:17 0次 阅读
怎样利用FPGA去设计二乘二取二安全系统?

要用什么方法才能使AD7543发挥最大作用?

要用什么方式才能使AD7543发挥作用?以此提高系统的抗干扰能力和可靠性。...
发表于 04-07 06:04 0次 阅读
要用什么方法才能使AD7543发挥最大作用?

芯片的速度取决于哪几个方面?

芯片的速度取决于哪几个方面? CPU和GPU擅长和不擅长的地方看了就知道 ...
发表于 04-06 09:05 0次 阅读
芯片的速度取决于哪几个方面?

TMS320VC5501 定点数字信号处理器

TMS320VC5501(5501)定点数字信号处理器(DSP)基于TMS320C55x™DSP生成CPU处理器内核。 C55x™DSP架构通过增加并行性和全面关注降低功耗来实现高性能和低功耗。 CPU支持内部总线结构,该结构由一个程序总线,三个数据读总线,两个数据写总线以及专用于外设和DMA活动的附加总线组成。这些总线能够在一个周期内执行最多三次数据读取和两次数据写入。并行,DMA控制器可以独立于CPU活动执行数据传输。 C55x™CPU提供两个乘法累加(MAC)单元,每个单元能够进行17位×17位乘法运算。单循环。额外的16位ALU支持中央40位算术/逻辑单元(ALU)。 ALU的使用受指令集控制,提供优化并行活动和功耗的能力。这些资源在C55x CPU的地址单元(AU)和数据单元(DU)中进行管理。 C55x DSP代支持可变字节宽度指令集,以提高代码密度。指令单元(IU)从内部或外部存储器执行32位程序提取,并为程序单元(PU)排队指令。程序单元解码指令,将任务指向AU和DU资源,并管理完全受保护的管道。预测分支功能可避免执行条件指令时的管道刷新。 5501外设...
发表于 10-09 14:55 305次 阅读
TMS320VC5501 定点数字信号处理器