侵权投诉

GPU和CPU有什么区别GPU的详细介绍

2020-11-28 11:23 次阅读

对于GPU,大家想必也十分熟悉。但是,大家真的了解GPU吗?譬如,GPU和显卡是同一个东西吗?CPU和GPU有什么区别吗?在本文中,小编将对这两个问题加以介绍。如果GPU是您正在了解的知识,本文将是很好的入门素材哦,不妨和小编共同往下阅读吧。

一、GPU 、显卡关系

总的来说,显卡是显示卡的简称,显卡是由GPU、显存等等组成的。

GPU是图形处理器,一般GPU就是焊接在显卡上的,大部分情况下,我们所说GPU就等于指显卡,但是实际情况是GPU是显示卡的“心脏”,是显卡的一个核心零部件,核心组成部分。它们是“寄生与被寄生”关系。GPU本身并不能单独工作,只有配合上附属电路接口,才能工作。这时候,它就变成了显卡。

也就相当于CPU在电脑中的作用,它决定了该显卡的档次和大部分性能,现在还没有出现GPU插在主板上的,因为GPU功耗很高,背面电流过大,还是焊接更为可靠。

二、CPU、GPU区别

CPU和GPU之所以大不相同,是由于其设计目标的不同,它们分别针对了两种不同的应用场景。CPU需要很强的通用性来处理各种不同的数据类型,同时又要逻辑判断又会引入大量的分支跳转和中断的处理。这些都使得CPU的内部结构异常复杂。而GPU面对的则是类型高度统一的、相互无依赖的大规模数据和不需要被打断的纯净的计算环境。

于是CPU和GPU就呈现出非常不同的架构(示意图):

图片来自nVidia CUDA文档。其中绿色的是计算单元,橙红色的是存储单元,橙黄色的是控制单元。

GPU采用了数量众多的计算单元和超长的流水线,但只有非常简单的控制逻辑并省去了Cache。而CPU不仅被Cache占据了大量空间,而且还有有复杂的控制逻辑和诸多优化电路,相比之下计算能力只是CPU很小的一部分。

从上图可以看出:

Cache, local memory: CPU 》 GPU

Threads(线程数): GPU 》 CPU

Registers: GPU 》 CPU 多寄存器可以支持非常多的Thread,thread需要用到register,thread数目大,register也必须得跟着很大才行。

SIMD Unit(单指令多数据流,以同步方式,在同一时间内执行同一条指令): GPU 》 CPU。

CPU 基于低延时的设计:

CPU有强大的ALU(算术运算单元),它可以在很少的时钟周期内完成算术计算。

当今的CPU可以达到64bit 双精度。执行双精度浮点源算的加法和乘法只需要1~3个时钟周期。

CPU的时钟周期的频率是非常高的,达到1.532~3gigahertz(千兆HZ, 10的9次方)。

大的缓存也可以降低延时。保存很多的数据放在缓存里面,当需要访问的这些数据,只要在之前访问过的,如今直接在缓存里面取即可。

复杂的逻辑控制单元。当程序含有多个分支的时候,它通过提供分支预测的能力来降低延时。

数据转发。 当一些指令依赖前面的指令结果时,数据转发的逻辑控制单元决定这些指令在pipeline中的位置并且尽可能快的转发一个指令的结果给后续的指令。这些动作需要很多的对比电路单元和转发电路单元。

GPU是基于大的吞吐量设计。GPU的特点是有很多的ALU和很少的cache. 缓存的目的不是保存后面需要访问的数据的,这点和CPU不同,而是为thread提高服务的。如果有很多线程需要访问同一个相同的数据,缓存会合并这些访问,然后再去访问dram(因为需要访问的数据保存在dram中而不是cache里面),获取数据后cache会转发这个数据给对应的线程,这个时候是数据转发的角色。但是由于需要访问dram,自然会带来延时的问题。

GPU的控制单元(左边黄色区域块)可以把多个的访问合并成少的访问。

GPU的虽然有dram延时,却有非常多的ALU和非常多的thread. 为啦平衡内存延时的问题,我们可以中充分利用多的ALU的特性达到一个非常大的吞吐量的效果。尽可能多的分配多的Threads.通常来看GPU ALU会有非常重的pipeline就是因为这样。

所以与CPU擅长逻辑控制,串行的运算。和通用类型数据运算不同,GPU擅长的是大规模并发计算,这也正是密码破解等所需要的。所以GPU除了图像处理,也越来越多的参与到计算当中来。

GPU的工作大部分就是这样,计算量大,但没什么技术含量,而且要重复很多很多次。就像你有个工作需要算几亿次一百以内加减乘除一样,最好的办法就是雇上几十个小学生一起算,一人算一部分,反正这些计算也没什么技术含量,纯粹体力活而已。而CPU就像老教授,积分微分都会算,就是工资高,一个老教授资顶二十个小学生,你要是富士康你雇哪个?GPU就是这样,用很多简单的计算单元去完成大量的计算任务,纯粹的人海战术。这种策略基于一个前提,就是小学生A和小学生B的工作没有什么依赖性,是互相独立的。很多涉及到大量计算的问题基本都有这种特性,比如你说的破解密码,挖矿和很多图形学的计算。这些计算可以分解为多个相同的简单小任务,每个任务就可以分给一个小学生去做。但还有一些任务涉及到“流”的问题。比如你去相亲,双方看着顺眼才能继续发展。总不能你这边还没见面呢,那边找人把证都给领了。这种比较复杂的问题都是CPU来做的。

总而言之,CPU和GPU因为最初用来处理的任务就不同,所以设计上有不小的区别。而某些任务和GPU最初用来解决的问题比较相似,所以用GPU来算了。GPU的运算速度取决于雇了多少小学生,CPU的运算速度取决于请了多么厉害的教授。教授处理复杂任务的能力是碾压小学生的,但是对于没那么复杂的任务,还是顶不住人多。当然现在的GPU也能做一些稍微复杂的工作了,相当于升级成初中生高中生的水平。但还需要CPU来把数据喂到嘴边才能开始干活,究竟还是靠CPU来管的。

收藏 人收藏
分享:

评论

相关推荐

常用的焊接设备有哪些

乙炔是一种无色却带有特殊臭味的可燃气体,具有爆炸性。所产生的火火焰温度高达3300℃。
的头像 陈翠 发表于 04-18 09:34 43次 阅读
常用的焊接设备有哪些

超声波熔接的焊线设计

许多熔接的技巧与熔接问题处理的对策中都离不开焊接线的设计,虽然只是0.3~0.5mm的细线,却让多少....
发表于 04-17 11:37 136次 阅读
超声波熔接的焊线设计

利用导热硅胶片解决散热问题

随着科技迅速的发展,市场上的高科技先进电子产品日新月异,而且很受消者朋友们的青睐,而且电子产品的安装....
发表于 04-16 16:36 37次 阅读
利用导热硅胶片解决散热问题

如何解决氨水管道渗漏问题

氨水又称阿摩尼亚水,可写作NH3(aq)是氨的水溶液,无色透明且具有刺激性气味。工业氨水是含氨25%....
发表于 04-16 15:18 8次 阅读
如何解决氨水管道渗漏问题

浅谈GPU: 衡量计算效能的正确姿势(3)

而且Cache往往分几个层级,与内存以及其它外部存储器共同构成计算机系统的存储器层次结构(Memor....
的头像 Linuxer 发表于 04-16 11:16 140次 阅读
浅谈GPU: 衡量计算效能的正确姿势(3)

浅谈GPU: 衡量计算效能的正确姿势(2)

这次我们准备聊下决定系统计算性能的两大关键指标,1. 浮点运算能力(FLOPS), 2. 内存带宽(....
的头像 Linuxer 发表于 04-16 11:12 132次 阅读
浅谈GPU: 衡量计算效能的正确姿势(2)

浅谈GPU: 衡量计算效能的正确姿势(1)

言归正状,万事开头难,现在骑虎难下,也只好勉力为之。在这里想先介绍些今后文章经常会涉及的一些指标概念....
的头像 Linuxer 发表于 04-16 11:05 161次 阅读
浅谈GPU: 衡量计算效能的正确姿势(1)

基于赛灵思提供的实时计算平台的超低时延视频流解决方案

本期案例将介绍 BroadBand 与 Skreens 的合作,双方基于赛灵思提供的实时计算平台打造....
的头像 FPGA开发圈 发表于 04-16 10:56 156次 阅读
基于赛灵思提供的实时计算平台的超低时延视频流解决方案

剖析MELD报警信息提示/存储-解读FB651

FB651 用于 多语言转换 用于在三种语言之间切换消息视图(数据库视图)和消息归档(数据库归档)中....
的头像 机器人及PLC自动化应用 发表于 04-16 10:54 102次 阅读
剖析MELD报警信息提示/存储-解读FB651

简述SCL -CPU内存区域的索引存取

也能够用一外索引来存取CPU的内存区域。与绝对地址比较,此方式的优点是能够用变量索引动态寻址。例如,....
的头像 机器人及PLC自动化应用 发表于 04-16 10:45 52次 阅读
简述SCL -CPU内存区域的索引存取

学会Python全网资源任意爬 简直太强大了!

我最近看中了一款CPU,结果被价格劝退。   想提前练练手速,等有活动了再冲。   结果被来我家玩的....
的头像 机器人及PLC自动化应用 发表于 04-16 10:10 217次 阅读
学会Python全网资源任意爬 简直太强大了!

V模式的设计方法及自动代码生成资料下载

电子发烧友网为你提供V模式的设计方法及自动代码生成资料下载的电子资料下载,更有其他相关的电路图、源代....
发表于 04-16 08:54 5次 阅读
V模式的设计方法及自动代码生成资料下载

什么程序适合在GPU上运行?什么时候用CPU资料下载

电子发烧友网为你提供什么程序适合在GPU上运行?什么时候用CPU资料下载的电子资料下载,更有其他相关....
发表于 04-16 08:53 5次 阅读
什么程序适合在GPU上运行?什么时候用CPU资料下载

工业设备中LED显示和键盘扫描设计资料推荐

工业设备、汽车电子及仪器仪表中普遍使用LED显示器,原因是LED显示器成本低廉、使用灵活、封装体积小。开发这类设备时,常...
发表于 04-16 07:27 0次 阅读
工业设备中LED显示和键盘扫描设计资料推荐

浅谈Armv9的三个技术特性及引发的市场竞争力

十年转瞬,Armv9架构终于露出庐山真面目,适用于Arm全系列芯片的Armv9架构,这次的升级瞄准的....
的头像 beanxyy 发表于 04-15 18:08 561次 阅读
浅谈Armv9的三个技术特性及引发的市场竞争力

一文带你深入了解量子计算

量子计算使用亚原子粒子的物理学领域来执行复杂的并行计算,从而取代了当今计算机系统中更简单的晶体管。量....
的头像 Les 发表于 04-15 15:04 225次 阅读
一文带你深入了解量子计算

简述IC卡技术的城市信息平台的建设

IC卡技术已经大量应用于与城市居民生活息息相关的方方面面,基于IC卡技术的城市信息化平台建设,已经成....
的头像 电子发烧友网工程师 发表于 04-15 14:37 179次 阅读
简述IC卡技术的城市信息平台的建设

​GPU越做越大 到极限了怎么办?

消费用户市场,普通用户都能用上16核甚至64核处理器的PC。这可不是单纯堆核心就完事儿的。以当前CP....
的头像 电子发烧友网工程师 发表于 04-15 11:35 162次 阅读
​GPU越做越大 到极限了怎么办?

脱苯塔塔顶局部渗漏的治理方法

脱苯塔从属于解吸塔,是让溶解于洗油溶剂中的苯族烃经过热载体的直接接触传热而蒸发释放出来的操作设备。脱....
发表于 04-15 10:37 48次 阅读
脱苯塔塔顶局部渗漏的治理方法

佳士科技发布2020年业绩报告:2020年公司实现营收10.2亿

在业绩说明会上,佳士科技董事长兼总经理潘磊表示,公司目前在手订单饱满,已排产至今年6月,与2018-....
的头像 高工机器人 发表于 04-15 10:27 181次 阅读
佳士科技发布2020年业绩报告:2020年公司实现营收10.2亿

详解硬核与软核处理器的区别及联系

SOPC技术,即软核处理器,最早是由Altera公司提出来的,它是基于FPGA的SOC片上系统设计技....
的头像 FPGA之家 发表于 04-15 09:48 110次 阅读
详解硬核与软核处理器的区别及联系

电子设计实施有效的安全认证方法资料下载

电子发烧友网为你提供电子设计实施有效的安全认证方法资料下载的电子资料下载,更有其他相关的电路图、源代....
发表于 04-15 08:48 8次 阅读
电子设计实施有效的安全认证方法资料下载

如何实现声音隔离?工程师可用哪些技术资料下载

电子发烧友网为你提供如何实现声音隔离?工程师可用哪些技术资料下载的电子资料下载,更有其他相关的电路图....
发表于 04-15 08:40 5次 阅读
如何实现声音隔离?工程师可用哪些技术资料下载

请问如何在复杂IC上设计测试与测量仪器?

如何在复杂IC上设计测试与测量仪器? 在IC中设计测试仪器的潮流开始于什么? 如何在高速I/O块中建立分析仪器?...
发表于 04-15 07:06 0次 阅读
请问如何在复杂IC上设计测试与测量仪器?

单片机基础及应用|80C51单片机的结构及信号引脚资料下载

电子发烧友网为你提供单片机基础及应用|80C51单片机的结构及信号引脚资料下载的电子资料下载,更有其....
发表于 04-14 08:47 16次 阅读
单片机基础及应用|80C51单片机的结构及信号引脚资料下载

NVIDIA BlueField-3,引领数据中心基础设施新潮

BlueField-3是首款为AI和加速计算而设计的DPU,助力各企业在任何规模的应用上都能实现业内....
发表于 04-13 16:53 768次 阅读
NVIDIA BlueField-3,引领数据中心基础设施新潮

x86主板有什么特点,它的优势有哪些

X86指令集是美国Intel公司为其第一块16位CPU(i8086)专门开发的,美国IBM公司198....
发表于 04-13 15:49 21次 阅读
x86主板有什么特点,它的优势有哪些

业界唯一内置AI的数据中心CPU来了

业界唯一内置AI的数据中心CPU来了。4月6日,英特尔在北京首钢园推出第三代至强可扩展处理器(代号I....
的头像 机器人创新生态 发表于 04-13 11:34 385次 阅读
业界唯一内置AI的数据中心CPU来了

手持PDA操作系统有哪些,其区别是什么

手持PDA是指具备信息传输处理功能的手持终端设备,配有操作系统、内存、CPU、显卡、屏幕,键盘和电池....
发表于 04-13 10:09 111次 阅读
手持PDA操作系统有哪些,其区别是什么

美媒造谣台积电为大陆制造军用芯片,台当局紧急回应

北京时间4月8日晚,美国商务部再次以所谓“威胁国家安全”为由,将包括天津飞腾信息技术有限公司(下称:....
的头像 旺材芯片 发表于 04-13 09:48 574次 阅读
美媒造谣台积电为大陆制造军用芯片,台当局紧急回应

据外媒报道 英特尔要将其7nm改名为5nm

据外媒报道,英特尔可能将其7纳米制程重命名为5纳米以匹配代工厂的营销计划。在SemiAccurate....
的头像 旺材芯片 发表于 04-13 09:31 465次 阅读
据外媒报道 英特尔要将其7nm改名为5nm

深度剖析电动汽车转子油冷电机

今天给大家带来一篇关于电动汽车转子油冷电机方案的文献解读,文章详细介绍了油路设计中各个变量的优化过程....
的头像 电机技术及应用 发表于 04-13 08:53 211次 阅读
深度剖析电动汽车转子油冷电机

关于组态CPU的访问保护浅析

设置访问等级和密码后,需输入密码才能访问功能和存储区。将在 CPU 的对象属性中指定各种访问级别及其....
的头像 机器人及PLC自动化应用 发表于 04-12 14:36 128次 阅读
关于组态CPU的访问保护浅析

Sapphire Rapids对应第四代至强可扩展处理器预计今年底登场

在爆料Up主Moore’s Law Is Dead的最新视频中,他探听到了Intel神秘新项目,隶属....
的头像 FPGA之家 发表于 04-12 14:31 273次 阅读
Sapphire Rapids对应第四代至强可扩展处理器预计今年底登场

澜起科技重磅发布全新第三代津逮CPU!

2021年4月8日,上海——澜起科技,国际领先的高性能处理器和全互连芯片设计公司,正式对外发布其全新....
的头像 电子发烧友网工程师 发表于 04-12 14:26 311次 阅读
澜起科技重磅发布全新第三代津逮CPU!

揭秘古法制作CPU 你见过吗

无到有(make something from scratch)一直是工程师的浪漫,例如自行调配出操....
的头像 Linux爱好者 发表于 04-12 13:36 217次 阅读
揭秘古法制作CPU 你见过吗

微处理器体系结构

微处理器体系结构说明。
发表于 04-12 11:42 7次 阅读
微处理器体系结构

Labview的超时和等待函数时间精度和电脑配置有关吗?

我自己写的程序中有一个模块功能是这样的: 1.先是一个等待通知,超时设置为450ms(正常情况下没有通知,等待450ms后超时); ...
发表于 04-12 10:47 113次 阅读
Labview的超时和等待函数时间精度和电脑配置有关吗?

大联大世平集团推出基于NXP i.MXRT1010的音乐播放器解决方案

方案采用了NXP i.MXRT1010高性能低功耗跨界MCU作为主控,该产品采用Cortex-M7內....
发表于 04-12 10:20 198次 阅读
大联大世平集团推出基于NXP i.MXRT1010的音乐播放器解决方案

声子BTE方程迭代求解在GPU上的并行加速方案

声子玻尔兹曼输运方程(BTE)可以有效地模拟介观尺度下的导热问题,相比于随机性方法,以有限体积法为代....
发表于 04-12 09:50 35次 阅读
声子BTE方程迭代求解在GPU上的并行加速方案

多进制扩频编码是如何实现的?

FPGA的应用原理是什么?主要应用于哪些领域? 正交扩频码的解扩解调是什么? ...
发表于 04-12 06:40 0次 阅读
多进制扩频编码是如何实现的?

LM86温度传感器工作原理及特点是什么?

LM86报警输出有哪几种不同的使用方式? LM86在CPU测温中有哪些应用? ...
发表于 04-12 06:36 0次 阅读
LM86温度传感器工作原理及特点是什么?

求大佬分享关于8086CPU汇编指令速查手册

请没有大佬可以分享一下8086CPU汇编指令速查手册?...
发表于 04-12 06:13 0次 阅读
求大佬分享关于8086CPU汇编指令速查手册

x86嵌入式主板的相关知识

X86嵌入式主板是嵌入式主板的一种,主要特点源于体积小巧、参数稳定,其还能分为多个类型,它们分别对应....
发表于 04-11 10:15 32次 阅读
x86嵌入式主板的相关知识

ACM中国-国际并行计算挑战赛已经正式启动

科技是强国之基,创新是发展之魂,在全球经济增长持续放缓、国际形势错综复杂的形势下,科技创新能力不足、....
的头像 科技观察者 发表于 04-10 11:34 190次 阅读
ACM中国-国际并行计算挑战赛已经正式启动

关于CPU运行速度计算详解

相对人的感官来说CPU跑的太快了——即便是人们常常用来描述时间短暂的“一眨眼功夫”对CPU来说也是及....
的头像 FPGA之家 发表于 04-09 18:19 438次 阅读
关于CPU运行速度计算详解

关于Arm发布的V9架构详细解析

今天,作为Arm的Vision Day活动的一部分,该公司正式发布了该公司的新一代Armv9架构的首....
的头像 安芯教育科技 发表于 04-09 16:19 858次 阅读
关于Arm发布的V9架构详细解析

如何理解FCSFC的输出参数RET_VAL(返回值)?

调用一个系统功能 (SFC24):当调用系统功能 SFC 24 “TEST_DB”(测试数据块) ....
的头像 机器人及PLC自动化应用 发表于 04-09 15:22 141次 阅读
如何理解FCSFC的输出参数RET_VAL(返回值)?

浅谈Google将尝试用SoC替代传统CPU主板的方式

谷歌近日公布了其对自定义计算的愿景,并透露他们计划采用“片上系统”基础架构来取代传统主板作为关键集成....
的头像 ssdfans 发表于 04-09 15:16 247次 阅读
浅谈Google将尝试用SoC替代传统CPU主板的方式

关于CPU指令集架构详细讲解

现代CPU成为处理器(processor)芯片的核心组件之一,而不仅仅是唯一组件。在过去50多年间,....
的头像 旺材芯片 发表于 04-09 10:19 1362次 阅读
关于CPU指令集架构详细讲解

求一种使用CPU控制数字锁相环频率合成系统FPGA实现方法

数字锁相环频率合成系统的工作原理 CPU控制数字锁相环频率合成系统FPGA实现 ...
发表于 04-09 06:20 0次 阅读
求一种使用CPU控制数字锁相环频率合成系统FPGA实现方法

怎样利用FPGA去设计二乘二取二安全系统?

基于嵌入式系统理论和容错系统体系结构,怎样利用FPGA去设计二乘二取二安全系统? 二乘二取二系统是什么?由什么组成? ...
发表于 04-08 06:17 0次 阅读
怎样利用FPGA去设计二乘二取二安全系统?

要用什么方法才能使AD7543发挥最大作用?

要用什么方式才能使AD7543发挥作用?以此提高系统的抗干扰能力和可靠性。...
发表于 04-07 06:04 0次 阅读
要用什么方法才能使AD7543发挥最大作用?

芯片的速度取决于哪几个方面?

芯片的速度取决于哪几个方面? CPU和GPU擅长和不擅长的地方看了就知道 ...
发表于 04-06 09:05 0次 阅读
芯片的速度取决于哪几个方面?

TMS320VC5501 定点数字信号处理器

TMS320VC5501(5501)定点数字信号处理器(DSP)基于TMS320C55x™DSP生成CPU处理器内核。 C55x™DSP架构通过增加并行性和全面关注降低功耗来实现高性能和低功耗。 CPU支持内部总线结构,该结构由一个程序总线,三个数据读总线,两个数据写总线以及专用于外设和DMA活动的附加总线组成。这些总线能够在一个周期内执行最多三次数据读取和两次数据写入。并行,DMA控制器可以独立于CPU活动执行数据传输。 C55x™CPU提供两个乘法累加(MAC)单元,每个单元能够进行17位×17位乘法运算。单循环。额外的16位ALU支持中央40位算术/逻辑单元(ALU)。 ALU的使用受指令集控制,提供优化并行活动和功耗的能力。这些资源在C55x CPU的地址单元(AU)和数据单元(DU)中进行管理。 C55x DSP代支持可变字节宽度指令集,以提高代码密度。指令单元(IU)从内部或外部存储器执行32位程序提取,并为程序单元(PU)排队指令。程序单元解码指令,将任务指向AU和DU资源,并管理完全受保护的管道。预测分支功能可避免执行条件指令时的管道刷新。 5501外设...
发表于 10-09 14:55 305次 阅读
TMS320VC5501 定点数字信号处理器