0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CPU和GPU对于微架构、主频、IPC的对比分析

GReq_mcu168 2017-12-21 10:09 次阅读

芯片的速度主要取决于三个方面:微架构、主频、IPC(每个时钟周期执行的指令数)。

1.微架构

从微架构上看,CPUGPU看起来完全不是按照相同的设计思路设计的,当代CPU的微架构是按照兼顾“指令并行执行”和“数据并行运算”的思路而设计,就是要兼顾程序执行和数据运算的并行性、通用性以及它们的平衡性。CPU的微架构偏重于程序执行的效率,不会一味追求某种运算极致速度而牺牲程序执行的效率。
CPU和GPU对于微架构、主频、IPC的对比分析

CPU微架构的设计是面向指令执行高效率而设计的,因而CPU是计算机中设计最复杂的芯片。和GPU相比,CPU核心的重复设计部分不多,这种复杂性不能仅以晶体管的多寡来衡量,这种复杂性来自于实现:如程序分支预测,推测执行,多重嵌套分支执行,并行执行时候的指令相关性和数据相关性,多核协同处理时候的数据一致性等等复杂逻辑。

GPU其实是由硬件实现的一组图形函数的集合,这些函数主要用于绘制各种图形所需要的运算。这些和像素,光影处理,3D 坐标变换等相关的运算由GPU硬件加速来实现。图形运算的特点是大量同类型数据的密集运算——如图形数据的矩阵运算,GPU的微架构就是面向适合于矩阵类型的数值计算而设计的,大量重复设计的计算单元,这类计算可以分成众多独立的数值计算——大量数值运算的线程,而且数据之间没有像程序执行的那种逻辑关联性。

GPU微架构复杂度不高,尽管晶体管的数量不少。从应用的角度看,如何运用好GPU的并行计算能力主要的工作是开发好它的驱动程序。GPU驱动程序的优劣很大程度左右了GPU实际性能的发挥。

因此从微架构上看,CPU擅长的是像操作系统、系统软件和通用应用程序这类拥有复杂指令调度、循环、分支、逻辑判断以及执行等的程序任务。它的并行优势是程序执行层面的,程序逻辑的复杂度也限定了程序执行的指令并行性,上百个并行程序执行的线程基本看不到。GPU擅长的是图形类的或者是非图形类的高度并行数值计算,GPU可以容纳上千个没有逻辑关系的数值计算线程,它的优势是无逻辑关系数据的并行计算。

2.主频

另外,GPU执行每个数值计算的速度并没有比CPU快,从目前主流CPU和GPU的主频就可以看出了,CPU的主频都超过了1GHz,2GHz,甚至3GHz,而GPU的主频最高还不到1GHz,主流的也就500~600MHz。要知道1GHz = 1000MHz。所以GPU在执行少量线程的数值计算时并不能超过CPU。

目前GPU数值计算的优势主要是浮点运算,它执行浮点运算快是靠大量并行,但是这种数值运算的并行性在面对程序的逻辑执行时毫无用处。

3.IPC

(每个时钟周期执行的指令数)

这个方面,CPU和GPU无法比较,因为GPU大多数指令都是面向数值计算的,少量的控制指令也无法被操作系统和软件直接使用。如果比较数据指令的IPC,GPU显然要高过CPU,因为并行的原因。但是,如果比较控制指令的IPC,自然是CPU的要高的多。原因很简单,CPU着重的是指令执行的并行性。

另外,目前有些GPU也能够支持比较复杂的控制指令,比如条件转移、分支、循环和子程序调用等,但是GPU程序控制这方面的增加,和支持操作系统所需要的能力CPU相比还是天壤之别,而且指令执行的效率也无法和CPU相提并论。

最后总结一下:

CPU擅长的:操作系统,系统软件,应用程序,通用计算,系统控制等等;游戏中人工智能,物理模拟等等;3D建模-光线追踪渲染;虚拟化技术——抽象硬件,同时运行多个操作系统或者一个操作系统的多个副本等等。

GPU擅长的:图形类矩阵运算,非图形类并行数值计算,高端3D游戏。

综上所述,在一台均衡计算的计算机系统中,CPU和GPU还是各司其职,除了图形运算,GPU将来可能主要集中在高效率低成本的高性能并行数值计算,帮助CPU分担这种类型的计算,提高系统这方面的性能。而当前的典型应用还是高端3D游戏,一个高效的GPU配合一个高效的CPU,3D游戏的整体效率才能得到保证。“高端3D游戏只需要高端显卡”或者“高端3D游戏只需要CPU”都是无稽之谈。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10442

    浏览量

    206548
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4417

    浏览量

    126689
  • IPC
    IPC
    +关注

    关注

    3

    文章

    306

    浏览量

    51348

原文标题:CPU和GPU擅长和不擅长的地方

文章出处:【微信号:mcu168,微信公众号:硬件攻城狮】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    CPUGPU擅长和不擅长的地方

    和不擅长”。 芯片的速度主要取决于三个方面:架构主频IPC(每个时钟周期执行的指令数)。 1.
    发表于 12-03 15:43

    CPUGPU擅长和不擅长的地方

    和不擅长”。芯片的速度主要取决于三个方面:架构主频IPC(每个时钟周期执行的指令数)。1.架构
    发表于 12-03 20:08

    步进电机与伺服电机对比分析

    步进电机与伺服电机对比分析采用闭环技术的步进电机
    发表于 02-05 06:05

    LTE与WiMAX对比分析哪个好?

    LTE与WiMAX对比分析哪个好?
    发表于 05-31 06:22

    CPLD与FPGA对比分析哪个好?

    CPLD与FPGA对比分析哪个好?
    发表于 06-21 06:10

    x86/arm/mips各架构对比分析哪个好?

    x86/arm/mips各架构对比分析哪个好?
    发表于 10-21 06:39

    STM32和Arduino对比分析哪个好?

    Arduino和STM32各自的特点是什么?STM32和Arduino对比分析哪个好?
    发表于 11-04 06:34

    ARM与单片机对比分析哪个好?

    ARM与单片机对比分析哪个好?
    发表于 11-05 07:16

    CPLD与FPGA的对比分析哪个好?

    CPLD与FPGA的对比分析哪个好?
    发表于 11-05 08:20

    异步通信与同步通信对比分析哪个好?

    异步通信与同步通信对比分析哪个好?
    发表于 12-16 07:35

    DRAM和SRAM对比分析哪个好?

    RAM有哪些分类?特点是什么?DRAM和SRAM对比分析哪个好?
    发表于 01-20 07:16

    对RK3588和QCS8250进行详细的对比分析

    的处理器,二者主要性能基本一致,不过高通历来都是榨干处理器的潜力,因此性能偏高,而瑞芯深耕行业定制多年,有着更丰富的拓展接口。本文将对RK3588和QCS8250进行详细的对比分析,方便大家按需选型
    发表于 08-04 15:29

    SPWM调制方法对比分析

    SPWM调制方法对比分析 摘要:对比分析了三种正弦波脉宽调制(SPWM)控制方法,指出各自的优缺点及应用,给出了一些数学
    发表于 07-06 13:33 1.3w次阅读
    SPWM调制方法<b class='flag-5'>对比分析</b>

    小型PLC对比分析

    小型PLC对比分析.
    发表于 04-27 15:43 71次下载
    小型PLC<b class='flag-5'>对比分析</b>

    瑞萨H3和高通8155对比分析

    ,而高通8155则是美国高通公司的明星产品之一。那么,这两款处理器究竟能给我们带来什么不同的体验呢?下面我们将对他们进行详细的对比分析。 首先,我们从处理器的基本参数开始比较。瑞萨H3采用的是全新的Cortex-A55架构主频
    的头像 发表于 08-15 16:23 3053次阅读