0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CPU 的浮点运算能力比 GPU 差,为什么不提高 CPU 的浮点运算能力呢

Dbwd_Imgtec 来源:未知 作者:李建兵 2018-03-16 15:12 次阅读

问:为什么 CPU 的浮点运算能力比 GPU 差,为什么不提高 CPU 的浮点运算能力?


「速度区别主要是来自于架构上的区别」是一个表面化的解释。对,架构是不同。但是这种不同是目前各个厂家选择的现状,还是由于本质的原因决定的?CPU 能不能增加核?GPU 那张图为什么不需要 cache?

首先,CPU 能不能像 GPU 那样去掉 cache?不行。GPU 能去掉 cache 关键在于两个因素:数据的特殊性(高度对齐,pipeline 处理,不符合局部化假设,很少回写数据)、高速度的总线。对于后一个问题,CPU 受制于落后的数据总线标准,理论上这是可以改观的。对于前一个问题,从理论上就很难解决。因为 CPU 要提供通用性,就不能限制处理数据的种类。这也是 GPGPU 永远无法取代 CPU 的原因。

其次,CPU 能不能增加很多核?不行。首先 cache 占掉了面积。其次,CPU 为了维护 cache 的一致性,要增加每个核的复杂度。还有,为了更好的利用 cache 和处理非对齐以及需要大量回写的数据,CPU 需要复杂的优化(分支预测、out-of-order 执行、以及部分模拟 GPU 的 vectorization 指令和长流水线)。所以一个 CPU 核的复杂度要比 GPU 高的多,进而成本就更高(并不是说蚀刻的成本高,而是复杂度降低了成片率,所以最终成本会高)。所以 CPU 不能像 GPU 那样增加核。

至于控制能力,GPU 的现状是差于 CPU,但是并不是本质问题。而像递归这样的控制,并不适合高度对齐和 pipeline 处理的数据,本质上还是数据问题。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10434

    浏览量

    206521
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4413

    浏览量

    126640

原文标题:为什么 CPU 的浮点运算能力比 GPU 差,为什么不提高 CPU 的浮点运算能力?

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    verilog语音实现浮点运算

    Verilog可以通过使用IEEE标准的浮点数表示来实现浮点运算。下面是一个基本的Verilog模块示例,展示了如何进行加法、乘法和除法等常见的浮点
    发表于 03-25 21:49

    STSPIN32F0支持硬件浮点运算吗?

    STSPIN32F0 支不支持硬件浮点运算
    发表于 03-13 06:32

    XMC7100D进行2维浮点fft运算,如何优化?

    使用XMC72_EVK 降频到250MHz,运行一个2维浮点fft运算,这个二维数组大小是64x128。循环运行1000次的时间是22秒 而使用XMC72_EVK 工作在350MHz,循环运行
    发表于 02-02 07:53

    ADSP-CM419的浮点运算速度大概是多快?

    求问有人知道ADSP-CM419的浮点运算速度大概是多快吗?就是说完成一次加、减、乘、除大概需要多长时间?
    发表于 01-12 07:05

    stm32f407浮点运算速度

    支持硬件浮点运算单元(FPU),可以提供快速和高效的浮点运算性能。本文将详细介绍 STM32F407 的浮点
    的头像 发表于 01-04 10:58 1219次阅读

    浮点LMS算法的FPGA实现

    引言 LMS(最小均方)算法因其收敛速度快及算法实现简单等特点在自适应滤波器、自适应天线阵技术等领域得到了十分广泛的应用。为了发挥算法的最佳性能,必须采用具有大动态范围及运算精度的浮点运算,而
    的头像 发表于 12-21 16:40 292次阅读

    浮点运算提高速度减小代码量有什么方式?

    浮点运算提高速度,减小代码量有什么方式?
    发表于 10-16 06:25

    STM32F4和TMSF2812哪个浮点运算能力更强?

    STM32F4和TMSF2812哪个浮点运算能力更强
    发表于 10-15 11:28

    怎么提高单片机的浮点运算速度?

    有什么比较好的方法可以提高浮点运算速度
    发表于 10-15 11:07

    为什么MCU不建议用浮点运算

    为什么大部分变量都是整数型,而很少用浮点运算
    发表于 10-13 08:27

    为什么MCU的浮点运算整数运算要慢很多?

    是由于什么原因导致浮点运算
    发表于 10-12 07:32

    浮点数的运算怎么转换成整数运算

    浮点数的运算怎么转换成整数运算
    发表于 10-12 06:31

    为什么研究浮点加法运算,对FPGA实现方法很有必要?

    点击上方 蓝字 关注我们 现代信号处理技术通常都需要进行大量高速浮点运算。由于浮点数系统操作比较复杂,需要专用硬件来完成相关的操作(在浮点运算
    的头像 发表于 09-22 10:40 431次阅读
    为什么研究<b class='flag-5'>浮点</b>加法<b class='flag-5'>运算</b>,对FPGA实现方法很有必要?

    使用nucleistudio对whetstone代码进行编译后,lst文件为什么没有fadd等浮点运算的指令?

    在使用nucleistudio对whetstone代码进行编译后,查看lst文件发现没有fadd等浮点运算的指令,为什么会有这种结果,如果要支持对F/D模块的编译,要怎么办
    发表于 08-12 08:06

    恒讯科技分析:GPU是什么和CPU的区别?

    GPU是什么和CPU的区别?CPU是计算机的中央处理单元,可以以最小的延迟执行算术和逻辑运算。相比之下,GPU是一种嵌入式或外部图形处理单元
    的头像 发表于 05-25 17:23 1895次阅读