CPU 的浮点运算能力比 GPU 差，为什么不提高 CPU 的浮点运算能力呢-电子发烧友网

CPU 的浮点运算能力比 GPU 差，为什么不提高 CPU 的浮点运算能力呢

问：为什么 CPU 的浮点运算能力比 GPU 差，为什么不提高 CPU 的浮点运算能力？

「速度区别主要是来自于架构上的区别」是一个表面化的解释。对，架构是不同。但是这种不同是目前各个厂家选择的现状，还是由于本质的原因决定的？CPU 能不能增加核？GPU 那张图为什么不需要 cache？

首先，CPU 能不能像 GPU 那样去掉 cache？不行。GPU 能去掉 cache 关键在于两个因素：数据的特殊性（高度对齐，pipeline 处理，不符合局部化假设，很少回写数据）、高速度的总线。对于后一个问题，CPU 受制于落后的数据总线标准，理论上这是可以改观的。对于前一个问题，从理论上就很难解决。因为 CPU 要提供通用性，就不能限制处理数据的种类。这也是 GPGPU 永远无法取代 CPU 的原因。

其次，CPU 能不能增加很多核？不行。首先 cache 占掉了面积。其次，CPU 为了维护 cache 的一致性，要增加每个核的复杂度。还有，为了更好的利用 cache 和处理非对齐以及需要大量回写的数据，CPU 需要复杂的优化（分支预测、out-of-order 执行、以及部分模拟 GPU 的 vectorization 指令和长流水线）。所以一个 CPU 核的复杂度要比 GPU 高的多，进而成本就更高（并不是说蚀刻的成本高，而是复杂度降低了成片率，所以最终成本会高）。所以 CPU 不能像 GPU 那样增加核。

至于控制能力，GPU 的现状是差于 CPU，但是并不是本质问题。而像递归这样的控制，并不适合高度对齐和 pipeline 处理的数据，本质上还是数据问题。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

cpu

cpu

+关注

关注
68

文章
10434

浏览量
206521
gpu

gpu

+关注

关注
27

文章
4413

浏览量
126640

原文标题：为什么 CPU 的浮点运算能力比 GPU 差，为什么不提高 CPU 的浮点运算能力？

文章出处：【微信号：Imgtec，微信公众号：Imagination Tech】欢迎添加关注！文章转载请注明出处。

verilog语音实现浮点运算

Verilog可以通过使用IEEE标准的浮点数表示来实现浮点运算。下面是一个基本的Verilog模块示例，展示了如何进行加法、乘法和除法等常见的浮点

发表于 03-25 21:49

STSPIN32F0支持硬件浮点运算吗？

STSPIN32F0 支不支持硬件浮点运算

发表于 03-13 06:32

XMC7100D进行2维浮点fft运算，如何优化?

使用XMC72_EVK 降频到250MHz，运行一个2维浮点fft运算，这个二维数组大小是64x128。循环运行1000次的时间是22秒而使用XMC72_EVK 工作在350MHz，循环运行

发表于 02-02 07:53

ADSP-CM419的浮点运算速度大概是多快？

求问有人知道ADSP-CM419的浮点运算速度大概是多快吗？就是说完成一次加、减、乘、除大概需要多长时间？

发表于 01-12 07:05

stm32f407浮点运算速度

支持硬件浮点运算单元（FPU），可以提供快速和高效的浮点运算性能。本文将详细介绍 STM32F407 的浮点

发表于 01-04 10:58 •1219次阅读

浮点LMS算法的FPGA实现

引言 LMS(最小均方)算法因其收敛速度快及算法实现简单等特点在自适应滤波器、自适应天线阵技术等领域得到了十分广泛的应用。为了发挥算法的最佳性能，必须采用具有大动态范围及运算精度的浮点运算，而

发表于 12-21 16:40 •292次阅读

浮点运算提高速度减小代码量有什么方式？

浮点运算提高速度，减小代码量有什么方式？

发表于 10-16 06:25

STM32F4和TMSF2812哪个浮点数运算能力更强？

STM32F4和TMSF2812哪个浮点数运算能力更强

发表于 10-15 11:28

怎么提高单片机的浮点数运算速度？

有什么比较好的方法可以提高浮点数运算速度

发表于 10-15 11:07

为什么MCU不建议用浮点数运算？

为什么大部分变量都是整数型，而很少用浮点数运算

发表于 10-13 08:27

为什么MCU的浮点数运算比整数运算要慢很多？

是由于什么原因导致浮点数运算慢

发表于 10-12 07:32

对浮点数的运算怎么转换成整数运算？

对浮点数的运算怎么转换成整数运算

发表于 10-12 06:31

为什么研究浮点加法运算，对FPGA实现方法很有必要？

点击上方蓝字关注我们现代信号处理技术通常都需要进行大量高速浮点运算。由于浮点数系统操作比较复杂，需要专用硬件来完成相关的操作(在浮点运算

发表于 09-22 10:40 •431次阅读

使用nucleistudio对whetstone代码进行编译后，lst文件为什么没有fadd等浮点运算的指令？

在使用nucleistudio对whetstone代码进行编译后，查看lst文件发现没有fadd等浮点运算的指令，为什么会有这种结果呢，如果要支持对F/D模块的编译，要怎么办

发表于 08-12 08:06

恒讯科技分析：GPU是什么和CPU的区别？

GPU是什么和CPU的区别?CPU是计算机的中央处理单元，可以以最小的延迟执行算术和逻辑运算。相比之下，GPU是一种嵌入式或外部图形处理单元

发表于 05-25 17:23 •1895次阅读

搜索历史

CPU 的浮点运算能力比 GPU 差，为什么不提高 CPU 的浮点运算能力呢

评论

verilog语音实现浮点运算

STSPIN32F0支持硬件浮点运算吗？

XMC7100D进行2维浮点fft运算，如何优化?

ADSP-CM419的浮点运算速度大概是多快？

stm32f407浮点运算速度

浮点LMS算法的FPGA实现

浮点运算提高速度减小代码量有什么方式？

STM32F4和TMSF2812哪个浮点数运算能力更强？

怎么提高单片机的浮点数运算速度？

为什么MCU不建议用浮点数运算？

为什么MCU的浮点数运算比整数运算要慢很多？

对浮点数的运算怎么转换成整数运算？

为什么研究浮点加法运算，对FPGA实现方法很有必要？

使用nucleistudio对whetstone代码进行编译后，lst文件为什么没有fadd等浮点运算的指令？

恒讯科技分析：GPU是什么和CPU的区别？