为何CPU主频比FPGA快还要说可以帮助CPU加速？-电子发烧友网

主频只是影响计算速度的一个因素，并不是全部。在执行一些计算密集型的任务场景中，FPGA的计算速度是更快的，目前FPGA作为CPU的协处理器已经广泛应用在Intel、AMD等公司的产品中。

CPU、GPU、和FPGA的比较

桌面端的CPU为冯诺依曼结构，从上图可以看出，其基本组成为控制器，Cache，和ALU。而计算单元ALU在CPU中的占比不大，所以它的并行计算能力有限。

中间的为GPU，绿色的计算单元占了绝大部分，所以并行计算能力很强。

弱点是控制能力很弱，Cache小，为了保证计算能力，就需要大量的高速DDR保证数据吞吐率。

右侧为FPGA，包含可编程的I/O、DSP、memory、PCIE等，因为大量存储单元的存在，FPGA在做计算的时候可以直接从内部存储单元读取数据。

推荐一个国外的FPGA学习网站 -- fpga4fun，里边有FPGA的介绍及26个实战项目及实现代码，非常适合入门学习！

https://www.fpga4fun.com/

正因为CPU、GPU、和FPGA在结构上的不同，也让他们在实际应用层面有所侧重。

目前主流的方案是把CPU、GPU和FPGA都集成在一个SoC中，通过片内总线互联。在执行并行计算的时候，比如进行图像处理，FPGA的优势就体现出来了，通过协作分工，使芯片的工作效率最大化。

目前的3D封装以及chiplet等技术为这样的组合提供了可实现性。

为什么FPGA计算速度会比CPU更快？

在执行大量的运算场景中，FPGA相比GPU的核心优势在于低延迟。FPGA比CPU延迟低，在本质上是体系结构的区别。FPGA同时拥有流水线并行和数据并行，而CPU几乎只有数据并行，虽然也会才有流水线设计，但深度受限。因此，FPGA 更适合做需要低延迟的流式处理，GPU 更适合做大批量同构数据的处理。

举个例子：

我们有四个全加器，每一个的进为输出连接到下一个的进位输入，这样实现的加法器被称作行波进位加法器（Ripple-Carry Adder， RCA）。其特点为：

结构特点：低位全加器的Cout连接到高一位全加器Cin

优点：电路布局简单，设计方便

缺点：高位的运算必须等待低位的运算完成

我们来看一下其关键路径的延迟：

总延迟时间：（T + T）*4 + T = 9T，推广到n位，总时间为（2n + 1）*T。

每一个全加器计算的时候必须等待它的进位输入产生后才能计算，所以四个全加器并不是同时进行计算的，而是一个一个的串行计算。这样会造成较大的延迟。

我们把这个电路改进一下：提前计算出“进位信号”，对进位信号进行分析。

这样我们就得到了一个：超前进位加法器（Carry-Lookahead Adder， CLA）

其中，C1、C2、C3、C4都由下面的电路计算好，需要3级门延迟，然后在全加器中关键路径上还有1级延迟

所以，总共有4级门延迟。

如果采用这种完全的超前进位，理论上的门延迟都是4级门延迟。

实际电路过于复杂，难以实现（C31需要32位的与门和或门！）

通常的方法：采用多个小规模的超前进位加法器拼接而成，例如，用4个8-bit的超前进位加法器连接成32-bit加法器。

所以我们需要更多的计算位宽或者更大的数组，或者矩阵的运算的时候，我们使用FPGA的优势就体现出来。再多的计算，也就是放置更多的硬件逻辑资源。

FPGA对CPU加速场景

在一些特定的应用场景下，单独使用CPU和CPU+FPGA两种方案所需处理时间的对比，可见FPGA对CPU的加速效果非常明显，甚至比单独使用CPU高出1~2个数量级！

FPGA的缺点

FPGA也是有缺点的，其中之一便是开发周期长。其需要对特定的应用编写特定的FPGA。只要干的事情稍有不同，一般来说FPGA代码就要重新写一遍或者是至少要修改很多东西。如果要做的事情复杂、重复性不强，就会占用大量的逻辑资源，其中的大部分处于闲置状态。

不过，Chiplet的应用对对FPGA的开发周期有一定的优化，以下是传统FPGA开发的周期和应用chiplet的开发周期对比：

未来的方向

在现在的SoC设计中，要充分考虑不同模块的特点，FPGA 和 CPU 协同工作，充分发挥各自的长处，局部性和重复性强的归 FPGA，复杂的归 CPU。从而达到整个系统算力的最优化。

在未来，FPGA会作为协处理器和CPU、GPU共存一段时间，其主要提供以下三方面的能力：

能够提供专门的硬件加速，实现各种应用中需要的关键处理功能。

FPGA设计在性能上非常灵活，使用流水线和并行结构，适应对性能的需求变化。

协处理器能为主处理器和系统存储器提供宽带，低延迟接口。

目前，英特尔，AMD，赛灵思等公司都把FPGA作为协处理器集成在SoC中作为实际应用的硬件加速解决方案，这样的设计也使得CPU和FPGA在未来的一段时间内会共存，互相配合，赋能各种计算场景。

编辑：jq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

FPGA

FPGA

+关注

关注
1602

文章
21317

浏览量
593152
cpu

cpu

+关注

关注
68

文章
10439

浏览量
206534
gpu

gpu

+关注

关注
27

文章
4417

浏览量
126668

原文标题：为什么CPU主频一般都比FPGA快，但是却说FPGA可以帮助CPU加速？

文章出处：【微信号：leezym0317，微信公众号：FPGA开源工作室】欢迎添加关注！文章转载请注明出处。

什么是cpu的主频和外频,它们之间关系如何

CPU的主频和外频是计算机中两个重要的频率指标，它们分别代表了CPU内部和与外部组件之间的数据传输速率。这两个频率指标之间有着密切的关系，对计算机的性能和稳定性有着重要的影响。首先，我们来具体了解

发表于 02-03 16:50 •1138次阅读

如何帮助提高CPU分支跳转的正确率

B。唯一的不同就是在分支判断的时候，prog2.c加了likely。我们先看下实际的结果如何：可以看出，加了likely的prog2，明显用时变短。原因何在？为了理解上面的例子，我们先介绍CPU流水线相关知识： 3.1. CPU

发表于 12-13 11:25 •288次阅读

cpu温度太高怎么解决？cpu温度高的原因？

cpu温度太高怎么解决？cpu温度高的原因？ CPU (中央处理器) 温度过高可能会导致系统崩溃、性能下降甚至损坏硬件，因此是一个需要严肃对待的问题。在本文中，我们将探讨CPU温度过高

发表于 12-09 16:15 •1634次阅读

影响CPU性能的高低的因素是什么

根据以上公式，可以反向推算出 CPU 的外频。如 CPU 主频为 3.2GHz，倍频为 24 时，外频为 3200MHz÷24=133MHz。

发表于 12-08 12:19 •548次阅读

内核中的psci架构cpu_ops接口

cpu_ops接口驱动初始化完成后，cpu的cpu_ops就可以调用这些回调实现psci功能的调用。如下所示，当devicetree中cpu

发表于 12-05 17:25 •292次阅读

cpu满载是什么原因 cpu容易满载怎么办 cpu过高怎么处理

cpu满载是什么原因 cpu容易满载怎么办 cpu过高怎么处理 CPU满载是指CPU的使用率非常高，接近或达到100%的状态。

发表于 11-28 17:29 •7262次阅读

FPGA可以做CPU吗？怎么实现？

FPGA可以做什么类型的CPU，原理是什么？

发表于 11-10 07:26

FPGA和CPU、GPU有什么区别？为什么越来越重要？

训练时长的三分之一。图10：FPGA仅用200MHz，就可以实现比CPU快43倍、比G

发表于 11-09 14:09

一文教会你固定ElfBoard开发板CPU的频率！

ELF1开发板选用的是主频800MHzNXP的i.MX6ULL处理器。根据实际的应用场景，如果需要降低CPU功耗，可以将CPU频率固定为节能模式，下面以这款开发板为例给小伙伴们介绍一下

发表于 10-31 13:26 •511次阅读

cpu缓存的作用及原理是什么

CPU高速缓存集成于CPU的内部，其是CPU可以高效运行的成分之一，本文围绕下面三个话题来讲解CPU缓存的作用

发表于 08-21 12:17 •879次阅读

推断FP32模型格式的速度比CPU上的FP16模型格式快是为什么？

在 CPU 上推断出 FP32 模型格式和 FP16 模型格式。 FP32 模型格式的推断速度比 FP16 模型格式快。无法确定推断 FP32 模型格式的原因比

发表于 08-15 08:03

什么是CPU使用率？如何测量CPU使用率？

CPU 使用率是 CPU 在计算机上执行各种任务和进程所花费的时间量的度量。

发表于 08-06 17:07 •3028次阅读

RTX4000显卡怎么样 cpu主频重要还是核数重要

cpu主频重要还是核数重要　　这个问题涉及到不同类型的应用程序，因此不能简单地回答“主频重要”或“核数重要”哪一个更重要。

发表于 05-31 16:32 •4100次阅读

CPU工作原理！#CPU #单片机#电子

cpu

学习电子知识
发布于 :2023年05月22日 20:12:16

国产C2000，替代TMS320F280049C，独立双核32位CPU，主频高达400MHz

一、特性参数 1、独立双核，32位CPU，单核主频400MHz 2、IEEE 754 单精度浮点单元（FPU） 3、三角函数单元（TMU） 4、1MB 的 FLASH （ECC保护） 5、1MB

发表于 05-16 14:20 •1165次阅读

搜索历史

为何CPU主频比FPGA快还要说可以帮助CPU加速？

评论

什么是cpu的主频和外频,它们之间关系如何

如何帮助提高CPU分支跳转的正确率

cpu温度太高怎么解决？cpu温度高的原因？

影响CPU性能的高低的因素是什么

内核中的psci架构cpu_ops接口

cpu满载是什么原因 cpu容易满载怎么办 cpu过高怎么处理

FPGA可以做CPU吗？怎么实现？

FPGA和CPU、GPU有什么区别？为什么越来越重要？

一文教会你固定ElfBoard开发板CPU的频率！

cpu缓存的作用及原理是什么

推断FP32模型格式的速度比CPU上的FP16模型格式快是为什么？

什么是CPU使用率？如何测量CPU使用率？

RTX4000显卡怎么样 cpu主频重要还是核数重要

CPU工作原理！#CPU #单片机#电子

国产C2000，替代TMS320F280049C，独立双核32位CPU，主频高达400MHz