0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

未来FPGA是否会脱离CPU独立部署?

电子工程师 来源:网络整理 作者:佚名 2021-03-24 14:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为一种硬件可重构的体系结构,FPGA经常被用作专用芯片(ASIC)的小批量替代品,随着全球数据中心的大规模部署,以及人工智能应用的落地,FPGA凭借强大的计算能力和高度的灵活性有了更多的用武之地。

FPGA最大的优势就是处理速度快,因为引脚比较多,而且其逻辑单元可以根据算法需求重组而产生定制化的数据通路,非常适合处理大批量的数据流。

简单来说,CPU中有控制取指、译码等流程,数据处理流程复杂;而FPGA是可编程的,每个逻辑单元的功能在重编程(烧写)时就已经确定,不需要指令。其实FPGA和GPU内都有大量的计算单元,计算能力都很强,但是GPU在数据处理过程中,需要反复调取片外存储器中的数据,FPGA只要数据一次性流入再流出,算法就完成了,因此在批量数据处理方面,FPGA完胜。

正是因为数据处理的优势,FPGA在数据中心加速和AI推理中成了香饽饽,销量大涨,2018年全球FPGA市场达到了60亿美金,MRFR预测FPGA在2025年有望达到约125.21亿美元,Xilinx也预估数据中心对芯片的需求在未来五年将有67%的年复合增长率。

FPGA是否能够独立部署?

虽然FPGA有很强的计算能力,但是在数据中心都是和CPU协同工作,采用“CPU+FPGA”的异构架构进行加速。随着FPGA应用范围的增加,业内有人也提出,未来FPGA是否会脱离CPU独立部署?

赛灵思数据中心业务部产品规划和市场营销总监Jamon Bowen在接受与非网记者的采访中,用一个应用案例做了解释,“这是合作伙伴开发的一个存储盒的解决方案,采用了Alveo U50,其前端是以太网,后端是固态硬盘,其中加速IP和存储几乎是放在了同一个空间里,有意思的是这个系统没有CPU,是加速器和外围直接连到网络上,所以未来数据中心会被异构计算驱动,没有必要和这个系统连在同一个地方,也就是因为执行的处理器的高性能,深度学习、存储、加速等就没有必要进行本地连接,可以做异地系统连接,这也预示着未来数据中心一个布局的趋势。”

在终端,有些自动驾驶公司的车上系统中就采用了FPGA 完成一些实时检测识别任务。小鹏汽车的副总裁、机器学习专家谷俊丽女士曾经提到,FPGA 可以凭借信号处理和低能耗方面的优势,成为一个可靠的第二系统,在汽车的第一系统出现失误的时候,作为安全模式介入进来。

FPGA需要克服的难题

面对未来的大好前景,FPGA厂商自然喜笑颜开,但是FPGA想成为主流,也要克服更大的挑战。

针对浮点运算,FPGA的计算速度似乎还难以超越GPU。英伟达Tesla V100 ,在理论上最大运算速度可达15 TFLOPS(万亿次浮点运算/ 秒);搭载英特尔Statix 10的Nallatech 520C,理论最大运算速度为9.2 TFLOPS,功耗约为225 瓦特。英伟达曝光的最新Quadro GV100,能够提供高达每秒7.4万亿次的双精度浮点运算性能以及每秒14.8万亿次的单精度浮点运算性能和每秒118.5万亿次的深度学习浮点运算性能,从这一点来看,FPGA追赶GPU还需要一些时日。

另外,FPGA开发工程师反应,基于FPGA做设计的编译时间很长,几乎占到整个工程的80%,而且每次只要修改其中一个参数都需要重新编译,造成了调试效率很低,这也成为FPGA走向主流的一大障碍。

责任编辑:lq6

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1655

    文章

    22283

    浏览量

    630139
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222895
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261441
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【CIE全国RISC-V创新应用大赛】基于 K1 AI CPU 的大模型部署落地

    。llama.cpp 引擎本身兼容 Q2_K,Spacemit 的硬件加速(X60 NPU)通常对矩阵乘法通用,即使 NPU 不支持 Q2,CPU (RVV) 也自动接管,保证任务“成功完成”。 2. 完整的实施
    发表于 11-27 14:43

    RDMA设计4:技术需求分析2

    多,因此本数据传输系统能够部署在支持 CMAC 集成块的 FPGA 开发板上。另一方面,独立设计 UDP/IP 协议栈能够让本设计具有更高的数据传输性能并进一步降低资源占用。 (3)采用纯逻辑电路
    发表于 11-24 09:09

    安路科技AEC-FPGA技术研讨深圳站即将开幕

    盛夏如火,心意更浓,在这个充满活力的季节里,安路科技AEC-FPGA技术研讨深圳站即将拉开帷幕!此次,我们怀揣着“定制未来,共建生态”的初心,诚邀各位新老朋友的莅临。
    的头像 发表于 08-18 16:18 745次阅读

    SPD用外部脱离器(后备保护器)在防雷中的行业应用解决方案

    并不能独立完成全部防护任务,其在高能雷击下可能发生热击穿或工频续流引发的故障。因此,配套安装SPD用外部脱离器(俗称后备保护器),是实现系统安全防雷的关键措施之一。 二、SPD用外部脱离器的作用和基本要求 SPD用外部
    的头像 发表于 08-07 11:24 534次阅读
    SPD用外部<b class='flag-5'>脱离</b>器(后备保护器)在防雷中的行业应用解决方案

    AI的未来,属于那些既能写代码,又能焊电路的“双栖人才”

    工程师”的每一步我们相信,未来的AI系统,不只是云端模型的胜利,更是每一个工程细节的胜利。每一个能调硬件、懂系统、部署的工程师,都是这个AI时代的“产品设计师”。AI的未来,属于那些
    发表于 07-30 16:15

    【VisionFive 2单板计算机试用体验】3、开源大语言模型部署

    的表现:这个参数量的表现只能说一般。“听蛙飞”,青蛙怎么飞呢。 visionfive2的表现: 执行 ./ollama ps 可以看到当前正在运行的大模型,以及运行方式:CPU。 如果有显卡的话
    发表于 07-19 15:45

    STM32F769是否可以部署边缘AI?

    STM32F769是否可以部署边缘AI
    发表于 06-17 06:44

    Intel-Altera FPGA:通信行业的加速引擎,开启高速互联新时代

    美元估值出售Altera 51%股权,保留49%股权,并签署至2040年的长期晶圆供应协议。此举旨在聚焦核心CPU业务,同时通过Altera独立运营释放FPGA业务潜力。二、产品与技术优势产品线:涵盖
    发表于 04-25 10:19

    是否可以使用OpenVINO™部署管理器在部署机器上运行Python应用程序?

    使用 OpenVINO™部署管理器创建运行时软件包。 将运行时包转移到部署机器中。 无法确定是否可以在部署机器上运行 Python 应用程序,而无需安装OpenVINO™ Toolk
    发表于 03-05 08:16

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    ”“大模型圈的大黑马”“硅谷震惊了”“来自中国的学霸级AI”…… 从智能手机到自动驾驶,从数据中心到物联网,FPGA 正悄然改变着我们的生活。未来FPGA 又将如何塑造世界?DeepSeek 带你一起
    发表于 03-03 11:21

    当我问DeepSeek AI爆发时代的FPGA是否重要?答案是......

    并行架构使其在处理深度学习中的矩阵运算、卷积运算等任务时,效率远高于传统的CPU和GPU。例如,在图像识别任务中,FPGA可以通过并行处理多个卷积核,显著加速特征提取过程。 • 低延迟与高吞吐量
    发表于 02-19 13:55

    fpgacpu的区别 芯片是gpu还是CPU

    一、FPGACPU的区别 FPGA(Field-Programmable Gate Array,现场可编程门阵列)和CPU(Central Processing Unit,中央处理器
    的头像 发表于 02-01 14:57 2985次阅读

    Altera正式独立运营:FPGA行业格局将迎来新变局

    迎来了一个历史性的时刻,正式以Altera的名义独立运营,以我们的灵活性和专注力,引领未来的创新,塑造FPGA技术的新时代。”
    的头像 发表于 01-23 15:15 1293次阅读

    FPGA+GPU+CPU国产化人工智能平台

    算法架构可快速移植,接口灵活搭配,具备部署灵活、功耗和算力性价比高、支持人工智能推理应用部署等特点。FPGA+GPU+CPU多核异构平台架构示意图前面板实物图前面板
    的头像 发表于 01-07 16:42 1734次阅读
    <b class='flag-5'>FPGA+GPU+CPU</b>国产化人工智能平台

    助力AIoT应用:在米尔FPGA开发板上实现Tiny YOLO V4

    学习如何在 MYIR 的 ZU3EG FPGA 开发板上部署 Tiny YOLO v4,对比 FPGA、GPU、CPU 的性能,助力 AIoT 边缘计算应用。 一、 为什么选择
    发表于 12-06 17:18