0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

未来FPGA是否会脱离CPU独立部署?

电子工程师 来源:网络整理 作者:佚名 2021-03-24 14:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为一种硬件可重构的体系结构,FPGA经常被用作专用芯片(ASIC)的小批量替代品,随着全球数据中心的大规模部署,以及人工智能应用的落地,FPGA凭借强大的计算能力和高度的灵活性有了更多的用武之地。

FPGA最大的优势就是处理速度快,因为引脚比较多,而且其逻辑单元可以根据算法需求重组而产生定制化的数据通路,非常适合处理大批量的数据流。

简单来说,CPU中有控制取指、译码等流程,数据处理流程复杂;而FPGA是可编程的,每个逻辑单元的功能在重编程(烧写)时就已经确定,不需要指令。其实FPGA和GPU内都有大量的计算单元,计算能力都很强,但是GPU在数据处理过程中,需要反复调取片外存储器中的数据,FPGA只要数据一次性流入再流出,算法就完成了,因此在批量数据处理方面,FPGA完胜。

正是因为数据处理的优势,FPGA在数据中心加速和AI推理中成了香饽饽,销量大涨,2018年全球FPGA市场达到了60亿美金,MRFR预测FPGA在2025年有望达到约125.21亿美元,Xilinx也预估数据中心对芯片的需求在未来五年将有67%的年复合增长率。

FPGA是否能够独立部署?

虽然FPGA有很强的计算能力,但是在数据中心都是和CPU协同工作,采用“CPU+FPGA”的异构架构进行加速。随着FPGA应用范围的增加,业内有人也提出,未来FPGA是否会脱离CPU独立部署?

赛灵思数据中心业务部产品规划和市场营销总监Jamon Bowen在接受与非网记者的采访中,用一个应用案例做了解释,“这是合作伙伴开发的一个存储盒的解决方案,采用了Alveo U50,其前端是以太网,后端是固态硬盘,其中加速IP和存储几乎是放在了同一个空间里,有意思的是这个系统没有CPU,是加速器和外围直接连到网络上,所以未来数据中心会被异构计算驱动,没有必要和这个系统连在同一个地方,也就是因为执行的处理器的高性能,深度学习、存储、加速等就没有必要进行本地连接,可以做异地系统连接,这也预示着未来数据中心一个布局的趋势。”

在终端,有些自动驾驶公司的车上系统中就采用了FPGA 完成一些实时检测识别任务。小鹏汽车的副总裁、机器学习专家谷俊丽女士曾经提到,FPGA 可以凭借信号处理和低能耗方面的优势,成为一个可靠的第二系统,在汽车的第一系统出现失误的时候,作为安全模式介入进来。

FPGA需要克服的难题

面对未来的大好前景,FPGA厂商自然喜笑颜开,但是FPGA想成为主流,也要克服更大的挑战。

针对浮点运算,FPGA的计算速度似乎还难以超越GPU。英伟达Tesla V100 ,在理论上最大运算速度可达15 TFLOPS(万亿次浮点运算/ 秒);搭载英特尔Statix 10的Nallatech 520C,理论最大运算速度为9.2 TFLOPS,功耗约为225 瓦特。英伟达曝光的最新Quadro GV100,能够提供高达每秒7.4万亿次的双精度浮点运算性能以及每秒14.8万亿次的单精度浮点运算性能和每秒118.5万亿次的深度学习浮点运算性能,从这一点来看,FPGA追赶GPU还需要一些时日。

另外,FPGA开发工程师反应,基于FPGA做设计的编译时间很长,几乎占到整个工程的80%,而且每次只要修改其中一个参数都需要重新编译,造成了调试效率很低,这也成为FPGA走向主流的一大障碍。

责任编辑:lq6

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1664

    文章

    22501

    浏览量

    639031
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11326

    浏览量

    225860
  • 人工智能
    +关注

    关注

    1820

    文章

    50304

    浏览量

    266855
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于openEuler平台的CPU、GPU与FPGA异构加速实战

    随着 AI、视频处理、加密和高性能计算需求的增长,单一 CPU 已无法满足低延迟、高吞吐量的计算需求。openEuler 作为面向企业和云端的开源操作系统,在 多样算力支持 方面表现出色,能够高效调度 CPU、GPU、FPGA
    的头像 发表于 04-08 11:02 624次阅读
    基于openEuler平台的<b class='flag-5'>CPU</b>、GPU与<b class='flag-5'>FPGA</b>异构加速实战

    FPGA+GPU异构混合部署方案设计

    为满足对 “纳秒级实时响应” 与 “复杂数据深度运算” 的双重需求,“FPGA+GPU”异构混合部署方案通过硬件功能精准拆分与高速协同,突破单一硬件的性能瓶颈 ——FPGA聚焦低延迟实时交易链路,GPU承接高复杂度数据处理任务,
    的头像 发表于 01-13 15:20 479次阅读

    【CIE全国RISC-V创新应用大赛】基于 K1 AI CPU 的大模型部署落地

    。llama.cpp 引擎本身兼容 Q2_K,Spacemit 的硬件加速(X60 NPU)通常对矩阵乘法通用,即使 NPU 不支持 Q2,CPU (RVV) 也自动接管,保证任务“成功完成”。 2. 完整的实施
    发表于 11-27 14:43

    RDMA设计4:技术需求分析2

    多,因此本数据传输系统能够部署在支持 CMAC 集成块的 FPGA 开发板上。另一方面,独立设计 UDP/IP 协议栈能够让本设计具有更高的数据传输性能并进一步降低资源占用。 (3)采用纯逻辑电路
    发表于 11-24 09:09

    如何在FPGA部署AI模型

    如果你已经在用 MATLAB 做深度学习,那一定知道它的训练和仿真体验非常丝滑。但当模型要真正落地到 FPGA 上时,往往就会卡住:怎么把网络结构和权重优雅地搬到硬件里?
    的头像 发表于 09-24 10:00 4615次阅读
    如何在<b class='flag-5'>FPGA</b><b class='flag-5'>部署</b>AI模型

    FPGA技术为什么越来越牛,这是有原因的

    最近几年,FPGA这个概念越来越多地出现。例如,比特币挖矿,就有使用基于FPGA的矿机。还有,之前微软表示,将在数据中心里,使用FPGA“代替”CPU,等等。其实,对于专业人士来说,
    的头像 发表于 08-22 11:39 5205次阅读
    <b class='flag-5'>FPGA</b>技术为什么越来越牛,这是有原因的

    电源控制器MCU硬件在环(HIL)测试方案

    ,与上位机之间采用千兆网的 TCP/IP 通讯交互,模型程序可以部署CPU 中或者 FPGA 中进行高速实时运行。 CPUFPGA
    发表于 08-20 18:31

    安路科技AEC-FPGA技术研讨深圳站即将开幕

    盛夏如火,心意更浓,在这个充满活力的季节里,安路科技AEC-FPGA技术研讨深圳站即将拉开帷幕!此次,我们怀揣着“定制未来,共建生态”的初心,诚邀各位新老朋友的莅临。
    的头像 发表于 08-18 16:18 1113次阅读

    SPD用外部脱离器(后备保护器)在防雷中的行业应用解决方案

    并不能独立完成全部防护任务,其在高能雷击下可能发生热击穿或工频续流引发的故障。因此,配套安装SPD用外部脱离器(俗称后备保护器),是实现系统安全防雷的关键措施之一。 二、SPD用外部脱离器的作用和基本要求 SPD用外部
    的头像 发表于 08-07 11:24 870次阅读
    SPD用外部<b class='flag-5'>脱离</b>器(后备保护器)在防雷中的行业应用解决方案

    AI的未来,属于那些既能写代码,又能焊电路的“双栖人才”

    工程师”的每一步我们相信,未来的AI系统,不只是云端模型的胜利,更是每一个工程细节的胜利。每一个能调硬件、懂系统、部署的工程师,都是这个AI时代的“产品设计师”。AI的未来,属于那些
    发表于 07-30 16:15

    【VisionFive 2单板计算机试用体验】3、开源大语言模型部署

    的表现:这个参数量的表现只能说一般。“听蛙飞”,青蛙怎么飞呢。 visionfive2的表现: 执行 ./ollama ps 可以看到当前正在运行的大模型,以及运行方式:CPU。 如果有显卡的话
    发表于 07-19 15:45

    STM32F769是否可以部署边缘AI?

    STM32F769是否可以部署边缘AI
    发表于 06-17 06:44

    微控制器读取闪存中的软件信息时,软件信息部署在哪里? 是 SRAM 吗?

    我对 PMG1 闪光灯有疑问。 1.微控制器读取闪存中的软件信息时,软件信息部署在哪里? 是 SRAM 吗? 2.微控制器加载软件时,在部署之前是否检查 SRAM 是否复位?
    发表于 05-23 06:22

    HarmonyOS5云服务技术分享--Serverless抽奖模板部署

    手把手教你部署HarmonyOS Serverless抽奖活动模板(附贴心提醒) 嘿,小伙伴们!今天给大家分享一个超实用的教程——如何用华为HarmonyOS的Serverless模板快速搭建抽奖
    发表于 05-22 20:25

    Intel-Altera FPGA:通信行业的加速引擎,开启高速互联新时代

    美元估值出售Altera 51%股权,保留49%股权,并签署至2040年的长期晶圆供应协议。此举旨在聚焦核心CPU业务,同时通过Altera独立运营释放FPGA业务潜力。二、产品与技术优势产品线:涵盖
    发表于 04-25 10:19