0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据中心加速器就看GRVI Phalanx FPGA加速器

YCqV_FPGA_EETre 来源:未知 作者:佚名 2017-10-16 11:49 次阅读

背景

数据中心采用FPGA做加速器已经成为主流,像MS的Catapult,Amazon基于Xilinx FPGA的AWS F1,IntelAltera,Baidu公司等。数据中心具有大规模并行数据处理,高数据吞吐量,低延时,能效高等特点。但是存在两个问题,第一个是软件的问题,软件移植和保证一定加速的工作负荷;第二个是硬件的问题,配备众核处理器,25-100G的网络接口卡,一些DRAM/HBM通道,容易时序收敛等。

现介绍一种GRVI Phalanx FPGA加速器结构。其中,GRVI是一种基于FPGA的有效的RISC-V运算单元,即RISC-V RV321软处理器核;Phalanx是一种并行FPGA加速器框架,由PE集群,SRAM,加速器,DRAM,I/O控制器等组成,减少在开发和管理FPGA加速器时所需付出的消耗和努力;还需要Hoplite NoC,它是一种基于FPGA优化的定向2D环形片上网络系统,用到的技术还有局部内存共享和全局信息流通等。

图.1 GRVI运行单元

先看一下GRVI Phalanx的1680个核的运算单元,运算单元是基于32位的RISCV微处理器架构,在一个多核心的芯片中,去掉了每一个核心中的不必要的资源,目的是减小每一个单元的芯片面积。因此,每一个GRVI处理单元都是三级流水的,采用用户模式下的RV321核心,减掉了部分不必要的位和其他模块,具体结构如图.1所示。每个GRVI运行单元需要320个LUT,而且能够跑在375MHz的频率下,看到博主Jan Gray所设计的众核处理器芯片(详情见“GRVI Phalanx: A Massively Parallel RISC-V FPGA Accelerator Framework: A 1680-core, 26 MB SRAM Parallel Processor Overlay on Xilinx UltraScale+ VU9P”),其特点是每一个GRVI运行单元都是手动排布的,将单个处理器单元在Xilinx FPGA的UltraScale+的架构下重复1680次,并将生成的文件下载到板卡Xilinx VCU118 Eval Kit上的Virtex UltraScale+VU9P FPGA芯片中。

将一大堆的处理器核心一股脑的扔进Xilinx 的Virtex UltraScale+ VU9P FPGA芯片中听起来很有趣,但是如果不给每一个核心都匹配一些内存的话,也不能给这么多核心的处理器核心委以重任。因此,每一个在集群中的GRVI处理器单元都会配备8个RISCV处理器核心和32到128 Kbyte的RAM,以及另外的一些加速器。整个加速芯片的功耗为31-40W,单个核心的功耗为24mW,最大的吞吐量是0.4TIPS,内存带宽能够达到2.5TB/s。同一个芯片中的核心集群之间都会相互连接,芯片和外部的I/O端口通信是通过HOPLITE路由连接到一个NOC(片上网络)来实现的,NOC节点之间的数据通信速度可达100Gbps,HOPLITE路由是一个经过FPGA优化的定向路由,是专门为2D环形网络所设计的,如图2所示。

图.2 一个400MHz的4*6*256 Hoplite NoC,100 Gb/s links

GRVI Phalanx集群单元如图3所示,软件部分需要有多线程的C++的编译器,信息传递的执行时间在RISC-V的RV321MA GCC编译器中分层排布,为的是在将来的计划中支持像OpenCL,P4和其他的一些编程工具。

图.3 GRVI Phalanx集群

还有其他的案例,拥有80个核心的GRVI Phalanx被实例化到可编程的Zynq Z-7020 SOC中,此案例是在Digilent PYNQ-Z1开发板中作为教学所用的一种。

更令人惊喜的是,硬件开发云端的出现,让硬件设计人员不用买昂贵的开发板也可以进行开发工作,只需要动动自己触手可及的鼠标和键盘,通过亚马逊的平台:Amazon AWS EC2 F1.2XL and F1.16XL instances,找到相关的Verilog芯片开发代码就可以进行自己的创作了。

总结

数据中心的加速器要从软件和硬件上同时进行,软件是要有加速算法,需要考虑算法的可移植性和稳定性;硬件方面可以使用文中分析的多核处理器的解决方案,当然要考虑软件移植性、编译工具的易用性、硬件本身的设计困难和硬件的性能、功耗、易维护性等方面。Xilinx的FPGA在数据中心的并行运算中扮演着一个重要的角色。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1600

    文章

    21281

    浏览量

    592860
  • Xilinx
    +关注

    关注

    70

    文章

    2118

    浏览量

    119341

原文标题:惊呆! 数据中心加速神器---1680核处理器+FPGA !

文章出处:【微信号:FPGA-EETrend,微信公众号:FPGA开发圈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一个模型带你了解#回旋加速器原理

    加速器DIY
    jf_49445761
    发布于 :2022年08月28日 08:57:57

    #硬声创作季 电子制作:磁性加速器

    加速器DIY
    Mr_haohao
    发布于 :2022年10月19日 00:19:38

    采用Xilinx FPGA加速机器学习应用

    也因而开始转向采用加速器来满足低时延、高吞吐量的需求,同时保持合理的功耗水平。  赛灵思FPGA所提供的功耗效率让加速器能部署于整个数据中心,而且可将单位功耗性能比提升10-20倍。百
    发表于 12-15 17:15

    关于长整加速器的工作步骤:

    (此时源地址寄存和目标地址寄存都已经以后数据了),则开始执行加速的长整计算7. 加速器获得启动(start=1)后,首先要向仲裁
    发表于 03-17 10:53

    请问66ak系列芯片加密加速器的调用?在程序设计中如何调用此加速器

    本帖最后由 一只耳朵怪 于 2018-6-19 10:42 编辑 请问,在66ak系列有加密加速器,现在的项目需要此功能,请问,在程序设计中如何调用此加速器?采用pdk平台,openmpacc开发。
    发表于 06-19 05:53

    机器学习实战:GNN加速器FPGA解决方案

    的场景。如上所述种种设计挑战的存在,使得业界急需一种可以支持高度并发实时计算、巨大内存容量和带宽、以及在数据中心范围可扩展的GNN加速解决方案。5. GNN加速器FPGA设计方案Ac
    发表于 10-20 09:48

    21489的IIR加速器滤波参数设置如何对应加速器的滤波参数?

    目前在用21489内部的IIR加速器去做一个低通滤波,在例程的基础上修改参数。通过平板的fda 工具工具去设计参数,但是设计出来的参数不知道如何对应加速器的滤波参数,手册里也看得不是很明白。 设计的参数如下: 请问
    发表于 11-30 08:11

    GRVI Phalanx实现千核处理器

    关于GRVI Phalanx ,它是一个大规模并行RISC-V FPGA加速器,由GRVIPhalan
    发表于 02-15 16:57 4244次阅读

    FPGA预计是数据中心加速器市场中年均增长率最高的细分市场

    数据中心市场的加速芯片主要包括CPU、GPU、FPGA和ASIC等。据Semico Research于2019年5月的预测,从2018年到2023年的5年间,数据中心
    发表于 07-14 17:19 724次阅读
    <b class='flag-5'>FPGA</b>预计是<b class='flag-5'>数据中心</b><b class='flag-5'>加速器</b>市场中年均增长率最高的细分市场

    数据中心 AI 加速器:当前一代和下一代

    数据中心 AI 加速器:当前一代和下一代演讲ppt分享
    发表于 07-14 17:15 0次下载

    Rapanda流加速器-实时流式FPGA加速器解决方案

    电子发烧友网站提供《Rapanda流加速器-实时流式FPGA加速器解决方案.pdf》资料免费下载
    发表于 09-13 10:17 0次下载
    Rapanda流<b class='flag-5'>加速器</b>-实时流式<b class='flag-5'>FPGA</b><b class='flag-5'>加速器</b>解决方案

    Alveo U30数据中心加速器数据手册

    电子发烧友网站提供《Alveo U30数据中心加速器数据手册.pdf》资料免费下载
    发表于 09-13 09:15 0次下载
    Alveo U30<b class='flag-5'>数据中心</b><b class='flag-5'>加速器</b>卡<b class='flag-5'>数据</b>手册

    Alveo U50数据中心加速器数据手册

    电子发烧友网站提供《Alveo U50数据中心加速器数据手册.pdf》资料免费下载
    发表于 09-15 11:44 0次下载
    Alveo U50<b class='flag-5'>数据中心</b><b class='flag-5'>加速器</b>卡<b class='flag-5'>数据</b>手册

    Alveo数据中心加速器卡入门指南

    电子发烧友网站提供《Alveo数据中心加速器卡入门指南.pdf》资料免费下载
    发表于 09-15 10:31 0次下载
    Alveo<b class='flag-5'>数据中心</b><b class='flag-5'>加速器</b>卡入门指南

    Alveo U50数据中心加速器卡安装指南

    电子发烧友网站提供《Alveo U50数据中心加速器卡安装指南.pdf》资料免费下载
    发表于 09-15 11:17 0次下载
    Alveo U50<b class='flag-5'>数据中心</b><b class='flag-5'>加速器</b>卡安装指南