0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

FPGA和GPU计算存储加速有啥不一样

是德科技KEYSIGHT 来源:Xilinx赛灵思官微 作者:Xilinx赛灵思官微 2021-08-09 11:00 次阅读

为了提升计算基础设施的性能,并紧跟数据分析与 AI 不断攀升的需求,众多企业将硬件加速视为主要的解决方案。在大多数情况下,先进的可编程硬件(主要是指 GPUFPGA)是加速的主要方式。通过使用这种先进的硬件,企业正在赢得计算优势;然而,对于编程难度,他们仍然存在合理的担忧。

硬件制造商正在将加速方法应用于计算存储,这是专门设计用于包含内嵌计算元素的存储。这种方法已经被证明可以为分析和 AI 应用提供优异的性能(图 1)。使用或者不使用机器学习辅助的分析以及验证,都可以借助计算存储器件进行加速。这些器件提供了一个关键的优势,使得成本高昂的计算被卸载到存储器件上,而不必在服务器 CPU 上完成。与标准的存储/CPU 方法相比,通过计算存储获得的优势包括:

1

借助应用专用编程定制可编程硬件,获得更高性能

2

将计算任务从服务器卸载到存储器件,释放 CPU 资源

3

数据与计算共址,降低数据传输需求

这种新颖的方法前景光明。不过,您应根据具体用例评估这种方法,考量性能、成本、功耗和易用性。性价比和单位功耗性能在选择加速硬件评估时,占据主要比率。在本文中,我们将研讨单位功耗性能。

计算存储功耗比较

在这个场景中,我们将比较以 CSV 数据读取用例为主的三种工具:英伟达 GPUDirect 存储 和RAPIDS存储,以及基于赛灵思技术的三星 SmartSSD 存储。CSV 读取在计算密集型流水线中起着重要的作用(参见图 1)。

在下文中,我们将性能定义成 CSV 的处理速率,或处理“带宽”。我们先快速回顾一下三种系统的运行方式。

英伟达 GPUDirect 存储

端到端满足分析和 AI 需求

将 GPU 用作计算单元,紧贴基于 NVMe 的存储器件布局 (GPUDirect)

使用 CUDA 进行编程 (RAPIDS)

英伟达用其 CSV 数据读取技术衡量相对于标准 SSD 的性能提升。结果如图 1 所示。使用 1 到 8 个加速器时,对应的吞吐量是 4 到 23GB/s。

三星 SmartSSD 驱动器

将赛灵思 FPGA 用作计算单元

与存储逻辑内嵌驻留在同一个内部 PCIe 互联上

通过编程在存储平台上开展运算

赛灵思数据分析解决方案合作伙伴 Bigstream 与三星合作,为 Apache Spark 设计加速器,包括用于 CSV 和 Parquet 处理的 IP。SmartSSD 的测试使用单机模式的 CSV 解析引擎,以便开展比较。结果如图 2 所示,使用 1 到 12 个加速器时,对应的吞吐量是 4 到 23GB/s,同时也给出英伟达的结果(使用 1 到 8 个加速器)。请注意,本讨论中的所有结果都按 x 轴上的加速器数量进行参数化。

这些结果令人振奋,但在选择您的解决方案时,请务必将功耗情况纳入考虑。

单位功耗性能比较

图 3 显示了将功耗考虑在内后的分析结果。它们代表单位功耗达到的性能水平,根据上述讨论中引用的相关材料,给出了以下假设:

Tesla V100 GPU:最大功耗 200 瓦

SmartSSD 驱动器 FPGA:最大功耗 30 瓦

在这个场景下,计算表明,在全部使用 8 个加速器的情况下,SmartSSD 的单位功耗性能比 GPUDirect Storage 高 25 倍。

最 终 思 考

计算存储的优势在于能增强数据分析和 AI 应用的性能。然而,要让这种方法具备可实际部署的能力和实用性,就必须在评估时将功耗纳入考虑。

针对用于 CSV 数据解析的两种不同的计算存储方法,我们已经提出按功耗参数化的吞吐量性能曲线。结果显示,在使用相似数量的加速器进行比较时,SmartSSD 驱动器的单位功耗性能优于 GPUDirect存储方法。

GPUDirect 是英伟达通过 NVIDIA DGX-2 应用平台提供的研究系统。

三星 SmartSSD 驱动器是一种可部署的量产型 PCIe 可插拔平台,现在已经通过赛灵思及分销商供货。

如需了解更多信息,请查看:

• 有关 Bigstream 与 SmartSSD 计算存储器件结合使用,加速大数据和数据分析的电子书。

• Bigstream 硬件加速 Apache Spark解决方案。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10446

    浏览量

    206575
  • SSD
    SSD
    +关注

    关注

    20

    文章

    2690

    浏览量

    115500
  • AI
    AI
    +关注

    关注

    87

    文章

    26459

    浏览量

    264088
  • csv
    csv
    +关注

    关注

    0

    文章

    35

    浏览量

    5760

原文标题:FPGA 与 GPU 计算存储加速对比

文章出处:【微信号:是德科技KEYSIGHT,微信公众号:是德科技KEYSIGHT】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    STM32的VDD与VDDA不一样可以吗?

    STM32 的VDD与VDDA不一样可以么
    发表于 04-11 06:34

    2003和245什么不一样的地方

    2003和245什么不一样的地方啊啊 啊???
    发表于 10-11 23:11

    为什么测量值和实际不一样

    交流电流实际值和测量值不一样?如图:
    发表于 12-10 23:10

    labview的调试程序和执行程序在与串口通信时,不一样

    本帖最后由 seven619329959 于 2015-10-21 15:04 编辑 如题:labview的调试程序和执行程序在与串口通信时,不一样?求大神赐教。。。我现在遇到
    发表于 10-21 10:22

    线损校准,为啥不一样

    线损校准,为啥不一样,今天测试时发现,校准是,信号源频率不一样,线损差别很大,1dB 多!!!
    发表于 06-05 13:58

    数据类型不一样和接口 怎么解决

    要怎么解决接口和产生的数据类型不一样的问题,然后利用MYRIO的模拟输出通道接到示波器里面为什么没有波形啊,数据类型应该是不一样,要怎么解决这个问题呢?
    发表于 05-09 01:00

    请问该整流电路后加与不加二极管产生的波形不一样的原因是

    请问该整流电路后加与不加二极管产生的波形不一样的原因是
    发表于 06-05 19:49

    请问F2806X的芯片和F2806的哪些不一样

    请教F2806X的芯片和F2806的哪些不一样?我的理解是只有ADC不一样,其他的SPI、SCI、ePWM、eCAN、eQEP等都一样的;
    发表于 12-21 11:18

    一样的c文件但keil的输出文件不一样

    一模一样的啊,还有都能编译通过和下载,不知道这是什么原因,还有就是我对比发现这两个工程的输出文件的差别,是不是keil没有设置好导致输出文件不一样,进而导致程序运行结果不一样啊,求
    发表于 03-07 08:26

    为什么我的泪滴不一样

    我的泪滴怎么和网上的不一样??
    发表于 03-13 15:23

    请问CCS输入频率为什么和显示的不一样

    我参考EMIF_FPGA以及DA的程序,编写了在ccs中写入正弦波然后通过EMIF传到fpga再传到DA的程序最后示波器上可以显示波形,可是为什么在示波器上显示频率是12MHZ?和我设置的不一样,我的是#define F11 谢
    发表于 09-17 08:16

    为什么c语言中a和b的值不一样,c和d的值不一样

    ];a = sizeof(table1);b = sizeof((u8)table1);c = sizeof(table2);d = sizeof((u32)table2);为什么a和b的值不一样啊???为什么c和d的值不一样啊???
    发表于 09-29 08:50

    伺服电机控制器对比步进电机控制器不一样

    伺服电机控制器与步进电机控制器不一样
    发表于 02-25 07:42

    SWD和传统的调试方式什么不一样

    SWD 仿真模式概念简述先所说 SWD 和传统的调试方式什么不一样:首先给大家介绍下经验之谈:(): SWD 模式比 JTAG 在高速模式下面更加可靠. 在大数据量的情况下面 JTAG 下载 程序会失败, 但是 SWD 发生
    发表于 02-23 06:38

    CH365基址不一样是为什么?

    我安装好CH365评估卡后通过DEBUG软件获取的存储器地址为F0000000,而通过查看硬件设备管理器里CH365的属性获得的内存基址范围是DFD08000-DFD0FFFF,两者为什么不一样,但是两者方式获得的I/O基址是相同的
    发表于 10-11 06:34