电子发烧友网 > 可编程逻辑 > 正文

FPGA+CPU助力数据中心实现图像处理应用体验与服务成本新平衡

2020年03月06日 15:18 次阅读

文 / 深维科技 樊平

编者按:图片逐渐成为互联网主要的内容构成,相应的图片处理需求也在高速成长,移动应用与用户生产内容(UGC)正在驱动数据中心图像处理的业务负载快速增加。本文深维科技联合创始人兼CEO樊平详细剖析了图片加速的必要性、当前实际的图片解决方案与部署方式以及如何通过FPGA+CPU异构计算的方案维护用户体验与服务成本新平衡。

1.为什么需要图片加速?

FPGA+CPU助力数据中心实现图像处理应用体验与服务成本新平衡

目前,图片处理的需求正在快速成长,即源于用户生成内容,视频图片抓取等方式的图片缩略图生成,像素处理,图片转码、智能分析处理需求不断增加。众多应用迫切需要高性能,高性价比的图片处理解决方案。

FPGA+CPU助力数据中心实现图像处理应用体验与服务成本新平衡

在这种情况下,数据中心面临着一个核心的考验--即用户体验与服务成本之间的平衡。总地来说,目前存在的纯CPU处理方案,TCO(服务器、电费、带宽、场地人员 成本)相对高昂,用户体验也相对较差。

2 。 解决方案

2.1. ThunderImage JPEG2JPEG缩略图方案

鉴于此,深维科技推出了基于FPGA+CPU异构计算的解决方案-JPEG2JPEG,通过高性能FPGA分担CPU处理任务,其所带来的优势是20倍吞吐性能提升,20倍延迟的降低,5倍实际成本的节省以及10倍的能效比提升。

FPGA+CPU助力数据中心实现图像处理应用体验与服务成本新平衡

JPEG2JPEG缩略图方案是将用户上传的图片进行高质量的缩放,即可满足绝大多数应用场合需求,例如,微信接收的一般都是缩小后的图片。缩略图是一项大量的、高并发的需求,针对4K图像输入,输出缩放至1024x768、640x480的场景。目前,JPEG2JPEG缩略图方案可以实现吞吐量550张、延迟约58ms的高性能效果。

2.2 。 ThunderImage JPEG2WebP转码方案

FPGA+CPU助力数据中心实现图像处理应用体验与服务成本新平衡

WebP的需求主要来自于对带宽成本的节省。WebP相较于JPEG,在同等图像质量情况下,压缩率可以提升25%~34%,相应的对带宽成本的节省更加明显,并且因为传输数据量的减少,延迟也会随之降低,进而带来用户体验的提升。但与此同时,WebP也存在一项问题,其计算复杂度是JPEG的10倍,对服务器的性能要求也更高,进而造成部署成本的提升。

FPGA+CPU助力数据中心实现图像处理应用体验与服务成本新平衡

深维科技的ThunderImage JPEG2WebP转码方案,通过FPGA加速带来10倍左右的性能提升,进而降低WebP的复杂度及服务器成本。ThunderImage JPEG2WebP转码方案支持Baseline、Main、Ultra几种类型,实现了对WebP M4以及M6模式的支持,并且支持了M4的比特级一致(与CPU参考软件输出结果每比特一致)。

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

对话FPGA原厂——既聊技术,也谈市场

感谢大家对Mil往期FPGA直播的支持!最后一期,大家要继续加油哟!关于直播中,Mill老师有提到的FPGA众筹,为大家
发烧友学院发表于 2019-05-22 00:00 5646次阅读
对话FPGA原厂——既聊技术,也谈市场

MathWorks将加快支持FPGA和ASIC的...

MathWorks宣布,HDLVerifier从现已上市的Release2019b开始提供对Univ....
发表于 2020-03-07 14:29 0次阅读
MathWorks将加快支持FPGA和ASIC的...

AMD公布最新CPU路线图,Zen 4 Geno...

3月6日,根据消息报道,AMD 在金融分析师日中公布了最新的服务器级和消费级CPU路线图。
发表于 2020-03-07 14:28 6次阅读
AMD公布最新CPU路线图,Zen 4 Geno...

AMD首次曝光锐龙处理器出货量,并发布最新CPU...

AMD锐龙处理器这几年取得了巨大的成功,但是它到底卖了多少呢?AMD似乎从未公布过锐龙的出货量数字,....
发表于 2020-03-07 11:12 236次阅读
AMD首次曝光锐龙处理器出货量,并发布最新CPU...

AMD自2017年以来已经售出2.6亿个核心

根据外媒AnandTech的报道,在AMD的金融分析师日上,AMD CTO Mark Paperma....
发表于 2020-03-07 11:00 84次阅读
AMD自2017年以来已经售出2.6亿个核心

在Vx-Works平台实现交叉编译工具链的开发及...

交叉编译技术,就是一种在一个异构平台上编译出目标平台程序的技术。比如在PC平台(X86 CPU)上编....
发表于 2020-03-07 10:55 27次阅读
在Vx-Works平台实现交叉编译工具链的开发及...

采用LH7A404和LPC2214两款CPU芯片...

随着全自动绣花机的不断发展,机械方面的改进对机器的性能改善已经没有太大的效果。因而,控制系统就成为了....
发表于 2020-03-07 10:25 27次阅读
采用LH7A404和LPC2214两款CPU芯片...

采用EP1C20芯片和S698IP核实现平台计算...

平台计算机采用FPGA+S698IP核的方案(简称SOC),以欧比特公司的S698IP核做为主CPU....
发表于 2020-03-07 10:12 23次阅读
采用EP1C20芯片和S698IP核实现平台计算...

AMD针对数据中心工作负载优化推出全新GPU 架...

为满足数据中心的需求,该公司计划在今年晚些时候正式推出 AMD CDNA 架构。
发表于 2020-03-07 09:44 37次阅读
AMD针对数据中心工作负载优化推出全新GPU 架...

GF与AMD渐行渐远后,重心是MRAM领域

2018年8月份AMD宣布将7nm CPU订单全都交给台积电,双方的合作关系这两年非常密切。与之相比....
发表于 2020-03-07 09:42 95次阅读
GF与AMD渐行渐远后,重心是MRAM领域

英特尔推出首个一体封装光学以太网交换机 针对超大...

英特尔3月6日宣布,已成功将其1.6 Tbps的硅光引擎与12.8 Tbps的可编程以太网交换机进行....
发表于 2020-03-07 09:29 40次阅读
英特尔推出首个一体封装光学以太网交换机 针对超大...

Intel表示将在7nm节点上追平,5nm时代会...

据外媒报道,Intel首席财务官George Davis在昨天举行的摩根士丹利会议上发表演讲,谈及了....
发表于 2020-03-07 09:25 46次阅读
Intel表示将在7nm节点上追平,5nm时代会...

AMD锐龙处理器累计出货达到了9700万颗

AMD锐龙处理器这几年取得了巨大的成功,但是它到底卖了多少呢?AMD似乎从未公布过锐龙的出货量数字,....
发表于 2020-03-07 09:03 176次阅读
AMD锐龙处理器累计出货达到了9700万颗

微软Xbox Series S曝光,CPU规格可...

在本世代的家用游戏主机中,微软的Xbox One和索尼PS4均采用了高低配双版本的战略,高配性能更强....
发表于 2020-03-06 16:35 337次阅读
微软Xbox Series S曝光,CPU规格可...

AMD Zen处理器确定采用5nm工艺,2022...

AMD今天公布的好消息太多了,都让人有点眼花缭乱了,去年是CPU、GPU同时升级7nm,2020年虽....
发表于 2020-03-06 16:05 234次阅读
AMD Zen处理器确定采用5nm工艺,2022...

物联网实施需要满足怎样的条件

物联网是一个动态的全球网络基础设施,其英文名称是“the internet of things”。顾....
发表于 2020-03-06 15:36 29次阅读
物联网实施需要满足怎样的条件

CPU散片是什么?与盒装有什么区别?

散片,可以说是很多玩家装机的选择了。今天就和大家聊聊什么是散片CPU,这些CPU又从何而来。
发表于 2020-03-06 10:45 162次阅读
CPU散片是什么?与盒装有什么区别?

Intel实验室联合美国莱斯大学宣布深度学习新算...

AI(人工智能)是当今科技圈的热门话题,深度学习则是AI训练的重要手段之一。如何学习要靠硬件和算法支....
发表于 2020-03-06 10:36 317次阅读
Intel实验室联合美国莱斯大学宣布深度学习新算...

NTKO OFFICE文档控件Linux版与统一...

统信软件今日表示,目前,NTKO OFFICE文档控件Linux版已经与统一操作系统UOS在鲲鹏、飞....
发表于 2020-03-06 10:21 114次阅读
NTKO OFFICE文档控件Linux版与统一...

如何加快5G网络数据中心等新基建的发展进度

什么是“新基建”?新基建是指立足于科技端的基础设施建设,主要包括:5G基建、特高压、城际高速铁路和城....
发表于 2020-03-06 10:04 82次阅读
如何加快5G网络数据中心等新基建的发展进度

台积电联合博通打造1700平方毫米巨型中介层

之前我们就见识过Cerebras Systems打造的世界最大芯片WSE,拥有46225平方毫米面积....
发表于 2020-03-06 08:55 295次阅读
台积电联合博通打造1700平方毫米巨型中介层

AMD即将公布Zen4架构 或将集中精力于架构优...

AMD今天获得了一份新的超算订单,联合HPE旗下的Cray为美国能源部建造El Capitan超算,....
发表于 2020-03-06 08:42 67次阅读
AMD即将公布Zen4架构 或将集中精力于架构优...

散片cpu能买吗?

散片,可以说是很多玩家装机的选择了。今天就和大家聊聊什么是散片CPU,这些CPU又从何而来。
发表于 2020-03-06 08:42 198次阅读
散片cpu能买吗?

配置数据下载到FPGA不成功

我有一块带有Spartan 6 FPGA和SPI闪存的电路板。 当我在GUI模式下编程闪存时,它工作正常。 但是当我使用...
发表于 2020-03-06 08:32 14次阅读
配置数据下载到FPGA不成功

请问upp怎样连续接收FPGA的数据?

[tr])写了这样的一个乒乓操作:         while(pingpong_buffer_num UPID0 = (U...
发表于 2020-03-06 06:39 7次阅读
请问upp怎样连续接收FPGA的数据?

AMD CPU份额将持续扩大 疫情对AMD的长期...

最近的疫情危机有点闹大的趋势,国外多个国家越来越严重了,半导体行业也是人心惶惶。不过对AMD来说,这....
发表于 2020-03-05 15:38 61次阅读
AMD CPU份额将持续扩大 疫情对AMD的长期...

基于FPGA控制模块的大屏幕LED显示屏设计

LED大屏幕显示系统由上位机(PC机)、单片机系统、FPGA控制器、LED显示屏的行列驱动电路等模块....
发表于 2020-03-05 15:36 101次阅读
基于FPGA控制模块的大屏幕LED显示屏设计

AMD新一代锐龙H系列处理器核显性能曝光,相当于...

从昨天开始,联想中国游戏台式机产品规划经理@WolStame开始在微博上放出一款神秘CPU的测试数据....
发表于 2020-03-05 14:54 482次阅读
AMD新一代锐龙H系列处理器核显性能曝光,相当于...

苹果即将推出iMac和Mac mini升级版,配...

根据外媒9to5Mac报道,一位之前泄露了大量关于苹果产品线的准确细节的推特用户今天表示,苹果即将推....
发表于 2020-03-05 14:45 374次阅读
苹果即将推出iMac和Mac mini升级版,配...

2020全网首发《60天FPGA工程师入门就业项目实战特训营》

2020全网首发《60天FPGA工程师入门就业项目实战特训营》 FPGA就业培训班带你深入全面掌握FPGA。让理论与...
发表于 2020-03-05 14:42 221次阅读
2020全网首发《60天FPGA工程师入门就业项目实战特训营》

FPGA的工作原理以及设计的基础问题分析

FPGA(Field-Program mable Gate Array),即现场可编程门阵列,它是在....
发表于 2020-03-05 11:34 84次阅读
FPGA的工作原理以及设计的基础问题分析

通过嵌入式软件实现路径覆盖测试的设计方案研究

路径覆盖测试是覆盖测试中的关键测试技术之一,目前已应用于程序覆盖率分析、测试用例设计、程序调试、性能....
发表于 2020-03-05 10:55 88次阅读
通过嵌入式软件实现路径覆盖测试的设计方案研究

不是两根内存就能实现双通道

DIY玩家都知道双通道是一种内存控制和管理技术,通过同时向两根内存中读写数据来实现双倍的内存带宽,也....
发表于 2020-03-05 08:54 224次阅读
不是两根内存就能实现双通道

可移植性Win CE应用程序怎么编写?

由于桌面Windows绝大多数情况下运行于X86平台上,也就不存在不同平台的可移植性问题。然而Windows CE运行在四大架...
发表于 2020-03-05 06:57 76次阅读
可移植性Win CE应用程序怎么编写?

用ARM和FPGA怎么设计便携式人工地震数据采集系统?

近年来,随着可编程逻辑器件(CPLD/FPGA)的迅猛发展,可编程逻辑器件在数据采集、逻辑接口设计、电平接口转换...
发表于 2020-03-05 06:20 67次阅读
用ARM和FPGA怎么设计便携式人工地震数据采集系统?

用FPGA做的MCU内核的汇编指令集完全解析

用FPGA做的MCU内核的汇编指令集完全解析,FPGA使用VHDL编写MCU内核,使用PHP编写汇编器,使用vc...
发表于 2020-03-04 18:53 161次阅读
用FPGA做的MCU内核的汇编指令集完全解析

戴尔XPS 13 9300笔记本评测,CPU性能...

  在1月份的CES期间,戴尔发布了新款的XPS 13 9300笔记本,相比上代变化巨大,16:10....
发表于 2020-03-04 16:48 847次阅读
戴尔XPS 13 9300笔记本评测,CPU性能...

Intel今年将推最少9款10nm新品

随着Ice Lake处理器的成功,Intel的10nm工艺总算可以长舒一口气,产能已经没什么问题了。....
发表于 2020-03-04 15:35 405次阅读
Intel今年将推最少9款10nm新品

Intel:解决产能不足将可夺回失去的低端CPU...

AMD的锐龙处理器在去年的7nm Zen2架构上终于实现了赶超,在工艺及性能上都有优势,这是过去几十....
发表于 2020-03-04 15:05 283次阅读
Intel:解决产能不足将可夺回失去的低端CPU...

Xilinx推出业界首款“一体化 SmartNI...

同时发布符合开放计算项目 3.0 ( OCP3.0)尺寸规格的以太网适配器,以及世界首款基于FPGA....
发表于 2020-03-04 13:45 97次阅读
Xilinx推出业界首款“一体化 SmartNI...

FPGA芯片行业长年被美国垄断 这家国产企业横空...

FPGA芯片,一个特别专业又烧钱的领域。
发表于 2020-03-04 11:50 656次阅读
FPGA芯片行业长年被美国垄断 这家国产企业横空...

Intel两颗新CPU实拍图曝光 采用新的LGA...

进入3月份,已经传闻很久的Intel第十代桌面级酷睿处理器仍然没有官方动静,但随着各种曝料越发密集,....
发表于 2020-03-04 11:37 304次阅读
Intel两颗新CPU实拍图曝光 采用新的LGA...

ADI:小尺寸高功率密度

市场渗透率如此之高,全球对大电流低压数字IC的需求激增也就不足为奇了。当前全球市场规模预估超过18亿....
发表于 2020-03-04 11:27 136次阅读
ADI:小尺寸高功率密度

64核锐龙Threadripper 3990X性...

权威的SPECworkstation测试也有这样的问题,目前的3.0.2版本中对锐龙Threadri....
发表于 2020-03-04 11:09 287次阅读
64核锐龙Threadripper 3990X性...

云存储需求达到平流层,数据中心开发迅速增加

托管服务器是企业客户将其服务器移到安全位置的一种可靠方法。但是最近几年,云服务商已经占据了更大的市场....
发表于 2020-03-04 10:45 97次阅读
云存储需求达到平流层,数据中心开发迅速增加

基于FPGA器件和DSP系统实现自适应回波抵消器...

在数字通信、卫星通信等系统中,不同程度的存在回波现象,影响了通信质量。为了消除回波可以采用回波抵消器....
发表于 2020-03-04 10:41 101次阅读
基于FPGA器件和DSP系统实现自适应回波抵消器...

意大利电信集团正在计划出售23个数据中心

意大利电信集团的市场部经理Massimo Bandinelli表示:“尽管有许多电信公司进军了数据中....
发表于 2020-03-04 10:39 42次阅读
意大利电信集团正在计划出售23个数据中心

基于级联结构和VHDL语言的IIR数字滤波器在F...

IIR数字滤波器在很多领域中有着广阔的应用。与FIR数字滤波器相比,它可以用较低的阶数获得高选择性,....
发表于 2020-03-04 10:32 75次阅读
基于级联结构和VHDL语言的IIR数字滤波器在F...

基于FPGA技术和AD9833芯片实现可编程遥测...

FPGA是一种高密度的可编程逻辑器件。经过20多年的发展,FPGA的逻辑规模已经从最初的1000个可....
发表于 2020-03-04 10:22 85次阅读
基于FPGA技术和AD9833芯片实现可编程遥测...

采用FPGA技术芯片模块实现运动估计的设计方案并...

运动估计主要是针对帧间预测,去除视频帧在空间域和时间域的冗余度。块匹配方法是目前编码效率较高,普遍采....
发表于 2020-03-04 10:12 68次阅读
采用FPGA技术芯片模块实现运动估计的设计方案并...

应用于FPGA器件中电源模块的选择及设计方案

DPA的主要缺点是每个电源“砖”都包含隔离,这会降低效率,并增加尺寸、成本和复杂性。随着大多数DPA....
发表于 2020-03-04 09:56 98次阅读
应用于FPGA器件中电源模块的选择及设计方案

通过FPGA器件和RS编码器实现前向纠错系统的设...

目前,无线产品的广泛应用使无线音频和视频的高质量传输成为可能。蓝牙、无限局域网等无线传输设备比较复杂....
发表于 2020-03-04 09:09 76次阅读
通过FPGA器件和RS编码器实现前向纠错系统的设...

采用可编程器件和多相滤波实现数字正交混频的设计方...

传统的正交下变频是通过对模拟I、Q输出直接采样数字化来实现的,由于I、Q两路模拟乘法器、低通模拟器本....
发表于 2020-03-04 09:07 57次阅读
采用可编程器件和多相滤波实现数字正交混频的设计方...

做智能宿舍课题,选什么FPGA的开发板合适呢?

我刚刚涉及到FPGA,导师让做“基于zigbee的智能宿舍”课题,不知道怎么选择FPGA开发板,求大佬推荐!!!...
发表于 2020-03-03 21:53 191次阅读
做智能宿舍课题,选什么FPGA的开发板合适呢?

波形相位频率可调DDS信号发生器(设计分享)

波形相位频率可调DDS信号发生器(设计分享) --作者:造就狂野青春 本文为明德扬原创及录用文章,转载请注明出...
发表于 2020-03-02 11:15 542次阅读
波形相位频率可调DDS信号发生器(设计分享)

【答疑】关于锁存器问题的讨论

关于锁存器问题的讨论    很多同学提问到锁存器的相关问题,说明大家对这方面知识还不是很了解,今天我们就...
发表于 2020-03-02 00:25 643次阅读
【答疑】关于锁存器问题的讨论