电子发烧友网 > 可编程逻辑 > 正文

在视频应用的新领域,CPU和FPGA或将胜过GPU

2020年02月04日 17:31 次阅读

(文章来源:翔snowman)
       在视频行业繁荣发展的背后,离不开互联网技术的日新月异。其中,视频行业的创新更是其中的佼佼者:从商业模式上看,在短短几年中视频喊个也就进行了三次迭代——搜狐视频、优酷为代表的点播平台;’花椒、斗鱼为代表的直播平台;快手、抖音为代表的短视频平台。从内容上看,从网剧的日渐精良、到网络综艺的“奇葩”纷呈,甚至是用户原创内容UGC的全民火爆,视频行业大有取代传统娱乐的发展之势。

前端应用的精彩纷呈,体现的是业务的变化,也导致了视频行业对数据中心底层技术需求的变化。这种变化与云、大数据AI的发展息息相关——工作负载的多样化,云原生应用模型的兴起都让数据中心从统一平台向着多样化平台转变。

第一批进入视频行业的搜狐视频,经历过天价购买国外头部网剧版权的时代,如今将更多精力放在自制网剧的精良制作上,其中“法医秦明”,“无心法师”等口碑与流量俱佳的网剧作品奠定了搜狐视频的业界地位。

随着视频行业逐渐进入全平台、全媒体化后,视频行业在数据中心的底层技术上不要不断投入,更要求快速创新。这也促使搜狐和英特尔早在2011年就创建了联合实验室,英特尔最新技术会早于上市之前数月就率先引入搜狐;搜狐也会将新的业务场景迁移到英特尔的最新技术和产品,以新场景+新技术的方式确保视频用户的视听体验。

值得一提的是,云转码是搜狐视频的强项,可以实现实时转码,即用户在上传的时候就已经实现转码,上传完成时转码也基本完成,可以立即分发。此外,一键实现添加滤镜,人脸识别,也是AI提升用户体验的用武之地。

在视频应用的新领域,CPU和FPGA或将胜过GPU

此外,搜狐视频和英特尔展开了多项联合创新,除了硬件在软件和人工智能等方面也一同合作,比如搜狐视频与英特尔在软件定义存储的性能优化、语音识别应用和推荐系统的加速与优化、DPDK网络负载均衡加速等方面也有很多探索,这对加速搜狐视频在深度学习领域的应用发挥了重要的作用。

大数据和AI融入工作负载已经是大势所趋,它们在最火爆的短视频领域应用更是如火如荼。快手的 崛起首先让业界看到了视频行业还可以迅速切分出短视频这个潜力巨大的细分领域。

诞生于2013年7月,彼时4G网络和智能手机开始普及,快手也算自带科技基因。在后续的发展中,快手逐步证明自己“应科技而生”——使用包括大数据、机器学习、深度学习等技术用机器代替人力完成内容审核,并在内容生产、理解、分发、消费、互动等业务闭环的各个环节优化用户体验。

如果你是短视频app深度用户,“娃娃脸”模板你肯定玩过。别小看这么一个看似简单快捷的功能,它实际上是在移动端实时实现的GAN技术,类似于iPhone手机上的emoji功能。最大的不同是只有在iPhone X以上的机型才能实现的emoji功能,到了快手这里,哪怕用户使用的是一千元以下的机型依旧可以变换自如。

现在,快手数据总量超过EB级,每天的请求数超过2亿,已经俨然成为一家AI+大数据驱动的公司。它对数据中心在存储、网络、计算三个方面的需求很明确:日均新增超过1500万个短视频,带来内容数据、行为数据以及随之而来的要对数据进行特征提取对存储的挑战;在训练和推理中因为特征参数越来越多,深度学习模型越来越深,模型越来越大,对传输网络带来挑战;千亿级的展示给计算和内存带来挑战。

这也使得快手成为第一批采用CPU+FPGA异构计算的企业。与GPU相比,FPGA因低功耗、低延迟、高性能、可编程等特点,已成为线上AI推理平台的重要选项;而GPU并不擅长推理应用场景,而被广泛应用在AI训练平台。此外,FPGA相对GPU还有一个独特的优势——具备网卡口,这也源于它最早应用在通信领域。而针对FPGA相对劣势——软件开发难,英特尔推出了OpenCL的开发语言,从而降低了开发难度和开发周期。

为此,快手基于英特尔FPGA提供的PAC A10、E3S10和PAC S10板卡,已经构建出了三大类型的异构计算平台,并将在数据中心部署FPGA的创新应用归结为既要“上天”,又要“入地”。

“上天”指的是FPGA是部署在云上的,首要问题是需要在数据中心找到合适的业务场景,能够提供有价值的解决方案,它需有一定的通用性和规模化。具体体现为提高业务的服务容量,这需要充分利用FPGA的优势之一:确定性的低延时,来降低线上服务的延时。另外也需要采用一些高层次的开发语言(如OpenCL,甚至OpenVINO这种推理应用框架)来加速硬件交付,以匹配软件开发的速度。

此外,在数据处理方面,为了优化视频检索的时间,提升高并发下的检索效率,快手抛弃了受限于内存价格和单台服务器上内存容量的KV数据库,转投英特尔傲腾数据中心级持久内存构建了异构存储,在Redis和推荐系统中都所有应用。通过实践,快手发现在满足业务性能需求的前提下,用傲腾持久内存代替DRAM内存,使得快手该存储系统整体TCO大幅降低,AI算法效率大幅提升。

从搜狐视频和快手的最新实践中可以发现,它们在创新应用场景下都大量采用了CPU和FPGA技术,虽然GPU因为AI的兴起成为第一批异构计算的受益者,但是FPGA真正崛起,而CPU也随着新一代技术的更新向多元化应用进一步拓展。
      (责任编辑:fqj)

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

小梅哥FPGA设计思想与验证方法视频教程

刚刚录制了一个fpga开发流程的视频,该视频为投石问路,主要是想听听大家对于小梅哥在录制视频时需要注意的内容以及希望系列
发烧友学院发表于 2016-03-24 00:00 37952次阅读
小梅哥FPGA设计思想与验证方法视频教程

FPGA和GPU谁才是未来市场的大局所向

一直以来,FPGA 的主要应用领域是电子工程。但当英特尔完成对 Altera(Altera 是最大的....
发表于 2020-02-05 21:19 0次阅读
FPGA和GPU谁才是未来市场的大局所向

嵌入式的CPU自定义指令有什么特点

Arm的自定义指令最早将在2020年上半年在ArmCortex®M33CPU中开展,而新的和现有的被....
发表于 2020-02-05 17:32 113次阅读
嵌入式的CPU自定义指令有什么特点

英特尔DG1独显现身跑分库,性能与GTX 165...

根据消息报道,英特尔DG1独显现在已经出现在3DMark跑分库中,与AMD最新的7nm R7 480....
发表于 2020-02-05 14:14 66次阅读
英特尔DG1独显现身跑分库,性能与GTX 165...

英特尔i9-10900K定位与最强游戏CPU,跑...

在游戏性能方面,高频率往往能起到更大的作用,英特尔上一代的i9-9900K以及全核5GHz的i9-9....
发表于 2020-02-05 14:07 91次阅读
英特尔i9-10900K定位与最强游戏CPU,跑...

如何利用旧手机作为电脑系统监视器

手机有很多用途:可以作为网络盒子、行车记录仪、便携NAS、时尚时钟、游戏机等等。这里说一说,我是如何....
发表于 2020-02-05 12:21 121次阅读
如何利用旧手机作为电脑系统监视器

实现带CPCI接口模块的AFDX终端通讯系统的设...

本文在研究航空全双工交换式以太网(Avionics Full Duplex Switched Eth....
发表于 2020-02-05 10:04 23次阅读
实现带CPCI接口模块的AFDX终端通讯系统的设...

兆芯新一代8核x86 CPU,其性能直追英特尔七...

近日,中国芯片厂商兆芯推出了一款8核x86架构的CPU,名为KX-6780A,采用台积电16nm工艺....
发表于 2020-02-04 17:42 682次阅读
兆芯新一代8核x86 CPU,其性能直追英特尔七...

服务器主板和普通主板有什么区别?

首先我们来看专业上服务器是怎样定义的:工控服务器是一种高性能计算机,作为网络的节点,存储、处理网络上....
发表于 2020-02-04 17:15 192次阅读
服务器主板和普通主板有什么区别?

Intel或将推出搭载0nm++工艺及多芯封装、...

在说Arctic Sound显卡之前,我们先缕缕Intel已经曝光的GPU,它们都会使用全新的Xe架....
发表于 2020-02-04 16:53 181次阅读
Intel或将推出搭载0nm++工艺及多芯封装、...

国产X86处理器到底是一个什么情况

兆芯最新的处理器是开先KX-6000系列,使用的是16nm工艺,核心采用超标量、多发射、乱序执行架构....
发表于 2020-02-04 16:29 160次阅读
国产X86处理器到底是一个什么情况

英特尔i5-10500H处理器曝光,全核boos...

  按照惯例,英特尔即将推出i5-10300H和i7-10750H两款移动CPU,为2020年的游戏....
发表于 2020-02-04 16:13 349次阅读
英特尔i5-10500H处理器曝光,全核boos...

英伟达加速部署下一代GPU,7纳米GPU性能有希...

  英伟达7纳米GPU什么时候来?印第安纳大学一场次时代平台活动中暗示了英伟达最近的动向,他们很可能....
发表于 2020-02-04 15:46 382次阅读
英伟达加速部署下一代GPU,7纳米GPU性能有希...

CPU核心数没有那么重要 从工作负载等角度来服务...

在AMD连接推出32核以及64核的EPYC霄龙处理器之后,CPU性能就开始走向依多为胜的局面。在这点....
发表于 2020-02-04 15:04 98次阅读
CPU核心数没有那么重要 从工作负载等角度来服务...

如何使用Python实现一个简单的系统监控图表

作为运维人员,想必大家肯定都做过这样的事情:为了监控系统资源使用情况,开了若干个窗口,来回切换看输出....
发表于 2020-02-04 12:45 140次阅读
如何使用Python实现一个简单的系统监控图表

国产X86处理器与国际CPU有多大差距?有人做了...

国产处理器何时能够达到世界领先水平?这个问题几乎是每一个关心国产半导体的人都在期待的,尤其是国产的X....
发表于 2020-02-04 11:35 1109次阅读
国产X86处理器与国际CPU有多大差距?有人做了...

你到底用了你家网速的多少

上次在微头条里跟大家说了下网速以及路由器的事情,收到很多专业小伙伴的建议,整理下发给大家做个参考。你....
发表于 2020-02-04 10:50 218次阅读
你到底用了你家网速的多少

x86兼容处理器消除国外进口依赖 兆芯Kx678...

威盛电子与中国国家成立的合资企业兆芯已开始消除中国对进入消费者市场的 x86 兼容处理器外国供应商的....
发表于 2020-02-03 18:38 139次阅读
x86兼容处理器消除国外进口依赖 兆芯Kx678...

Arm Mali-G77 GPU荣获The Li...

Arm2020年1月21日宣布Arm Mali-G77 GPU在The Linley Group的2....
发表于 2020-02-03 13:25 255次阅读
Arm Mali-G77 GPU荣获The Li...

关于自学FPGA就业

现在研二,觉得Verilog挺有意思的,就自学了FPGA,没做过项目,今年秋招就业,有什么FPGA的项目可以帮助自己...
发表于 2020-02-03 10:45 173次阅读
关于自学FPGA就业

【雨的FPGA笔记】基础实践-------IP核中RAM的使用

内容:        使用IP核中的RAM进行读写,数据位宽为32位 RAM读写模块输出给RAM模块...
发表于 2020-01-23 15:28 486次阅读
【雨的FPGA笔记】基础实践-------IP核中RAM的使用

龙芯2019年净利润首破1亿元,2020年将成立...

胡伟武提到,2019年龙芯中科销售收入是2018年的2.2倍,利润是2018年的3倍以上,2019年....
发表于 2020-01-22 11:45 3298次阅读
龙芯2019年净利润首破1亿元,2020年将成立...

计算架构迎来黄金时代,水大鱼大、风高浪急的新十年...

这一个新十年,时代的“大”和“快”从数字的比较上是以前难以想象的。大数据雪崩爆发时,每一片雪花都是意....
发表于 2020-01-20 17:20 7697次阅读
计算架构迎来黄金时代,水大鱼大、风高浪急的新十年...

外媒:英特尔CPU供应短缺可能持续到今年年底

外媒在报道中表示,英特尔CPU供应短缺将贯穿2020年,持续到今年年底。 外媒是援引英特尔内部人士....
发表于 2020-01-20 10:36 814次阅读
外媒:英特尔CPU供应短缺可能持续到今年年底

【雨的FPGA笔记】基础实践-------串口程序

内容        实现的是简单的PC机和FPGA的通信,实现一个简单的数据传回实验, 串口是按b...
发表于 2020-01-19 12:54 359次阅读
【雨的FPGA笔记】基础实践-------串口程序

智慧物流解决方案中GPS模块的应用及选型分析

电商平台的迅速崛起,给物流各个领域都带来机遇和挑战,使以前一些不可控的因素透明化、职责化,迫切需要一....
发表于 2020-01-19 10:22 83次阅读
智慧物流解决方案中GPS模块的应用及选型分析

matlab与FPGA无线通信、FPGA数字信号处理系列(4)—— Vivado DDS 与 FIR IP核设计 FIR 滤波器系统

本讲使用两个DDS产生待滤波的信号和matlab产生带滤波信号,结合FIR滤波器搭建一个信号产生及滤波的系统,并编写...
发表于 2020-01-18 22:05 368次阅读
matlab与FPGA无线通信、FPGA数字信号处理系列(4)—— Vivado DDS 与 FIR IP核设计 FIR 滤波器系统

Linux CPU的性能应该如何优化

在Linux系统中,由于成本的限制,往往会存在资源上的不足,例如 CPU、内存、网络、IO 性能。本....
发表于 2020-01-18 08:52 589次阅读
Linux CPU的性能应该如何优化

Altera新发布一款多功能低成本的单芯片FPG...

一直以来,FPGA可编程器件都主要应用在通讯设备或工业控制等较为专业的应用领域,但随着不同行业使用需....
发表于 2020-01-17 16:33 539次阅读
Altera新发布一款多功能低成本的单芯片FPG...

Intel十代酷睿i9-10900有10核心20...

Intel Comet Lake-S十代桌面酷睿虽然预期发布时间推迟了,但是型号曝光还在继续,3DM....
发表于 2020-01-17 09:04 930次阅读
Intel十代酷睿i9-10900有10核心20...

苹果手机开不了机的原因主要有哪些

相信很多人都遇到过苹果手机开不了机的情况,但遇到手机开不了机不必着急,成都苹果维修点的小朋友来给大家....
发表于 2020-01-16 17:21 291次阅读
苹果手机开不了机的原因主要有哪些

台积电和三星争相启动2nm工艺,巨额资金投入能用...

为了确保在5nm之后保持优势,三星、台积电都会投入巨额资金,去年,三星宣布了一项高达133万亿韩元(....
发表于 2020-01-16 09:12 945次阅读
台积电和三星争相启动2nm工艺,巨额资金投入能用...

Intel提出了哪六大技术战略?意义所在?

在10nm+工艺之外,Tiger Lake处理器还会用上全新的CPU内核——Willow Cove,....
发表于 2020-01-15 14:43 746次阅读
Intel提出了哪六大技术战略?意义所在?

半导体霸主英特尔去年的CPU短缺问题怎么解决?

回顾英特尔2019年的表现,14纳米CPU短缺仍旧是该公司最大问题,不仅如此,也成为该公司企业顾客心....
发表于 2020-01-15 11:26 572次阅读
半导体霸主英特尔去年的CPU短缺问题怎么解决?

Ryzen 7 4800U仍然是移动平台最强核显...

新一代的锐龙4000U系列处理器的虽然如愿的使用了Zen2构架的CPU核心,但是GPU依然Vega构....
发表于 2020-01-15 10:37 410次阅读
Ryzen 7 4800U仍然是移动平台最强核显...

德国DCX推出DLC CPU V2水冷模块 每个...

还在担心CPU核心、频率升级导致的发热问题吗?风冷不行就上水冷,一般水冷不行就上服务器级水冷,效果刚....
发表于 2020-01-15 09:52 531次阅读
德国DCX推出DLC CPU V2水冷模块 每个...

DCX的DLC CPU V2水冷模块散热能力能够...

还在担心CPU核心、频率升级导致的发热问题吗?风冷不行就上水冷,一般水冷不行就上服务器级水冷,效果刚....
发表于 2020-01-15 09:22 547次阅读
DCX的DLC CPU V2水冷模块散热能力能够...

台积电5nm产能可提升到7-8万片晶圆一月

在抢先推出7nm及7nm EUV工艺之后,台积电今年又要抢先量产5nm工艺了,上半年的产能将达到1万....
发表于 2020-01-15 09:18 638次阅读
台积电5nm产能可提升到7-8万片晶圆一月

AMD锐龙4000有八个核心,性能提升56%

AMD近日正式发布了锐龙4000U、锐龙4000H系列移动APU(代号Renoir),采用7nm工艺....
发表于 2020-01-15 09:08 774次阅读
AMD锐龙4000有八个核心,性能提升56%

AMD第三代线程撕裂者平台有三种接口?

处理器和主板换接口、换插座是绝大多数用户非常厌烦的事情,这意味着整个平台都要跟着换,也失去了升级性和....
发表于 2020-01-14 16:47 1005次阅读
AMD第三代线程撕裂者平台有三种接口?

采用双闭环PI和重复控制方案实现三相逆变器设计并...

本文利采用双闭环PI和重复控制相结合的控制方案,首先用双闭环PI控制算法,得到高动态特性的三相交流电....
发表于 2020-01-14 16:36 289次阅读
采用双闭环PI和重复控制方案实现三相逆变器设计并...

在FPGA硬件平台通过采用DDS技术实现跳频系统...

DDS的原理如图1所示,包含相位累加器、波形存储器(ROM)、数模转换器(DAC)和低通滤波器4个部....
发表于 2020-01-14 16:27 1112次阅读
在FPGA硬件平台通过采用DDS技术实现跳频系统...

Altera FPGA硬核浮点DSP模块解决方案...

以往FPGA在进行浮点运算时,为符合IEEE 754标准,每次运算都需要去归一化和归一化步骤,导致了....
发表于 2020-01-14 16:19 223次阅读
Altera FPGA硬核浮点DSP模块解决方案...

英特尔正式宣布了其首款代号为“ DG1”的独立G...

英特尔已经主导了CPU游戏数十年,在2020年国际消费电子展上,该公司正式宣布了其首款代号为“ DG....
发表于 2020-01-14 16:16 699次阅读
英特尔正式宣布了其首款代号为“ DG1”的独立G...

全球最大FPGA的问世将给IC设计带来便利

英特尔公司在京发布了Stratix 10 GX 10M FPGA,这款拥有1020万个逻辑单元的产品....
发表于 2020-01-14 16:11 223次阅读
全球最大FPGA的问世将给IC设计带来便利

英特尔与赛灵思的竞争使得FPGA进入黄金时代

目前,赛灵思和英特尔的FPGA市场竞逐角力,一来一往、有输有赢。鉴于双方都有不俗的实力,可以预计,未....
发表于 2020-01-14 16:07 204次阅读
英特尔与赛灵思的竞争使得FPGA进入黄金时代

英特尔与赛灵思的竞争将会研制更强大的FPGA器件

FPGA芯片比CPU更快,比GPU功耗更低、延时更短,且比ASIC更加便宜、周期更短,因此在目前人工....
发表于 2020-01-14 16:03 211次阅读
英特尔与赛灵思的竞争将会研制更强大的FPGA器件

如何利用FPAG开发板搭建LEON2 SOC开发...

随着IC制造工艺水平的快速发展,片上系统(SOC)在ASIC设计中得到广泛应用。微处理器IP核是SO....
发表于 2020-01-14 16:00 182次阅读
如何利用FPAG开发板搭建LEON2 SOC开发...

AMD的RDNA 2图形架构性能最高可提高50%...

根据消息报道,AMD的RDNA 2图形架构将为玩家带来性能上的重大飞跃,在不增加功耗的情况下,RDN....
发表于 2020-01-14 14:26 802次阅读
AMD的RDNA 2图形架构性能最高可提高50%...

联发科新一代Helio G70系列处理器,红米9...

联发科技表示,Helio G70 系列处理器搭载有 Hyper Engine 游戏技术,对 CPU、....
发表于 2020-01-14 14:24 909次阅读
联发科新一代Helio G70系列处理器,红米9...

北京微电子技术研究所成功研制出了高可靠多通道混合...

据悉,该产品已形成针对多通道智能传感器信号处理的集成解决方案,实现了单一封装内智能传感器模拟数字信号....
发表于 2020-01-14 11:36 228次阅读
北京微电子技术研究所成功研制出了高可靠多通道混合...

NVIDIA将在3月GTC 2020上发布Amp...

随着今年迈入 NVIDIA 两年一度的 GPU 升级周期,若没有太多意外, NVIDIA 应该会在今....
发表于 2020-01-14 10:56 2097次阅读
NVIDIA将在3月GTC 2020上发布Amp...

Intel 10nm+工艺Tiger Lake处...

在前几天的CES展会上,Intel宣布了10nm+工艺的Tiger Lake处理器,这是Ice La....
发表于 2020-01-14 09:14 649次阅读
Intel 10nm+工艺Tiger Lake处...

基于fpga的电源设计

我现在没有一个具体的方案 谁能给我个提示一下 比如 fpga从哪入手(fpga一点不会) 具体的电路应该分为哪几个模块 单...
发表于 2020-01-13 23:30 426次阅读
基于fpga的电源设计

【雨的FPGA笔记】基础实践-------IP核中PLL的使用

PLL锁相环,可以对时钟网络进行系统级的时钟管理和偏移控制,具有时钟倍频和分频,相位偏移和可编程占空比的功能。...
发表于 2020-01-13 19:13 307次阅读
【雨的FPGA笔记】基础实践-------IP核中PLL的使用

采用FPGA器件实现GPS数据加密系统中机载模块...

针对GPS测量系统数据传输过程中的安全问题,采用FPGA技术设计了GPS数据加密系统。系统移植MD5....
发表于 2020-01-13 17:00 223次阅读
采用FPGA器件实现GPS数据加密系统中机载模块...

【雨的FPGA笔记】基础实践-------ModelSim手动仿真

基于流水灯的ModelSIm软件仿真为例子                 ...
发表于 2020-01-13 16:34 818次阅读
【雨的FPGA笔记】基础实践-------ModelSim手动仿真

关于异构计算FPGA基础知识的详细介绍

随着云计算,大数据和人工智能技术应用,单靠 CPU 已经无法满足各行各业的算力需求。
发表于 2020-01-13 15:15 168次阅读
关于异构计算FPGA基础知识的详细介绍

【雨的FPGA笔记】基础实践-------呼吸灯设计和实现

呼吸灯设计和实现 内容 一个周期为1s的呼吸灯,从熄灭到完全点亮一共需要1s。 将1s分为1000个1ms作为呼吸...
发表于 2020-01-12 19:50 459次阅读
【雨的FPGA笔记】基础实践-------呼吸灯设计和实现

如何用FPGA测量数字正弦波的频率?

如何用FPGA测量数字正弦波的频率
发表于 2020-01-11 22:27 371次阅读
如何用FPGA测量数字正弦波的频率?

【雨的FPGA笔记】基础实践-------按键控制LED和BEEP设计和实现

设计内容        按KEY0时点亮最右边的灯,按动按键KEY1时依次往左移动,按下KEY2时关...
发表于 2020-01-11 12:47 323次阅读
【雨的FPGA笔记】基础实践-------按键控制LED和BEEP设计和实现