0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于FPGA的高性能视频硬件编码器

LiveVideoStack 来源:LiveVideoStack 作者:杨名远 2020-08-11 09:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

基于高性能视频编解码技术的解决方案,可以实现高清画质更快的压缩速度、更少的带宽消耗,在满足用户高清画质要求的前提下有效降低运营成本。阿里巴巴达摩院XG实验室,高级算法专家杨名远在LiveVideoStack线上分享中详细介绍了现有视频编码方案存在的挑战,并对高性能视频硬件编码技术进行了详细解析。

大家好,非常高兴能够和大家分享我们团队这一年内所做的一些工作、研究和想法,本次分享的主题是高性能硬件视频编码。 1 视频业务发展趋势

大约是在2018年,我们在考虑是否要面向视频编码方向做些研究,当时看到的一个趋势是:互联网视频头部内容如电商直播、游戏直播等视频内容质量越来越高,已经从标准尺寸转换为720P,甚至部分游戏直播场景、网红直播场景已经支持1080p/30fps、1080p/60fps,同时由于5G信道带宽的增加,AR/VR场景的应用出现复苏迹象。 从端侧来讲,手机屏幕的面积越来越大,目前已基本可以支持720P或1080P。随着柔性屏幕的扩展以及观看视野的放大,视频的体验也许可以从1080P扩展到4K、8K,高性能视频端到端传输系统已经具备了从内容制作到传输到终端整体的技术支持。

如图是一些调研报告,我们可以看到无线信道中的视频流量占有很大比重,预计到2024年比重可达到74%,同时用户的使用行为正在逐渐发生变化,从标清视频开始向高清HD甚至是4K、8K超高清方向转变。 因此,高质量视频(high resolution/high framerate/HDR)将在明后年迎来大幅度的增长.

如图左边是一个商业调研报告,以电商直播、在线教育等新的基于行业特点的视频应用不断涌现,到2020年,中国网络视频行业规模达2940亿人民币,其中大部分来自于泛娱乐直播,包括短视频、在线视频等。 如图右边是来自赛灵思的针对各大上市公司的财报调研报告,报告中显示,普遍带宽成本在全年财政收入中所占比重较大,特别以游戏直播为主的视频网站,带宽成本甚至可能有超过10%的占比。所以,对于视频网站来说,带宽成本和存储成本是非常大的。 2 现有视频编码方案存在的挑战

现有视频编码方案主要分为两种,一种是软件方案,例如较多应用于x86平台上的软件编码器。另一种就是硬件方案,例如NVDIA GPU中的硬核,FPGA方案以及ASIC SoC的解决方案。 软件编码器的特点是可以进行复杂度配置的任意调整,例如x265,就有很多复杂度,不同的复杂度对应不同的压缩效率和处理能力,例如x265 veryslow档的带宽节省比superfast档高出40%的码率,但是单位时间内处理帧率会低很多。随着摩尔定律的失效,软件编码器在对时效性有要求的业务场景需要进行压缩性能和处理能力的平衡。 右图是对当前几种不同硬件编码器的水平进行的测试,从测试结果中可以看到,现存业界较好的硬件实时高清硬件编码方案的压缩性能基本可以达到x265 medium档的水平。 3 硬件编码技术 基于上述现有编码技术背景的调研以及现有方案的分析,我们发现,硬件编码器可能需要一种产品形态,即在现有硬件编码技术基础上追求更高的压缩性能,同时需要保证一定的实时性的处理能力,在压缩性能与处理能力间寻找一种平衡,以更好的解决带宽和存储成本的问题。

因此,我们团队经过一年多的努力,成功研发了一款基于FPGA的硬件编码器-XGH265,目前已经将该编码器部署在阿里云的异构服务平台。右侧图就是FPGA卡,可以通过PCIE插在x86服务器上。图中Host代表x86服务器,通过PCIE与FPGA板卡进行信息交互。

如上图中架构图所示,黄色区域代表x86服务器;蓝色区域代表异构服务器平台本身具备的硬件和架构,包括PCIE的驱动、传输等;绿色部分是我们搭建的整套系统,包括嵌入式CPUDMA交互、数据传输等;橙色部分也是我们团队研发的265编码器,主要包括两个模块:预处理模块、编码模块。

软件方面,在x86服务器上采用的是较为流行的FFmpeg软件进行编码调度、命令下发等工作,原始编码码流会通过FFmpeg解码,将解码后的YUV图像通过PCIE传到FPGA卡上,FPGA卡上的CPU/固件系统在接收到YUV图像后进行编码任务调度,控制FPGA HEVC Encoder编码出265码流,将编好的码流回传至主服务器, 再通过协议封装成TS或MP4等格式进行推流。 x86服务器的FFmpeg支持多线程、多进程编码、编码参数等信息传递、以及对编码器的监控和异常处理。 FPGA编码器上的CPU和固件负责的工作有:编码通道管理、不同通道的编码器配置、预分析计算(包括场景检测、帧类型决策等)、参考帧管理、码率控制等。

如图是硬件编码器的编码框架,之前的一些硬件编码器设计中,MD模块大多是采用非RDO或者说是简单RDO的决策,而我们的设计目标是实现一款高压缩性能的编码器,因此在编码器架构设计中采用了全RDO的决策模式,整个决策过程可以得到最真实的重构像素和CABAC状态及时更新后的概率表,最大程度上保留了编码过程的依赖性,同时对DPCM流水线处理做了极致优化保证MD能够全遍历不同CU大小和更多的模式,从而获得了最好的压缩性能。 但是全RDO的编码架构设计会给硬件的高速实现带来很多困难,如编码模块中会存在大量复杂的反馈信息。在硬件设计中,处理性能的更好实现主要是基于数据的流水和并行处理,因此反馈机制所要承担的压力就会比较大,如果在一定时间内反馈的数据没有到达则流水处理就需要等待,所以说反馈机制的设计是编码器设计实现中的一个难点。 我们在流水线设计和算法设计上的优化解决了这些难题,比如通过对TU流水线的Cycle级精细化控制,频域Distortion预估等架构和算法的设计既增加了流水线的吞吐量,又保持了各个模块的信息获取的依赖关系。类似的设计和算法优化还有很多,由于篇幅的限制在此就不一一列举了。 从视频编码的角度来说,如H.265、H.266/VVC等,压缩性能的提升很大程度上来自反馈机制或者模块间的耦合。为了尽可能保证实现265比较高的压缩性能,因此在设计架构时,对于反馈机制部分我们投入了很大的精力进行设计与优化。

如图是FPGA的物理版图,由三个die组成,每个die之间通过连线的方式进行数据传递,不同色彩的模块代表不同的编码模块,资源的利用非常密集。实现了编码器的三大特点:高资源利用率、高频率(核心计算模块的主频已达到400M)、合理的多die设计,这三个特点保证了高性能压缩的能力。

以下是我们实现的硬件编码器的一些主要特性: l 全RDO架构保证了视频中低码率段的压缩性能 l 支持CBR、CRF、CQP等各类码控算法 l 场景检测、帧类型决策、码率控制等算法为软件算法,可以支持随时升级 l 支持延迟可配置,延迟从几帧到几十帧 l 支持高性能主管调节,提升主客观性能,减少马赛克效应的出现 l 支持Close GOP,OPEN GOP和自适应B帧 l 流媒体系统采用ffmpeg,便于与现有大部分系统对接 4 硬件编码器性能

最后是XGH265与x265 veryslow档 软件加速比的一个测试比较。在阿里云标准机型下,在同等成本下,XGH265达到近20倍速度的提升。在压缩性能方面,同等质量下,XGH265节省带宽最多。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1663

    文章

    22493

    浏览量

    638953
  • 编码器
    +关注

    关注

    45

    文章

    4009

    浏览量

    143308
  • 传输系统
    +关注

    关注

    0

    文章

    164

    浏览量

    38166

原文标题:基于FPGA的高性能视频硬件编码器

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ADV7390/ADV7391/ADV7392/ADV7393:低功耗视频编码器的卓越之选

    作为一款高性能的低功耗视频编码器,为我们带来了诸多优秀的特性和功能。下面,我们就来详细了解一下这款编码器。 文件下载: ADV7391.pdf 特性亮点 高质量DAC与过采样技术 该系
    的头像 发表于 04-18 16:45 901次阅读

    ADV7344:多功能视频编码器的技术剖析与应用

    ADV7344:多功能视频编码器的技术剖析与应用 在当今数字化视频技术飞速发展的时代,视频编码器作为关键组件,对于实现高质量
    的头像 发表于 04-18 16:45 867次阅读

    ADV7342/ADV7343:高性能多格式视频编码器的技术剖析

    ADV7342/ADV7343:高性能多格式视频编码器的技术剖析 一、引言 在当今的视频处理领域,高性能
    的头像 发表于 04-18 16:25 478次阅读

    ADV7340/ADV7341:高性能多格式视频编码器的技术解析

    ADV7340/ADV7341:高性能多格式视频编码器的技术解析 在当今数字化的时代,视频处理技术不断发展,对于高质量、多格式视频
    的头像 发表于 04-18 16:20 467次阅读

    低功耗RGB转NTSC/PAL编码器AD724:高效视频编码解决方案

    低功耗RGB转NTSC/PAL编码器AD724:高效视频编码解决方案 引言 在当今的视频处理领域,将RGB信号转换为NTSC或PAL标准的视频
    的头像 发表于 04-18 14:35 70次阅读

    深入解析HCS300:高性能代码跳变编码器的技术探秘

    深入解析HCS300:高性能代码跳变编码器的技术探秘 在电子工程领域,安全可靠的远程无钥匙进入(RKE)系统一直是研究的重点。Microchip Technology Inc.推出的HCS300代码
    的头像 发表于 04-07 10:50 100次阅读

    磁铁在编码器中的作用与应用

    编码器中,磁铁的作用不可小觑,常用的磁性材料主要是钕铁硼和铁氧体,今天这篇文章主要介绍下磁铁用于哪些编码器类型,以及其具体作用。磁铁在编码器中的作用(功能)是什么?在编码器中,磁铁主
    的头像 发表于 03-19 14:42 337次阅读
    磁铁在<b class='flag-5'>编码器</b>中的作用与应用

    HCS300:高性能代码跳频编码器的技术剖析与应用

    HCS300:高性能代码跳频编码器的技术剖析与应用 在电子工程领域,安全与便捷是设计中永恒的追求。Microchip Technology Inc.推出的HCS300代码跳频编码器,凭借其卓越的
    的头像 发表于 03-17 17:30 451次阅读

    探索Broadcom AS20系列微型编码器:创新技术与卓越性能

    探索Broadcom AS20系列微型编码器:创新技术与卓越性能 在电子工程领域,编码器作为关键组件,其性能和特性对诸多应用场景起着决定性作用。今天,我们来深入了解一下Broadcom
    的头像 发表于 12-30 15:30 451次阅读

    探索AEDR - 9940:高性能三通道反射式增量编码器的奥秘

    探索AEDR - 9940:高性能三通道反射式增量编码器的奥秘 在电子工程师的日常设计工作中,编码器是一个关键的组件,它在众多领域都发挥着重要作用。今天,我们就来深入探讨一下博通(Broadcom
    的头像 发表于 12-30 14:50 541次阅读

    编码器为何能取代光电编码器

    在复杂工业场景下,磁编码器凭借其不怕油污粉尘、抗冲击振动、安装便捷及高速响应等优势,正有效解决光电编码器怕脏、怕震、难安装、怕高速的痛点,逐渐成为提升机器人性能的新选择。
    的头像 发表于 10-15 09:55 912次阅读
    磁<b class='flag-5'>编码器</b>为何能取代光电<b class='flag-5'>编码器</b>?

    FPGA FOC驱动编码器模块介绍

    在多路FOC驱动板上,一共是支持了两种编码器和两种角度获取方式,分别是AS5047P和MT6835,SPI和ABZ。AS5047P的精度是14bit,MT6835的精度是21bit,它们的价格差不多
    的头像 发表于 09-06 09:50 5821次阅读
    <b class='flag-5'>FPGA</b> FOC驱动<b class='flag-5'>编码器</b>模块介绍

    绝对值编码器与增量式编码器相比有哪些优势?

    绝对值编码器与增量式编码器相比有哪些优势?核心功能:断电后位置信息不丢失,绝对值编码器:通过机械结构或电子存储(如电池备份),能实时输出当前位置的唯一绝对值编码(如二进制、格雷码)。无
    的头像 发表于 08-11 13:57 2013次阅读
    绝对值<b class='flag-5'>编码器</b>与增量式<b class='flag-5'>编码器</b>相比有哪些优势?

    艾毕胜电子提供麦歌恩MT6701磁编码器芯片的应用

    编码器是一种将机械运动转换为数字信号的设备,常用于测量、控制和位置检测等领域。MT6701磁编码器芯片是一款高性能、低功耗的编码器芯片,具有多种编码
    的头像 发表于 05-07 16:37 1120次阅读

    瑞苏盈科FPGA CoaXPress解决方案,重构地面远程视频编码器性能边界

    (现场可编程门阵列)凭借其独特的硬件可编程特性和强大的并行处理能力,为地面远程视频编码器带来了新的突破,成为构建可靠、高性能远程监控系统的核心技术方案。解决方案在
    的头像 发表于 04-24 14:53 946次阅读
    瑞苏盈科<b class='flag-5'>FPGA</b> CoaXPress解决方案,重构地面远程<b class='flag-5'>视频</b><b class='flag-5'>编码器</b><b class='flag-5'>性能</b>边界