0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大串流时代,VPU的优先级甚至高过GPU

E4Life 来源:电子发烧友 作者:周凯扬 2024-05-24 00:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)无论是长视频串流平台,还是短视频社交媒体,每日庞大的视频上传数据和访问量都对其背后的硬件平台提出了极高的要求,比如网络带宽、时延、视频处理等,为了进一步优化成本,硬件的选择成了一大难题。比如在视频编解码上,面临效率较低的CPU软件转码和成本较高的GPU硬件转码,不少公司决心改用更具性价比的VPU。

为什么我们需要VPU?

对于视频流媒体网站而言,高效的编码可以在有效节省带宽成本的同时,保证视频质量不变,诸如H265、VP9和AV1等。然而,依赖软件编码虽然能够带来极高的画面质量,但对硬件占用和配置要求高,使得编码效率极低,远不如FPGA、GPU之类的硬件加速。而基于ASIC的VPU,则进一步提高了编码效率,在成本上也要低于FPGA、GPU等硬件。无论是租用服务器还是采用本地服务器,都能使性价比成倍增长。

除了视频串流之外,VPU在另一个云端应用场景中同样起到了至关重要的作用,那就是云游戏。对于云游戏而言,服务器内部的GPU和CPU已经贡献出了一部分算力用于游戏的运行和图形处理,如果再加上视频编码的工作,无疑会进一步加重负载,这也就意味着同规格硬件的并发数会进一步降低。这样的改变反映到租用服务器的游戏厂商上,就等效于支持单个用户的成本降低。

坐拥全球最大视频网站,谷歌选择了自研VPU

要论播放量、规模、地区覆盖以及视频质量,排名第一的视频网站自然是谷歌的Youtube。每分钟500小时以上的视频上传量,超过19亿的月活跃用户,让其成为独一档的视频串流与分享平台。然而,在各大视频网站中,谷歌在图像质量上依然有着绝对的优势,这一方面归功于谷歌的网络基础设施建设,另一方面也与其自研的VPU脱不了干系。

从2015年起谷歌就开始研究独立的视频处理单元,从而用到更加高效的编码,比如VP9。2021年,谷歌发布了首个自研的视频处理单元,谷歌将其称为Argos VCU。这个谷歌自研的ASIC芯片,对最高4K60fps的H.264和VP9编码提供了完整的支持,同时支持单/多输出转码、速度/质量微调等。

wKgZomZPF-iAHLtLABQn0twAveY694.png
谷歌VPU / 谷歌

谷歌声称,相比在传统服务器上使用经过优化的软件转码方案,VCU给他们带来了20到33倍的计算效率提升。与此同时,与谷歌的TPU一样,谷歌已经准备好了硬件迭代的方案,比如增加对AV1编码的支持、进一步提高负载等。

第三方ASIC VPU,智能化成为趋势

有了谷歌的前车之鉴,不少厂商都开始打起了VPU的主意,这也包括了不少第三方VPU设计厂商。以NETINT为例,他们推出了Codensity G5这一ASIC芯片,单芯片可以支持32个1080p30、8个4kp30和2个8kp30视频流的实时编码,时延仅有8ms。Codensity G5既支持H.264、HEVC、AV1的编码,也支持H.264、HEVC和VP9等格式的解码。

与此同时,基于Codensity G5打造的VPU模组还具备18TOPS的AI算力,可以用于视频分析之类的AI从处理器,比如背景去除、画面加强、面部检测和物体检测等。Codensity G5也可与不同架构的CPU混合使用,比如x86的AMD EPYC处理器、Arm的Amepre Altra Max处理器等等。

wKgZomZPF_aAAWQMAAQCySQEh7g545.png
Alveo MA35D / AMD


除此之外,还有曾经以FPGA媒体加速卡方案闻名的AMD/Xilinx,其Alveo U30就是一款混合了ASIC和FPGA设计的处理器。但从去年发布的Alveo MA35D媒体加速卡开始,就成了不折不扣的ASIC VPU方案。相比上一代Alveo U30,Alveo MA35D实现了4倍的通道密度和1.8倍的压缩效率,编解码除了支持主流格式外,也新增了AV1的编码和VP9、AV1的解码。同样是4Kp60的视频,相较于U30的32ms转码时延,MA35D也能做到与Codensity G5一样的8ms。

写在最后

对于多数视频平台而言,有关视频处理类的工作也不仅仅是依赖VPU等硬件,还有一整套预处理管线等。但随着视频在社交媒体内的占比越来越高,VPU能够带来的成本、部署时间优势将越来越明显,尤其在带宽费用寸土寸金的国内。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134455
  • vpu
    vpu
    +关注

    关注

    0

    文章

    15

    浏览量

    12036
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    抢占优先级和子优先级

    关于抢占优先级和子优先级: 1)具有高抢占式优先级的中断可以在具有低抢占式优先级的中断服务程序执行过程中被响应,即中断嵌套,或者说高抢占式优先级
    发表于 12-03 07:11

    电能质量在线监测装置的暂态数据补传的优先级如何在实际应用中进行动态调整?

    电能质量在线监测装置的暂态数据补传优先级在实际应用中通过 事件驱动、主站指令、资源状态感知和动态策略调整 等多层机制实现灵活调控,确保关键数据的实时性与可靠性。以下是具体实现方式和典型场景的动态调整
    的头像 发表于 11-06 14:10 94次阅读

    电能质量在线监测装置的暂态数据补传的优先级是怎样的?

    电能质量在线监测装置的暂态数据补传优先级设计遵循 事件驱动、主站指令优先、资源动态分配 的原则,结合行业标准和设备机制,形成以下多层级优先级体系: 一、最高优先级:紧急事件驱动补传 1
    的头像 发表于 11-06 14:02 93次阅读

    FreeRTOS任务调度及优先级问题

    都有容错,但是心里没底,想向大家了解一下实际工作中有没有遇到到类似的问题,如果有又是怎么解决的呢? 另外有前辈可以分享一下任务的优先级在实际项目中该基于什么原则来划分呢?
    发表于 11-06 02:18

    使用fal api 来读写1024 字节数据,需要需要考虑被高优先级线程打断吗?

    使用fal api 来读写1024 字节数据,需要需要考虑被高优先级线程打断吗?
    发表于 10-10 07:16

    优先级线程无法调度怎么解决?

    1,设置了3,5,6,8几个优先级,设备在现场正常运行了一年多后,显示、前端、后端这3个低优先级线程异常了,表现为屏幕不动,前端采集数据没有变化等,其他高优先级的线程如通讯,按键都能正常运行,通讯有喂狗操作,停止通讯,会看门狗复
    发表于 09-25 07:33

    什么是RTOS中的优先级反转

    当一个高优先级任务正在等待一个资源,但一个低优先级任务正在持有它,一个中等优先级任务继续在中间运行时,就会发生优先级反转——阻止低优先级任务
    的头像 发表于 09-09 14:50 773次阅读

    求助,关于MS51设置中断优先级问题求解

    我确实发现在库代码和 TRM 之间设置中断优先级有一些差异,如下图所示。 Could you check what's wrong with me?
    发表于 08-25 07:01

    揭秘!基于RT-Thread探究“优先级反转”下的任务调度究竟是什么样的?| 技术集结

    本文将基于RT-Thread,结合RT-Trace调试器细化到实际任务调度的粒度,来调试并逐步讲解“优先级反转”的调度和运行逻辑。如果对RT-Trace感兴趣的可以看这篇文章:国产嵌入式调试器之光
    的头像 发表于 08-17 10:07 2800次阅读
    揭秘!基于RT-Thread探究“<b class='flag-5'>优先级</b>反转”下的任务调度究竟是什么样的?| 技术集结

    请问STM32的内部Flash操作是不是优先级最高?

    STM32的内部Flash操作是不是优先级最高?目前在内部Flash的单独一页存储了数据,发现在进行页擦除的时候正常工作的定时器中断无法进入了
    发表于 08-13 07:03

    TLe9893怎么调整外设的中断优先级

    你好林工,我该怎么调整外设的中断优先级?是否可以通过工具调整?默认设置下,是不是Brdv的在中断优先级高于T20和can?
    发表于 08-01 06:20

    请问C0系列单片机中断优先级只有4吗?

    C0系列单片机中断优先级只有4?C071在配置的时候只能配置0-3
    发表于 07-23 08:00

    ADL5308可以通过软件和硬件配置的参数,配置的优先级是什么?

    你好,麻烦问一下ADL5308可以通过软件和硬件配置的参数,配置的优先级是什么?有没有更详细的寄存器配置手册,截距配置的步进是多少?
    发表于 06-10 06:39

    CyU3PDebugPrint的最高优先级和最低优先级是什么?

    [i]CyU3PDebugPrint的最高优先级和最低优先级是什么?
    发表于 05-13 08:22

    配电柜—断电危机?配电柜故障排查优先级指南

    在排查配电柜故障过程中,合理安排排查优先级至关重要。下面聊一下如何科学合理安排配电柜故障排查优先级顺序。
    的头像 发表于 03-06 18:55 809次阅读
    配电柜—断电危机?配电柜故障排查<b class='flag-5'>优先级</b>指南