0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大串流时代,VPU的优先级甚至高过GPU

E4Life 来源:电子发烧友 作者:周凯扬 2024-05-24 00:16 次阅读

电子发烧友网报道(文/周凯扬)无论是长视频串流平台,还是短视频社交媒体,每日庞大的视频上传数据和访问量都对其背后的硬件平台提出了极高的要求,比如网络带宽、时延、视频处理等,为了进一步优化成本,硬件的选择成了一大难题。比如在视频编解码上,面临效率较低的CPU软件转码和成本较高的GPU硬件转码,不少公司决心改用更具性价比的VPU。

为什么我们需要VPU?

对于视频流媒体网站而言,高效的编码可以在有效节省带宽成本的同时,保证视频质量不变,诸如H265、VP9和AV1等。然而,依赖软件编码虽然能够带来极高的画面质量,但对硬件占用和配置要求高,使得编码效率极低,远不如FPGA、GPU之类的硬件加速。而基于ASIC的VPU,则进一步提高了编码效率,在成本上也要低于FPGA、GPU等硬件。无论是租用服务器还是采用本地服务器,都能使性价比成倍增长。

除了视频串流之外,VPU在另一个云端应用场景中同样起到了至关重要的作用,那就是云游戏。对于云游戏而言,服务器内部的GPU和CPU已经贡献出了一部分算力用于游戏的运行和图形处理,如果再加上视频编码的工作,无疑会进一步加重负载,这也就意味着同规格硬件的并发数会进一步降低。这样的改变反映到租用服务器的游戏厂商上,就等效于支持单个用户的成本降低。

坐拥全球最大视频网站,谷歌选择了自研VPU

要论播放量、规模、地区覆盖以及视频质量,排名第一的视频网站自然是谷歌的Youtube。每分钟500小时以上的视频上传量,超过19亿的月活跃用户,让其成为独一档的视频串流与分享平台。然而,在各大视频网站中,谷歌在图像质量上依然有着绝对的优势,这一方面归功于谷歌的网络基础设施建设,另一方面也与其自研的VPU脱不了干系。

从2015年起谷歌就开始研究独立的视频处理单元,从而用到更加高效的编码,比如VP9。2021年,谷歌发布了首个自研的视频处理单元,谷歌将其称为Argos VCU。这个谷歌自研的ASIC芯片,对最高4K60fps的H.264和VP9编码提供了完整的支持,同时支持单/多输出转码、速度/质量微调等。

wKgZomZPF-iAHLtLABQn0twAveY694.png
谷歌VPU / 谷歌

谷歌声称,相比在传统服务器上使用经过优化的软件转码方案,VCU给他们带来了20到33倍的计算效率提升。与此同时,与谷歌的TPU一样,谷歌已经准备好了硬件迭代的方案,比如增加对AV1编码的支持、进一步提高负载等。

第三方ASIC VPU,智能化成为趋势

有了谷歌的前车之鉴,不少厂商都开始打起了VPU的主意,这也包括了不少第三方VPU设计厂商。以NETINT为例,他们推出了Codensity G5这一ASIC芯片,单芯片可以支持32个1080p30、8个4kp30和2个8kp30视频流的实时编码,时延仅有8ms。Codensity G5既支持H.264、HEVC、AV1的编码,也支持H.264、HEVC和VP9等格式的解码。

与此同时,基于Codensity G5打造的VPU模组还具备18TOPS的AI算力,可以用于视频分析之类的AI从处理器,比如背景去除、画面加强、面部检测和物体检测等。Codensity G5也可与不同架构的CPU混合使用,比如x86的AMD EPYC处理器、Arm的Amepre Altra Max处理器等等。

wKgZomZPF_aAAWQMAAQCySQEh7g545.png
Alveo MA35D / AMD


除此之外,还有曾经以FPGA媒体加速卡方案闻名的AMD/Xilinx,其Alveo U30就是一款混合了ASIC和FPGA设计的处理器。但从去年发布的Alveo MA35D媒体加速卡开始,就成了不折不扣的ASIC VPU方案。相比上一代Alveo U30,Alveo MA35D实现了4倍的通道密度和1.8倍的压缩效率,编解码除了支持主流格式外,也新增了AV1的编码和VP9、AV1的解码。同样是4Kp60的视频,相较于U30的32ms转码时延,MA35D也能做到与Codensity G5一样的8ms。

写在最后

对于多数视频平台而言,有关视频处理类的工作也不仅仅是依赖VPU等硬件,还有一整套预处理管线等。但随着视频在社交媒体内的占比越来越高,VPU能够带来的成本、部署时间优势将越来越明显,尤其在带宽费用寸土寸金的国内。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4490

    浏览量

    127349
  • vpu
    vpu
    +关注

    关注

    0

    文章

    13

    浏览量

    11716
收藏 人收藏

    评论

    相关推荐

    如何在不同优先级安装相同的处理程序?

    在不同的优先级中安装相同的处理程序? 我需要一个解决方案,在不同的优先级中安装相同的处理程序(ISR),以便在我的项目中处理 CAT2 中断,但我不能上传项目,因为我签署了 NDA。
    发表于 05-28 08:13

    systick的中断优先级是否应该设置为最高优先级的嵌套中断?

    最近在学习ucosii有这样一个疑问,关于stm32的systick作为ucosii的基准时钟,systick的中断优先级是否应该设置为最高优先级的嵌套中断。理由是什么?各位大侠求指教!!!
    发表于 05-16 06:44

    stm32的中断优先级分组了之后还能改分组吗?

    如标题所示,stm32的中断优先级分组了之后还能改分组吗? 比如我要使用外部中断EXIT2,3,我在配置的时候配置了优先级分组2组,然后配置了EXIT2,3,如果我下面又想开外部中断的EXIT4,5的话,我是不是必须还的要使用优先级
    发表于 05-13 08:40

    创建了两个task如果一个优先级高 一个优先级低,高优先级的那个一直在做,什么时候会调度到低优先级的呢?

    创建了两个task如果一个优先级高一个优先级低, 我看到任务的函数都是用死循环做的,那个高优先级的那个一直在做,什么时候会调度到低优先级的呢?
    发表于 05-13 07:13

    求助,关于stm32F4中断优先级0无法抢占的问题求解

    使用F407遇到一个抢占优先级的问题: 现设置优先级分组 HAL_NVIC_SetPriorityGrouping(NVIC_PRIORITYGROUP_4);也就是15个优先级分组。按照手册说明0
    发表于 04-23 07:26

    STM32F103的寄存器NVIC_IPRx抢占优先级和子优先级是怎么设置的?

    STM32F103的寄存器NVIC_IPRx有些不明白,抢占优先级和子优先级是怎么设置的? 如果,中断分组2,抢占优先级3,子优先级3 那下面这样写对吗? SCB->AIR
    发表于 03-27 07:48

    Hightec对芯片中断优先级分配时,中断号越高中断优先级越高吗?

    请问大佬,Hightec对芯片中断优先级分配时,中断号越高中断优先级越高吗?看网上的帖子说中断号越低优先级越高。
    发表于 02-27 06:13

    RTTnano的用户main函数中的优先级是多少?

    RTTnano 的用户main函数中的优先级是多少?为什么会出现创建新的task之后,main函数会抢占掉低优先级的task,例如RT_THREAD_PRIORITY_MAX设置为8 ,低于3
    发表于 02-26 08:01

    M0516中断优先级怎么设置?

    新唐M0516中断优先级的设置,有没有示例,没找到相关接口,谢谢!
    发表于 01-16 07:25

    单片机的中断优先级是怎么确定的?

    单片机的中断优先级是怎么确定的,如果设定优先级后怎么确定设定的对不对?
    发表于 11-03 06:32

    freertos中的任务优先级通过什么函数设置?

    任务优先级怎么设置成最高
    发表于 11-02 07:40

    ucos怎么设置任务的优先级

    这个优先级怎么设置的
    发表于 10-30 06:18

    STM32中断没有子优先级

    比如,有时候你在使用STM32CubeMX配置时,你会发现只有Preemption Priority【抢占优先级】,而没有Sub Priority【次优先级
    的头像 发表于 10-17 15:50 495次阅读
    STM32中断没有子<b class='flag-5'>优先级</b>?

    freertos怎么在任务中修改任务的优先级

    freertos怎么在任务中修改任务的优先级
    发表于 10-11 07:56

    PLIC管理的中断的优先级和RISC-V本身的机器定时器以及软中断的中断优先级问题

    请问PLIC管理的外设中断的优先级和RISC-V本身的机器定时器以及软中断谁的优先级会更高? 机器定时器中断和软中断不归PLIC管(PLIC管理其他外设的中断优先级),那么机器定时器中断和软中断可以嵌套其他PLIC管理的外设中断
    发表于 06-25 19:05