电子发烧友网报道(文/周凯扬)在大型数据中心里,视频处理或许是当下占比最高的关键工作负载,疫情期间,人们在视频细分的产品上所花时间越来越多。对于云服务厂商来说,视频市场带来的红利仍然在持续,但对于视频网站和视频app等产品来说,他们面临的服务器成本压力也在与日俱增。
云平台的视频转码单价/ 华为云
比如随着流量激增,Teams、Zoom和腾讯会议等服务都出现了崩溃的事故,有的视频网站面临巨额的服务器费用和下跌的营收,也开始采取压缩画质等策略。尽管服务器端的摩尔定律依然在延续,但面对视频处理的计算需求,已经开始有些力不从心了,哪怕在专业处理图形的GPU加持下也是如此。如果不采用特定领域的ASIC硬件加速器,成本压力将会继续堆积。
全球最大视频网站的策略
作为全球最大视频网站Youtube的所有者,照理说谷歌面临的压力是最大的,但Youtube从疫情至今,却基本维持着稳定的状态,而且视频质量也是同行中最高的那一档。能维持住这样服务器压力,靠的并不是传统的CPU+GPU商用服务器组合,而是谷歌自研的视频处理芯片VCU。
谷歌预见了真正大规模视频处理和其他消费级服务器用例的根本差异,尤其是在数据多样性、质量要求、吞吐量和成本上。所以谷歌打算从计算资源最昂贵的一块,也就是视频处理这块着手,设计自己的VCU处理单元,解决从视频共享、照片与视频云存储、直播到云游戏等一众业务上的视频处理难题。
VCU的设计思路
谷歌的VCU全名为视频编码单元,单个芯片集成了10个编码核心、3个解码核心。从谷歌VCU芯片的布图规划也可以看出,大部分区域都分配给了编码器核心,其次是四通道的LPDDR4内存,不仅提供边带错误纠正,也提供芯片所需的带宽。
VCU芯片布图规划/ 谷歌
每个VCU服务器系统由10块板卡组成,每块板卡上配有2个VCU芯片。谷歌将一切非转码的处理工作丢给非VCU服务器,而VCU服务器则尽可能靠近视频上传的位置,降低延迟从而降低转码所需时间。
但我们要知道一点,视频处理专用的服务器成本之所以如此之高,并不是只有GPU价格高、性能要求高等原因,还有就是低利用率的问题。并非所有的转码工作都能用满芯片的硬件资源,所以谷歌采用了固件管理的队列来启用并发转码。
VCU加速卡/ 谷歌
比如某个操作是“将这一帧的画面编码为VP9位流,”那么应用程序负责将指令写入队列中,固件则只负责队列调度和编解码器核心的激活。如此一来编程只发生在应用层面,避免了ASIC这类硬件先天缺乏FPGA那样灵活的可编程性,也符合数据中心快节奏的软件迭代速度,同时又确保了没有一个编码核心能闲下来。
谷歌也给出了VCU与主流方案的差距,比如与纯英特尔SkylakeCPU转码或4个英伟达T4 GPU转码的对比,8个VCU的配置在进行H.264或VP9转码时,性价比最高可达前两种方案的20倍以上。
专用视频处理硬件的未来
对于流量快速增长,负载持续增加的大规模数据中心和云服务来说,谷歌这种方案无疑是最省成本的。阿里巴巴、亚马逊等云服务厂商纷纷开始了自研服务器芯片计划,这点人尽皆知,但从设计上就可以看出,这些芯片还是面向在通用服务器或AI服务器的,与视频沾边的应用也大部分是AI视频识别类的。
而目前最让视频产品头疼的转码这块,却少有ASIC产品的出现,不少加速卡做成了PCIe的尺寸规格,但其实仍是基于CPU,尤其是编解码性能稍强的英特尔CPU。反倒是Xilinx的AlveoU200/250 FPGA加速卡在性能上更有优势,但考虑到这些加速卡高昂的价格,目前云服务平台还没有普及开来,甚至还在用老版的UltraScaleFPGA。
与此同时,AV1这类压缩率更高编码的编码标准提出了更高的硬件要求,谷歌的VCU虽然性价比极高,也没有支持AV1这一标准,或许我们会在下一代VCU上看到。
云平台的视频转码单价/ 华为云
全球最大视频网站的策略
作为全球最大视频网站Youtube的所有者,照理说谷歌面临的压力是最大的,但Youtube从疫情至今,却基本维持着稳定的状态,而且视频质量也是同行中最高的那一档。能维持住这样服务器压力,靠的并不是传统的CPU+GPU商用服务器组合,而是谷歌自研的视频处理芯片VCU。
谷歌预见了真正大规模视频处理和其他消费级服务器用例的根本差异,尤其是在数据多样性、质量要求、吞吐量和成本上。所以谷歌打算从计算资源最昂贵的一块,也就是视频处理这块着手,设计自己的VCU处理单元,解决从视频共享、照片与视频云存储、直播到云游戏等一众业务上的视频处理难题。
VCU的设计思路
谷歌的VCU全名为视频编码单元,单个芯片集成了10个编码核心、3个解码核心。从谷歌VCU芯片的布图规划也可以看出,大部分区域都分配给了编码器核心,其次是四通道的LPDDR4内存,不仅提供边带错误纠正,也提供芯片所需的带宽。
VCU芯片布图规划/ 谷歌
每个VCU服务器系统由10块板卡组成,每块板卡上配有2个VCU芯片。谷歌将一切非转码的处理工作丢给非VCU服务器,而VCU服务器则尽可能靠近视频上传的位置,降低延迟从而降低转码所需时间。
但我们要知道一点,视频处理专用的服务器成本之所以如此之高,并不是只有GPU价格高、性能要求高等原因,还有就是低利用率的问题。并非所有的转码工作都能用满芯片的硬件资源,所以谷歌采用了固件管理的队列来启用并发转码。
VCU加速卡/ 谷歌
谷歌也给出了VCU与主流方案的差距,比如与纯英特尔SkylakeCPU转码或4个英伟达T4 GPU转码的对比,8个VCU的配置在进行H.264或VP9转码时,性价比最高可达前两种方案的20倍以上。
专用视频处理硬件的未来
对于流量快速增长,负载持续增加的大规模数据中心和云服务来说,谷歌这种方案无疑是最省成本的。阿里巴巴、亚马逊等云服务厂商纷纷开始了自研服务器芯片计划,这点人尽皆知,但从设计上就可以看出,这些芯片还是面向在通用服务器或AI服务器的,与视频沾边的应用也大部分是AI视频识别类的。
而目前最让视频产品头疼的转码这块,却少有ASIC产品的出现,不少加速卡做成了PCIe的尺寸规格,但其实仍是基于CPU,尤其是编解码性能稍强的英特尔CPU。反倒是Xilinx的AlveoU200/250 FPGA加速卡在性能上更有优势,但考虑到这些加速卡高昂的价格,目前云服务平台还没有普及开来,甚至还在用老版的UltraScaleFPGA。
与此同时,AV1这类压缩率更高编码的编码标准提出了更高的硬件要求,谷歌的VCU虽然性价比极高,也没有支持AV1这一标准,或许我们会在下一代VCU上看到。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
谷歌
+关注
关注
27文章
6264浏览量
112155
发布评论请先 登录
相关推荐
热点推荐
好视角为何坚持“专用智能钥匙”
在智能手机高度普及的今天,为什么福建好视角在无源智能锁具领域,依然坚持采用统一的专用智能钥匙,而不是直接拥抱看似更便捷的“手机NFC开锁”?这背后,并不是对新技术的排斥,而是基于应用场景的实际需求
GPU负重前行:一组实验看懂视频色彩空间转换的真相
GPU能加速视频处理,工程师都知道。但它默默扛下了多少?ZLG致远电子D9340核心板实测:开GPU,CPU占用砍半。GPU:视频处理的隐形劳模GPU(图形处理器)是专为并行计算设计的芯片,能同时
为何企业纷纷引入线束接头气密性测漏设备?
在智能制造升级的浪潮中,降本增效已成为企业核心竞争力的关键指标。线束接头作为电气系统的核心连接部件,其密封检测环节的效率与成本控制,直接影响企业整体运营效益。如今,越来越多企业纷纷引入线束接头气密性
炸裂!为什么各行各业都纷纷拥抱物联网 + 智能?有人硬核方案让降本增效爽到飞起!
的 “转型加速器”——究竟是什么让企业趋之若鹜? 一、降本增效:从 “经验管理” 到 “数据驱动”,有人方案直击企业痛点 企业最核心的诉求永远是 “少花钱、多办事”,而物联网的本质就是用数据打通生产堵点,有人智能的方案更是把这点做到
集创北方推出首款移动终端AI画质增强独显芯片
集创北方隆重推出首款12纳米AI-PQ画质增强独显芯片。该芯片聚焦移动终端用户对高画质、高帧率、低功耗的核心诉求,融合了集创北方在多媒体AI处理、画质提升、低功耗芯片设计领域的核心技术。
钢铁厂降本秘诀:风机预警让停机时间砍半
钢铁厂降本关键在 “少损失”。风机预警系统的核心,是将运维从 “事后维修” 推向 “事前预防”,从 “经验依赖” 转向 “数据驱动”。如今老王只需查看系统健康报表,按预警安排维护,厂区风机轰鸣依旧,却少了惊心动魄,多了安稳 —— 这背后,是千万级成本节约与企业竞争力的提升。
谷歌查找我的设备配件(Google Find My Device Accessory)详解和应用
谷歌查找我的设备配件(Google Find My Device Accessory)介绍
谷歌查找我的设备配件是与谷歌 “查找我的设备” 应用程序配合使用的配件,旨在帮助用户更方便地追踪和定位个人
发表于 08-31 21:10
AI终于赚钱了,科技巨头纷纷猛加杠杆
电子发烧友网报道(文/梁浩斌)在2025年,科技巨头们的AI业务,终于开始赚钱了。 最近,谷歌、微软、Meta、亚马逊纷纷公布2025年二季度财报,四大AI巨头都交出了一份强劲的业绩答卷。过去
STM32N6570-DK自带的摄像头运行自带的AI demo,画质特别差,这是应该这个例程的原因,还是摄像头不行?
STM32N6570-DK自带的摄像头运行自带的AI demo,画质特别差,这是应该这个例程的原因,还是摄像头不行?
发表于 06-18 07:18
STM32N6570-DK自带的摄像头运行自带的AI demo,画质特别差,这是应该这个例程的原因,还是摄像头不行?
STM32N6570-DK自带的摄像头运行自带的AI demo,画质特别差,这是应该这个例程的原因,还是摄像头不行?
发表于 06-16 06:02
谷歌地图GPS定位
谷歌地图GPS定位:精准导航背后的技术解析 谷歌地图作为全球最受欢迎的地图服务之一,其精准的GPS定位功能为用户提供了极大便利。本文将深入探讨谷歌地图如何利用GPS技术,实现高精度定位,并带来革命性
视频网站为了降本纷纷砍画质,为何只有谷歌仍在坚持?
评论