0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速

NVIDIA英伟达 来源:未知 2023-07-28 17:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

案例介绍

腾讯云音视频 PaaS 平台与 NVIDIA 团队合作,利用CV-CUDA加速视频增强 AI 工作管线中的前后处理模块,结合NVIDIA TensorRT,将视频增强 AI 全流程置于 GPU 上进行加速,前后处理部分效率提升 16% - 38%。

客户简介

腾讯云音视频 PaaS 平台(以下简称腾讯视频云)专注技术产品,构建了行业中极速高清智能转码、超低时延快直播的音视频解决方案,已连续四年居于市场份额和解决方案首位[1],在音视频领域已有超过 21 年的技术积累,腾讯云音视频已持续支持国内 90% 的音视频客户。其中腾讯云 MPS 媒体处理服务为海内外客户提供全场景极速高清转码,音视频增强,专有云 codec SDK 等服务,在近期全球 MSU 云端编码大赛及 SLC 评测中,所参评项目均取得了第一名的好成绩[2]

使用 GPU 加速视频增强 AI 全流程

本案例中,腾讯云音视频 PaaS 平台与 NVIDIA 团队合作,利用CV-CUDA加速视频增强 AI 工作管线中的前后处理模块,结合NVIDIA TensorRT,将视频增强 AI 全流程置于 GPU 上进行加速。集成 CV-CUDA 后相比加速前,前后处理部分效率提升 16% - 38%,端到端效率提升 6% - 10%。

加速画质增强全链路工作管线的挑战

画质增强是腾讯视频云提供的主要视频类云服务之一,其通过 3D 去噪、色彩增强、超分辨率、插帧等处理技术,有效处理噪点、马赛克、抖动、顿挫感等问题,提高画面清晰度,让画质重生。该服务的工作管线基于 ffmpeg filter 构建,整体工作流如下图所示:

5b96b476-2d25-11ee-815d-dac502259ad0.png

图 1. 画质增强工作管线示意图

该服务中应用了三种主要的 AI 模型,包括:去噪模型、色彩增强模型以及超分辨率模型。这些模型的工作管线中,除模型推理外,还包含了一系列前后处理操作,包括:yuv2rgb、copyMakeBorder、normalize、hwc2chw、chw2hwc、float2uint8、rgb2yuv 等。

此前,这些前后处理操作使用自定义的 CUDA 算子在 GPU 上处理或使用 OpenCV 在 CPU 上处理,计算效率并不理想。一方面,这使得前后处理在整个工作管线中占据了可观的开销;另一方面,前后处理可能增加 CPU 负载,影响 CPU 上其他任务的执行效率。因此,如何尽可能地节省前后处理引入的开销,缓解 CPU 负载,成为了加速画质增强全链路工作管线的挑战。

视频增强 AI 前后处理效率提升 16% - 38%

腾讯视频云与 NVIDIA 合作,将 CV-CUDA 集成进去噪模型、色彩增强模型和超分辨率模型的工作流中,替换原有的 CUDA 算子及 OpenCV CPU 算子,从而加速前后处理部分的计算效率,提升 AI 任务端到端的推理效率。下表展示了对于 1080p 输入图像,应用 CV-CUDA 前后,上述三种模型工作管线的处理速度(单位:ms):

5ba6e562-2d25-11ee-815d-dac502259ad0.png

图 2. 使用 CV-CUDA 后,处理

1080p输入图像的效率提升效果

可以观察到,使用 CV-CUDA 后,三种模型的前后处理部分的计算效率有了不同程度的加速,模型整体性能也得以提升。此种性能提升尤其在前后处理耗时占比大的任务中将更加明显。

持续合作,实现视频 AI 全链路 GPU 加速

腾讯视频云未来将持续与 NVIDIA 合作,对提升视频增强服务处理效率方面进行不断地探索。例如,双方将共同尝试引入 TensorRT 最新的特性,进一步加速视频增强各类模型的推理性能;另外,双方将继续推动利用 CV-CUDA 加速更多视频类工作管线的处理,实现视频 AI 全链路 GPU 加速。

准备好开始了吗?

CV-CUDA 抢先体验开发者申请:

https://developer.nvidia.cn/zh-cn/cv-cuda/early-access

[1] 资料来源于腾讯云音讯频开发者社区官网,其数据来源于国际数据公司(IDC)发布的《中国视频云市场跟踪(2021 上半年) 》https://cloud.tencent.com/developer/article/2046119。 [2] 资料来源于腾讯云音讯频开发者社区官网,据莫斯科国立大学(MoscowState University)于 2021 年与 2022 年举办的 MSU 云端视频转码大赛(CloudVideo Transcoding Services Comparison)成绩公布https://cloud.tencent.com/developer/article/1794385; https://cloud.tencent.com/developer/article/2057612 。

点击“阅读原文”,或扫描下方海报二维码,在 8 月 8日聆听NVIDIA 创始人兼 CEO 黄仁勋在 SIGGRAPH 现场发表的 NVIDIA 主题演讲,了解 NVIDIA 的新技术,包括屡获殊荣的研究,OpenUSD 开发,以及最新的 AI 内容创作解决方案。

5bbc9ca4-2d25-11ee-815d-dac502259ad0.jpg


原文标题:CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97673

原文标题:CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    三款PXIe板卡科普:解锁专业音视频处理的核心力量

    便是其中的“佼佼者”。它以高速FPGA为核心“大脑”,实现了对多路音视频信号的同步捕捉与精准处理,为后续的数据分析和应用提供了坚实基础。 从硬件架构来看,这款板卡采用3U CPCIe总线设计,这种标准化的总线接口不仅让板卡能够轻松适配主流设备,更依托
    的头像 发表于 12-04 17:04 414次阅读
    三款PXIe板卡科普:解锁专业<b class='flag-5'>音视频</b>处理的核心力量

    KS-PXIe638 型 8 通道音视频采集板:高清同步采集,专业场景 “性能标杆”

    路同步采集、硬编高效压缩、简易集成优势,成为专业领域的靠谱之选,轻松搞定复杂场景下的音视频采集需求! 一、8 路同步采集,音画双高保真 通道覆盖,音视频同步捕获 :配备 8 路标清视频
    的头像 发表于 11-26 13:24 98次阅读
    KS-PXIe638 型 8 通道<b class='flag-5'>音视频</b>采集板:高清同步采集,专业场景 “性能标杆”

    音视频编解码封装解封装部件介绍

    是否有探索开源鸿蒙音视频编解码技术的欲望?是否对开源鸿蒙音视频编解码格式支持有诉求?别急——今天这份开源鸿蒙AVCodec Kit介绍文章,就是解答疑惑的指南!参考这份指南,可以使用开源鸿蒙的音视频编解码能力,进行应用开发;也可
    的头像 发表于 10-31 09:15 249次阅读
    <b class='flag-5'>音视频</b>编解码封装解封装部件介绍

    音视频开发栈解析

    Media Kit 让开发者可以调用系统的音视频能力,涵盖播放、录制、录屏、元数据提取与转码六大核心功能模块,支撑系统应用与第三方应用在视频播放、内容创作、教学录屏、直播互动等典型场景下的音视频处理需求。
    的头像 发表于 09-18 14:42 579次阅读
    <b class='flag-5'>音视频</b>开发<b class='flag-5'>全</b>栈解析

    千视电子受邀亮相2025音视频产业链研讨会,引领链路音视频IP化新趋势

    主管部门负责人,共同探讨产业前沿技术、市场趋势及合作机会,旨在推动湖南音视频产业链高质量发展。当前,全球音视频产业正经历深刻变革,正在加速迈向智能化、融合化及沉浸式体验的新
    的头像 发表于 08-27 11:33 1018次阅读
    千视电子受邀亮相2025<b class='flag-5'>音视频</b>产业链研讨会,引领<b class='flag-5'>全</b>链路<b class='flag-5'>音视频</b>IP化新趋势

    泰芯半导体推出星闪音视频无线SOC芯片TXW828

    在短距离无线通信技术加速迭代的浪潮中,珠海泰芯半导体有限公司全球首先发布支持星闪(NearLink)标准的音视频无线SOC芯片——TXW828。这款集WiFi/蓝牙BLE/星闪三模融合音视频无线芯片
    的头像 发表于 06-20 15:51 2273次阅读

    达辰威执法音视频管理平台全新升级

    在传统执法场景中,海量音视频数据的存储、分析和监管一直是难题——无效视频堆积如山、关键信息难以快速提取、执法规范性缺乏实时监督……在科技赋能执法的时代背景下,达辰威科技集团推出全新升级的执法音视频
    的头像 发表于 05-20 15:06 779次阅读

    中国音视频产业迈向高质量发展

    随着超高清先锋计划的逐步推进,截至2024年底,中国音视频产业规模超5万亿,包括个人消费电子、家庭影音娱乐、行业多媒体应用及车载视听产业和相关衍生应用等行业企业超过百万家,音视频产业已经成为国家数字经济发展的重要支柱。
    的头像 发表于 04-24 11:10 1070次阅读

    音视频一体化解决方案

    随着数字化转型加速音视频技术在各行业深度应用,传统音视频分散式管理系统面临多源异构设备接入困难、数据孤岛林立、运维复杂、协作效率低下等挑战,各行业对信息技术的需求逐渐从单一化向集成化、系统化转变
    的头像 发表于 04-24 09:14 891次阅读

    实用调试技能:志T113-i 音视频测试

    前言:音视频功能是现代嵌入式系统中的核心应用之一,尤其在志T113-i开发板中,其丰富的音视频接口为开发者提供了强大的开发能力。本篇文章将带你快速掌握T113-i平台
    的头像 发表于 03-06 08:31 2255次阅读
    实用调试技能:<b class='flag-5'>全</b>志T113-i <b class='flag-5'>音视频</b>测试

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    学习、自然语言处理(NLP)、计算机视觉(CV)等先进技术提供的强大的数据处理和分析能力。 在视频应用开发中,AI Agent可以用于视频内容分析、推荐、编辑等。 下面跟随作者的指导,
    发表于 03-05 19:52

    RCA接口音视频传输的原理

    RCA接口音视频传输的原理主要基于模拟信号的传输方式。以下是对其传输原理的介绍: 一、RCA接口的基本结构 RCA接口,又称AV接口或莲花插座,其结构包括一个圆形的插头和一个相应的插座。插头上通常
    的头像 发表于 02-17 15:36 2288次阅读

    RK628H:高端音视频处理与传输芯片详解

    RK628H是一款集高清音视频处理与传输功能于一体的高端芯片,专为满足现代多媒体设备对高分辨率、高帧率视频以及高质量音频的需求而设计。其强大的音视频处理能力和多样化的输入输出接口,使得RK628H在
    的头像 发表于 02-10 17:56 2033次阅读

    艾为电子助力闪极科技发布音视频AI眼镜

    日前,闪极科技发布 “闪极 A1 拍拍镜”。这是一款音视频AI眼镜,搭载国产紫光展锐去蜂窝平台,内置1600万索尼高清摄像头。旅行、日常,轻触镜腿即可拍照摄像,解放双手,所见即拍,无感出行。
    的头像 发表于 01-06 10:49 1226次阅读
    艾为电子<b class='flag-5'>助力</b>闪极科技发布<b class='flag-5'>音视频</b><b class='flag-5'>AI</b>眼镜

    国科微荣获音视频领域关键技术突破一等奖

    近日,第五届“马栏山杯”国际音视频算法大赛-2024音视频领域关键技术突破奖揭晓,国科微8K超高清视频系列芯片凭借优异的产品性能及示范性应用获评一等奖。
    的头像 发表于 12-26 15:11 866次阅读