0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速

NVIDIA英伟达 来源:未知 2023-07-28 17:05 次阅读

案例介绍

腾讯云音视频 PaaS 平台与 NVIDIA 团队合作,利用CV-CUDA加速视频增强 AI 工作管线中的前后处理模块,结合NVIDIA TensorRT,将视频增强 AI 全流程置于 GPU 上进行加速,前后处理部分效率提升 16% - 38%。

客户简介

腾讯云音视频 PaaS 平台(以下简称腾讯视频云)专注技术产品,构建了行业中极速高清智能转码、超低时延快直播的音视频解决方案,已连续四年居于市场份额和解决方案首位[1],在音视频领域已有超过 21 年的技术积累,腾讯云音视频已持续支持国内 90% 的音视频客户。其中腾讯云 MPS 媒体处理服务为海内外客户提供全场景极速高清转码,音视频增强,专有云 codec SDK 等服务,在近期全球 MSU 云端编码大赛及 SLC 评测中,所参评项目均取得了第一名的好成绩[2]

使用 GPU 加速视频增强 AI 全流程

本案例中,腾讯云音视频 PaaS 平台与 NVIDIA 团队合作,利用CV-CUDA加速视频增强 AI 工作管线中的前后处理模块,结合NVIDIA TensorRT,将视频增强 AI 全流程置于 GPU 上进行加速。集成 CV-CUDA 后相比加速前,前后处理部分效率提升 16% - 38%,端到端效率提升 6% - 10%。

加速画质增强全链路工作管线的挑战

画质增强是腾讯视频云提供的主要视频类云服务之一,其通过 3D 去噪、色彩增强、超分辨率、插帧等处理技术,有效处理噪点、马赛克、抖动、顿挫感等问题,提高画面清晰度,让画质重生。该服务的工作管线基于 ffmpeg filter 构建,整体工作流如下图所示:

5b96b476-2d25-11ee-815d-dac502259ad0.png

图 1. 画质增强工作管线示意图

该服务中应用了三种主要的 AI 模型,包括:去噪模型、色彩增强模型以及超分辨率模型。这些模型的工作管线中,除模型推理外,还包含了一系列前后处理操作,包括:yuv2rgb、copyMakeBorder、normalize、hwc2chw、chw2hwc、float2uint8、rgb2yuv 等。

此前,这些前后处理操作使用自定义的 CUDA 算子在 GPU 上处理或使用 OpenCV 在 CPU 上处理,计算效率并不理想。一方面,这使得前后处理在整个工作管线中占据了可观的开销;另一方面,前后处理可能增加 CPU 负载,影响 CPU 上其他任务的执行效率。因此,如何尽可能地节省前后处理引入的开销,缓解 CPU 负载,成为了加速画质增强全链路工作管线的挑战。

视频增强 AI 前后处理效率提升 16% - 38%

腾讯视频云与 NVIDIA 合作,将 CV-CUDA 集成进去噪模型、色彩增强模型和超分辨率模型的工作流中,替换原有的 CUDA 算子及 OpenCV CPU 算子,从而加速前后处理部分的计算效率,提升 AI 任务端到端的推理效率。下表展示了对于 1080p 输入图像,应用 CV-CUDA 前后,上述三种模型工作管线的处理速度(单位:ms):

5ba6e562-2d25-11ee-815d-dac502259ad0.png

图 2. 使用 CV-CUDA 后,处理

1080p输入图像的效率提升效果

可以观察到,使用 CV-CUDA 后,三种模型的前后处理部分的计算效率有了不同程度的加速,模型整体性能也得以提升。此种性能提升尤其在前后处理耗时占比大的任务中将更加明显。

持续合作,实现视频 AI 全链路 GPU 加速

腾讯视频云未来将持续与 NVIDIA 合作,对提升视频增强服务处理效率方面进行不断地探索。例如,双方将共同尝试引入 TensorRT 最新的特性,进一步加速视频增强各类模型的推理性能;另外,双方将继续推动利用 CV-CUDA 加速更多视频类工作管线的处理,实现视频 AI 全链路 GPU 加速。

准备好开始了吗?

CV-CUDA 抢先体验开发者申请:

https://developer.nvidia.cn/zh-cn/cv-cuda/early-access

[1] 资料来源于腾讯云音讯频开发者社区官网,其数据来源于国际数据公司IDC)发布的《中国视频云市场跟踪(2021 上半年) 》https://cloud.tencent.com/developer/article/2046119。 [2] 资料来源于腾讯云音讯频开发者社区官网,据莫斯科国立大学(MoscowState University)于 2021 年与 2022 年举办的 MSU 云端视频转码大赛(CloudVideo Transcoding Services Comparison)成绩公布https://cloud.tencent.com/developer/article/1794385; https://cloud.tencent.com/developer/article/2057612 。

点击“阅读原文”,或扫描下方海报二维码,在 8 月 8日聆听NVIDIA 创始人兼 CEO 黄仁勋在 SIGGRAPH 现场发表的 NVIDIA 主题演讲,了解 NVIDIA 的新技术,包括屡获殊荣的研究,OpenUSD 开发,以及最新的 AI 内容创作解决方案。

5bbc9ca4-2d25-11ee-815d-dac502259ad0.jpg


原文标题:CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3330

    浏览量

    87783

原文标题:CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    音视频SoC与AI技术融合,带来更智能的音视频处理解决方案

    电子发烧友网报道(文/李弯弯)音视频SoC,即音视频系统级芯片或片上系统,是一种高度集成化的芯片,它将电路板上的多块芯片以及嵌入式软件全部集成到一块芯片中。音视频SoC芯片广泛应用于各种嵌入式系统
    的头像 发表于 04-26 01:20 1550次阅读

    【RTC程序设计:实时音视频权威指南】音频采集与预处理

    音视频通信对音频采集的实时性和性能要求很高。为了降低延迟并提高吞吐量,可能需要采用一些优化技术,如硬件加速、多线程处理等。 最后,音频采集还需要考虑与后续处理步骤的衔接问题。例如,采集到的音频
    发表于 04-25 10:41

    【RTC程序设计:实时音视频权威指南】新书一瞥

    本人从事音视频领域的开发,经常接触实时音视频处理相关的技术,看到这本书非常有兴趣阅读,这本书全面介绍实时音视频(RTC)技术的权威著作,该书详细讲解了RTC的基本概念、技术原理、系统设计以及实际
    发表于 04-22 09:09

    音视频解码生成:打造极致观影体验的关键技术

    在现代多媒体时代,音视频解码生成技术已成为提供极致观影体验的核心要素。它不仅能够确保音视频数据的高效传输,还能保证播放的流畅性和画质清晰度,为用户带来身临其境的观影享受。 1. 解码生成的重要性
    的头像 发表于 02-25 14:43 152次阅读

    音视频解码生成在多媒体制作中的应用

    音视频解码生成是多媒体制作中不可或缺的一部分,它扮演着将编码的音视频数据转化为可播放、可编辑的内容的关键角色。在多媒体制作的全过程中,音视频解码生成技术都有广泛的应用。 1. 视频编辑
    的头像 发表于 02-21 14:39 110次阅读

    如何用USB-C端口实现快充及高清音视频传输?

    求助,用USB-C端口实现快充及高清音视频传输
    发表于 01-24 06:52

    音视频

    音视频技术都喜欢深究内部最核心的原理和机制,尤其是ffmpeg这个编解码库,可以说是音视频领域事实上的标准。语音智能算法,语言语义分析和理解,流媒体服务器等高端技术也都基于它而构建。希望有幸获得本书,深度学习ffmpeg核心技术,和作者一起在技术海洋中探索和进步。
    发表于 11-23 08:51

    HarmonyOS音视频开发概述

    音视频开发指导中,将介绍各种涉及音频、视频播放或录制功能场景的开发方式,指导开发者如何使用系统提供的音视频API实现对应功能。比如使用TonePlayer
    发表于 10-17 16:39

    打造沉浸式专业音视频体验

    视频质量、延迟或控制的情况下进行成本效益设计。AMD 平台可快速适应新兴音视频技术的要求,可通过 AV-over-IP 的方式,采用无损压缩或者深压缩方式进行高质量音视频传输,并在成本
    的头像 发表于 09-06 09:10 434次阅读
    打造沉浸式专业<b class='flag-5'>音视频</b>体验

    MediaBox,行业音视频数字化再加速

    根据权威数据表明,65%的行业数字化信息来自视频,基于此,音视频技术对于行业数字化来说是至关重要的。今天我想借此机会向大家介绍一个重量级的客户端产品——MediaBox,它将致力于实现行业音视
    的头像 发表于 09-05 17:20 568次阅读
    MediaBox,行业<b class='flag-5'>音视频</b>数字化再<b class='flag-5'>加速</b>

    音视频矩阵是什么意思 音视频矩阵的主要作用

    音视频矩阵(Audio-Video Matrix)是一种设备或系统,用于管理和控制音频和视频信号的传输和分配。它允许用户根据需求选择和路由不同的音频和视频源,并将它们传输到所需的输出设备,如扬声器、显示器、投影仪等。
    发表于 07-20 15:16 2116次阅读

    音视频开发:实时传输与处理音视频流的技术与应用

    音视频
    YS YYDS
    发布于 :2023年06月27日 18:20:58

    基于WebAssembly构建Web端音视频通话引擎

    Web技术在发展,音视频通话需求在演进,怎么去实现新的Web技术点在实际应用中的值,以及给我们带来更大的收益是需要我们去探索和实践的。LiveVideoStackCon 2022北京站邀请到田建华
    的头像 发表于 06-26 15:56 486次阅读
    基于WebAssembly构建Web端<b class='flag-5'>音视频</b>通话引擎

    音视频集成是什么 音视频视频有什么区别

    音视频集成是将音频和视频设备、系统和技术进行整合,以实现全面的音视频功能和体验的过程。
    发表于 06-19 17:14 1796次阅读

    周三研讨会预告 | 从 CUDACV-CUDA:如何为自己定制高效的 CV 任务算子

    CUDA (Compute Unified Device Architecture)编程模型 ,利用 GPU 强大的并行计算能力,为计算机视觉任务带来了前所未有的加速效果。 为了能让 CV
    的头像 发表于 06-13 20:55 284次阅读
    周三研讨会预告 | 从 <b class='flag-5'>CUDA</b> 到 <b class='flag-5'>CV-CUDA</b>:如何为自己定制高效的 <b class='flag-5'>CV</b> 任务算子