0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速

NVIDIA英伟达 来源:未知 2023-07-28 17:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

案例介绍

腾讯云音视频 PaaS 平台与 NVIDIA 团队合作,利用CV-CUDA加速视频增强 AI 工作管线中的前后处理模块,结合NVIDIA TensorRT,将视频增强 AI 全流程置于 GPU 上进行加速,前后处理部分效率提升 16% - 38%。

客户简介

腾讯云音视频 PaaS 平台(以下简称腾讯视频云)专注技术产品,构建了行业中极速高清智能转码、超低时延快直播的音视频解决方案,已连续四年居于市场份额和解决方案首位[1],在音视频领域已有超过 21 年的技术积累,腾讯云音视频已持续支持国内 90% 的音视频客户。其中腾讯云 MPS 媒体处理服务为海内外客户提供全场景极速高清转码,音视频增强,专有云 codec SDK 等服务,在近期全球 MSU 云端编码大赛及 SLC 评测中,所参评项目均取得了第一名的好成绩[2]

使用 GPU 加速视频增强 AI 全流程

本案例中,腾讯云音视频 PaaS 平台与 NVIDIA 团队合作,利用CV-CUDA加速视频增强 AI 工作管线中的前后处理模块,结合NVIDIA TensorRT,将视频增强 AI 全流程置于 GPU 上进行加速。集成 CV-CUDA 后相比加速前,前后处理部分效率提升 16% - 38%,端到端效率提升 6% - 10%。

加速画质增强全链路工作管线的挑战

画质增强是腾讯视频云提供的主要视频类云服务之一,其通过 3D 去噪、色彩增强、超分辨率、插帧等处理技术,有效处理噪点、马赛克、抖动、顿挫感等问题,提高画面清晰度,让画质重生。该服务的工作管线基于 ffmpeg filter 构建,整体工作流如下图所示:

5b96b476-2d25-11ee-815d-dac502259ad0.png

图 1. 画质增强工作管线示意图

该服务中应用了三种主要的 AI 模型,包括:去噪模型、色彩增强模型以及超分辨率模型。这些模型的工作管线中,除模型推理外,还包含了一系列前后处理操作,包括:yuv2rgb、copyMakeBorder、normalize、hwc2chw、chw2hwc、float2uint8、rgb2yuv 等。

此前,这些前后处理操作使用自定义的 CUDA 算子在 GPU 上处理或使用 OpenCV 在 CPU 上处理,计算效率并不理想。一方面,这使得前后处理在整个工作管线中占据了可观的开销;另一方面,前后处理可能增加 CPU 负载,影响 CPU 上其他任务的执行效率。因此,如何尽可能地节省前后处理引入的开销,缓解 CPU 负载,成为了加速画质增强全链路工作管线的挑战。

视频增强 AI 前后处理效率提升 16% - 38%

腾讯视频云与 NVIDIA 合作,将 CV-CUDA 集成进去噪模型、色彩增强模型和超分辨率模型的工作流中,替换原有的 CUDA 算子及 OpenCV CPU 算子,从而加速前后处理部分的计算效率,提升 AI 任务端到端的推理效率。下表展示了对于 1080p 输入图像,应用 CV-CUDA 前后,上述三种模型工作管线的处理速度(单位:ms):

5ba6e562-2d25-11ee-815d-dac502259ad0.png

图 2. 使用 CV-CUDA 后,处理

1080p输入图像的效率提升效果

可以观察到,使用 CV-CUDA 后,三种模型的前后处理部分的计算效率有了不同程度的加速,模型整体性能也得以提升。此种性能提升尤其在前后处理耗时占比大的任务中将更加明显。

持续合作,实现视频 AI 全链路 GPU 加速

腾讯视频云未来将持续与 NVIDIA 合作,对提升视频增强服务处理效率方面进行不断地探索。例如,双方将共同尝试引入 TensorRT 最新的特性,进一步加速视频增强各类模型的推理性能;另外,双方将继续推动利用 CV-CUDA 加速更多视频类工作管线的处理,实现视频 AI 全链路 GPU 加速。

准备好开始了吗?

CV-CUDA 抢先体验开发者申请:

https://developer.nvidia.cn/zh-cn/cv-cuda/early-access

[1] 资料来源于腾讯云音讯频开发者社区官网,其数据来源于国际数据公司(IDC)发布的《中国视频云市场跟踪(2021 上半年) 》https://cloud.tencent.com/developer/article/2046119。 [2] 资料来源于腾讯云音讯频开发者社区官网,据莫斯科国立大学(MoscowState University)于 2021 年与 2022 年举办的 MSU 云端视频转码大赛(CloudVideo Transcoding Services Comparison)成绩公布https://cloud.tencent.com/developer/article/1794385; https://cloud.tencent.com/developer/article/2057612 。

点击“阅读原文”,或扫描下方海报二维码,在 8 月 8日聆听NVIDIA 创始人兼 CEO 黄仁勋在 SIGGRAPH 现场发表的 NVIDIA 主题演讲,了解 NVIDIA 的新技术,包括屡获殊荣的研究,OpenUSD 开发,以及最新的 AI 内容创作解决方案。

5bbc9ca4-2d25-11ee-815d-dac502259ad0.jpg


原文标题:CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4126

    浏览量

    99772

原文标题:CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    讯维音视频全域智能管控平台重新定义行业标准

    在数字化、智能化、国产化深度融合的时代浪潮下,音视频管控系统早已从单一的信号切换、画面显示,升级为指挥调度、会议协同、应急处置、信息安全的核心中枢。传统音视频方案设备零散、功能割裂、部署复杂、安全薄弱、运维繁琐,早已无法满足现代化场景对高效、稳定、安全、智能的严苛要求。
    的头像 发表于 04-22 15:58 379次阅读

    C++实战FFmpeg音视频编码实战屏幕录像机视频课程-基于QT5和ffmpeg sdk

    pan.baidu.com/s/1g64x9D_jp9ufk4uBpQBmvA?pwd=497f QT5+FFmpeg底层实战,为未来音视频产品开发筑牢技术根基 站在2026年的技术浪潮之巅,音视频
    的头像 发表于 04-21 15:27 686次阅读

    BK7258 wifi6音视频soc芯片sch以及datasheet应用分析

    BK7258是上海博通推出的高度集成的Wi-Fi+BLE combo音视频芯片,保活功耗低至120UA,支持UVC和DVP摄像头,该芯片集成音视频外设及接口,1080P,H.264,低功耗,内置
    发表于 04-15 17:55

    MAX4079:完整的音视频后端解决方案

    MAX4079:完整的音视频后端解决方案 一、引言 在当今的电子设备中,音视频处理是一个关键的环节。无论是卫星接收器、有线电视接收器,还是家庭影院系统、DVD 播放器等,都需要高效可靠的音视频后端
    的头像 发表于 04-03 12:50 347次阅读

    车载音视频系统环境试验方法解析:从高温到EMC测试

    车载音视频系统环境试验是指通过模拟车辆在实际使用过程中可能遇到的各种极端环境条件(如温度、湿度、振动、电磁干扰等),对车载信息娱乐系统(IVI)、显示屏、音响、摄像头等音视频设备进行可靠性、安全性
    的头像 发表于 03-25 16:49 490次阅读
    车载<b class='flag-5'>音视频</b>系统环境试验方法<b class='flag-5'>全</b>解析:从高温到EMC测试

    从 “卡脖子” 到 “自主可控”,音视频分布式系统国产化实践之路

    在当前全球音视频芯片市场格局中,国外企业长期占据主导地位,核心技术与核心器件的垄断的局面,曾是国内音视频行业发展的重要制约因素。近年来,随着国际形势的深刻变化,国外对我国芯片行业的技术封锁与市场打压
    的头像 发表于 03-02 11:18 432次阅读
    从 “卡脖子” 到 “自主可控”,<b class='flag-5'>音视频</b>分布式系统国产化实践之路

    洲明科技荣获2025年度音视频行业品牌评选九项大奖

    2025年12月20日,由DAV数字音视工程网与《数字音视工程》杂志联合主办的第17届音视频行业品牌评选结果正式揭晓。
    的头像 发表于 12-28 11:45 900次阅读

    打破国外垄断!自主分布式音视频方案筑牢行业安全根基

    在当前的全球音视频芯片市场中,国外公司一直占据着主导地位,然而,近年来国外对中国芯片行业的打压让国内音视频行业的发展面临了巨大的挑战。在这样的背景下,国内领先的音视频技术企业挺身而出,成功完成
    的头像 发表于 12-19 11:28 529次阅读
    打破国外垄断!自主分布式<b class='flag-5'>音视频</b>方案筑牢行业安全根基

    专业音视频板卡核心接口科普 + 产品优劣解析

    在航空航天、工业测控、多屏监控等专业场景中,音视频板卡的接口类型直接决定信号传输质量与应用适配性,而板卡本身的性能参数则影响系统稳定性与拓展性。本文将结合 8 款专业板卡(CPCI/PXIe 系列
    的头像 发表于 12-11 17:09 1223次阅读

    三款PXIe板卡科普:解锁专业音视频处理的核心力量

    便是其中的“佼佼者”。它以高速FPGA为核心“大脑”,实现了对多路音视频信号的同步捕捉与精准处理,为后续的数据分析和应用提供了坚实基础。 从硬件架构来看,这款板卡采用3U CPCIe总线设计,这种标准化的总线接口不仅让板卡能够轻松适配主流设备,更依托
    的头像 发表于 12-04 17:04 1121次阅读
    三款PXIe板卡科普:解锁专业<b class='flag-5'>音视频</b>处理的核心力量

    KS-PXIe638 型 8 通道音视频采集板:高清同步采集,专业场景 “性能标杆”

    路同步采集、硬编高效压缩、简易集成优势,成为专业领域的靠谱之选,轻松搞定复杂场景下的音视频采集需求! 一、8 路同步采集,音画双高保真 通道覆盖,音视频同步捕获 :配备 8 路标清视频
    的头像 发表于 11-26 13:24 654次阅读
    KS-PXIe638 型 8 通道<b class='flag-5'>音视频</b>采集板:高清同步采集,专业场景 “性能标杆”

    音视频编解码封装解封装部件介绍

    是否有探索开源鸿蒙音视频编解码技术的欲望?是否对开源鸿蒙音视频编解码格式支持有诉求?别急——今天这份开源鸿蒙AVCodec Kit介绍文章,就是解答疑惑的指南!参考这份指南,可以使用开源鸿蒙的音视频编解码能力,进行应用开发;也可
    的头像 发表于 10-31 09:15 732次阅读
    <b class='flag-5'>音视频</b>编解码封装解封装部件介绍

    音视频开发栈解析

    Media Kit 让开发者可以调用系统的音视频能力,涵盖播放、录制、录屏、元数据提取与转码六大核心功能模块,支撑系统应用与第三方应用在视频播放、内容创作、教学录屏、直播互动等典型场景下的音视频处理需求。
    的头像 发表于 09-18 14:42 1142次阅读
    <b class='flag-5'>音视频</b>开发<b class='flag-5'>全</b>栈解析

    千视电子受邀亮相2025音视频产业链研讨会,引领链路音视频IP化新趋势

    主管部门负责人,共同探讨产业前沿技术、市场趋势及合作机会,旨在推动湖南音视频产业链高质量发展。当前,全球音视频产业正经历深刻变革,正在加速迈向智能化、融合化及沉浸式体验的新
    的头像 发表于 08-27 11:33 1638次阅读
    千视电子受邀亮相2025<b class='flag-5'>音视频</b>产业链研讨会,引领<b class='flag-5'>全</b>链路<b class='flag-5'>音视频</b>IP化新趋势

    泰芯半导体推出星闪音视频无线SOC芯片TXW828

    在短距离无线通信技术加速迭代的浪潮中,珠海泰芯半导体有限公司全球首先发布支持星闪(NearLink)标准的音视频无线SOC芯片——TXW828。这款集WiFi/蓝牙BLE/星闪三模融合音视频无线芯片
    的头像 发表于 06-20 15:51 3234次阅读