0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA加速虚拟人项目渲染与推理效率

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2021-10-22 09:12 次阅读

腾讯AI LAB致力于打造产学研用一体的 AI 生态,主要的研究方向包括计算机视觉语音识别、自然语言处理和机器学习,结合腾讯场景与业务优势,在社交AI、游戏AI、内容AI及平台AI等领域取得了显著的成果,技术被应用于微信、QQ、天天快报和QQ音乐等上百个腾讯产品。其中围棋AI “绝艺” 多次获得世界人工智能围棋大赛的冠军。

腾讯AI LAB打造的虚拟人,具有自然、生动且饱含情绪的表情,其背后由一套腾讯 AI LAB 自研的复杂系统支撑,系统首先要从文本中提取不同信息,包括表情、情感、重音位置、和激动程度等;提取之后,这些信息被输入到模型中生成,再同步生成语音、口型和表情参数,最终才有了虚拟人自然生动的表现。

虚拟人物打造需要更高效平台

根据虚拟人物需要表达的语言和情感,生成自然生动的人脸,是打造虚拟人重要的一个阶段。需要先渲染人脸的纹理图和渲染图,并将它们输入到深度学习模型中,最终生成自然生动的人脸。在这个过程中,需要用到OpenGL、OpenCV、CUDA、TensorFlow等软件技术,腾讯原有的方案有很多CPUGPU的数据交互,且有很多计算型的操作通过CPU来实现,效率非常低下, 无论是吞吐还是延时都不满足要求,具体体现在:

OpenGL在GPU上渲染好图像绘制到framebuffer后,需要先用glReadPixels拷贝数据到CPU,再用cudaMemcpy将数据从CPU拷回到GPU以进行深度学习模型的推理,这里有两次不必要的CPU与GPU之间的数据传输。

颜色空间转换方面,深度学习推理的前后处理等操作在CPU上完成,效率非常低下。

NVIDIA 加速虚拟人项目渲染与推理效率

NVIDIA 技术在虚拟人项目的渲染和推理阶段均提供了强大的支持。在渲染阶段,NVIDIA 助力提升了颜色空间转换效率,降低整体延时,主要体现在:

1. 用NVIDIA CUDA/OpenGL interoperability 代替腾讯之前使用glReadPixels在CUDA和OpenGL之间拷贝数据的方案,大幅减少了CPU和GPU之间的数据拷贝,从而降低了整体的延时。

2. 把原来在CPU上做的颜色空间转换的操作,迁移到NVIDIA T4 GPU上用CUDA kernel实现,利用GPU的并行优势,大大提高了颜色空间转换的效率,进一步降低了整体的延时。

3. 将多帧的mesh组成一个batch分别绘制到framebuffer的不同区域,在提高OpenGL并行度的同时,给下一阶段的深度学习模型的推理提供了更大的输入数据的batch size,充分发挥NVIDIA T4 GPU高并发计算的优势,进一步提高GPU的利用率,从而提高整体的吞吐。

在推理阶段,NVIDIA助力提高推理整体吞吐,降低推理延时,主要体现在以下几点:

1. 用NVIDIA TensorRT替换TensorFlow对模型推理进行加速,并利用NVIDIA T4 GPU上的FP16 Tensor Core可以极大提高矩阵乘等操作速度的特性,在最终视觉效果几乎不变的情况下,进一步提升推理的吞吐,降低推理延时。

2. 在NVIDIA T4 GPU上利用CUDA kernel 替代原始流程中在CPU上使用OpenCV实现 Mat-to-Tensor 和 Tensor-to-Mat 等格式转换操作,并使用OpenCV-CUDA版替换OpenCV-CPU版的部分操作(如Resize等),充分发挥GPU相对于CPU更高的并发优势,在加速这些操作的同时减少GPU到CPU的数据传输通信量,提高格式转换效率,降低端到端的推理延时。

3. 通过Pipeline的方式,使GPU和CPU上的操作进行overlap,并结合NVIDIA的MPS技术提高单卡上多个进程同时处理多个数据流的同时提高整体的吞吐。

在虚拟人项目中,NVIDIA CUDA技术大幅提升了渲染速度,NVIDIA TensorRT 方便快速地加速深度学习模型的推理,结合MPS技术,实现了单卡多路推流,使整体推理效率达到了原来的三倍!性能的大幅提升,既提升了GPU的利用率,又降低了AI技术的使用成本。责任编辑:haq

腾讯AI LAB致力于打造产学研用一体的 AI 生态,主要的研究方向包括计算机视觉、语音识别、自然语言处理和机器学习,结合腾讯场景与业务优势,在社交AI、游戏AI、内容AI及平台AI等领域取得了显著的成果,技术被应用于微信、QQ、天天快报和QQ音乐等上百个腾讯产品。其中围棋AI “绝艺” 多次获得世界人工智能围棋大赛的冠军。 腾讯AI LAB打造的虚拟人,具有自然、生动且饱含情绪的表情,其背后由一套腾讯 AI LAB 自研的复杂系统支撑,系统首先要从文本中提取不同信息,包括表情、情感、重音位置、和激动程度等;提取之后,这些信息被输入到模型中生成,再同步生成语音、口型和表情参数,最终才有了虚拟人自然生动的表现。

虚拟人物打造需要更高效平台

根据虚拟人物需要表达的语言和情感,生成自然生动的人脸,是打造虚拟人重要的一个阶段。需要先渲染人脸的纹理图和渲染图,并将它们输入到深度学习模型中,最终生成自然生动的人脸。在这个过程中,需要用到OpenGL、OpenCV、CUDA、TensorFlow等软件技术,腾讯原有的方案有很多CPU与GPU的数据交互,且有很多计算型的操作通过CPU来实现,效率非常低下, 无论是吞吐还是延时都不满足要求,具体体现在:

OpenGL在GPU上渲染好图像绘制到framebuffer后,需要先用glReadPixels拷贝数据到CPU,再用cudaMemcpy将数据从CPU拷回到GPU以进行深度学习模型的推理,这里有两次不必要的CPU与GPU之间的数据传输。

颜色空间转换方面,深度学习推理的前后处理等操作在CPU上完成,效率非常低下。

NVIDIA加速虚拟人项目渲染与推理效率

NVIDIA 技术在虚拟人项目的渲染和推理阶段均提供了强大的支持。在渲染阶段,NVIDIA 助力提升了颜色空间转换效率,降低整体延时,主要体现在: 1. 用NVIDIA CUDA/OpenGL interoperability 代替腾讯之前使用glReadPixels在CUDA和OpenGL之间拷贝数据的方案,大幅减少了CPU和GPU之间的数据拷贝,从而降低了整体的延时。 2. 把原来在CPU上做的颜色空间转换的操作,迁移到NVIDIA T4 GPU上用CUDA kernel实现,利用GPU的并行优势,大大提高了颜色空间转换的效率,进一步降低了整体的延时。 3. 将多帧的mesh组成一个batch分别绘制到framebuffer的不同区域,在提高OpenGL并行度的同时,给下一阶段的深度学习模型的推理提供了更大的输入数据的batch size,充分发挥NVIDIA T4 GPU高并发计算的优势,进一步提高GPU的利用率,从而提高整体的吞吐。

在推理阶段,NVIDIA助力提高推理整体吞吐,降低推理延时,主要体现在以下几点:
1. 用NVIDIA TensorRT替换TensorFlow对模型推理进行加速,并利用NVIDIA T4 GPU上的FP16 Tensor Core可以极大提高矩阵乘等操作速度的特性,在最终视觉效果几乎不变的情况下,进一步提升推理的吞吐,降低推理延时。
2. 在NVIDIA T4 GPU上利用CUDA kernel 替代原始流程中在CPU上使用OpenCV实现 Mat-to-Tensor 和 Tensor-to-Mat 等格式转换操作,并使用OpenCV-CUDA版替换OpenCV-CPU版的部分操作(如Resize等),充分发挥GPU相对于CPU更高的并发优势,在加速这些操作的同时减少GPU到CPU的数据传输通信量,提高格式转换效率,降低端到端的推理延时。
3. 通过Pipeline的方式,使GPU和CPU上的操作进行overlap,并结合NVIDIA的MPS技术提高单卡上多个进程同时处理多个数据流的同时提高整体的吞吐。 在虚拟人项目中,NVIDIA CUDA技术大幅提升了渲染速度,NVIDIA TensorRT 方便快速地加速深度学习模型的推理,结合MPS技术,实现了单卡多路推流,使整体推理效率达到了原来的三倍!性能的大幅提升,既提升了GPU的利用率,又降低了AI技术的使用成本。 责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10411

    浏览量

    206465
  • NVIDIA
    +关注

    关注

    14

    文章

    4579

    浏览量

    101639
  • AI
    AI
    +关注

    关注

    87

    文章

    26352

    浏览量

    263945
  • 深度学习
    +关注

    关注

    73

    文章

    5221

    浏览量

    119863

原文标题:NVIDIA TensorRT和GPU软件栈助力腾讯AI LAB打造生动的虚拟人

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    虚拟人投融资持续火热,行业商业化探索加速

    电子发烧友网报道(文/李弯弯)近年来,虚拟数字人行业发展迅速。数据显示,2022年中国虚拟人带动产业市场规模和核心市场规模分别为1866.1亿元和120.8亿元,预计2025年分别达到6402.7
    的头像 发表于 05-04 00:01 3623次阅读
    <b class='flag-5'>虚拟人</b>投融资持续火热,行业商业化探索<b class='flag-5'>加速</b>!

    抖音严打不当虚拟人物AI生成行为,优化平台生态环境

    据悉,去年8月抖音发布了《人工智能生成内容的平台规范及行业倡议》,强调禁止利用AI技术制作虚拟人物进行低质量创作。今年3月27日,抖音安全中心又发布公告表示,发现少数账号依然存在使用AI技术生成虚拟人物的违规行为。
    的头像 发表于 03-27 14:54 117次阅读

    使用NVIDIA Triton推理服务器来加速AI预测

    这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。
    的头像 发表于 02-29 14:04 201次阅读

    子曰教育大模型加速落地应用:推出虚拟人AI产品,新增口语定级等功能

    最新推出的 Hi Echo 2.0 版本进行了四大能力创新升级——新增口语难度分级;更丰富的虚拟人形象;更多元的对话场景及更具个性化的对话评价报告。即便是零基础的英语学习者,也可以毫无压力地开口说英文,在不同语境中快速提升口语能力,实现真正的英语对话自由。
    的头像 发表于 12-21 16:57 684次阅读

    虚拟人产业链及市场前景报告

    电子发烧友网站提供《虚拟人产业链及市场前景报告.pdf》资料免费下载
    发表于 12-08 10:47 0次下载
    <b class='flag-5'>虚拟人</b>产业链及市场前景报告

    周四研讨会预告 | 注册报名 NVIDIA AI Inference Day - 大模型推理线上研讨会

    由 CSDN 举办的 NVIDIA AI Inference Day - 大模型推理线上研讨会,将帮助您了解 NVIDIA 开源大型语言模型(LLM)推理
    的头像 发表于 10-26 09:05 189次阅读

    魔珐科技亮相第五届运博会,3D虚拟人消费级AIGC产品“面对面”体验!

    3D虚拟人与文旅相遇,不仅催生出新的营销模式,还创造了新的场景体验,成为文旅企业、展馆展厅及城市景区的宣传新名片。 近日,第五届大运河文化旅游博览会在苏州成功举办。魔珐科技作为3D虚拟人行业领军企业
    的头像 发表于 09-28 10:22 462次阅读
    魔珐科技亮相第五届运博会,3D<b class='flag-5'>虚拟人</b>消费级AIGC产品“面对面”体验!

    国内首批!商汤如影获中国信通院“可信虚拟人”L3卓越级证书

    每一个在“商汤如影”平台创作的数字人,都是经过严格认证的“可信数字人”。 日前 “商汤如影SenseAvatar”AI数字人生成平台 正式通过中国信通院“可信虚拟人生成内容管理系统”测评,荣获最高
    的头像 发表于 09-15 15:45 630次阅读

    世集文旅宣布AIGC、MR、虚拟人等战略伙伴,共建迷塔城1933超级场景

    2023年世界人工智能大会(WAIC 2023)于7月6日至8日在上海成功举办,在WAIC 2023元宇宙应用场景成果展上,国内头部文旅运营商世集文旅集团与AIGC、AR、VR、MR、虚拟人、NFT
    的头像 发表于 07-14 10:19 411次阅读
    世集文旅宣布AIGC、MR、<b class='flag-5'>虚拟人</b>等战略伙伴,共建迷塔城1933超级场景

    NVIDIA 赋能中科深智实现 NPC 与玩家的千人千面多模态互动

    中科深智 成立于 2016 年,是一家专注于端到端生成式 AI 虚拟人技术的公司,从底层自研的大语言模型、动作和表情生成算法模型以及 3D 自动建模,到 Motionverse 虚拟人业务中台,再到
    的头像 发表于 07-11 23:10 218次阅读
    <b class='flag-5'>NVIDIA</b> 赋能中科深智实现 NPC 与玩家的千人千面多模态互动

    研究报告丨虚拟人产业链及市场前景报告

    自己的模板 研究 报告《 虚拟人产业链及市场前景报告》,如需领取报告,请关注公众号,后台回复   虚拟人  即可领取! 声明 : 本文由电子发烧友原创 ,转载请注明以上来源。如需入群交流 ,请添加
    的头像 发表于 07-03 17:25 299次阅读
    研究报告丨<b class='flag-5'>虚拟人</b>产业链及市场前景报告

    虚拟人产业链及市场前景报告

    虚拟人洞见分析经验分享
    电子发烧友网官方
    发布于 :2023年06月19日 10:51:24

    短视频制作结合元宇宙虚拟人能够带来哪些变化?

    随着科学技术的不断发展,元宇宙虚拟人呈现飞跃式发展,各式各样的虚拟人进入到我们的视野,而同样作为新风口的短视频行业,也成为了人们日常生活中不可或缺的一部分。那么,将这两者结合起来会带来哪些变化
    的头像 发表于 06-02 15:25 501次阅读

    NVIDIA GPU 助力三维家打造 3D 垂类大模型,引领家居设计变革

    案例简介 广东三维家信息科技有限公司(以下简称“三维家”),通过采用 NVIDIA GPU 和 NVIDIA 推理加速引擎 TensorRT,提升了家装设计
    的头像 发表于 05-17 05:55 299次阅读
    <b class='flag-5'>NVIDIA</b> GPU 助力三维家打造 3D 垂类大模型,引领家居设计变革

    虚拟数字人制作者、使用者如何获取收入

    等)的综合产物。   虚拟人制作者或服务提供方如何获取收入   在虚拟数字人产业中,对于虚拟人的制作者或者虚拟人的服务提供者,以及虚拟数字人
    的头像 发表于 04-27 01:18 1875次阅读