0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA助力腾讯AI LAB打造一体AI生态

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-21 10:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

案例简介

• 本案例中通过使用NVIDIA T4 GPUTensorRT,OpenGL,CUDA, CUDA/OpenGL interoperability等GPU软件技术栈,助力腾讯AI LAB虚拟人项目在人脸生成阶段达到了超过3倍的加速。

• 本案例主要应用到 NVIDIA T4 GPU,TensorRT, OpenGL,CUDA, CUDA/OpenGL interoperability等AI加速平台。

客户简介及应用背景

腾讯AI LAB致力于打造产学研用一体的 AI 生态,主要的研究方向包括计算机视觉语音识别、自然语言处理和机器学习,结合腾讯场景与业务优势,在社交AI,游戏AI,内容AI及平台AI等领域取得了显著的成果,技术被应用于微信、QQ、天天快报和QQ音乐等上百个腾讯产品。其中围棋AI “绝艺” 多次获得世界人工智能围棋大赛的冠军。

腾讯AI LAB打造的虚拟人,具有自然,生动且饱含情绪的表情,其背后由一套腾讯 AI Lab 自研的复杂系统支撑,系统首先要从文本中提取不同信息,包括表情、情感、重音位置、和激动程度等;之后,这些信息被输入到模型中生成,再同步生成语音、口型和表情参数,最终才有了虚拟人自然生动的表现。

客户挑战

根据虚拟人物需要表达的语言和情感,生成自然生动的人脸,是打造虚拟人重要的一个阶段。需要先渲染人脸的纹理图和渲染图,并将它们输入到深度学习模型中,最终生成自然生动的人脸。在这个过程中,需要用到OpenGL、OpenCV、CUDA、TensorFlow等软件技术,腾讯原有的方案有很多CPU与GPU的数据交互,且有很多计算型的操作通过CPU来实现,效率非常低下, 无论是吞吐还是延时都不满足要求,具体体现在:

OpenGL在GPU上渲染好图像绘制到framebuffer后,需要先用glReadPixels拷贝数据到CPU,再用cudaMemcpy将数据从CPU拷回到GPU以进行深度学习模型的推理,这里有两次不必要的CPU与GPU之间的数据传输。

颜色空间转换,深度学习推理的前后处理等操作在CPU上完成,效率非常低下。

应用方案

NVIDIA 技术在虚拟人项目的渲染和推理阶段均提供了强大的支持。在渲染阶段,NVIDIA 助力提升了颜色空间转换效率,降低整体延时,主要体现在:

用NVIDIA CUDA/OpenGL interoperability 代替腾讯之前使用glReadPixels在CUDA和OpenGL之间拷贝数据的方案,大幅减少了CPU和GPU之间的数据拷贝,从而降低了整体的延时。

把原来在CPU上做的颜色空间转换的操作,迁移到NVIDIA T4 GPU上用CUDA kernel实现,利用GPU的并行优势,大大提高了颜色空间转换的效率,进一步降低了整体的延时。

将多帧的mesh组成一个batch分别绘制到framebuffer的不同区域,在提高OpenGL并行度的同时,给下一阶段的深度学习模型的推理提供了更大的输入数据的batch size,充分发挥NVIDIA T4 GPU高并发计算的优势,进一步提高GPU的利用率,从而提高整体的吞吐。

在推理阶段,NVIDIA助力提高推理整体吞吐,降低推理延时,主要体现在以下几点:用NVIDIA TensorRT替换TensorFlow对模型推理进行加速,并利用NVIDIA T4 GPU上的FP16 Tensor Core可以极大提高矩阵乘等操作速度的特性,在最终视觉效果几乎不变的情况下,进一步提升推理的吞吐,降低推理延时。

用NVIDIA TensorRT替换TensorFlow对模型推理进行加速,并利用NVIDIA T4 GPU上的FP16 Tensor Core可以极大提高矩阵乘等操作速度的特性,在最终视觉效果几乎不变的情况下,进一步提升推理的吞吐,降低推理延时。

在NVIDIA T4 GPU上利用CUDA kernel 替代原始流程中在CPU上使用OpenCV实现 Mat-to-Tensor 和 Tensor-to-Mat 等格式转换操作,并使用OpenCV-CUDA版替换OpenCV-CPU版的部分操作(如Resize等),充分发挥GPU相对于CPU更高的并发优势,在加速这些操作的同时减少GPU到CPU的数据传输通信量,提高格式转换效率,降低端到端的推理延时。

通过Pipeline的方式,使GPU和CPU上的操作进行overlap,并结合NVIDIA的MPS技术提高单卡上多个进程同时处理多个数据流的同时提高整体的吞吐。

使用效果及影响

在虚拟人项目中,NVIDIA CUDA技术大幅提升了渲染速度,NVIDIA TensorRT 方便快速地加速深度学习模型的推理,结合MPS技术,实现了单卡多路推流,使整体推理效率达到了原来的三倍!性能的大幅提升,既提升了GPU的利用率,又降低了AI技术的使用成本。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5690

    浏览量

    110118
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5272

    浏览量

    136070
  • AI
    AI
    +关注

    关注

    91

    文章

    41138

    浏览量

    302608
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    神州信息携手腾讯打造AI智能生态标杆

    ,成功落地全国性股份制银行智能工程平台项目,以“技术底座+行业生态”的深度协同模式,树立金融AI生态合作新标杆,为金融行业智能化转型注入生态
    的头像 发表于 04-17 14:54 339次阅读

    研华科技AI+BI一体化生产运营升级方案助力制造企业打破数据孤岛

    研华AI+BI一体化生产运营升级方案,以BI夯实数据可视底座,以AI突破分析效率边界,助力制造企业打破管理瓶颈、激活数据价值,实现从被动应对到主动管控的数字化转型。
    的头像 发表于 03-19 13:44 328次阅读
    研华科技<b class='flag-5'>AI</b>+BI<b class='flag-5'>一体</b>化生产运营升级方案<b class='flag-5'>助力</b>制造企业打破数据孤岛

    生命科学领先企业采用 NVIDIA BioNeMo 平台加速 AI 驱动的药物研发

    —— NVIDIA 近日宣布对 NVIDIA BioNeMo™ 进行重大扩展, 将通过个开放式开发平台支持实现实验室闭环(lab-in-the-loop)工作流,以推动
    的头像 发表于 01-14 11:40 661次阅读
    生命科学领先企业采用 <b class='flag-5'>NVIDIA</b> BioNeMo 平台加速 <b class='flag-5'>AI</b> 驱动的药物研发

    NVIDIA Spectrum-X以太网硅光技术助力AI工厂网络创新

    NVIDIA 将率先为 AI 工厂引入采用光电一体封装 (CPO) 的优化以太网网络,通过 NVIDIA Spectrum-X 以太网硅光技术,为
    的头像 发表于 01-14 09:06 888次阅读
    <b class='flag-5'>NVIDIA</b> Spectrum-X以太网硅光技术<b class='flag-5'>助力</b><b class='flag-5'>AI</b>工厂网络创新

    联想重磅升级天禧AI一体多端

    2025年10月31日,AI有凌犀 赫然心动——联想天禧AI一体多端秋季新品超能之夜在北京联想全球总部举办。联想描绘了天禧AI的全景规划,重磅升级发布天禧个人超级智能
    的头像 发表于 11-04 11:35 1050次阅读

    南京微雀与华为打造法律AI一体机联合解决方案

    站式“行业+AI”解决方案,让服务更精准、决策更高效、治理更智能。本期将重点呈现南京微雀与华为共同打造的法律AI一体机联合解决方案,让我们
    的头像 发表于 10-24 09:23 1200次阅读
    南京微雀与华为<b class='flag-5'>打造</b>法律<b class='flag-5'>AI</b><b class='flag-5'>一体</b>机联合解决方案

    影目INMO GO3新品发布,携手蚂蚁、腾讯应用宝、智谱等行业巨头打造AI+AR生态

      10月16日,影目科技正式发布全新AI智能眼镜——INMO GO3,以“未来科技美学提案”为主题,带来智能眼镜行业颜值革命与功能跃迁。同时,影目INMO重磅官宣打造面向全球开放的 AI
    发表于 10-16 19:57 1585次阅读
    影目INMO GO3新品发布,携手蚂蚁、<b class='flag-5'>腾讯</b>应用宝、智谱等行业巨头<b class='flag-5'>打造</b><b class='flag-5'>AI</b>+AR<b class='flag-5'>生态</b>

    BPI-AIM7 RK3588 AINvidia Jetson Nano 生态系统兼容的低功耗 AI 模块

    应用。 []() AIM-IO是款专为 Jetson Nano 生态系统设计的开源扩展板。它与 RK3588 AI Module7 配合使用,为您提供个微型
    发表于 10-11 09:08

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    器件敏捷调配。 定制化服务:支持OEM/ODM/JDM模式,满足客户从标准品到液冷模块的多元化需求。 这优势已助力多家头部云服务商在AI云平台部署中抢占市场窗口期。 三、广泛兼容性:平滑升级,保护
    发表于 08-13 19:01

    基于飞腾腾云S5000C打造的多款AI一体机亮相WAIC

    第七届世界人工智能大会(WAIC)7月26日在上海拉开大幕,飞腾携手合作伙伴在核心技术馆(H1馆)全面展示了 “云边端” 一体化智算方案,基于飞腾腾云 S5000C 打造的多款 AI 一体
    的头像 发表于 07-29 17:33 3166次阅读
    基于飞腾腾云S5000C<b class='flag-5'>打造</b>的多款<b class='flag-5'>AI</b><b class='flag-5'>一体</b>机亮相WAIC

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐下?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐下?直接发个安装包,谢谢。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    发表于 07-09 18:30

    IQVIA和NVIDIA合作推出多款AI Orchestrator智能

    IQVIA 发布由 IQVIA Connected Intelligence 和 NVIDIA AI Foundry 提供技术支持的 AI Orchestrator 智能,提升临床试
    的头像 发表于 06-19 14:43 1462次阅读

    NVIDIA AI技术助力欧洲医疗健康行业发展

    从构建全球规模最大的生物多样性数据库,到打造赋能罕见病研究的 AI 工厂,NVIDIAAI 初创企业生态系统正持续为欧洲医疗健康领域注
    的头像 发表于 06-19 14:40 3526次阅读

    NVIDIA技术助力企业创建主权AI智能

    AI Factory 的经验证设计将加速基础设施与软件(包括全新 NVIDIA NIM 微服务和经扩展的 NVIDIA Blueprint)相结合,为各国和企业简化了全栈式 AI 开发
    的头像 发表于 06-16 14:28 1531次阅读

    NVIDIA携手诺和诺德借助AI加速药物研发

    打造定制化 AI 模型与智能,用于诺和诺德的早期研究与临床开发工作,并引入先进的仿真与物理 AI 技术。
    的头像 发表于 06-12 15:49 1490次阅读