NVIDIA助力腾讯助力“开悟”AI开放研究平台-电子发烧友网

案例简介

• 本案例中通过NVIDIA V100 GPU和TensorRT，腾讯“开悟”AI开放研究平台将强化学习模型训练中的自对弈推理部分，从CPU迁移到GPU上，实现了10倍的加速，并使推理成本下降90%，整体训练成本下降 67%。

• 本案例主要应用到 NVIDIA V100 GPU 和 TensorRT。

客户简介及应用背景

腾讯一直积极地推动强化学习在游戏AI领域的发展，并在2019年推出了“开悟”AI开放研究平台，提供不同游戏的训练场景、支撑AI进行强化训练的大规模算力、统一的强化学习框架以加速研发速度、通用的训练与推理服务，加快AI训练速度。

客户挑战

和图像以及语音的训练方式不同，目前在游戏AI训练上表现最好的方式是强化学习。强化学习除了需要大量的算力来训练深度学习网络之外，还需要一个自对弈的模块用来产生训练数据。在自对弈模块当中，会模拟游戏环境，并且选择不同时期的模型来操控游戏内的角色，AI对游戏内角色的每一操控都需要对模型进行一次前向推理。由于更新模型的训练数据来自于自对弈模块，因此自对弈的推理速度会对整个模型的训练速度和效果造成非常大的影响。

而自对弈推理每一次前向推理对延时的要求比实际的线上服务小，因此常见的方式是通过CPU来进行自对弈中的推理，但CPU成本太高。为了提高自对弈的速度与吞吐，减少推理成本，腾讯希望在“开悟”AI开放研究平台里面充分利用GPU去进行自对弈中的模型前向推理。

应用方案

为了解决上述在自对弈推理当中GPU利用率不高的问题，腾讯“开悟”AI开放研究平台选择使用NVIDIA V100 GPU和NVIDIA TensorRT推理引擎来加速推理。

为了自动化地将模型从TensorFlow转换到TensorRT，腾讯“开悟”AI开放研究平台一开始通过自行开发parser，将TensorFlow的算子映射到TensorRT的算子。同时，为了支持更广泛的模型与算子，减少维护和开发的成本，腾讯“开悟”AI开放研究平台也积极地与NVIDIA合作，推动从TensorFlow转换成ONNX模型，再通过TensorRT ONNX parser转换到TensorRT的流程。

在自对弈的过程中，需要频繁地更新模型的权重，让自对弈模型始终能保持在较新的状态。这个更新的频率大概几分钟一次，每次必须限制在几百个毫秒。如果通过重新build engine 的方式来更新模型的话，无法满足上述要求。因此腾讯“开悟”AI开放研究平台采用 TensorRT refit engine的功能来更新权重。同时，为了对更新权重有更好的支持、以及支持更多的算子，腾讯“开悟”AI开放研究平台从原本的TensorRT 5 升级到TensorRT 7。

TensorRT 7虽然在部分算子上支持权重更新，但并不支持LSTM这个在游戏AI当中很重要的算子。为了解决这个问题，腾讯“开悟”AI开放研究平台通过开发TensorRT插件的方式封装LSTM算子，并在插件当中更新权重。

为了充分利用NVIDIA V100 GPU的Tensor core，腾讯“开悟”AI开放研究平台希望能够使用TensorRT FP16精度来加速推理。由于TensorRT对FP16的支持非常成熟和简便，整个推理流程很快被切换到FP16，并取得了2倍左右的加速。

寻找模型推理时的性能瓶颈，通过开发TensorRT插件进行算子融合，进一步地提升推理的速度。

在完成以上的工作之后，对比TensorFlow的基础版本，TensorRT 7 能提供5倍以上的加速效果。

使用效果及影响

通过NVIDIA V100 GPU以及TensorRT推理引擎加速自对弈训练的推理部分，腾讯“开悟”AI开放研究平台极大地提升了自对弈推理的吞吐量与速度，进一步地提升了整个模型训练的速度与降低训练成本，加快模型迭代的周期。

审核编辑：郭婷

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4597

浏览量
101763
gpu

gpu

+关注

关注
27

文章
4424

浏览量
126737
AI

AI

+关注

关注
87

文章
26478

浏览量
264108

是德科技与NVIDIA携手推进6G研究云平台发展

是德科技近日宣布与现已开启与全新NVIDIA 6G研究云平台的合作，加速推进6G技术研究。该平台集成了N

发表于 03-27 09:26 •340次阅读

NVIDIA推出微服务，助力企业迈向生成式AI

NVIDIA 的 AI 平台适用于任何高瞻远瞩的企业使用，而且比以往任何时候都更加易于应用。

发表于 03-21 09:39 •151次阅读

HarmonyOS SDK 助力新浪新闻打造精致易用的新闻应用

原生智能是 HarmonyOS NEXT 的核心亮点之一，依托 HarmonyOS SDK 丰富全面的开放能力，开发者只需通过几行代码，即可快速实现 AI 功能。新浪新闻作为鸿蒙原生应用开发的先行者

发表于 02-07 15:51

NVIDIA AI Enterprise助力九州未来构建MaaS平台

本案例中，九州未来的团队基于NVIDIA AI Enterprise的全栈软件套件，构建其 MaaS 大模型一体化开发及部署平台，该平台同时支持云端部署和私有化部署，通过九州未来开发的

发表于 01-10 17:24 •548次阅读

NVIDIA 人工智能开讲 | 什么是 AI For Science？详解 AI 助力科学研究领域的新突破

”两大音频 APP上搜索“ NVIDIA 人工智能开讲 ”专辑，众多技术大咖带你深度剖析核心技术，把脉未来科技发展方向！ AI For Science （亦称 “AI In Science” ），是人工智能领域的一大热门话题，

发表于 12-25 18:30 •533次阅读

NVIDIA 知乎精彩问答甄选 | 分享 NVIDIA 助力医学研究的相关精彩问答

您分享 NVIDIA 助力医学研究的具体实践。 Q: 药物研发的大神们可以解答一下生成式 AI 在这一领域带来了哪些新变化吗？ A: 如今，放射科医师使用

发表于 11-24 19:25 •276次阅读

戴尔科技、慧与和联想即将推出 NVIDIA 全新 AI 以太网络平台

基于最新 NVIDIA Spectrum-X 网络端到端平台，助力客户通过 AI 实现业务转型 NVIDIA 今日宣布，戴尔科技、慧与和联想

发表于 11-21 21:50 •330次阅读

戴尔科技、慧与和联想即将推出 NVIDIA 全新 AI 以太网络平台

基于最新 NVIDIA Spectrum-X 网络端到端平台，助力客户通过 AI 实现业务转型 NVIDIA 今日宣布，戴尔科技、慧

发表于 11-21 18:18 •156次阅读

NVIDIA AI Enterprise 4.0 推出，助力企业构建生产就绪的生成式 AI 为业务赋能

时。NVIDIA 正在将专业知识投入到解决方案的开发过程中，助力企业实现这样的飞跃。推出 NVIDIA AI Enterprise 4.0 最新版

发表于 09-19 20:20 •395次阅读

“2023 腾讯全球数字生态大会” 今日隆重登场！NVIDIA 专家众星云集，邀您一同在线参与 9 月 8 日腾讯专场演讲

的最新技术和应用，包括腾讯和 NVIDIA 的合作案例，NVIDIA 网络如何助力 AI 数据中心、NV

发表于 09-07 19:35 •801次阅读

Qt助力工业HMI设计

Qt 助力工业HMI设计内容包含：Qt发布历程、Qt Group、Qt Product Portfolio、Qt’s Products in the Product Creation Flow、Challenge: Developing the First Prototype、Qt UI Framework等

发表于 09-05 06:25

物联网卡平台的优势助力智能未来

物联网卡平台的优势助力智能未来

发表于 09-01 09:47 •232次阅读

ServiceNow、NVIDIA 和埃森哲携手合作，助力企业加快采用生成式 AI

业界首创的 AI 灯塔计划助力合作伙伴与客户合作，共同制定基于生成式 AI 的计划，转变业务运营方式 ServiceNow（NYSE: NOW）、NVIDIA（NASDAQ: NVDA

发表于 07-31 20:40 •474次阅读

CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速

案例介绍腾讯云音视频 PaaS 平台与 NVIDIA 团队合作，利用 CV-CUDA 加速视频增强 AI 工作管线中的前后处理模块，结合 N

发表于 07-28 17:05 •468次阅读

Snowflake 携手 NVIDIA 助力企业在数据云端利用数据实现生成式 AI

式 AI 应用，而这一切都可以在 Snowflake 数据云中安全地实现。凭借用于开发大语言模型（LLM）的 NVIDIA NeMo 平台以及 NVIDIA GPU 加速计算，S

发表于 06-27 21:10 •270次阅读