0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA助力腾讯助力“开悟”AI开放研究平台

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-21 10:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

案例简介

• 本案例中通过NVIDIA V100 GPUTensorRT,腾讯“开悟”AI开放研究平台将强化学习模型训练中的自对弈推理部分,从CPU迁移到GPU上,实现了10倍的加速,并使推理成本下降90%,整体训练成本下降 67%。

• 本案例主要应用到 NVIDIA V100 GPU 和 TensorRT。

客户简介及应用背景

腾讯一直积极地推动强化学习在游戏AI领域的发展,并在2019年推出了“开悟”AI开放研究平台,提供不同游戏的训练场景、支撑AI进行强化训练的大规模算力、统一的强化学习框架以加速研发速度、通用的训练与推理服务,加快AI训练速度。

客户挑战

和图像以及语音的训练方式不同,目前在游戏AI训练上表现最好的方式是强化学习。强化学习除了需要大量的算力来训练深度学习网络之外,还需要一个自对弈的模块用来产生训练数据。在自对弈模块当中,会模拟游戏环境,并且选择不同时期的模型来操控游戏内的角色,AI对游戏内角色的每一操控都需要对模型进行一次前向推理。由于更新模型的训练数据来自于自对弈模块,因此自对弈的推理速度会对整个模型的训练速度和效果造成非常大的影响。

而自对弈推理每一次前向推理对延时的要求比实际的线上服务小,因此常见的方式是通过CPU来进行自对弈中的推理,但CPU成本太高。为了提高自对弈的速度与吞吐,减少推理成本,腾讯希望在“开悟”AI开放研究平台里面充分利用GPU去进行自对弈中的模型前向推理。

应用方案

为了解决上述在自对弈推理当中GPU利用率不高的问题, 腾讯“开悟”AI开放研究平台选择使用NVIDIA V100 GPU和NVIDIA TensorRT推理引擎来加速推理。

为了自动化地将模型从TensorFlow转换到TensorRT, 腾讯“开悟”AI开放研究平台一开始通过自行开发parser,将TensorFlow的算子映射到TensorRT的算子。同时,为了支持更广泛的模型与算子,减少维护和开发的成本, 腾讯“开悟”AI开放研究平台也积极地与NVIDIA合作,推动从TensorFlow转换成ONNX模型,再通过TensorRT ONNX parser转换到TensorRT的流程。

在自对弈的过程中,需要频繁地更新模型的权重,让自对弈模型始终能保持在较新的状态。这个更新的频率大概几分钟一次,每次必须限制在几百个毫秒。如果通过重新build engine 的方式来更新模型的话,无法满足上述要求。因此 腾讯“开悟”AI开放研究平台采用 TensorRT refit engine的功能来更新权重。同时,为了对更新权重有更好的支持、以及支持更多的算子, 腾讯“开悟”AI开放研究平台从原本的TensorRT 5 升级到TensorRT 7。

TensorRT 7虽然在部分算子上支持权重更新,但并不支持LSTM这个在游戏AI当中很重要的算子。为了解决这个问题, 腾讯“开悟”AI开放研究平台通过开发TensorRT插件的方式封装LSTM算子,并在插件当中更新权重。

为了充分利用NVIDIA V100 GPU的Tensor core, 腾讯“开悟”AI开放研究平台希望能够使用TensorRT FP16精度来加速推理。由于TensorRT对FP16的支持非常成熟和简便,整个推理流程很快被切换到FP16,并取得了2倍左右的加速。

寻找模型推理时的性能瓶颈,通过开发TensorRT插件进行算子融合,进一步地提升推理的速度。

在完成以上的工作之后,对比TensorFlow的基础版本,TensorRT 7 能提供5倍以上的加速效果。

使用效果及影响

通过NVIDIA V100 GPU以及TensorRT推理引擎加速自对弈训练的推理部分,腾讯“开悟”AI开放研究平台极大地提升了自对弈推理的吞吐量与速度,进一步地提升了整个模型训练的速度与降低训练成本,加快模型迭代的周期。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5725

    浏览量

    110284
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5321

    浏览量

    136206
  • AI
    AI
    +关注

    关注

    91

    文章

    41964

    浏览量

    303059
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA开放模型助力构建下一代数字健康智能体

    NVIDIA Nemotron 系列开放模型和 NVIDIA NeMo 库正在为临床医生、研究人员和开发者提供开放权重和方法,使他们能够在自
    的头像 发表于 03-25 09:46 560次阅读

    NVIDIA加速计算平台助力从地球到太空的AI应用

    NVIDIA 今日宣布,其最新一代加速计算平台正在开启太空创新的新时代,将为轨道数据中心 (ODC)、地理空间信息收集以及自主太空运行提供 AI 算力。
    的头像 发表于 03-18 14:44 686次阅读

    NVIDIA 成立由全球领先 AI 实验室组成的 Nemotron Coalition,推动开放前沿模型发展

    在内的领先创新者皆是创始成员,助力塑造新一代 AI 系统。 ● 联盟成员将协作开发一款基于 NVIDIA DGX™ Cloud 训练的开放模型,并将生成的模型开源,使全球开发者和组织
    的头像 发表于 03-17 11:14 402次阅读
    <b class='flag-5'>NVIDIA</b> 成立由全球领先 <b class='flag-5'>AI</b> 实验室组成的 Nemotron Coalition,推动<b class='flag-5'>开放</b>前沿模型发展

    NVIDIA DRIVE AV软件平台与Halos架构助力梅赛德斯奔驰CLA车型获得最高安全评分

    NVIDIA DRIVE AV 软件平台NVIDIA Halos 架构助力 CLA 车型获得最高安全评分(top safety rating)。
    的头像 发表于 02-02 09:28 2466次阅读

    生命科学领先企业采用 NVIDIA BioNeMo 平台加速 AI 驱动的药物研发

    —— NVIDIA 近日宣布对 NVIDIA BioNeMo™ 进行重大扩展, 将通过一个开放式开发平台支持实现实验室闭环(lab-in-the-loop)工作流,以推动
    的头像 发表于 01-14 11:40 739次阅读
    生命科学领先企业采用 <b class='flag-5'>NVIDIA</b> BioNeMo <b class='flag-5'>平台</b>加速 <b class='flag-5'>AI</b> 驱动的药物研发

    NVIDIA携手Mistral AI发布全新开源大语言模型系列

    全新 Mistral 3 系列涵盖从前沿级到紧凑型模型,针对 NVIDIA 平台进行了优化,助力 Mistral AI 实现云到边缘分布式智能愿景。
    的头像 发表于 12-13 09:58 1590次阅读

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVID
    的头像 发表于 12-01 09:25 1619次阅读

    NVIDIA DGX Spark助力构建自己的AI模型

    作为个人 AI 超级计算机,为世界各地的 AI 研究人员、数据科学家和学生提供 NVIDIA Grace Blackwell 平台的强大功
    的头像 发表于 11-21 09:25 1687次阅读
    <b class='flag-5'>NVIDIA</b> DGX Spark<b class='flag-5'>助力</b>构建自己的<b class='flag-5'>AI</b>模型

    腾讯地图推出全新时空智能开放平台“盖亚”

    )。 该平台基于腾讯位置服务开放平台与位置大数据平台的底层能力,深度融合腾讯混元大模型与时空动态
    的头像 发表于 09-18 10:26 2329次阅读

    Arm率先适配腾讯混元开源模型,助力端侧AI创新开发

    共同赋能端侧人工智能 (AI) 部署,助力本土开发者实现 AI 应用创新! 这次的首日开源适配是双方再次携手提升端侧应用功能和用户体验的又一例证。去年,Arm 将 Arm KleidiAI 技术与
    的头像 发表于 08-08 09:16 1642次阅读
    Arm率先适配<b class='flag-5'>腾讯</b>混元开源模型,<b class='flag-5'>助力</b>端侧<b class='flag-5'>AI</b>创新开发

    NVIDIA AI助力科学研究领域持续突破

    随着 AI 技术的广泛应用,AI 正在成为科学研究的引擎。NVIDIA 作为重要的技术推手,持续驱动着 AI 系统解锁更多领域的科学突破。
    的头像 发表于 08-05 16:30 1377次阅读

    安森美助力NVIDIA AI系统检测实验室

    NVIDIA Halos综合安全系统,将NVIDIA的汽车硬件、软件安全解决方案与其自动驾驶汽车安全领域前沿的AI研究相结合。
    的头像 发表于 07-10 16:21 1001次阅读

    NVIDIA技术助力欧洲加强AI原生无线网络研究与开发

    来自 30 多个欧洲国家的 200 多家公司和大学正在利用 NVIDIA 6G 研究组合,在 AI 原生无线网络领域取得突破。
    的头像 发表于 06-19 14:49 1554次阅读

    NVIDIA AI技术助力欧洲医疗健康行业发展

    从构建全球规模最大的生物多样性数据库,到打造赋能罕见病研究AI 工厂,NVIDIAAI 初创企业生态系统正持续为欧洲医疗健康领域注入创新动能。
    的头像 发表于 06-19 14:40 3587次阅读

    NVIDIA AI如何助力艺术创意落地

    本次 GTC 将在欧洲著名艺术之都巴黎举办,特别策划的艺术画廊将展示 AI 如何助力创意落地,实现技术与灵感碰撞的愿景。
    的头像 发表于 06-12 15:26 1204次阅读