0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA助力腾讯助力“开悟”AI开放研究平台

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-21 10:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

案例简介

• 本案例中通过NVIDIA V100 GPUTensorRT,腾讯“开悟”AI开放研究平台将强化学习模型训练中的自对弈推理部分,从CPU迁移到GPU上,实现了10倍的加速,并使推理成本下降90%,整体训练成本下降 67%。

• 本案例主要应用到 NVIDIA V100 GPU 和 TensorRT。

客户简介及应用背景

腾讯一直积极地推动强化学习在游戏AI领域的发展,并在2019年推出了“开悟”AI开放研究平台,提供不同游戏的训练场景、支撑AI进行强化训练的大规模算力、统一的强化学习框架以加速研发速度、通用的训练与推理服务,加快AI训练速度。

客户挑战

和图像以及语音的训练方式不同,目前在游戏AI训练上表现最好的方式是强化学习。强化学习除了需要大量的算力来训练深度学习网络之外,还需要一个自对弈的模块用来产生训练数据。在自对弈模块当中,会模拟游戏环境,并且选择不同时期的模型来操控游戏内的角色,AI对游戏内角色的每一操控都需要对模型进行一次前向推理。由于更新模型的训练数据来自于自对弈模块,因此自对弈的推理速度会对整个模型的训练速度和效果造成非常大的影响。

而自对弈推理每一次前向推理对延时的要求比实际的线上服务小,因此常见的方式是通过CPU来进行自对弈中的推理,但CPU成本太高。为了提高自对弈的速度与吞吐,减少推理成本,腾讯希望在“开悟”AI开放研究平台里面充分利用GPU去进行自对弈中的模型前向推理。

应用方案

为了解决上述在自对弈推理当中GPU利用率不高的问题, 腾讯“开悟”AI开放研究平台选择使用NVIDIA V100 GPU和NVIDIA TensorRT推理引擎来加速推理。

为了自动化地将模型从TensorFlow转换到TensorRT, 腾讯“开悟”AI开放研究平台一开始通过自行开发parser,将TensorFlow的算子映射到TensorRT的算子。同时,为了支持更广泛的模型与算子,减少维护和开发的成本, 腾讯“开悟”AI开放研究平台也积极地与NVIDIA合作,推动从TensorFlow转换成ONNX模型,再通过TensorRT ONNX parser转换到TensorRT的流程。

在自对弈的过程中,需要频繁地更新模型的权重,让自对弈模型始终能保持在较新的状态。这个更新的频率大概几分钟一次,每次必须限制在几百个毫秒。如果通过重新build engine 的方式来更新模型的话,无法满足上述要求。因此 腾讯“开悟”AI开放研究平台采用 TensorRT refit engine的功能来更新权重。同时,为了对更新权重有更好的支持、以及支持更多的算子, 腾讯“开悟”AI开放研究平台从原本的TensorRT 5 升级到TensorRT 7。

TensorRT 7虽然在部分算子上支持权重更新,但并不支持LSTM这个在游戏AI当中很重要的算子。为了解决这个问题, 腾讯“开悟”AI开放研究平台通过开发TensorRT插件的方式封装LSTM算子,并在插件当中更新权重。

为了充分利用NVIDIA V100 GPU的Tensor core, 腾讯“开悟”AI开放研究平台希望能够使用TensorRT FP16精度来加速推理。由于TensorRT对FP16的支持非常成熟和简便,整个推理流程很快被切换到FP16,并取得了2倍左右的加速。

寻找模型推理时的性能瓶颈,通过开发TensorRT插件进行算子融合,进一步地提升推理的速度。

在完成以上的工作之后,对比TensorFlow的基础版本,TensorRT 7 能提供5倍以上的加速效果。

使用效果及影响

通过NVIDIA V100 GPU以及TensorRT推理引擎加速自对弈训练的推理部分,腾讯“开悟”AI开放研究平台极大地提升了自对弈推理的吞吐量与速度,进一步地提升了整个模型训练的速度与降低训练成本,加快模型迭代的周期。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109094
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134461
  • AI
    AI
    +关注

    关注

    89

    文章

    38104

    浏览量

    296629
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVID
    的头像 发表于 12-01 09:25 496次阅读

    NVIDIA DGX Spark助力构建自己的AI模型

    作为个人 AI 超级计算机,为世界各地的 AI 研究人员、数据科学家和学生提供 NVIDIA Grace Blackwell 平台的强大功
    的头像 发表于 11-21 09:25 537次阅读
    <b class='flag-5'>NVIDIA</b> DGX Spark<b class='flag-5'>助力</b>构建自己的<b class='flag-5'>AI</b>模型

    腾讯地图推出全新时空智能开放平台“盖亚”

    )。 该平台基于腾讯位置服务开放平台与位置大数据平台的底层能力,深度融合腾讯混元大模型与时空动态
    的头像 发表于 09-18 10:26 1764次阅读

    NVIDIA AI助力科学研究领域持续突破

    随着 AI 技术的广泛应用,AI 正在成为科学研究的引擎。NVIDIA 作为重要的技术推手,持续驱动着 AI 系统解锁更多领域的科学突破。
    的头像 发表于 08-05 16:30 958次阅读

    安森美助力NVIDIA AI系统检测实验室

    NVIDIA Halos综合安全系统,将NVIDIA的汽车硬件、软件安全解决方案与其自动驾驶汽车安全领域前沿的AI研究相结合。
    的头像 发表于 07-10 16:21 639次阅读

    NVIDIA AI技术助力欧洲医疗健康行业发展

    从构建全球规模最大的生物多样性数据库,到打造赋能罕见病研究AI 工厂,NVIDIAAI 初创企业生态系统正持续为欧洲医疗健康领域注入创新动能。
    的头像 发表于 06-19 14:40 3173次阅读

    NVIDIA AI如何助力艺术创意落地

    本次 GTC 将在欧洲著名艺术之都巴黎举办,特别策划的艺术画廊将展示 AI 如何助力创意落地,实现技术与灵感碰撞的愿景。
    的头像 发表于 06-12 15:26 797次阅读

    NVIDIA助力解决量子计算领域重大挑战

    NVIDIA 加速量子研究中心提供了强大的工具,助力解决量子计算领域的重大挑战。
    的头像 发表于 03-27 09:17 997次阅读

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    和 Renesas一直致力于推动开源生态的发展,并积极合作打造高效、开放的计算平台。BPI-AI2N & BPI-AI2N Carrier 的发布,不仅为开发者提供了强大的硬
    发表于 03-19 17:54

    Oracle 与 NVIDIA 合作助力企业加速代理式 AI 推理

    Oracle Cloud Infrastructure (OCI) 与 NVIDIA AI Enterprise 软件平台之间的集成,将使 160 多个 AI 工具和 100 多个
    发表于 03-19 15:24 470次阅读
    Oracle 与 <b class='flag-5'>NVIDIA</b> 合作<b class='flag-5'>助力</b>企业加速代理式 <b class='flag-5'>AI</b> 推理

    NVIDIA 推出开放推理 AI 模型系列,助力开发者和企业构建代理式 AI 平台

    月 18 日 ——  NVIDIA 今日发布具有推理功能的开源 Llama Nemotron 模型系列,旨在为开发者和企业提供业务就绪型基础,助力构建能够独立工作或以团队形式完成复杂任务的高级 AI 智能体。
    发表于 03-19 09:31 335次阅读
    <b class='flag-5'>NVIDIA</b> 推出<b class='flag-5'>开放</b>推理 <b class='flag-5'>AI</b> 模型系列,<b class='flag-5'>助力</b>开发者和企业构建代理式 <b class='flag-5'>AI</b> <b class='flag-5'>平台</b>

    借助NVIDIA AI Foundry平台推动医疗健康与生命科学行业发展

    借助 NVIDIA AI Foundry,全球领先的临床研究与商业服务提供商 IQVIA 将为其全球生命科学领域的客户提供 AI 智能体,助力
    的头像 发表于 01-17 09:59 1271次阅读

    NVIDIA推出开放式Llama Nemotron系列模型

    作为 NVIDIA NIM 微服务,开放式 Llama Nemotron 大语言模型和 Cosmos Nemotron 视觉语言模型可在任何加速系统上为 AI 智能体提供强效助力
    的头像 发表于 01-09 11:11 1191次阅读

    NVIDIA发布Cosmos™平台助力物理AI系统发展

    NVIDIA近日宣布推出全新的NVIDIA Cosmos™平台,该平台专为自动驾驶汽车(AV)和机器人等物理AI系统而设计,旨在推动这些领域
    的头像 发表于 01-08 15:36 895次阅读

    NVIDIA推出面向RTX AI PC的AI基础模型

    NVIDIA 今日发布能在 NVIDIA RTX AI PC 本地运行的基础模型,为数字人、内容创作、生产力和开发提供强大助力
    的头像 发表于 01-08 11:01 870次阅读