0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个基于TF2.0的强化学习训练工具

电子工程师 来源:lq 2019-02-25 09:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,Github 一位开发者 danaugrs 开源了一个新项目——Huskarl,一个专注研究和快速原型的深度强化学习框架。

此框架基于 TensorFlow 2.0 构建,使用了 tf.keras API,保证了其简洁性和可读性。Huskarl 可以使多环境的并行计算变得很容易,这将对加速策略学习算法(比如 A2C 和 PPO)非常有用。此外,Huskarl 还可以与 OpenAI Gym 环境无缝结合,并将计划支持多代理环境和 Unity3D 环境。

OpenAI Gym:2016 年 OpenAI 发布的一个可以开发、对比强化学习算法的工具包,提供了各种环境、模拟任务等,任何人都可以在上面训练自己的算法。

Unity3D:一个全面整合的专业游戏引擎,由 Unity Technologies 开发的一款可以让玩家轻松创建三维视频游戏、实时三维动画等类型互动内容的多平台综合型游戏开发工具。

目前,Huskarl 已经支持了 DQN(Deep Q-Learning Network)、Multi-step DQN、Double DQN、A2C(Advantage Actor-Critic)等算法,还有 DDPG(Deep Deterministic Policy Gradient)、PPO(Proximal Policy Optimization)、Curiosity-Driven Exploration 等算法在计划中。

最重要的是,TF 2.0 的 nightly 已经发布,这个开源工具也是基于 TF2.0 开发的,所以大家要先安装一下 tf 2.0 nighty 版本。除此之外,还需要安装以下工具和环境:

这个工具还是新鲜出炉烫手的呢,大家赶紧来尝鲜试一下~

地址:

https://github.com/danaugrs/huskarl

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 强化学习
    +关注

    关注

    4

    文章

    269

    浏览量

    11909
  • tensorflow
    +关注

    关注

    13

    文章

    332

    浏览量

    61870
  • 开源工具
    +关注

    关注

    0

    文章

    27

    浏览量

    4737

原文标题:新鲜开源:基于TF2.0的深度强化学习平台

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA 推出 Nemotron 3 系列开放模型

    token 数。 ● Nemotron 通过先进的强化学习技术以及大规模并行多环境后训练,实现了卓越的准确率。 ● NVIDIA 率先推出整套前沿的开放模型、训练数据集及强化学习环境
    的头像 发表于 12-16 09:27 169次阅读
    NVIDIA 推出 Nemotron 3 系列开放模型

    如何训练好自动驾驶端到端模型?

    [首发于智驾最前沿微信公众号]最近有位小伙伴在后台留言提问:端到端算法是怎样训练的?是模仿学习强化学习和离线强化学习这三类吗?其实端到端(end-to-end)算法在自动驾驶、智能体
    的头像 发表于 12-08 16:31 1009次阅读
    如何<b class='flag-5'>训练</b>好自动驾驶端到端模型?

    今日看点:智元推出真机强化学习;美国软件公司SAS退出中国市场

    智元推出真机强化学习,机器人训练周期从“数周”减至“数十分钟”   近日,智元机器人宣布其研发的真机强化学习技术,已在与龙旗科技合作的验证产线中成功落地。据介绍,此次落地的真机强化学习
    发表于 11-05 09:44 921次阅读

    自动驾驶中常提的“强化学习”是啥?

    下,就是智能体在环境里行动,它能观察到环境的些信息,并做出动作,然后环境会给出
    的头像 发表于 10-23 09:00 356次阅读
    自动驾驶中常提的“<b class='flag-5'>强化学习</b>”是<b class='flag-5'>个</b>啥?

    沐曦助力上海创智学院siiRL 2.0全面升级

    在人工智能加速迈向大模型与智能体时代的今天,强化学习(Reinforcement Learning,RL)已经成为推动智能系统演化的关键技术。
    的头像 发表于 09-29 11:38 585次阅读
    沐曦助力上海创智学院siiRL <b class='flag-5'>2.0</b>全面升级

    如何在Ray分布式计算框架下集成NVIDIA Nsight Systems进行GPU性能分析

    在大语言模型的强化学习训练过程中,GPU 性能优化至关重要。随着模型规模不断扩大,如何高效地分析和优化 GPU 性能成为开发者面临的主要挑战之
    的头像 发表于 07-23 10:34 2070次阅读
    如何在Ray分布式计算框架下集成NVIDIA Nsight Systems进行GPU性能分析

    NVIDIA Isaac Lab可用环境与强化学习脚本使用指南

    Lab 是适用于机器人学习的开源模块化框架,其模块化高保真仿真适用于各种训练环境,Isaac Lab 同时支持模仿学习(模仿人类)和
    的头像 发表于 07-14 15:29 1903次阅读
    NVIDIA Isaac Lab可用环境与<b class='flag-5'>强化学习</b>脚本使用指南

    【书籍评测活动NO.62】本书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘

    时的基本礼仪和清晰度; 第二次是在强化学习之后 ,收集在训练中表现优秀的解题示例,再混合些人工整理的题目,重新训练模型。通过这样的流程,DeepSeek-R1 就像
    发表于 06-09 14:38

    在阿里云PAI上快速部署NVIDIA Cosmos Reason-1模型

    NVIDIA 近期发布了 Cosmos Reason-1 的 7B 和 56B 两款多模态大语言模型 (MLLM),它们经过了“物理 AI 监督微调”和“物理 AI 强化学习”两阶段的训练。其中
    的头像 发表于 06-04 13:43 717次阅读

    18常用的强化学习算法整理:从基础方法到高级模型的理论技术与代码实现

    本来转自:DeepHubIMBA本文系统讲解从基本强化学习方法到高级技术(如PPO、A3C、PlaNet等)的实现原理与编码过程,旨在通过理论结合代码的方式,构建对强化学习算法的全面理解。为确保内容
    的头像 发表于 04-23 13:22 1338次阅读
    18<b class='flag-5'>个</b>常用的<b class='flag-5'>强化学习</b>算法整理:从基础方法到高级模型的理论技术与代码实现

    恩智浦eIQ Time Series Studio工具使用教程之模型训练

    大家好,eIQ Time SeriesStudio又和大家见面啦!本章为大家带来工具核心部分-模型训练
    的头像 发表于 03-25 15:25 1457次阅读
    恩智浦eIQ Time Series Studio<b class='flag-5'>工具</b>使用教程之模型<b class='flag-5'>训练</b>

    无法转换TF OD API掩码RPGA模型怎么办?

    无法转换重新训练TF OD API 掩码 RPGA 模型,该模型使用以下命令在 GPU 上工作: mo > --saved_model_dir
    发表于 03-06 06:44

    详解RAD端到端强化学习训练范式

    受限于算力和数据,大语言模型预训练的 scalinglaw 已经趋近于极限。DeepSeekR1/OpenAl01通过强化学习训练涌现了强大的推理能力,掀起新轮技术革新。
    的头像 发表于 02-25 14:06 1046次阅读
    详解RAD端到端<b class='flag-5'>强化学习</b>后<b class='flag-5'>训练</b>范式

    浅谈适用规模充电站的深度学习有序充电策略

    应用强化学习算法求解电动汽车有序充电策略,可以有效减少充电场站的充电成本,同时使模型训练难度不受电动汽车规模影响。
    的头像 发表于 02-08 15:00 830次阅读
    浅谈适用规模充电站的深度<b class='flag-5'>学习</b>有序充电策略

    tf卡存储容量选择 tf卡的常见故障及解决方法

    TF卡存储容量选择 TF卡(TransFlash卡)是种小型的存储卡,广泛应用于手机、相机、平板电脑等便携式设备中。选择合适的TF卡存储容量,需要考虑以下几个因素: 设备兼容性 :首
    的头像 发表于 12-19 15:20 4414次阅读