电子发烧友App

硬声App

扫码添加小助手

加入工程师交流群

0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示
电子发烧友网>电子资料下载>电子论文>模拟数字论文>强化学习在RoboCup带球任务中的应用刘飞

强化学习在RoboCup带球任务中的应用刘飞

2017-03-14 | pdf | 566KB | 次下载 | 1积分

资料介绍

强化学习在RoboCup带球任务中的应用_刘飞

  RoboCup 仿真比赛提供了一个完全分布式控制、实时异步多智能体的环境,通过这个平台,可以测试各种理论、算法和 A- gent 体系结构,在实时异步、有噪声的对抗环境下,研究多智能体之间的合作和对抗问题。仿真比赛在一个标准的计算机环境内进行,采用 Client/Server 方式,参赛队伍编写各自的客户端程序,模拟实际足球队员进行比赛。在 RoboCup 足球机器人仿真中使用强化学习算法必须克服几个问题,如:多维连续的状态空间、噪声的影响、多智能体以及需要实时的动作。在过去的一段时间内,机器学习已经被应用在 RoboCup 的许多的子任务中。本文提出了将 SARSA 算法应用在多智能体(4V3)的带球的任务中,经过一段时间的学习之后, 取得了理想的效果。

强化学习在RoboCup带球任务中的应用刘飞

  强化学习也叫激励学习、评价学习,它是智能体不断的试探和学习的过程,通过这种试探来使系统行为从环境中获得的累积奖赏值最大。其基本的模型如图 1 所示。在强化学习中,设计算法的原则就是把外界环境转化为最大奖励量的方式的动作。智能体并没有被告诉要做什么或者采取哪个动作,而是通过看哪个动作得到了最多的奖励来自己发现。智能体的动作的影响不只是立即得到的奖励,而且还影响接下来的动作和最终的奖励。在强化学习中,环境处于状态集合 S 中的某一状态 s,Agent 选择动作集合 A 中的一个动作 a, 动作 a 作用于环境后会接收到一个即时奖赏 r,若 r 大于 0,则智能体以后产生这个动作的趋势就会加强;反之,智能体产生这个动作的趋势就会减弱。在学习系统的控制行为与环境反馈的状态及评价的反复的相互作用中,以学习的方式不断修改从状态到动作的映射策略,以达到优化系统性能目的。

Robocup
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

下载该资料的人也在下载 下载该资料的人还在阅读
更多 >

评论

查看更多

下载排行

本周

  1. 1MDD品牌三极管MMBT3906数据手册
  2. 2.33 MB  |  次下载  |  免费
  3. 2MDD品牌三极管S9012数据手册
  4. 2.62 MB  |  次下载  |  免费
  5. 3联想flex2-14D/15D说明书
  6. 4.92 MB   |  次下载  |  免费
  7. 4收音环绕扩音机 AVR-1507手册
  8. 2.50 MB   |  次下载  |  免费
  9. 524Pin Type-C连接器设计报告
  10. 1.06 MB   |  次下载  |  免费
  11. 6新一代网络可视化(NPB 2.0)
  12. 3.40 MB  |  次下载  |  免费
  13. 7MS1000TA 超声波测量模拟前端芯片技术手册
  14. 0.60 MB   |  次下载  |  免费
  15. 8MS1022高精度时间测量(TDC)电路数据手册
  16. 1.81 MB   |  次下载  |  免费

本月

  1. 1爱华AIWA HS-J202维修手册
  2. 3.34 MB   |  37次下载  |  免费
  3. 2PC5502负载均流控制电路数据手册
  4. 1.63 MB   |  23次下载  |  免费
  5. 3NB-IoT芯片厂商的资料说明
  6. 0.31 MB   |  22次下载  |  1 积分
  7. 4H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料
  8. 0.63 MB   |  6次下载  |  1 积分
  9. 5UWB653Pro USB口测距通信定位模块规格书
  10. 838.47 KB  |  5次下载  |  免费
  11. 6技嘉H110主板IT8628E_BX IO电路图资料
  12. 2.61 MB   |  4次下载  |  1 积分
  13. 7苏泊尔DCL6907(即CHK-S007)单芯片电磁炉原理图资料
  14. 0.04 MB   |  4次下载  |  1 积分
  15. 8100W准谐振反激式恒流电源电路图资料
  16. 0.09 MB   |  2次下载  |  1 积分

总榜

  1. 1matlab软件下载入口
  2. 未知  |  935137次下载  |  10 积分
  3. 2开源硬件-PMP21529.1-4 开关降压/升压双向直流/直流转换器 PCB layout 设计
  4. 1.48MB  |  420064次下载  |  10 积分
  5. 3Altium DXP2002下载入口
  6. 未知  |  233089次下载  |  10 积分
  7. 4电路仿真软件multisim 10.0免费下载
  8. 340992  |  191439次下载  |  10 积分
  9. 5十天学会AVR单片机与C语言视频教程 下载
  10. 158M  |  183353次下载  |  10 积分
  11. 6labview8.5下载
  12. 未知  |  81602次下载  |  10 积分
  13. 7Keil工具MDK-Arm免费下载
  14. 0.02 MB  |  73822次下载  |  10 积分
  15. 8LabVIEW 8.6下载
  16. 未知  |  65991次下载  |  10 积分