0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

美国陆军研发了一种高效的地面机器人学习模型

姚小熊27 来源:人工智能实验室 作者:人工智能实验室 2021-01-06 09:20 次阅读

美国陆军面向未来多域作战概念研发了一种高效的地面机器人学习模型,该模型提出基于强化学习的策略,可有效减少当前训练强化学习策略的不可预测性,使自主智能体能够推理并适应不断变化的战场条件。

强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏。强化学习技术具备解决复杂问题的能力,近年来在如围棋、象棋和电子游戏等领域有较为长足的发展。美国陆军将这种强化学习技术应用在地面机器人面临着两个巨大挑战。首先是算法的限制。在强化学习中,策略梯度方法(Policy Gradient Methods)是连续空间可伸缩算法的基础,但是现有技术无法支持更广泛的决策目标,例如风险敏感性、安全约束、对先验知识的探索和发散。其次就是数据量的问题。强化学习需要大量的样本复杂性,而美国陆军多域作战概念和下一代战斗车辆(NGCV)项目目前数据匮乏并不支持现有训练机制。

在陆军多域作战概念和NGCV项目中应用强化学习,训练机制必须提高连续空间中的样本效率和可靠性,ARL通过将现有的策略搜索方案推广到通用工具,取得了重要突破。研究人员为通用程序开发了新的策略搜索方案,并且还确定了其样本复杂度。由此产生的策略搜索方案减少了奖励积累的波动性,形成了对未知领域的有效探索和先验的机制。值得注意的是,地面机器人获取数据的成本很高。减少奖励积累的波动性,确保以有效的方式探索未知领域,或者吸收以前的经验,都将有助于打破强化学习中现行实践的样本效率壁垒。通过减少随机抽样的数量,可以实现策略优化。

这项研究为强化学习中的经典策略梯度定理做出了贡献。装备有强化学习功能的自主机器人将能够协助战士在未来战场上进行侦察探索和风险评估。研究人员下一步计划在强化学习中将更广泛的决策目标纳入多主体设置,并研究强化学习主体之间的交互设置如何在团队之间产生协同和对抗性推理。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    206

    文章

    27043

    浏览量

    201423
收藏 人收藏

    评论

    相关推荐

    现代战场中地面机器人的应用与影响

    人工智能(AI)可以不断提升自主机器人的能力,这意味着地面机器人越来越有能力与人类并肩执行任务。到2030年,预计全球无人地面车辆的数量将从目前的1.5万辆增长到4万辆。
    发表于 04-20 09:19 102次阅读

    NVIDIA Isaac机器人平台升级,加速AI机器人技术革新

    NVIDIA Isaac机器人平台近期实现重大升级,通过引入最新的生成式AI技术和先进的仿真技术,显著加速了AI机器人技术的发展步伐。该平台正不断扩展其基础模型机器人学习框架、AI工
    的头像 发表于 03-27 10:36 200次阅读

    机器人学习中主流智能抓取方案

    RGB颜色空间由红绿蓝三种基本色组成,叠加成任意色彩,同样地,任意一种颜色也可以拆解为三种基本色的组合,机器人通过颜色坐标值来理解“颜色”。
    发表于 03-13 10:07 103次阅读
    <b class='flag-5'>机器人学习</b>中主流智能抓取方案

    机器人基于开源的多模态语言视觉大模型

    ByteDance Research 基于开源的多模态语言视觉大模型 OpenFlamingo 开发了开源、易用的 RoboFlamingo 机器人操作模型,只用单机就可以训练。
    发表于 01-19 11:43 127次阅读
    <b class='flag-5'>机器人</b>基于开源的多模态语言视觉大<b class='flag-5'>模型</b>

    LabVIEW的六轴工业机器人运动控制系统

    LabVIEW开发六轴工业机器人运动控制系统 本项目开发了高效的工业机器人控制系统,重点关注于运动学算法和轨迹规划算法的实现和测试。La
    发表于 12-21 20:03

    如何创建机器人模型

    完整机器人模型 所有的link和joint标签完成了对机器人每个部分的描述和组合,全都放在一个robot标签中,就形成了完整的机器人模型
    的头像 发表于 11-22 17:09 386次阅读
    如何创建<b class='flag-5'>机器人</b><b class='flag-5'>模型</b>

    目前几种主流的机器人智能抓取系统方案

    机器人学习中的经典问题之一便是分拣:在一堆无序摆放的物品堆中,取出目标物品。
    的头像 发表于 11-14 14:20 972次阅读
    目前几种主流的<b class='flag-5'>机器人</b>智能抓取系统方案

    Eureka!NVIDIA 研究突破为机器人学习注入新动力

    AI 智能体利用 LLM 自动生成奖励算法,训练机器人完成复杂任务。 NVIDIA Research 开发的一款名为 Eureka 的新型 AI 智能体可以教机器人复杂的技能,它教会了机器人
    的头像 发表于 10-25 15:55 131次阅读
    Eureka!NVIDIA 研究突破为<b class='flag-5'>机器人学习</b>注入新动力

    Eureka!NVIDIA 研究突破为机器人学习注入新动力

    AI 智能体利用 LLM 自动生成奖励算法,训练机器人完成复杂任务。     NVIDIA Research 开发的一款名为 Eureka 的新型 AI 智能体可以教机器人复杂的技能,它教会了机器人
    发表于 10-24 09:48 147次阅读
    Eureka!NVIDIA 研究突破为<b class='flag-5'>机器人学习</b>注入新动力

    利用Arduino让机器人学会识别标识并作出行为

    教你用Arduino让机器人学会识别标识并作出行为。你的人工智能小车从此有了眼睛!材料单:跟踪机器人底盘视觉传感器Arduino Uno电动机驱动板18650 Li-离子电池
    发表于 09-27 07:36

    机器学习模型评估指标

    机器学习模型指标在机器学习建模过程中,针对不同的问题,需采用不同的模型评估指标。
    发表于 09-06 12:51 452次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>模型</b>评估指标

    机器人学科建设沙盘套件!智慧农业3D分拣套装详解

    作为最热门的技术领域,机器人技术正在彻底改变产业,并推动全球的创新。为了满足这个快速发展的领域对技术人才日益增长的需求,开发了一个开创性的机器人教育解决方案。这个创新的解决方案将自动化水果采摘
    的头像 发表于 06-30 18:02 323次阅读
    <b class='flag-5'>机器人学</b>科建设沙盘套件!智慧农业3D分拣套装详解

    将工业机器人装配任务从仿真转为现实

    仿真是帮助机器人学习感知(从摄像机图像中了解世界)、规划(制定解决问题的行动序列)和控制(产生改变机器人位置和方向的电机指令)等新技能的一个必要工具。
    发表于 06-08 15:44 255次阅读
    将工业<b class='flag-5'>机器人</b>装配任务从仿真转为现实

    机器人如何计算简单的运动

    模型要具备齿轮,导轨几种基本的运动原理。 要分辨基本图形,视觉模型要能分辨圆形,方形和三角形。 有了这两点,机器人就基本上能计算开模和注塑这种简单的工作了。要替代人类的工作,还要进
    发表于 05-19 20:40

    浅谈儿童陪护机器人

    具有高效、稳定的特点,在儿童陪护机器人领域也得到了广泛应用。 对于儿童陪护机器人的设计者来说,TB6560AHQ是一种高性能、低噪音的双路步进电机驱动器芯片。其主要特点包括内置双路H桥
    发表于 05-11 15:12