0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

美国陆军研发了一种高效的地面机器人学习模型

姚小熊27 来源:人工智能实验室 作者:人工智能实验室 2021-01-06 09:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

美国陆军面向未来多域作战概念研发了一种高效的地面机器人学习模型,该模型提出基于强化学习的策略,可有效减少当前训练强化学习策略的不可预测性,使自主智能体能够推理并适应不断变化的战场条件。

强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏。强化学习技术具备解决复杂问题的能力,近年来在如围棋、象棋和电子游戏等领域有较为长足的发展。美国陆军将这种强化学习技术应用在地面机器人面临着两个巨大挑战。首先是算法的限制。在强化学习中,策略梯度方法(Policy Gradient Methods)是连续空间可伸缩算法的基础,但是现有技术无法支持更广泛的决策目标,例如风险敏感性、安全约束、对先验知识的探索和发散。其次就是数据量的问题。强化学习需要大量的样本复杂性,而美国陆军多域作战概念和下一代战斗车辆(NGCV)项目目前数据匮乏并不支持现有训练机制。

在陆军多域作战概念和NGCV项目中应用强化学习,训练机制必须提高连续空间中的样本效率和可靠性,ARL通过将现有的策略搜索方案推广到通用工具,取得了重要突破。研究人员为通用程序开发了新的策略搜索方案,并且还确定了其样本复杂度。由此产生的策略搜索方案减少了奖励积累的波动性,形成了对未知领域的有效探索和先验的机制。值得注意的是,地面机器人获取数据的成本很高。减少奖励积累的波动性,确保以有效的方式探索未知领域,或者吸收以前的经验,都将有助于打破强化学习中现行实践的样本效率壁垒。通过减少随机抽样的数量,可以实现策略优化。

这项研究为强化学习中的经典策略梯度定理做出了贡献。装备有强化学习功能的自主机器人将能够协助战士在未来战场上进行侦察探索和风险评估。研究人员下一步计划在强化学习中将更广泛的决策目标纳入多主体设置,并研究强化学习主体之间的交互设置如何在团队之间产生协同和对抗性推理。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30600

    浏览量

    219655
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA开源物理引擎与OpenUSD加速机器人学习

    开发能在工厂、医院和公共空间与人类协同作业的机器人项巨大的技术挑战。这类机器人需具备与人类接近的灵巧性、感知能力、认知能力和全身协调性,以便于实时应对充满不确定性的真实环境。
    的头像 发表于 10-13 11:15 664次阅读

    NVIDIA 发布三大利器,推动人形机器人迈向新纪元

    电子发烧友网综合报道 在节前的机器人学习大会(CoRL)上,NVIDIA 发布了系列突破性技术,包括开源物理引擎 Newton、机器人基础模型 Isaac GROOT N1.6以及全
    的头像 发表于 10-13 04:42 5428次阅读

    易控智驾与中科院端到端自动驾驶方案入选CoRL 2025

    近日,旨在分享和探讨机器人技术与机器学习交叉领域最新进展的国际顶级机器人学习会议CoRL 2025 (Conference on Robot Learning)论文接收结果揭晓。
    的头像 发表于 08-18 14:43 2144次阅读
    易控智驾与中科院端到端自动驾驶方案入选CoRL 2025

    NVIDIA展示机器人领域的研究成果

    在今年的机器人科学与系统会议 (RSS) 上,NVIDIA 研究中心展示了系列推动机器人学习的研究成果,展示了在仿真、现实世界迁移和决策制定领域的突破。
    的头像 发表于 07-23 10:43 1119次阅读

    通过NVIDIA Cosmos模型增强机器人学习

    通用机器人的时代已经到来,这得益于机械电子技术和机器人 AI 基础模型的进步。但目前机器人技术的发展仍面临个关键挑战:
    的头像 发表于 07-14 11:49 766次阅读
    通过NVIDIA Cosmos<b class='flag-5'>模型</b>增强<b class='flag-5'>机器人学习</b>

    构建人形机器人学习的合成运动生成流程

    通用人形机器人需要能够快速适应现有的以人类为中心的城市和工业工作空间,处理繁琐、重复或体力要求高的任务。这些移动机器人经过设计,能在以人类为中心的环境中有出色的表现,从工厂车间到医疗医疗机构,它们的价值日益凸显。
    的头像 发表于 04-10 09:36 1001次阅读
    构建人形<b class='flag-5'>机器人学习</b>的合成运动生成流程

    深度解读英伟达Newton机器人平台:技术革新与跨界生态构建

    的基础上,它使机器人能够学习如何以更高的精度处理复杂的任务,与MuJoCo Playground或 NVIDIA Isaac Lab 等学习框架兼容,这是个开源的
    的头像 发表于 03-20 15:15 2470次阅读
    深度解读英伟达Newton<b class='flag-5'>机器人</b>平台:技术革新与跨界生态构建

    机器人Blue亮相 搭载英伟达最新GR00T N1人形机器人通用基础模型

    GR00T N1以及新的数据生成和机器人学习框架,我们将共同开启AI时代的新边疆。” 黄仁勋还强调其泛化能力和多任务执行潜力‌。 机器人Blue由英伟达公司、谷歌DeepMind、迪士尼联合开发,行走动作流畅自然,声音设计可爱,具备拟人化交互表现‌很好。 
    的头像 发表于 03-20 10:50 1670次阅读
    <b class='flag-5'>机器人</b>Blue亮相 搭载英伟达最新GR00T N1人形<b class='flag-5'>机器人</b>通用基础<b class='flag-5'>模型</b>

    AgiBot World Colosseo:构建通用机器人智能的规模化数据平台

    数据的匮乏,制约了通用操纵能力的突破。上海人工智能实验室与AgiBot公司联合研发的AgiBot World Colosseo平台,通过构建大规模、多模态的真实世界数据集与通用政策模型,为机器人学习
    的头像 发表于 03-12 11:42 1696次阅读
    AgiBot World Colosseo:构建通用<b class='flag-5'>机器人</b>智能的规模化数据平台

    构建人形机器人学习的合成运动生成管线

    通用人形机器人旨在快速适应现有的以人类为中心的城市和工业工作空间,处理繁琐、重复或体力要求高的任务。这些移动机器人经过设计,能在以人类为中心的环境中有出色的表现,从工厂车间到医疗保健机构,它们的价值日益凸显。
    的头像 发表于 01-16 10:58 1700次阅读
    构建人形<b class='flag-5'>机器人学习</b>的合成运动生成管线

    【「具身智能机器人系统」阅读体验】2.具身智能机器人模型

    的局限性以及衡量大模型的关键指标。阅读了该部分后,我感受到了一种前所未有的震撼,这种震撼不仅来源于技术本身的先进性,更来源于它对传统机器人控制方式的颠覆。 传统机器人的局限性与大
    发表于 12-29 23:04

    【「具身智能机器人系统」阅读体验】1.初步理解具身智能

    工智能 认知发展机器人学 进化机器人学 物理体现与互动 五、具身智能的现代技术方向 另外,随着GPT等大语言模型的发展,这些技术也在具身智能机器人领域掀起了
    发表于 12-28 21:12

    【「具身智能机器人系统」阅读体验】1.全书概览与第学习

    非常感谢电子发烧友提供的这次书籍测评活动!最近,我一直在学习模型和人工智能的相关知识,深刻体会到机器人技术是个极具潜力的未来方向,甚至可以说是推动时代变革的重要力量。能参与这次活动
    发表于 12-27 14:50

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    医疗领域,手术辅助机器人需要毫米级的精确控制,书中有介绍基于视觉伺服的实时控制算法,以及如何利用大模型优化手术路径规划。工业场景中,协作机器人面临的主要挑战是快速适应新工艺流程。具身智能通过在线
    发表于 12-24 15:03

    【「具身智能机器人系统」阅读体验】+初品的体验

    动态互动的。 该理论强调智能行为源于智能体的物理存在和行为能力,智能体必须具备感知环境并在其中执行任务的能力。具身智能的实现涵盖了机器学习、人工智能、机器人学、计算机视觉、自然语言处理及强化
    发表于 12-20 19:17