0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook让机器人学会了自主绕道走路

Hf1h_BigDataDig 来源:fqj 2019-06-06 14:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人类每天都在进行不同层次的规划活动,比如说每天早上起床以后,你习惯性走到厨房喝一杯咖啡:你会先走下走廊,左转进入过道,然后进入右边的房间。

对于这些习惯成自然的流程,你无需思考,不会刻意去想你要使用哪一个肢体动作。但对于机器人而言,这并非易事。

Facebook刚刚发布了主导研究的新系统,让机器人也可以通过观看视频,拆解动作,并学习如何组合这些动作形成自己的规划。

层级抽象结构(hierarchal abstractions)

已经有越来越多的研究表明,层级抽象结构(即视觉运动子程序)可以提高强化学习中的采样效率,这是一种利用奖励驱动智能体达到目标的AI训练技术。

在过去,这些层次结构必须通过端到端的训练来手动编码或获取,而这需要大量的时间、注意力和长久的耐心。

Facebook这次的新研究提出,刻意让机器人通过观看视频学习导航,描述一个通过用逆向机器学习模型摄取视频伪标签(在本文中,伪标签指智能体想象的行为),从而学习层次结构的系统。

论文作者分别来自Facebook AI研究室,加州大学伯克利分校和伊利诺伊大学厄巴纳—香槟分校。

这让人想起去年Facebook开源的一组模型——Talk the Walk。它只需要360°的全景图像、自然语言以及一张有当地地标(比如银行和餐馆)的地图就可以通过问路,实现在整个纽约市的街道导航。

具体实现方式

机器人通过观看这些视频,研究这些简单的视觉运动子程序是如何组合以达到高级的抽象层次,这些视觉运动子程序能够解决一些已知问题,即经典的规划中的高计算成本和强化学习中的样本复杂性的问题。

研究者提出的系统分为两个阶段,在第一阶段,研究人员通过运行在随机探索数据上自我监督的智能体模型生成伪标签。模型从分布在四个环境中的1500个不同位置学习,在不同的位置随机执行30个不同步骤的动作,从而产生45,000个交互样本。

在系统的第二阶段,大约217,000个伪标记视频被剪辑成220万个单独的小视频,再将其输入预测参考视频中相应动作的模型,同时再通过一个单独的网络检查参考视频中的动作序列,并编码其行为作为向量。另一个模型通过推断第一帧的轨迹的编码,来预测哪一个子程序可以调用给已有的视频帧。

交互样本从1000万减少到4.5万

在一个部署在办公环境的真实世界中的机器人实验中,研究人员表明,相比单纯交互的方法,至少应用在之前从未见过的环境上,通过观看视频来学习技能(这里指采用最高效的方式前往目标位置)的方式能达到更好的效果。

最令人印象深刻的是,训练有素的模型学会了自主地前进导航并避开障碍物,比通过单纯交互方式要快4倍,这使得机器人能够做到完全自主地长距离行进。

“特别引人注目的是,这些模型从总计45,000次的环境交互中学习,”研究人员写道,“从第一视角的视频中成功学习,使得智能体能够执行连贯的轨迹,即使它只执行过随机动作。此外,它优于最先进的技能学习技术,该技术需要更大量的训练样本,大致1000万个。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30580

    浏览量

    219518
  • Facebook
    +关注

    关注

    3

    文章

    1432

    浏览量

    58336

原文标题:Facebook让机器人“观看”上万次视频后,TA学会了自主绕道走路

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    共筑智能教育新生态,维视智造亮相“科技赋能智创未来”论坛

    2025年11月1日,西安市人工智能机器人学会“科技赋能智创未来”论坛在西安文理学院顺利召开。作为学会理事单位、西安市智能制造产学研合作联盟首批签约企业,陕西维视智造股份有限公司受邀参加。
    的头像 发表于 11-05 11:38 81次阅读
    共筑智能教育新生态,维视智造亮相“科技赋能智创未来”论坛

    NVIDIA开源物理引擎与OpenUSD加速机器人学

    开发能在工厂、医院和公共空间与人类协同作业的机器人是一项巨大的技术挑战。这类机器人需具备与人类接近的灵巧性、感知能力、认知能力和全身协调性,以便于实时应对充满不确定性的真实环境。
    的头像 发表于 10-13 11:15 660次阅读

    NVIDIA 发布三大利器,推动人形机器人迈向新纪元

    电子发烧友网综合报道 在节前的机器人学习大会(CoRL)上,NVIDIA 发布了一系列突破性技术,包括开源物理引擎 Newton、机器人基础模型 Isaac GROOT N1.6以及全新 AI
    的头像 发表于 10-13 04:42 5418次阅读

    英伟达发布机器人 “新大脑”,黄仁勋:人形机器人三年普及

    完成如 “烤面包” 这样的复杂任务。结合 Omniverse 仿真平台,训练效率提高了10倍,大大缩短了机器人学习和适应现实环境的时间。 英伟达创始人兼首席执行官黄仁勋在链博会上发表演讲时指出,物理 AI 将推动 AI 从虚拟世界迈向实体领域,重构工业和日常生活
    的头像 发表于 08-25 18:34 298次阅读

    全球首次!人形机器人 24 小时自主行走

    电子发烧友网综合报道 近日,智元机器人宣布,该公司旗下的人形机器人 “远征 A2” 完成了一场全球首次的 24 小时高温环境下全自主行走挑战。   挑战于 8 月 17 日 8:20 开始,持续至
    发表于 08-25 08:29 1774次阅读

    NVIDIA展示机器人领域的研究成果

    在今年的机器人科学与系统会议 (RSS) 上,NVIDIA 研究中心展示了一系列推动机器人学习的研究成果,展示了在仿真、现实世界迁移和决策制定领域的突破。
    的头像 发表于 07-23 10:43 1106次阅读

    通过NVIDIA Cosmos模型增强机器人学

    通用机器人的时代已经到来,这得益于机械电子技术和机器人 AI 基础模型的进步。但目前机器人技术的发展仍面临一个关键挑战:机器人需要大量的训练数据来掌握诸如组装和检查之类的技能,而手动演
    的头像 发表于 07-14 11:49 753次阅读
    通过NVIDIA Cosmos模型增强<b class='flag-5'>机器人学</b>习

    NVIDIA Isaac Sim与NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了机器人仿真参考应用 NVIDIA Isaac Sim 和机器人学习框架 NVIDIA Isaac Lab 的更新,以加速各种形态机器人的开发。
    的头像 发表于 05-28 10:06 1751次阅读

    【「# ROS 2智能机器人开发实践」阅读体验】+ROS2应用案例

    地图构建,包括算法原理介绍、安装与配置方法、仿真环境中的SLAM以及真实机器人上的SLAM。 这一过程不仅涉及到计算机视觉和机器人学的知识,还需要对ROS 2的节点管理和数据处理有一定的了解。通过实践
    发表于 04-27 11:42

    构建人形机器人学习的合成运动生成流程

    通用人形机器人需要能够快速适应现有的以人类为中心的城市和工业工作空间,处理繁琐、重复或体力要求高的任务。这些移动机器人经过设计,能在以人类为中心的环境中有出色的表现,从工厂车间到医疗医疗机构,它们的价值日益凸显。
    的头像 发表于 04-10 09:36 987次阅读
    构建人形<b class='flag-5'>机器人学</b>习的合成运动生成流程

    深度解读英伟达Newton机器人平台:技术革新与跨界生态构建

    Newton是由NVIDIA、Google DeepMind和Disney Research开发的开源、可扩展的物理引擎,旨在推进机器人学习和开发。 Newton建立在 NVIDIA Warp
    的头像 发表于 03-20 15:15 2457次阅读
    深度解读英伟达Newton<b class='flag-5'>机器人</b>平台:技术革新与跨界生态构建

    构建人形机器人学习的合成运动生成管线

    通用人形机器人旨在快速适应现有的以人类为中心的城市和工业工作空间,处理繁琐、重复或体力要求高的任务。这些移动机器人经过设计,能在以人类为中心的环境中有出色的表现,从工厂车间到医疗保健机构,它们的价值日益凸显。
    的头像 发表于 01-16 10:58 1672次阅读
    构建人形<b class='flag-5'>机器人学</b>习的合成运动生成管线

    【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

    具身智能机器人的基础模块,这个是本书的第二部分内容,主要分为四个部分:机器人计算系统,自主机器人的感知系统,自主机器人的定位系统,自主机器人
    发表于 01-04 19:22

    【「具身智能机器人系统」阅读体验】1.初步理解具身智能

    工智能 认知发展机器人学 进化机器人学 物理体现与互动 五、具身智能的现代技术方向 另外,随着GPT等大语言模型的发展,这些技术也在具身智能机器人领域掀起了一股浪潮,那就是基于大模型的具身智能技术
    发表于 12-28 21:12

    【「具身智能机器人系统」阅读体验】+初品的体验

    动态互动的。 该理论强调智能行为源于智能体的物理存在和行为能力,智能体必须具备感知环境并在其中执行任务的能力。具身智能的实现涵盖了机器学习、人工智能、机器人学、计算机视觉、自然语言处理及强化学习等领域
    发表于 12-20 19:17