0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种如何自学几种新技巧的机器人

倩倩 来源:互联网分析沙龙 作者:互联网分析沙龙 2020-11-15 10:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

约翰霍普金斯大学的计算机科学家采用一种通常用于教狗坐下和坐下的训练技术,向机器人展示了一种如何自学几种新技巧的机器人,包括堆砌块。通过这种方法,名为Spot的机器人可以在几天内学习通常需要一个月的时间。

通过使用积极强化,这是任何使用过的对待改变狗的行为的人都熟悉的方法,团队极大地提高了机器人的技能,并且很快地完成了训练,使训练现实世界中的机器人成为更可行的企业。这些发现新发表在名为“ Good Robot!”的论文中。

“这里的问题是我们如何让机器人学习技能?”约翰霍普金斯大学计算交互与机器人实验室的博士生安德鲁·洪特说。“我有狗,所以我知道奖励的工作,这就是我设计学习算法的灵感。”

与天生具有高度直觉的大脑的人和动物不同,计算机是空白板,必须从头开始学习一切。但是,真正的学习通常是通过反复试验来完成的,机器人专家仍在研究如何从错误中有效学习。

该团队在这里通过设计一种奖励系统来实现这一目标,该奖励系统可以像对待狗一样对待机器人,为机器人工作。狗可能会因为做得好的工作而得到饼干,而机器人则获得了数字积分。

洪特回忆说,他曾经教过他的小混混小狗叫利亚(Leah)命令“离开它”,这样她就可以无视步行中的松鼠。他使用两种类型的零食,普通的教练零食和更好的东西,例如奶酪。当莉亚兴奋而无所事事时,她一无所有。但是当她冷静下来并移开视线时,她得到了好东西。“那时候我给了她奶酪,然后说,‘离开!好呀!’”

同样,要堆积块,发现机器人需要学习如何专注于建设性行动。当机器人探索积木时,它很快了解到正确的堆叠行为可以赚取高分,而错误的堆叠则不能赚到高分。伸出手,但不理解障碍?没有分数敲一堆?绝对没有分。通过将最后一个区块放在四个区块的堆栈之上,Spot获得了最大的收益。

训练策略不仅有效,而且花了几天的时间来告诉机器人过去需要数周的时间。通过首先训练类似于视频游戏的模拟机器人,然后使用Spot运行测试,该团队能够减少练习时间。

亨特说:“机器人想要更高的分数。”“它可以迅速学习正确的行为以获得最佳回报。实际上,机器人过去通常要花一个月的时间才能达到100%的精度。我们能够在两天内做到这一点。”

积极的强化不仅可以帮助机器人自学积木,而且通过点系统,机器人也可以很快地学会其他几项任务,甚至包括如何玩模拟的导航游戏。在所有情况下都可以从错误中学习,这对于设计一种可以适应新环境的机器人至关重要。

洪特说:“起初,机器人不知道自己在做什么,但是每次练习都会越来越好。它永远不会放弃,并且会不断尝试堆叠,并且能够100%地完成任务。”

该团队认为,这些发现可以帮助训练家用机器人去洗衣服和洗碗-这些任务在公开市场上很流行,并且可以帮助老年人独立生活。它还可以帮助设计改进的自动驾驶汽车。

哈格说:“我们的目标是最终开发出可以在现实世界中完成复杂任务的机器人,例如产品组装,照顾老人和手术。”“我们目前不知道如何编程这样的任务-世界太复杂了。但是像这样的工作向我们表明,机器人可以学习如何以安全且安全的方式完成此类现实任务的想法是有希望的有效的方式。”

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30631

    浏览量

    219759
  • 自动驾驶
    +关注

    关注

    791

    文章

    14682

    浏览量

    176809
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知

    更多"、"互动更流畅"是开发者面临的核心挑战。传统的单屏幕和有限的视觉输入已成为提升机器人智能化水平的瓶颈。而瑞芯微RK3576高性能处理器的出现
    发表于 10-29 16:41

    小萝卜机器人的故事

    代替, LED, 有大佬感兴趣, 起关注和讨论代码, 这个机器人知名度不高, 可是是机器人的原型, 如果开放接口, 定位和无线充电, 也不失为未来的礼物。 让我们为小萝卜工程师的, 自掏腰包救萝卜
    发表于 10-23 05:24

    什么是机器人?追溯机器人技术的演变和未来

    的定义。机器人的定义,真如表面看起来那么简单直白?还是比我们所认为的更为复杂呢? 从本质上讲,机器人一种可编程机器,能够感知、处理信息,并自主或在
    的头像 发表于 10-02 16:32 4191次阅读
    什么是<b class='flag-5'>机器人</b>?追溯<b class='flag-5'>机器人</b>技术的演变和未来

    工业机器人的特点

    机器人是关键。工业互联网是通过端上的数据传输,经过大数据分析和云计算处理,再进行智能化决策的整个过程,其中端的数据传输是基础。工业互联网的端包括机器人、传感器等切线下连接端口。因此
    发表于 07-26 11:22

    盘点#机器人开发平台

    地瓜机器人RDK X5开发套件地瓜机器人RDK X5开发套件产品介绍 旭日5芯片10TOPs算力-电子发烧友网机器人开发套件 Kria KR260机器人开发套件 Kria KR260-
    发表于 05-13 15:02

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    的非常好的,特别是些流程图,很清晰的阐释了概念 很适合作为初学者入门的引路书 还能了解很多技术和框架,破除初学者的自负困境,让初学者知道功能是由很多开发者维护的,前人已经为各种产品搭建了完善的框架。避免陷入得一个人单打独斗的错觉
    发表于 04-30 01:05

    什么是机器人?追踪机器人技术的发展和未来

    个可编程的机器,能够感知,处理信息,并自主或在定程度上的人类指导下执行任务。与传统工具不同,机器人可以适应周围环境,并经常执行重复或危险的工作,让我们有时间从事更具创造性的工作。
    的头像 发表于 04-24 19:21 4084次阅读

    海康机器人布局关节机器人业务

    关节机器人领域迎来位实力选手。继布局移动机器人机器视觉业务后,海康机器人正在拓展新的产品线。
    的头像 发表于 03-20 10:47 1217次阅读

    工业机器人4大控制方式,你知道几种

    目前市场上使用最多的机器人当属工业机器人,也是最成熟完善的一种机器人,而工业机器人能得到广泛应用,得益于它拥有多种控制方式,按作业任务的不同
    的头像 发表于 03-13 10:11 1370次阅读
    工业<b class='flag-5'>机器人</b>4大控制方式,你知道<b class='flag-5'>几种</b>?

    【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

    次生成深度信息。 自主机器人定位任务的本质是对机器人自身状态的估计问题,包括位置,朝向,速度等问题。 路径规划旨在找到从起点到目标区域的路径,确保路径的可行性和最优性。路径规划方法包括变分方法,图搜
    发表于 01-04 19:22

    【「具身智能机器人系统」阅读体验】+两本互为支持的书

    最近在阅读《具身智能机器人系统》这本书的同时,还读了 《计算机视觉之PyTorch数字图像处理》书,这两本书完全可以视为是互为依托的姊妹篇。《计算机视觉之PyTorch数字图像处理》是介绍
    发表于 01-01 15:50

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    的局限性以及衡量大模型的关键指标。阅读了该部分后,我感受到了一种前所未有的震撼,这种震撼不仅来源于技术本身的先进性,更来源于它对传统机器人控制方式的颠覆。 传统机器人的局限性与大模型的变革 传统的
    发表于 12-29 23:04

    【「具身智能机器人系统」阅读体验】1.初步理解具身智能

    、家庭服务机器人等。具身智能机器人技术与市场的融合闭环是自主经济中重要的发展方向之。 具身智能机器人一种能够在没有人类直接控制的情况下自
    发表于 12-28 21:12

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    嵌入式人工智能(EAI)将人工智能集成到机器人等物理实体中,使它们能够感知、学习环境并与之动态交互。这种能力使此类机器人能够在人类社会中有效地提供商品及服务。 数据是一种货币化工具 数据是互联网
    发表于 12-24 00:33

    《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

    意味着在“具身智能”领域,还没有哪个玩家能像O社那样能站在AGI的制高点。 具身智能从字面上拆解为“具身+智能”,指的是一种机器学习算法适配至物理实体,从而与物理世界交互的AI范式。通俗
    发表于 12-19 22:26