0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个开源的低成本机器人学习平台ROBEL

机器人技术与应用 来源:机器人技术与应用 2019-11-25 11:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

为了让机器人研究走向大众,加州大学伯克利分校(UC Berkeley)和谷歌大脑的研究人员提出了一个开源的低成本机器人学习平台ROBEL(RoboticsBenchmarks for Learning with Low-Cost Robots)。

ROBEL可以作为快速实验平台,支持各种实验需求,以及新的强化学习和控制方法的开发,同时提供主要用于促进现实世界物理硬件研究和开发的基准任务。其由D’Claw和D'Kitty组成,D'Claw是一个有三只手臂的机械臂型机器人,可以帮助学习灵巧的操作任务;D'Kitty是一个有四条腿的机器人,可以帮助学习灵活的腿部运动任务。该机器人平台具有低成本、模块化、可靠性高、易于维护等特点,并且功能强大,可支持基于硬件的强化学习。

图中左:十二自由度D'Kitty;中:9 自由度D'Claw;右:功能齐全的D'Claw 装置D’Lantern。

为了使机器人成本便宜和易于构建,研究人员基于现成的组件和常见的原型工具(3D打印或激光切割)设计了ROBEL。该设计很容易组装,只需要几个小时即可构建。

为了使机器人成本低且易于构建,研究人员基于现成的组件和常用的原型制作工具(3D打印或激光切割)设计出ROBEL,并提供详细的零件清单、组装说明和入门软件说明。ROBEL设计易于组装,仅需几个小时即可构建。

谷歌设计了一套对 D’Claw和D’Kitty两个平台都适用的任务,可用于对现实世界的机器人学习进行基准测试。ROBEL的任务定义包括密集和稀疏任务目标,并在任务定义中引入硬件安全指标,例如,指示关节是否超过“安全”操作界限或作用力阈值。此外,ROBEL还为所有任务提供模拟器,以促进算法开发和快速原型设计。D’Claw 任务主要围绕三种常见的操作行为展开:摆形(Pose)、旋转(Turn)和拧(Screw);D’Kitty任务主要围绕三种常见的移动行为——站立、定向和行走展开。针对这些基准任务,研究人员评估了几种深度强化学习方法,评估结果和最终策略被作为baseline包含在软件包中以供比较。

ROBEL平台支持直接的硬件训练,迄今已积累了超过1.4万h的实际经验。为了确保平台和基准方法的可重复性,研究人员通过两个不同的实验室分别对ROBEL进行了研究,本研究仅使用软件分发和文档、不允许亲自访问,利用ROBEL的设计文档和组装说明,两者都可以复制两个硬件平台。基准任务训练在两个实验室分别构建的机器人上进行,实验表明,在两个不同地点打造的两个D'Claw机器人,它们不仅训练进度相似,而且最终收敛到了相同的性能,这说明ROBEL基准具备良好的可重复性。

ROBEL在各种强化学习研究中都非常有用。D’Claw平台是完全自主的,可以在很长一段时间内维持实验的可靠性,而且可以使用刚性和柔性对象的各种强化学习范例和任务改进实验。重要的是,D'Claw平台是高度模块化的,而且具备高度可重复性,便于进行扩展实验。通过扩展设置,研究人员发现多个D'Claws可以通过共享经验更快地对任务进行集体学习,通过共享SAC的分布式版本的硬件训练流程,其可以面向多个目标任务实现任意角度的结合。在多任务定制中,完成五个任务只需要单个任务经验的2倍时间即可。

同时,研究人员成功地在D’Kitty平台上部署了强大的移动策略,比如,D'Kitty可以在“盲眼”条件下在室内和室外地形上稳定行走,展现了步态的稳健性。

具体而言,在杂乱的室内环境行走时,通过MuJoCo模拟通过自然策略梯度训练的Sim2Real策略,机器人可以在随机扰动的条件下实现行走,并跨过障碍物;在布满碎石和树枝的室外环境行走时,通过自然策略梯度在MuJoCo模拟中训练的Sim2Real策略具有随机的高度场,机器人可以学习在分布着碎石和树枝的户外环境中行走;在室外斜坡和草丛环境中,通过自然策略梯度在MuJoCo模拟中训练的Sim2Real策略具有随机高度场,机器人可以学习在缓坡上行走。

当D’Kitty收到有关其躯干和场景中目标的信息时,其可以学会与表现出复杂行为的目标进行交互。比如,通过HierarchicalSim2Real训练的策略可以学习躲避移动障碍物,到达目标位置;通过Hierarchical Sim2Real训练的策略学习将目标推向移动目标(由手中的控制器标记);双机器人协同-通过Hi-Herarchical Sim2Real训练的策略,可以学习协调两个D'Kitty机器人,将沉重的障碍物推向目标位置。

总之,ROBEL可以满足新兴的基于学习范式的需求,这些范式需要高度的可扩展性和弹性。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30580

    浏览量

    219540
  • 3D打印
    +关注

    关注

    27

    文章

    3624

    浏览量

    116542

原文标题:加州大学伯克利分校和谷歌大脑联合推出低成本机器人训练平台

文章出处:【微信号:robotmagazine,微信公众号:机器人技术与应用】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA Isaac Lab 2.3新增功能助力简化机器人学习

    基于真实世界演示训练机器人策略,不仅成本高、速度慢,还容易出现过拟合问题,进而限制其在不同任务与环境中的泛化能力。而仿真优先的方法可简化开发流程、降低风险与成本,同时部署到真实环境也将更安全、适应性更强。
    的头像 发表于 10-21 10:50 773次阅读

    NVIDIA开源物理引擎与OpenUSD加速机器人学习

    开发能在工厂、医院和公共空间与人类协同作业的机器人项巨大的技术挑战。这类机器人需具备与人类接近的灵巧性、感知能力、认知能力和全身协调性,以便于实时应对充满不确定性的真实环境。
    的头像 发表于 10-13 11:15 660次阅读

    NVIDIA 发布三大利器,推动人形机器人迈向新纪元

    电子发烧友网综合报道 在节前的机器人学习大会(CoRL)上,NVIDIA 发布了系列突破性技术,包括开源物理引擎 Newton、机器人基础模型 Isaac GROOT N1.6以及全
    的头像 发表于 10-13 04:42 5418次阅读

    NVIDIA展示机器人领域的研究成果

    在今年的机器人科学与系统会议 (RSS) 上,NVIDIA 研究中心展示了系列推动机器人学习的研究成果,展示了在仿真、现实世界迁移和决策制定领域的突破。
    的头像 发表于 07-23 10:43 1110次阅读

    NVIDIA Isaac Lab可用环境与强化学习脚本使用指南

    Lab 是适用于机器人学习开源模块化框架,其模块化高保真仿真适用于各种训练环境,Isaac Lab 同时支持模仿学习(模仿人类)和强
    的头像 发表于 07-14 15:29 1827次阅读
    NVIDIA Isaac Lab可用环境与强化<b class='flag-5'>学习</b>脚本使用指南

    通过NVIDIA Cosmos模型增强机器人学习

    通用机器人的时代已经到来,这得益于机械电子技术和机器人 AI 基础模型的进步。但目前机器人技术的发展仍面临关键挑战:
    的头像 发表于 07-14 11:49 758次阅读
    通过NVIDIA Cosmos模型增强<b class='flag-5'>机器人学习</b>

    盘点#机器人开发平台

    Athena机器人****开发平台思岚推出Athena机器人开发平台,有望主导机器人开发平台未来
    发表于 05-13 15:02

    大象机器人携手进迭时空推出 RISC-V 全栈开源六轴机械臂产品

    全球80多个国家和地区。 近日,大象机器人联合进迭时空推出全球首款RISC-V全栈开源六轴机器臂“myCobot 280 RISC-V”,为开发者打造全新的机器人
    发表于 04-25 17:59

    构建人形机器人学习的合成运动生成流程

    通用人形机器人需要能够快速适应现有的以人类为中心的城市和工业工作空间,处理繁琐、重复或体力要求高的任务。这些移动机器人经过设计,能在以人类为中心的环境中有出色的表现,从工厂车间到医疗医疗机构,它们的价值日益凸显。
    的头像 发表于 04-10 09:36 987次阅读
    构建人形<b class='flag-5'>机器人学习</b>的合成运动生成流程

    深度解读英伟达Newton机器人平台:技术革新与跨界生态构建

    的基础上,它使机器人能够学习如何以更高的精度处理复杂的任务,与MuJoCo Playground或 NVIDIA Isaac Lab 等学习框架兼容,这是
    的头像 发表于 03-20 15:15 2462次阅读
    深度解读英伟达Newton<b class='flag-5'>机器人平台</b>:技术革新与跨界生态构建

    AgiBot World Colosseo:构建通用机器人智能的规模化数据平台

    数据的匮乏,制约了通用操纵能力的突破。上海人工智能实验室与AgiBot公司联合研发的AgiBot World Colosseo平台,通过构建大规模、多模态的真实世界数据集与通用政策模型,为机器人学习
    的头像 发表于 03-12 11:42 1692次阅读
    AgiBot World Colosseo:构建通用<b class='flag-5'>机器人</b>智能的规模化数据<b class='flag-5'>平台</b>

    开源项目!教你如何制作开源教育机械臂

    和适应性强的机器人平台。 作为开源项目,构建Pedro所需的所有文件都可以在Pedro Github页面上找到: 用于3D打印和定制的STL文件。 Gerber文件来制造您自己的
    发表于 03-10 11:22

    【「具身智能机器人系统」阅读体验】1.初步理解具身智能

    工智能 认知发展机器人学 进化机器人学 物理体现与互动 五、具身智能的现代技术方向 另外,随着GPT等大语言模型的发展,这些技术也在具身智能机器人领域掀起了股浪潮,那就是基于大
    发表于 12-28 21:12

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习
    的头像 发表于 12-25 11:54 699次阅读

    【「具身智能机器人系统」阅读体验】+初品的体验

    动态互动的。 该理论强调智能行为源于智能体的物理存在和行为能力,智能体必须具备感知环境并在其中执行任务的能力。具身智能的实现涵盖了机器学习、人工智能、机器人学、计算机视觉、自然语言处理及强化
    发表于 12-20 19:17