0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

3.2万美元造成的斯坦福双臂机器人爆红后,项目负责人亲自发翻车视频

AI科技大本营 来源:CSDN 2024-01-08 16:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

过去几年间,随着 AI 的发展,一个属于机器人的万亿级赛道正在火热开启,无论是 Google 、特斯拉,还是国内的达闼、追觅、以及稚晖君创业的「智元机器人(AGIBot)」公司均投身其中。

不过,对于普通用户而言,机器人最为重要的并不是设计得多么好看,而是实用性。在当代年轻人的“精致懒”之吃饭要人弄、家务要人做状态下,如果有一款集做饭、收纳、保洁等多个才艺于一身的机器人,岂不美哉!

近日,斯坦福大学 3 位研究人员让许多用户的美梦成真了,其发布了一款名为Mobile Aloha的 AI 机器人。一经展示之后,这款机器人便迅速在网络上走红,成为不少人想人手一个的大热门产品。

只因为它,不仅可以煎大虾,亲自端上桌:

529bf5d0-adfd-11ee-8b88-92fbcf53809c.gif

也能收拾不小心洒出来的水渍:

52ad0366-adfd-11ee-8b88-92fbcf53809c.gif

还能打开柜门,归纳整理:

52c7aa4a-adfd-11ee-8b88-92fbcf53809c.gif

刷碗:

530ceab0-adfd-11ee-8b88-92fbcf53809c.gif

简单来看,Mobile Aloha 是一种用于双手遥控操作的低成本开源硬件系统,解决了训练需要人类操作员仔细指导的移动双手机器人的高成本和技术挑战。

值得一提的是,Mobile Aloha 能实现以上操作,并非完全自主,其全身也支持远程操作。

得益于生成模型的成功,MobileAloha 可以快速从人类演示中学习,而且它可以只通过 50 次的演示就能学会一件事,合作训练可以提高成功率高达 90%。

同时,整个机器人机载电源和计算在内的成本为3.2 万美元,远远低于市场现有的系统及硬件。更让人兴奋的是,Mobile Aloha 的软硬件均是开源的,也方便所有的 AI 爱好者、开发者深入学习与共建。

5366daf2-adfd-11ee-8b88-92fbcf53809c.png

左:用户通过遥控操作从冰箱中获取食物;右图:Mobile ALOHA 可以通过模仿学习完成复杂的长时间任务

硬件代码:https://github.com/MarkFzp/mobile-aloha

软件代码:https://github.com/MarkFzp/act-plus-plus

项目地址:https://mobile-aloha.github.io/

研究 5 年,以低成本打破传统机器人系统的局限性

项目的负责人之一 Tony Z.Zhao 表示,“这个我过去 5 年里最努力的项目之一!”

而之所以会萌生开发这样一款会做饭的 AI 机器人,是因为该研究团队发现,大多数机器人操纵任务都侧重于桌面操纵。这包括最近基于 Transformer 和 Diffusion 模型(广泛应用于生成式人工智能的架构)建立的一系列模型。

然而,日常环境中的许多任务都需要全身协调的流动性和灵巧的操作。譬如,把一个罐子放进厨房的柜子里,那么,机器人需要首先导航到柜子边上,这就需要机器人底座可以移动;进而为了打开橱柜,机器人需要后退,同时牢牢抓住两个门把手,激发全身控制;随后双臂需要抓住锅柄,一起将锅放入橱柜,双手也要协调好。

在研究人员来看,过去有两个主要因素阻碍了模仿学习在双臂移动操作中的广泛应用:

缺乏可访问的、即插即用的全身远程控制硬件。当然并不是说市面上没有这种硬件,而是如果购买现成的机械手,成本会很高。像 PR2 和 TIA GO 这样的机器人价格可能超过 20万美元,这让很多研究实验室无法负担。此外,要在这些平台上实现远程控制操作,还需要额外的硬件和校准。

以前的机器人学习工作没有表现出高性能的双臂移动操作复杂的任务。随着自由度的增加,手臂和基础动作之间的交互可能会变得复杂,基础姿势的微小偏差可能会导致手臂末端执行器姿势的大幅偏移。

在论文中,研究员表示,“立足于硬件和学习的角度,以前的工作还没有为双臂移动操作提供一个实用而有说服力的解决方案。”

现如今随着 AI 的发展,机器人到底可以不可以做到移动并实现协调全身去完成任务。研究人员研究了将模仿学习扩展到需要双臂移动机器人全身控制的任务可行性。

537d4544-adfd-11ee-8b88-92fbcf53809c.png

https://mobile-aloha.github.io/resources/mobile-aloha.pdf

MobileALOHA 的研发

在硬件维度,研究人员提出了 MobileALOHA,扩展了原始ALOHA的功能,这是一种低成本和全身远程控制系统,用于收集双臂移动操作数据。

在硬件设计时,研究人员主要从四个维度切入考虑:

移动速度要快:与人类的行走速度相媲美,约为 1.42 米/秒。

稳定性:在拿起沉重的家居物品时,如锅、吸尘器时,它是稳定的。

支持全身远程控制:所有的自由度可以同时远程操作,包括双臂和移动底座。

不受限制:板载电源和计算。

要想实现 MobileALOHA 的灵活性,研究员在它的下方安装了一个专为仓库设计的轮子底座——Tracer AGV,它可以承载 100kg,移动速度高达 1.6m/s,而成本只有 7000 美元。

为了使 Mobile ALOHA 不受限制,研究人员配备了一个 1.26 千瓦时的电池,重量在 14 公斤,这样还可以压住机器人,防止不平衡摔倒。此外,整个装置还包括网络摄像头和一个搭载消费级 GPU 的笔记本电脑,成本共计约为 3.2 万美元,比现成的双臂机器人便宜得多。

研究员在论文中介绍道,Mobile ALOHA 可同时遥控所有自由度。人类操作员的腰部被用物理的方式拴在系统上,并反向驱动车轮,在工作环境中驾驶系统,同时用控制器控制机器人手臂。同时,研究人员记录基本速度数据和手臂操纵数据,形成一个全身远程控制操作系统

538bfbc0-adfd-11ee-8b88-92fbcf53809c.png

这样,机器人控制系统就能同时学习动作和其他控制指令。一旦收集到足够的信息,模型就能自主地重复一系列任务。

在模仿学习方面,Mobile ALOHA 利用了 Transformer(大型语言模型中使用的架构)。最初的 ALOHA 系统使用了一种名为 Action Chunking with Transformers (ACT) 的架构,它将来自多个视点和关节位置的图像作为输入并预测一系列动作。

53972d4c-adfd-11ee-8b88-92fbcf53809c.png

MobileALOHA 将运动信号添加到输入向量中,从而扩展了该系统。这种方法可以让 Mobile ALOHA 重复使用以前的深度模仿学习算法,而只需做最小的改动。

在论文中,研究人员写道:“我们观察到,简单地将底座和手臂动作连接起来,然后通过直接模仿学习进行训练,就可以产生出色的表现。具体来说,我们将 ALOHA 的 14-DoF 关节位置与移动底座的线速度和角速度连接起来,形成 16 维动作向量。”

与此同时,研究人员汲取了近期业界在预训练和不同机器人数据集上取得的成功经验,并利用静态双臂数据集的信息,逐步提高模仿学习的性能。

在演示中,研究员展示了训练有素的机器人烹饪三道菜,并执行了一些精细的任务,例如打碎鸡蛋、切碎大蒜、倒液体、拆开蔬菜包装以及在煎锅中翻转鸡肉。

53a1a18c-adfd-11ee-8b88-92fbcf53809c.gif

此外,Mobile ALOHA 还可以执行各种家务任务,包括给植物浇水、使用真空吸尘器、装卸洗碗机、从冰箱中取出饮料、操作洗衣机。

53cd18b2-adfd-11ee-8b88-92fbcf53809c.png

53db9996-adfd-11ee-8b88-92fbcf53809c.png

研究人员表示:“通过协同训练,我们只需对每项任务进行 50 次人类演示,就能在这些任务上取得超过 80% 的成功,与没有协同训练相比,平均绝对提高了 34%。”

53eb7230-adfd-11ee-8b88-92fbcf53809c.png

Mobile ALOHA 背后的研究员

Mobile ALOHA 的到来,不仅打破了很多传统机器人的局限性,也让我们看到了这个年轻人团队为 AI 带来的无限潜力。

正如文章伊始所述,Mobile ALOHA出自斯坦福大学 3 位研究人员之手,也是华人团队。

Zipeng Fu(项目联合负责人)

Zipeng Fu,是斯坦福人工智能实验室计算机科学专业的博士生,导师是Chelsea Finn。

同时,他还是 GoogleDeepMind 的学生研究员,与Google Brain Robotics机器人运动和安全团队的技术主管经理Jie Tan一起工作。

此前,ZipengFu在加州大学洛杉矶分校完成了计算机科学与应用数学学士学位,导师是Song-Chun Zhu,后来在CMU 攻读机器学习领域的硕士,并在机器人研究所担任学生研究员,导师是 Deepak Pathak 和 Jitendra Malik。

他的研究兴趣在于机器人学、机器学习和计算机视觉的交叉领域。重点关注机器人在非结构化开放世界中的强大性能和可部署机器人系统。

Tony Z. Zhao(项目联合负责人)

Tony Z. Zhao 是斯坦福大学计算机科学博士三年级学生,导师同是 Chelsea Finn。同时,他也是 Google Deepmind 的兼职学生研究员。

此前,Tony Z. Zhao 在特斯拉自动驾驶汽车公司和 Google X Intrinsic 实习。于 2021 年获得伯克利大学电子工程科学学士学位,导师是 Sergey Levine和 Dan Klein。

“我想让机器人能够执行复杂的精细操作任务。我对初创企业和自主机器人的未来感到兴奋”,Tony Z. Zhao 写道。

Chelsea Finn(顾问)

Chelsea Finn是斯坦福大学计算机科学与电子工程系助理教授。她的实验室 IRIS 主攻研究大规模机器人交互智能,隶属于 SAIL 和ML小组。

除了教授职位之外,Chelsea Finn 在 Google 任职,是 Google Brain 团队的一员。

此前,Chelsea Finn 在加州大学伯克利分校获得了计算机科学博士学位,并在麻省理工学院获得了电子工程和计算机科学学士学位。

项目负责人现身发布翻车视频:并未做好接管世界的准备!

随着研究人员将这一项目对外公开,不少网友开始期待:「感觉我以后养老可以靠它了,现在开始攒钱,然后让机器人给我打工!」

不过,这样的幻想还没有持续多久,该项目负责人之一的 Tony Z.Zhao 紧急在 Twitter 上又发布一则视频,为 Mobile ALOHA 泼了一盆冷水。其表示,“机器人还没有准备好接管世界!我刚刚制作了一个视频,记录了在自主模式下犯下的最愚蠢的错误 Mobile ALOHA。我们还计划在休息后组织一些现场演示。敬请关注!”

在视频中,Mobile ALOHA 在自主模式下,不仅手抖,将酒杯里的水洒出来了,还让它自由落体,变成了玻璃渣:

54118c9a-adfd-11ee-8b88-92fbcf53809c.png

弄翻了锅,研究员都来不及挽救:

541da21e-adfd-11ee-8b88-92fbcf53809c.gif

Tony Z.Zhao 对此说道,「老实说,这可能是迄今为止我最喜欢的视频,当它在你面前失败时就不那么有趣了」。同时,他还向 2015 年 DARPA 机器人挑战赛、波士顿机器人失败的案例致敬。

其实,Tony Z.Zhao在Mobile ALOHA 爆火一天后选择公布“幕后花絮”,实则也是希望更多的人保持理性,减少炒作。在 AI 快速发展背后,其实也依然存在很多的不足,我们应该正确对待 AI 的发展,也要勇于面对失败,毕竟失败是成功非常重要的一个过程。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    31442

    浏览量

    223639
  • AI
    AI
    +关注

    关注

    91

    文章

    41107

    浏览量

    302585
  • 模型
    +关注

    关注

    1

    文章

    3818

    浏览量

    52268

原文标题:3.2万美元造成的斯坦福双臂机器人爆红后,项目负责人亲自发翻车视频

文章出处:【微信号:AI科技大本营,微信公众号:AI科技大本营】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    创346万美元众筹记录,扫雪机器人成现象级产品,电池、电机是关键

    科技(Yarbo)凭借模块化设计理念,在Kickstarter众筹平台创下346万美元的纪录,成为现象级产品。   在北美市场,扫雪机器人已从高端玩具转变为家庭标配,美国70%的独栋住宅位于雪区,传统人工扫雪年均耗时超50小时,而智能化设备通过技术创新将效率提升10倍以上
    的头像 发表于 09-14 00:21 9111次阅读

    火遍海外!中国人形机器人波兰街头赶野猪

    近期,一机器人在波兰街头驱逐业主的视频在网络火。据悉,这款网机器人并非波兰本土制造,而是
    的头像 发表于 04-14 17:22 783次阅读

    如何校准斯坦福锁相放大器的增益

    锁相放大器(Lock-in Amplifier)是一种用于提取微弱信号、抑制噪声的高精度测量仪器,广泛应用于物理、化学、生物及材料科学等领域。斯坦福研究系统(Stanford Research
    的头像 发表于 04-08 15:48 93次阅读
    如何校准<b class='flag-5'>斯坦福</b>锁相放大器的增益

    云知声CEO黄伟博士做客斯坦福“与AI同行”系列讲座

    近日,斯坦福成长创新圈联合斯坦福上海校友会举办的斯坦福“与AI同行”系列讲座马年首场线上活动圆满落幕,云知声CEO黄伟博士作为特邀嘉宾,结合近30年AI领域深耕经验与云知声十余载创业实践,深度复盘了中国AI产业从1.0到2.0的
    的头像 发表于 03-13 15:46 462次阅读

    江智机器人技术核心团队

    与本土实践经验的专业技术与实际市场场景高度融合的实战力量。核心成员构成:‌赵国江‌:现任康养机器人负责人、公司算法首席专家。美国卡耐基梅隆大学硕士毕业,曾就职于
    的头像 发表于 03-05 22:57 559次阅读
    江智<b class='flag-5'>机器人</b>技术核心团队

    三星电子相关业务负责人一行到访谷东智能参观交流

    12月23日,三星电子相关业务负责人一行到访谷东智能,围绕增强现实(AR)近眼显示核心光学技术及整机解决方案展开深入交流。来访团队包括三星电子CSS 部门长Richard Hwang、LEDoS中国负责人 Hang Wang等。
    的头像 发表于 12-29 15:44 506次阅读

    特斯拉消息:机器人成本目标2万美元以内 马斯克:特斯拉或建巨型芯片工厂

    给大家带来一些特斯拉的最新消息: 特斯拉:机器人成本目标2万美元以内 11月7日,特斯拉在微博发文称人形机器人的试生产产线已经在弗里蒙特工厂开始运行,规模更大的第三代人形机器人的生产线
    的头像 发表于 11-07 15:45 678次阅读

    斯坦福(Stanford)锁相放大器故障修复

    斯坦福锁相放大器是由斯坦福研究系统公司(Stanford Research Systems, SRS)研发的一款测量工具,主要用于微弱信号的测量和提取。它结合了高灵敏度、高精度、高稳定性和多功能性于一体,是科研和工业领域的重要设备。
    的头像 发表于 07-30 10:58 1051次阅读
    <b class='flag-5'>斯坦福</b>(Stanford)锁相放大器故障修复

    工业机器人的特点

    点焊机器人、切割机器人可以完成危险的电焊、切割工作;搬运机器人搬运有害物料。近年来制造业工人工资不断攀升,而由于高危行业除了高企的工人工资还有福利保障等支出,对企业造成较大的成本负担。
    发表于 07-26 11:22

    湖北省人形机器人创新中心莅临飞利信座谈交流

    近日,湖北省人形机器人创新中心董事长李正祥及光谷数字经济产业园区相关负责人一行莅临飞利信,就具身智能机器人垂域场景的数据采集、场景验证等软硬件方案展开深入交流,并探讨未来合作。
    的头像 发表于 07-25 16:28 1304次阅读

    斯坦福SR530锁相放大器技术手册

    斯坦福SR530锁相放大器是一款专为精密微弱信号检测设计的高性能仪器,核心功能是从强噪声背景中提取特定频率信号,广泛应用于物理、化学、生物医学及工程领域。
    的头像 发表于 07-11 18:02 1032次阅读
    <b class='flag-5'>斯坦福</b>SR530锁相放大器技术手册

    人形机器人遇阻?特斯拉“擎天柱”项目负责人离职

    电子发烧友网报道(文/李弯弯)特斯拉“擎天柱”(Optimus)人形机器人项目负责人米兰·科瓦奇(Milan Kovac)周五表示,他将离开公司。   科瓦奇在X平台上发文称,“我不得不做出一生中
    的头像 发表于 06-10 00:07 6700次阅读
    人形<b class='flag-5'>机器人</b>遇阻?特斯拉“擎天柱”<b class='flag-5'>项目负责人</b>离职

    特斯拉optimus人形机器人项目负责人离职

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2025年06月09日 11:52:24

    重庆市领导莅临华数机器人调研

    近日,重庆市政府副市长郑向东,市政府副秘书长全伟一行莅临华数机器人调研,华数机器人总经理王旭丽、重庆智能机器人研究院副院长夏亮等相关负责人
    的头像 发表于 05-21 17:28 1190次阅读

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    ROS的全称:Robot Operating System 机器人操作系统 ROS的 目的 :ROS支持通用库,是通信总线,协调多个传感器 为了解决机器人里各厂商模块不通用的问题,让机器人快速开发
    发表于 04-30 01:05