0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DON抓取算法:训练无需标注数据集,省时省力

DPVg_AI_era 来源:未知 作者:李倩 2018-09-14 08:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

MIT团队打造“密集目标网络”(DON)的机器人系统,能够让抓取机器人真正“读懂”目标,该系统将目标处理生成三维“视觉路线图”的点集合,让机器人真正在视觉上理解目标。利用这一系统,科学家们不必再像过去的计算机视觉研究一样,繁琐地对大量数据集中的数据进行标记了。

长期以来,人类一直以灵巧著称,这种特点在很大程度上要归功于我们的眼睛。不过现在,机器人也逐步迎头赶上。经过几十年的发展,现在用于生产线等受控环境中的机器人已经能够一次又一次地拾起同一个目标了。

最近在计算机视觉方面的突破,让机器人也能区分出不同的目标。不过即使这样,机器人还是无法真正理解物体的形状,因此在拾取目标后,几乎无法再做什么别的事。

近日,麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员在一篇新论文中表示,他们已在这个领域取得了一项重要进展:他们打造的机器人系统可以识别出之前未见过的随机目标,并能够在视觉上“理解”这些目标,以完成更丰富的任务。

研究人员使用KUKA机器人抓起一只杯子

“密集对象网络”:让机器人读懂抓取目标

该系统名为“密集对象网络”(DON),该网络将对象视为点的集合,当作“视觉路线图”来使用。这种方法可以让机器人更好地理解和抓取目标,最重要的是,机器人能够在大量类似目标中挑出特定的目标。亚马逊和沃尔玛等公司在其仓库中使用的机器就具备类似的技能。

比如,有人可能会使用DON系统让机器人抓住目标上的特定位置,比如鞋舌头。之后,它就能够看到之前从未见过的鞋子,并成功抓住鞋舌头。

参与该研究的博士生Lucas Manuelli说道:“许多控制系统和识别方法都无法识别朝多个方向放置的目标的特定部分。”他与该论文另一作者、博士生Pete Florence和MIT教授Russ Tedrake一起撰写了该论文。 “比如,现有的算法就无法抓住马克杯的杯柄,尤其是在马克杯朝多个方向放置的情况下,比如直立或侧放。”

该团队认为,该技术不仅能用于工业制造,还能走入家庭的日常生活。比如,给系统展示一座整洁的房子的图像,让机器人在你工作时打扫房间,或向机器人展示菜肴的图像,让机器人在你度假时把你的餐桌上的盘子收拾好。

DON抓取算法:训练无需标注数据集,省时省力

值得注意的一点是,没有任何数据事先被人类标记过。这个系统是“自我监督的”,因此不需要任何来自人类的数据标注。

机器人抓取目标的两种常见方法是,创建特定任务的机器学习,创建通用的抓取算法。这两种技术都存在障碍:基于特定任务的方法很难推广到其他任务,而通用的抓取算法不够具体,无法顾及处理特定任务时的细微差别,比如将目标放到特定的位置上。

而DON系统基本上是在给定目标上创建一系列坐标,作为基于目标的一种“视觉路线图”,使机器人更好地理解自己需要抓取哪些目标,目标在何处等。

该团队训练系统将对象视为构成较大坐标系的一系列点。然后将不同的点映射到一起,显示出对象的三维形状,这种方式和使用多张照片拼接全景照片的方式有些类似。在训练之后,如果指定目标上的一个点,机器人可以拍摄该物体的照片,并一系列的点进行识别和匹配,然后就可以指定点拾取目标。

这个系统与加州大学伯克利分校的DexNet系统有所不同,伯克利的系统可以抓取许多不同的目标,但不能满足抓取特定目标的要求。就好比一个一岁半的婴儿,他不明白你想要他玩哪个玩具,但仍然可以抓起很多不同的玩具,而一个四岁的孩子,就可以准确地回应“去抓住那辆红色小卡车的车尾”的要求。

在形状对称毛绒玩具上进行的一组测试中,由DON驱动的Kuka机器人手臂可以从一系列不同的目标位置抓住玩具的右耳。这表明系统具有在对称物体上区分左右的能力。

在利用不同棒球帽进行测试时,DON可以选择特定的目标帽子,尽管所有的帽子的设计都非常相似,机器人在之前从未在训练数据中看到过帽子的照片。

未来,团队希望将系统进行改进,让其具备执行特定任务的能力,同时能够更深入地了解相应的目标,例如学习如何抓住目标,并将其移动到最终位置等。

团队将于下个月在瑞士苏黎世举行的机器人学习会议上发表这一成果。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    214

    文章

    31624

    浏览量

    224344
  • 计算机视觉
    +关注

    关注

    9

    文章

    1716

    浏览量

    47756
  • 数据集
    +关注

    关注

    4

    文章

    1242

    浏览量

    26286

原文标题:MIT识物机器人:“秒懂”物体,过目不忘,不用标记数据!

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    手动输容值太费劲?换易控宝自动检测投切更精准!

    易控宝智能无功补偿控制器自动检测电容容值,精准投切,省时省力,提升效率与电费收益。
    的头像 发表于 02-03 12:58 313次阅读
    手动输容值太费劲?换易控宝自动检测投切更精准!

    自动装车机每小时600-1200包自动装车无需人工省时省力

    自动化
    jf_73817765
    发布于 :2026年01月06日 09:58:07

    算法工程师不愿做标注工作,怎么办?

    对于算法而言,图像标注是一项关键性工作,越是大量的新数据标注,对于算法的性能提升越有帮助。但是
    的头像 发表于 12-02 17:56 757次阅读
    <b class='flag-5'>算法</b>工程师不愿做<b class='flag-5'>标注</b>工作,怎么办?

    商品销量数据抓取接口

    ​  商品销量数据是电商分析的核心指标,能帮助企业优化库存、制定营销策略。构建一个高效的数据抓取接口,可以自动化获取这些数据,提升决策效率。本文将逐步介绍如何设计并实现一个商品销量
    的头像 发表于 10-21 18:02 793次阅读
    商品销量<b class='flag-5'>数据</b><b class='flag-5'>抓取</b>接口

    模板驱动 无需训练数据 SmartDP解决小样本AI算法模型开发难题

    算法作为软实力,其水平直接影响着目标检测识别的能力。两年前,慧视光电推出了零基础的基于yolo系列算法架构的AI算法开发平台SpeedDP,此平台能够通过数据驱动模型
    的头像 发表于 09-09 17:57 1617次阅读
    模板驱动  <b class='flag-5'>无需</b><b class='flag-5'>训练</b><b class='flag-5'>数据</b>  SmartDP解决小样本AI<b class='flag-5'>算法</b>模型开发难题

    请问AICube所需的目标检测数据标注可以使用什么工具?

    请问AICube所需的目标检测数据标注可以使用什么工具? 我使用labelimg进行标注标注后的数据
    发表于 08-11 08:07

    自动驾驶数据标注主要是标注什么?

    的结构化标签。这些标签不仅构成了模型训练与评估的数据基础,也直接影响系统在实际道路环境中的识别、理解和决策能力。准确、系统的数据标注能够有效提升感知
    的头像 发表于 07-30 11:54 1794次阅读
    自动驾驶<b class='flag-5'>数据</b><b class='flag-5'>标注</b>主要是<b class='flag-5'>标注</b>什么?

    训练平台数据过大无法下载数据至本地怎么解决?

    起因是现在平台限制了图片数量,想要本地训练下载数据时发现只会跳出网络异常的错误,请问这有什么解决办法?
    发表于 07-22 06:03

    根据标题利用API实现电商多平台同步:省时省力生成文章

    结合内容生成工具,还能自动创建吸引人的产品文章。本文将一步步解析如何实现这一过程,帮助您节省时间和精力。 1. 电商多平台同步的挑战与API的优势 电商多平台运营面临的核心问题是数据一致性。例如,库存更新不及时可能导致超
    的头像 发表于 07-18 10:02 792次阅读
    根据标题利用API实现电商多平台同步:<b class='flag-5'>省时省力</b>生成文章

    什么是自动驾驶数据标注?如何好做数据标注

    [首发于智驾最前沿微信公众号]在自动驾驶系统的开发过程中,数据标注是一项至关重要的工作。它不仅决定了模型训练的质量,也直接影响了车辆感知、决策与控制的性能表现。随着传感器种类和数据量的
    的头像 发表于 07-09 09:19 1807次阅读
    什么是自动驾驶<b class='flag-5'>数据</b><b class='flag-5'>标注</b>?如何好做<b class='flag-5'>数据</b><b class='flag-5'>标注</b>?

    使用AICube导入数据点创建后提示数据不合法怎么处理?

    重现步骤 data目录下 labels.txt只有英文 **错误日志** 但是使用示例的数据可以完成训练并部署
    发表于 06-24 06:07

    数据下载失败的原因?

    数据下载失败什么原因太大了吗,小的可以下载,想把大的下载去本地训练报错网络错误 大的数据多大?数据
    发表于 06-18 07:04

    k210在线训练算法是yolo5吗?

    k210在线训练算法是yolo5吗
    发表于 06-16 08:25

    数据标注与大模型的双向赋能:效率与性能的跃升

    ​‌在人工智能蓬勃发展的时代,大模型凭借其强大的学习与泛化能力,已成为众多领域创新变革的核心驱动力。而数据标注作为大模型训练的基石,为大模型性能提升注入关键动力,是模型不可或缺的“养料。大模型则凭借
    的头像 发表于 06-04 17:15 2343次阅读
    <b class='flag-5'>数据</b><b class='flag-5'>标注</b>与大模型的双向赋能:效率与性能的跃升

    OCR识别训练完成后给的是空压缩包,为什么?

    OCR识别 一共弄了26张图片,都标注好了,点击开始训练,显示训练成功了,也将压缩包发到邮箱了,下载下来后,压缩包里面是空的 OCR图片20几张图太少了。麻烦您多添加点,参考我们的ocr识别
    发表于 05-28 06:46