0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器人没有度量信息如何导航

3D视觉工坊 来源:3D视觉工坊 2024-11-13 10:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

0. 这篇文章干了啥?

机器人能否像人类一样利用有限的度量和空间信息进行导航呢?目前,大多数机器人的导航系统依赖于详细的几何地图和精确的度量定位。然而,人类通常可以凭借着抽象的、不准确的环境表示(例如手绘草图或基于语言的指示)以及对自己位置的近似语义概念,找到前往目的地的路线。这种技能的一个关键因素是我们能够使用导航行为来表示和导航环境,这些行为是语义行动抽象,如向左转或沿走廊前进。人类可以使用几何不准确的地图或表示,因为这些地图依然可以抽象地捕捉环境中的路径,作为导航行为序列:例如,平面图可以让我们推断出转弯和沿走廊行动的抽象序列,以达到给定房间的目的,尽管它们缺乏现实感。我们还可以感知导航机会,即在当地环境中执行导航行为的潜力,并将它们用作我们位置的非度量、视觉线索:例如,观察到附近的交叉口只能让我们左转和前进,可以暗示我们在建筑物中的位置。我们假设使用导航行为来表示和遍历环境赋予了机器人利用有限的度量和空间信息进行导航的能力。

为了测试这一假设,我们设计了一个基于场景动作地图(SAM)的导航行为系统,SAM是一个由关键位置(节点)和导航行为(边)连接而成的拓扑表示,支持非度量规划和定位。特别是,我们提出了一个可学习的地图阅读管道,从各种现成的环境二维地图中提取SAM,例如手绘草图和平面图。虽然许多系统难以使用这些地图,因为它们存在度量上的不准确和抽象性,但我们的系统利用了这些地图中编码的底层SAM,从而利用了这些丰富的现有地图信息。

视觉导航的先前工作已经证明了学习类人导航行为和与之相关的导航机会定位的实用性,并在此基础上,我们实现了一个使用SAM的行为导航栈,并将其部署到真实机器人上,以验证从地图中提取的SAM对导航的有用性。具体来说,我们使用DECISION控制器的避障导航行为,并为基于导航机会的定位改进了图形定位网络。我们从手绘地图、平面图和卫星地图中"读取"SAM,并证明这些提取出的SAM可用于有效的实际导航。

下面一起来阅读一下这项工作~

1. 论文信息

标题:Scene Action Maps: Behavioural Maps for Navigation without Metric Information

作者:Joel Loo, David Hsu

机构:新加坡国立大学

原文链接:http://arxiv.org/abs/2405.07948

代码链接:https://scene-action-maps.github.io/

官方主页:https://scene-action-maps.github.io/

2. 摘要

人类在没有度量信息的情况下导航能力非凡。我们可以阅读抽象的2D地图,比如平面图或手绘草图,并利用它们在未见过的丰富3D环境中导航,而无需先前的遍历来详细绘制这些场景。我们认为,这是通过将环境抽象地表示为相互连接的导航行为来实现的,例如"沿走廊前进"或"向右转",同时避免了在度量级别上详细、准确的空间信息。我们引入了场景行动地图(SAM),这是一个行为拓扑图,并提出了一种可学习的地图阅读方法,将各种2D地图解析成SAM。地图阅读从现有的、抽象的和不准确的地图中提取出关于导航行为的显著信息,这些地图从平面图到草图不等。我们通过在四足机器人上构建和部署行为导航堆栈来评估SAM在导航中的性能。视频和更多信息可在此网址获得:https://scene-action-maps.github.io/。

3. 效果展示

我们提出了一个可学习的地图阅读系统,该系统从现有的二维地图中提取场景行动地图,用于行为导航。

e7c379b8-9064-11ef-a511-92fbcf53809c.jpg

4. 基本原理是啥?

我们考虑在机器人之前可能没有见过或探索过的环境中导航到目标的任务。这自然需要导航具有有限的度量和空间信息,因为缺乏先前的数据意味着规划和定位可能无法获得详细的几何地图。然而,我们假设可以访问到环境的现有的2D地图,例如平面图、手绘地图和卫星地图。尽管它们可能是抽象的和不准确的,但它们保留了有关环境的导航方面的信息,对规划和定位是有用的。

这个任务的一些关键挑战包括指定目标、使用一系列抽象、不准确的地图进行规划和定位。我们的方法是从地图中提取环境的行为拓扑图,即场景动作图(SAM),并用它导航。我们假设可以访问一组像DECISION一样的导航行为,它们能够进行局部障碍物避让,并且足够多样化,可以让我们到达目标环境的大部分地方。我们的离线地图阅读系统是一个可学习的流水线,它可以根据特定的行为集从各种2D地图中提取SAM。在线行为导航系统接收在SAM上指定的目标,规划SAM上的路径并执行它。由于我们不能依赖于准确的度量信息,我们使用基于能力的定位和学习的导航行为。

e7f6bb34-9064-11ef-a511-92fbcf53809c.jpg

将fep应用于标记为橙色的节点:1) 使用ϕ_edge和Sinkhorn预测软分配矩阵,2) 阈值处理以生成出射边。

e825cfa0-9064-11ef-a511-92fbcf53809c.jpg

5. 实验结果

我们收集了3种地图类型的数据:手绘地图(Hand)和校园建筑的平面图(Flr),以及工业区域的卫星地图(SatMap)。对于Hand和Flr数据集中的地图,我们进行手动注释。对于SatMap地图,我们使用OpenStreetMap的道路/交叉口信息进行注释。我们为每种地图类型训练了一个单独的地图阅读模块实例。为了回答Q1,我们在留出的数据集上进行测试:Hand/Flr各有4张地图,每张地图平均有27个节点和64条边,SatMap有1张大型地图,包含137个节点和414条边。我们计算了3个任务的精度和召回率:(A)预测节点/变点,(B)仅预测边(忽略行为的正确性),以及(C)预测边以及它们关联的行为。直观地说,(B)显示了环境的结构和连接性被捕捉的程度。(C)进一步检查每条边的分配行为是否与人工注释的地图相符。结果见表I。

e855db8c-9064-11ef-a511-92fbcf53809c.jpg

我们的节点预测在所有地图类型上都能很好地预测变点。从质量上来看,ϕnode能够可靠地捕捉地图中的视觉特征,如交叉口或转弯,在使用DECISION行为集时可以指示变点。失败主要发生在环境结构不够明确的开放区域,导致更多的假阳性和假阴性。SatMap的相对较低的召回率分数主要是由于交叉口等特征被高楼遮挡在密集建筑区域中,导致更多的假阴性。我们的边缘预测在任务(B)上表现良好,特别是在SatMap上,因为卫星地图中固有的丰富视觉信息。较低的召回率分数表明fep的主要限制在于偶尔无法识别有效边缘。与(B)相比,任务(C)的性能较低表明,虽然ϕedge能够很好地学习节点之间的可达性,但学习正确的视觉特征来分配正确的行为要困难得多。这一观察得到了支持,即大多数失败都涉及将前进行为错误地分配为转弯行为,反之亦然。我们连接节点和边的预测,并在图4中端到端生成SAMs。

e876c1bc-9064-11ef-a511-92fbcf53809c.jpg

我们的方法可以追踪出捕捉地图拓扑的连接图,相当准确。虽然预测的SAMs中存在一些噪音 - 如缺失的变点、标记错误的边缘等 - 但我们证明这些SAMs仍然可以有效用于行为导航。我们通过展示,可以使用"嘈杂"的预测SAMs进行有效的行为导航,这些SAMs可能包含诸如用错误行为标记的边缘或缺少节点/边缘等缺陷(见图4)。我们评估了SLS和SLS-Aug在嘈杂的SAMs上,其中SLS-Aug使用了我们提出的数据增强方法训练的GLN,以提高噪声鲁棒性。我们从表II中得出两个结论。首先,当用预测的嘈杂SAMs替换人工注释的SAMs时,导航性能几乎没有受到不利影响,这表明SLS系统在人工注释和预测的SAMs之间最多只见到少量的PC下降。从经验上看,SLS和SLS-Aug似乎对常见的噪声模式 - 即在交叉口处缺失边缘或混淆的前进和转弯行为 - 具有鲁棒性,并且通常能够利用剩余的正确拓扑特征来定位和导航。其次,我们的数据增强方法提高了包含噪音和伪迹的预测SAMs的定位和导航性能。在预测的SAMs上,SLS-Aug通常优于其他测试设置,甚至在人工注释的SAMs上也优于SLS。总的来说,即使在包含多个变点转换的100米Hard路线上,SLS-Aug在预测2D地图的SAMs上显示出了有希望的性能,从而证实了从2D地图预测SAMs以在现实世界中定位和导航的可行性。

e88385d2-9064-11ef-a511-92fbcf53809c.jpg

6. 总结 & 未来工作

我们引入了场景行为地图,这是一种用于导航的行为拓扑表示。我们认识到,常见的预先存在的地图,如平面图,通常编码了有关导航可供性和行为的信息,并提出了一个"地图阅读"系统,从这些地图中提取SAMs。我们还展示了从草图和平面图中提取的SAMs进行有效的现实世界导航。SAMs做出了一种权衡:通过受限于特定行为集(因此机器人动力学)来减少对度量信息的依赖。相比之下,几何地图需要准确的数据,不能从抽象输入构建,但足够丰富地表示世界,以使得具有各种机器人动力学的导航成为可能。在未来的工作中,我们打算在室外环境中测试我们的系统,并将更丰富的信息源纳入SAMs中。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    31444

    浏览量

    223662
  • 导航
    +关注

    关注

    7

    文章

    582

    浏览量

    44071
  • SAM
    SAM
    +关注

    关注

    0

    文章

    118

    浏览量

    34457

原文标题:ICRA'24开源 | 机器人没有度量信息怎么导航?

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    为什么说关节扭矩传感器是高端机器人的“触觉神经”?

    如果把高端机器人比作一个“”,那么关节扭矩传感器就是遍布全身的“触觉神经”。没有它,机器人就像得了末梢神经麻痹——能按程序动,却感受不到外界的力量,动作僵硬、笨拙,甚至危险。 核心原
    发表于 04-17 17:27

    智能机器人从0到1系统入门课程 带源码课件 百度网盘下载

    ,且无法传达空间信息;视觉识别虽然精准,但缺乏交互的即时性和意图的明确性。真正的智能交互,在于将两者有机结合。 未来的机器人将不再依赖简单的“关键词触发”,而是通过多模态融合技术,像人类一样通过
    发表于 04-11 16:41

    RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知

    引擎,访问并显示米尔官方网页,承担人机信息查询与交互角色。· MINI DP接口(27寸显示器):实时显示8路摄像头捕捉的图像预览,充当机器人的"视觉监控中心"
    发表于 10-29 16:41

    小萝卜机器人的故事

    经过我的申请, 马老师发放了, 小萝卜机器人的, 开发权限, 原来的小萝卜公司, 因为经营不善倒闭, 作为科研产品, 几个技术对此惋惜, 自掏腰包, 要让小萝卜机器人, 再生, 每次听到小萝卜说
    发表于 10-23 05:24

    自制巡线解迷宫机器人(上)

    简单点的项目来练练手,想来想去觉得自己下半年计划要做的巡线解迷宫机器人最为合适,不过由于时间有限的缘故,我决定先把这个机器人的原理验证机先搭建出来(标题中上篇的由来),等硬件和软件都经过验证没有问题后
    发表于 10-20 10:39

    什么是机器人?追溯机器人技术的演变和未来

    的定义。机器人的定义,真如表面看起来那么简单直白?还是比我们所认为的更为复杂呢? 从本质上讲,机器人是一种可编程机器,能够感知、处理信息,并自主或在一定程度的人工指令引导下执行任务。与
    的头像 发表于 10-02 16:32 5673次阅读
    什么是<b class='flag-5'>机器人</b>?追溯<b class='flag-5'>机器人</b>技术的演变和未来

    机器人竞技幕后:磁传感器芯片激活 “精准感知力”

    支撑机器人竞技能力的核心力量,深刻改变着竞技机器人的能力边界。 磁传感器芯片为机器人运动提供 “精准导航”。在动态平衡系统中,像昆泰芯 KTH71 系列磁传感器芯片,通过检测地磁场与
    发表于 08-26 10:02

    工业机器人的特点

    的基础,也是三者的实现终端,智能制造装备产业包括高档数控机床、工业机器人、自动化成套生产线、精密仪器仪表、智能传感器、汽车自动化焊接线、柔性自动化生产线、智能农机、3D 打印机等领域。而智能制造装备中工业
    发表于 07-26 11:22

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    接口则让语音机器人可以连接到互联网,实时获取最新的信息,增强其智能性和交互能力。 在实际应用场景中,以智能客服语音机器人为例。SSD2351开发板可以驱动语音识别模块,准确识别用户的问题,并在本地或
    发表于 05-28 11:36

    盘点#机器人开发平台

    地瓜机器人RDK X5开发套件地瓜机器人RDK X5开发套件产品介绍 旭日5芯片10TOPs算力-电子发烧友网机器人开发套件 Kria KR260机器人开发套件 Kria KR260-
    发表于 05-13 15:02

    详细介绍机场智能指路机器人的工作原理

    机场智能指路机器人主要依靠感知系统、定位系统、导航系统、智能交互系统和运动系统协同工作,来实现为旅客准确指路和提供服务的功能,以下是其详细工作原理: 感知系统 传感器类型 :机器人配备了多种传感器
    发表于 05-10 18:26

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    阅读心得体会:ROS2机器人视觉与地图构建技术 通过对本书第7章(ROS2视觉应用)和第8章(ROS2地图构建)的学习,我对机器人视觉感知和自主导航的核心技术有了更深入的理解。以下是我的心得体会
    发表于 05-03 19:41

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    ROS的全称:Robot Operating System 机器人操作系统 ROS的 目的 :ROS支持通用库,是通信总线,协调多个传感器 为了解决机器人里各厂商模块不通用的问题,让机器人快速开发
    发表于 04-30 01:05

    【「# ROS 2智能机器人开发实践」阅读体验】+ROS2应用案例

    整书的内容非常多有476页。非常厚,像本厚厚的工具书 拿出文章中的小节加以书写吧 视觉应用:二维码识别 二维码识别是视觉应用中的一个重要部分,它在机器人导航、物品追踪和信息交互等方面有着广泛
    发表于 04-27 11:42

    【「# ROS 2智能机器人开发实践」阅读体验】+内容初识

    出有用的信息,如障碍物的位置和形状。对于摄像头数据,可以使用 OpenCV 等图像处理库进行图像识别、目标跟踪等操作,为机器人导航和决策提供支持。 运动控制:运动控制是机器人开发的核
    发表于 04-27 11:24