0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

TRO新文:用于数据关联、建图和高级任务的对象级SLAM框架

3D视觉工坊 来源:3D视觉工坊 2023-07-14 16:49 次阅读

对象SLAM被认为对于机器人高级感知和决策制定越来越重要。现有研究在数据关联、对象表示和语义映射方面存在不足,并且经常依赖于额外的假设,从而限制了它们的性能。在本文中,我们提出了一个综合的对象SLAM框架,该框架专注于基于对象的感知和面向对象的机器人任务。首先,我们提出了一种集成数据关联方法,用于通过结合参数和非参数统计测试来关联复杂条件下的对象。此外,我们建议基于iForest和线对齐的对象建模的离群鲁棒质心和尺度估计算法。然后由估计的通用对象模型表示轻量级和面向对象的地图。考虑到对象的语义不变性,我们将对象图转换为拓扑图以提供语义描述符以实现多图匹配。最后,我们提出了一种对象驱动的主动探索策略,以在抓取场景中实现自主建图。

0922e6aa-21d2-11ee-962d-dac502259ad0.png

提出的对象SLAM框架。

1 系统框架

本框架主要包含4个模块:

1.Tracking module:基于ORB-SLAM2实现相机轨迹跟踪并生成稀疏点云。

2.Semantic module:采用YOLO物体检测网络,结合点云测量与2D检测结果进行数据关联。利用iForest和线段对齐算法优化点云和线段。基于关联和优化结果参数化物体。

3.Object map:实现基于物体的轻量语义地图表示。

4.Application module:Augmented reality:基于实际物体姿态实现虚实模型配准,考虑遮挡和碰撞效果。Scene matching:将对象地图转换为拓扑图,设计物体描述子实现多情景匹配。Active exploration:利用物体不完整度量式信息熵驱动主动构建全局对象地图,实现抓握场景。

总的来说,框架实现稳健的数据关联、精确的物体参数化以及基于语义对象地图的高层应用,解决了对象SLAM涉及的主要挑战。语义对象地图能为机器人抓取、导航、规划等复杂任务提供必要信息,有助于实现智能机器人

2 对象级数据关联

本文提出一个集成方法来执行多帧间的对象数据关联。关联算法主要包含4部分:

(1) 运动IOU模型:如果全局物体在前两帧(t-1和t-2)可观测,则基于匀速运动假设预测当前帧(t)的边界框,与检测到的本地物体计算IOU值。

(2) 非参数检验模型:如果连续观测到物体失败,则直接应用非参数Wilcoxon检验对P和Q(代表物体点云)进行验证。假设它们来自同一物体,则应满足同一分布 fP = fQ 。

(3) 单样本t检验模型:分析不同视角下物体质心C和c是否来自同一物体。建立t统计量并与临界值比较:

09415004-21d2-11ee-962d-dac502259ad0.png

(4)投影IOU模型:将三维点云投影到二维图像,拟合投影边界框与检测框的IOU(5) 双样本t检验模型:如果存在重复物体,则对两个物体的历史质心C1和C2建立t统计量并比较,实现合并:

094b5b94-21d2-11ee-962d-dac502259ad0.png

095731d0-21d2-11ee-962d-dac502259ad0.png

其中d为两个物体的池化标准差。通过集成利用不同统计特征,提高了数据关联的鲁棒性和成功率。实验结果表明,与单一方法相比,集成方法能更有效地关联不同视角下的物体,为下一步的参数化奠定基础。总的来说,该方法充分利用了点云和质心分别显示的非高斯分布和高斯分布特性,通过不同统计模型集成提高关联性能。

0961c74e-21d2-11ee-962d-dac502259ad0.png

对象级数据关联示意图

3 对象参数化

我们利用立方体和二次曲面、圆柱体来表示对象,而不是复杂的实例级或类别级模型。对于具有规则形状的对象,例如书本、键盘和椅子,我们使用立方体(由它们的顶点 Po 编码)来表示它们。对于球、瓶、杯等没有明确方向的非规则物体,采用二次/圆柱(由其半轴Qo编码)表示,忽略其方向参数。这里,Po 和 Qo 在对象坐标系中表示,仅取决于尺度 s。为了将这些元素对准到全局地图,我们还需要估计它们的平移 t 和方向 θ。全局坐标系中的立方体和二次曲面表示如下:

096c835a-21d2-11ee-962d-dac502259ad0.png

随后,提出了基于iForest和线段对齐的离群点过滤算法,实现精确的对象尺度、位置和方位估计。主要包括以下部分:

(1) 平移和尺度估计:利用iForest去除点云中的离群点,剩余点云实现对象的初始尺度s和位置t估计。算法1描述了基于iForest的算法:

097719d2-21d2-11ee-962d-dac502259ad0.png

(2) 方位估计:分为初始化和优化两个阶段。

算法2描述了初始化算法:

098473ca-21d2-11ee-962d-dac502259ad0.png

(3) 对象表示:根据物体形状使用立方体或对角模型表示,编码尺度s、位置t和方位角θ。

总的来说,采用iForest过滤离群点和线段对齐初始化方位角,有效实现了精确的6DOF姿态估计。最终构建了基于物体类型的通用模型,实现了轻量级语义对象地图:

098fcd42-21d2-11ee-962d-dac502259ad0.png

3 对象描述子

为了描述不同物体间的关系,文章构建了语义拓扑图和基于此的随机游走描述子。

拓扑图:通过物体的语义标签、位置、姿态和尺寸信息,构建不同物体及物体与情景的关系图:

099ac0da-21d2-11ee-962d-dac502259ad0.png表示物体节点,编码物体信息

09a59ae6-21d2-11ee-962d-dac502259ad0.png表示边,编码两个物体的距离d和角度α

描述子:基于拓扑图中不同物体间的关系,采用随机游走的方式构建物体描述子υ:

09af3b96-21d2-11ee-962d-dac502259ad0.png

r是一个随机行走路径,起始于被描述的物体,最多到达i个物体。每行重复j次随机行走。

多维度信息:为了提高鲁棒性,描述子中考虑物体标签l、尺寸s、距离d和角度α四个维度:

09c8c048-21d2-11ee-962d-dac502259ad0.png4. 场景匹配:基于多个物体对的描述子匹配,求解两个情景的转换矩阵T:

· 生成两个情景T1和T2的描述子V1和V2。

· 对每个对象v1在V1中找到在V2中的最佳匹配v2。

· 根据多个物体对,利用奇异值分解(SVD)求解转换矩阵T。

鲁棒性:采用RANSAC算法去除误匹配物体对,提高匹配的鲁棒性。总的来说,基于拓扑图实现的物体描述子充分利用了物体的语义、尺寸和相对关系,能有效实现不同视角下的场景匹配。考虑更多非物体的语义特征可能进一步提高鲁棒性和准确性。

4 实验结果

数据关联:实验结果表明,集成不同统计模型超过单一方法。表明点云和质心确实呈现非高斯分布和高斯分布。

09d8d3ac-21d2-11ee-962d-dac502259ad0.png

2. 对象参数化: 实验结果表明, iForest和线段对齐有效实现精确的6DOF姿态估计。并构建了基于形状的通用对象模型

09e2eb62-21d2-11ee-962d-dac502259ad0.png

09ed9e4a-21d2-11ee-962d-dac502259ad0.png

3. 对象地图构建:可在不同数据集上构建语义对象地图,处理不同类、数量、尺寸和方位角的物体。实验表明系统的鲁棒性。

0a176c70-21d2-11ee-962d-dac502259ad0.png

4. 增强现实:基于精确的物体姿态信息,实现虚拟模型与实物精准配准。考虑遮挡和碰撞效果,提高虚拟可信度。

0a2b2562-21d2-11ee-962d-dac502259ad0.png

5. 场景匹配:基于物体描述子,可在不同视角和照明条件下实现场景匹配和多地图融合。具有鲁棒性。

0a372cfe-21d2-11ee-962d-dac502259ad0.png

6. 主动地图构建:通过信息熵量化物体观测完整度,驱动主动建设语义对象地图。实验表明比随机探索和全面覆盖策略更高效和更准确。

0a464d9c-21d2-11ee-962d-dac502259ad0.png

7. 机器人抓取:基于语义对象地图信息,实现机器人抓握。在虚拟环境和实际环境下的成功率分别达到86%和81%。

0a6f8838-21d2-11ee-962d-dac502259ad0.png

局限性:数据关联在极端情况下存在问题;对象姿态估计受离群点影响而不准确;场景匹配依赖精确的对象建模。改进方向:优化数据关联鲁棒性;采用机器学习提高姿态估计精度;构建更通用的物体描述子;采用多源感知实现全景对象地图。

总的来说,实验结果充分证明了对象SLAM框架在不同应用上的有效性和潜力。同时指出了当前的局限性和未来的改进方向。这对促进对象SLAM技术的发展至关重要。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 框架
    +关注

    关注

    0

    文章

    297

    浏览量

    17045
  • 智能机器人
    +关注

    关注

    17

    文章

    825

    浏览量

    81327
  • SLAM
    +关注

    关注

    22

    文章

    390

    浏览量

    31591

原文标题:TRO新文:用于数据关联、建图和高级任务的对象级SLAM框架

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于多模态语义SLAM框架

    本文提出了一个鲁棒且快速的多模态语义 SLAM 框架,旨在解决复杂和动态环境中的 SLAM 问题。具体来说,将仅几何聚类和视觉语义信息相结合,以减少由于小尺度对象、遮挡和运动模糊导致的
    的头像 发表于 08-31 09:39 1352次阅读

    让机器人完美SLAM 3.0到底是何方神圣?

    引擎,让机器人在复杂、大面积的场景下也能轻松应对,稳定发挥,完成定位导航任务。 传统SLAMSLAM 3.0的
    发表于 01-21 10:57

    请问为什么不采用优先继承机制时高优先级任务竞争不过中优先级任务

    如图,请问画线部分怎么理解,为什么不采用优先继承机制时高优先级任务竞争不过中优先级任务?希望各位大神帮小弟解决一下,谢谢~
    发表于 07-11 04:35

    请问ucosii任务响应时会出现低优先级任务没法响应的情况吗?

    刚学ucosii有一个理论上的问题没搞懂,在ucosii中任务总是响应已经准备好的最高优先,那会不会出现这样一种情况:任务优先高的任务
    发表于 11-11 04:35

    任务优先问题

    同优先任务可以通过时间片轮转调度来实现任务切换。在不同优先任务中,如果高优先
    发表于 04-02 04:35

    UCOSII中断级任务调度是返回被中断处吗?

    UCOSII中断级任务调度是返回被中断处还是调度去执行优先最高的任务,如果去执行优先最高的任务那被中断的
    发表于 04-03 00:45

    FreeRTOS任务调度优先,会直接在就绪列表中调用低优先级任务么?

    由于刚开始使用FreeRTOS,所以有很多问题,也正在学习。请问各位,假如优先高的任务时间片用完后,会直接在就绪列表中调用低优先级任务么?假设:Task_A 优先为2,Task_B
    发表于 06-14 09:01

    FREERTOS 高优先级任务不能调度低优先级任务照常运行怎么办

    建立四个任务,两个优先相同的任务,两个比此优先高的任务,开始
    发表于 06-17 02:36

    创建0优先任务,程序会一直运行该任务这是为什么呢?

    看资料说,0优先是空闲任务,但是其他任务是可以与空闲任务,共享0优先的,那么我创建两个任务
    发表于 07-26 08:00

    激光SLAM与视觉SLAM有什么区别?

    在机器人运动控制系统架构中,可分为最底层、中间通信层和决策层三大层面,最底层包含了机器人本身的电机驱动和控制部分,中间通信层是底层部分和决策层的通信通路,而决策层则是实现机器人的定位及导航。在
    发表于 07-05 06:41

    在gazebo中构建一个用于和导航的虚拟环境

    完整任务内容在gazebo中构建一个用于和导航的虚拟环境,可以使用Building Editor工具创建,也可以使用其他功能包中已有的虚拟环境;将前面作业完成的带传感器的移动机器人
    发表于 12-17 07:06

    HOOFR-SLAM的系统框架及其特征提取

    Intelligent Vehicles Applications1. 介绍2. HOOFR-SLAM2.1 系统框架2.2 HOOFR特征提取2.3 映射线程2.3.1 特征匹配1. 介绍提出一种HOOFR-...
    发表于 12-21 06:35

    如何实现基于RK3399开发板的cartographer激光SLAM模块的设计?

    如何实现基于RK3399开发板的cartographer激光SLAM模块的设计?
    发表于 03-07 07:05

    ORB-SLAM3与ORB-SLAM2相比有哪些优势呢?

    自主导航是机器人基础性和关键性技术,是机器人实现其他更高级任务的前提。视觉 SLAM (Simultaneous Localization And Mapping) 利用视觉传感器获取环境图像信息,基于多视图几何算法构建环境地图。
    的头像 发表于 01-16 10:58 2145次阅读

    用于神经场SLAM的矢量化对象建图

    vMAP 是一种基于神经场的对象级密集 SLAM 系统,可根据 RGB-D 输入流实时自动构建对象级场景模型。
    的头像 发表于 06-15 09:29 534次阅读
    <b class='flag-5'>用于</b>神经场<b class='flag-5'>SLAM</b>的矢量化<b class='flag-5'>对象</b>建图