0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于图卷积的层级图网络用于基于点云的3D目标检测

454398 来源:学术头条 作者:徐家兴 2021-06-21 12:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

论文:A Hierarchical Graph Network for 3D Object Detection on Point Clouds

由于大多数现有的点云对象检测方法不能充分适应点云的特征(例如稀疏性),所以一些关键的语义信息(如物体形状)不能被很好的捕捉到。本文提出了一种基于层级图网络(HGNet)的图卷积(GConv),可以直接将点云作为输入来预测 3D 的边界框。形状注意图卷积(SA-GConv)可以通过剑魔点的位置星系来描述物体形状,基于 SA-GConv 的 U 形网络可以通过改进的 voting 模块获取多层级的特征进而生成候选,然后一个基于图卷积的候选推理模块考虑全局的场景语义来对边界框进行预测。该框架在两个大规模点云数据上的表现超过了目前最先进的模型。

论文背景

由于点云的稀疏性,一些已有的为网格形式数据设计的方法(如 CNN)在点云上的表现并不好,为解决这一问题,最近有一些对点云数据的方法被提出,例如基于投影的方法、基于体卷积的方法和基于 PointNet 的方法。前两种试图将点云数据严格转换为网格结构数据,而后一种则在不明确考虑点的几何位置的情况下聚合特征。

其他方法相比,PointNet++ 可以保留点的稀疏特点,因此被广泛作为框架的骨架。当目前仍有一些未能很好解决的挑战,首先由于没有考虑点的相对几何位置,因此使用 PointNet++ 作为主干忽略了一些局部形状信息。其次,框架的结构没有充分利用多级语义,这可能会忽略一些有助于目标检测的信息。

本文提出了一个基于图卷积(GCONV)的层级图网络(HGNet)用于基于点云的 3D 目标检测。HGNet 包含三部分:一个基于图卷积的 U 形网络(GUnet)、一个候选生成器以及一个候选推理模块(ProRe Module)。基于层级图网络(HGNet)的图卷积

整个 HGNet 以端到端的方式进行培训。在本文的框架中,点云的局部形状信息、多级语义和全局场景信息(候选的特征)已被层级图模型充分捕获、聚合和合并,充分考虑了点云数据的特征。

本文的主要贡献如下:

(A)开发了一种新的层级图网络(HGNet),用于在点云上进行 3D 对象检测,其表现好于已有方法。

(B)提出了一种新颖的 SA-(De)GConv,它可以有效地聚合特征并捕获点云中对象的形状信息。

(C)构建了一个新的 GU-net,用于生成多级特征,这对于 3D 对象检测至关重要。

(D)利用全局信息,ProRe 模块通过对候选进行推理来提高效果。

论文模型

pIYBAF-cV8yALlh9AAKzXXorTzM753.jpg

融合采样

3D 目标检测有基于点和基于体素两种框架,前者更加耗时,由候选生成与预测细化两个阶段组成。

在第一个阶段,SA 用于降采样以获得更高的效率以及扩大感受野,FP 用来为降采样过程中丢掉的点传播特征。在第二阶段,一个优化模块最优化 RPN 的结果以获得更准确的预测。SA 对于提取点的特征是必需的。但 FP 和优化模块会限制效率。

形状注意图卷积

点云通常不能清楚地表示出物体的形状,可以使用其相邻点的相对几何位置来描述点周围的局部形状。本文介绍了一种新颖的形状注意图卷积,它通过对点的几何位置建模来捕获对象形状。

对于一个点集 X,其中每一个点由其集合位置 p_i 以及 D 维的特征 f_i 组成,我们想要生成一个 X’,本文设计了图卷积用于聚合从 X 到 X’ 的特征。与 PointNet++的采样层相类似,本文首先从 n 个点中采样 n’ 个点,通常 K 最近邻(KNN)被用来在采样中保留局部信息将其作为中心点特征。

pIYBAF-cV86ABApMAAA25BZLxR8713.jpg

其中 g 表示 i 和 j 的相对位置,通过一个卷积将三维变为一维,f 是 mlp,然后二者的乘积就是中心点的 knn,其中最大的作为 i 的特征。形状注意操作不同于简单的基于 mlp 的操作主要就是因为这个 g 函数。虽然形式上没有 attention 中的 softmax 这样的归一化,但是 g 的输出就和 attention 一样,每个点的 weights,然后对应的乘以特征。

o4YBAF-cV9iAADYDAAfuw2ITQns343.jpg

GU-net

本文设计了一个下采样模块,并将其重复堆叠 4 次以形成下采样路径,而将一个上采样模块重复堆叠两次以构成上采样方式。类似 FPN、GU-net 生成三张点特征图的特征金字塔。下采样使用的是 FPS,然后通过 KNN 构建局部区域,再使用 SA-GConv 更新特征,上采样模块的过程与下采样模块的过程相反,主要由 SA-GConv 执行。

pIYBAF-cV96AZ4YhAAVmh5c6fG8299.jpg

候选生成器

GU-net 生成了包含多级语义的三张点特征图。一些先前的方法(如 VoteNet)仅使用一个特征图进行目标预测。即使通过在上采样过程中融合较低层的特征来计算较高层的特征,由于不同层的特征提供了各种语义,因此将多层特征一起用于候选生成会更加有益。本文提出了一种候选生成器,以改进的投票模块作为主要结构来预测对象中心,该模型将多级特征转换为相同的特征空间。接下来为了聚合特征,通过 FPS 保留 Np 的投票,该做法与 VoteNet 类似,从而融合多级特征以预测边界框及其类别。

候选推理模块

通过以上几步,多层局部的语义信息已经被很好的捕捉到了,但全局信息还没有很好的学到,或者说可能有些目标在点云中只体现出很小的一部分表面的点,在这样少的信息下很难正确的将其识别出来。其推理过程为:

o4YBAF-cV-CABjbfAAAyyHHn4tE694.jpg

其中 Hp 表示候选特征 tensor,P 表示候选的相对位置

论文实验

本文在 SUN RGB-D 和 ScanNet-V2 两个数据集上进行了实验。

pIYBAF-cV-SAecV-AAIQCbTGyOM690.jpg

o4YBAF-cV-mAODbPAAM3xD0AqUY930.jpg

此外,本文还进行了消融实验以证明各模快的有效性。

o4YBAF-cV-6ALsTCAAKeSQs30fg144.jpg

结论

本文提出了一种新颖的 HGNet 框架,该框架通过层级图建模学习语义。

具体来说,作者提出了一种新颖且轻巧的形状注意图卷积来捕获局部形状语义,该语义聚合了点的相对几何位置的特征。基于 SA-GConv 和 SA-DeGConv 构建了 GU-net,生成了包含多级语义的特征金字塔。要素金字塔投票的点将位于相应的对象中心,并且进一步聚合多级语义以生成候选。然后使用 ProRe 模块在候选之间合并和传播特征,从而利用全局场景语义来提高检测性能。最后,对边界框和类别进行了预测。

编辑:hfy


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    倍加福基于双目视觉技术的SmartRunner 3D传感器介绍

    当我们迈入自动化的“三维时代”,SmartRunner Explorer 3D不仅能生成清晰的2D图像,还可输出高精度的3D数据。
    的头像 发表于 04-08 10:39 327次阅读
    倍加福基于双目视觉技术的SmartRunner <b class='flag-5'>3D</b>传感器介绍

    光子精密3D工业相机高效质检连接器pin针

    光子精密GL-8000系列3D线激光轮廓测量仪,专为精密工件三维检测而生,从算法、硬件到系统集成,全面解除PIN针检测
    的头像 发表于 01-29 15:51 277次阅读
    光子精密<b class='flag-5'>3D</b>工业相机高效质检连接器pin针

    Vitrox的v510i系列的3D AOI光学检测设备

    V510i部署在SMT生产线的 贴片机之后、回流焊炉之前或之后 ,主要用于检测贴装好的电子元件是否存在缺陷。其核心任务是: 3D与2D复合检测
    的头像 发表于 12-04 09:27 949次阅读

    3D案例丨不良率直降!光子精密3D工业相机专治汽车散热板测量痛

    汽车散热板是热管理系统核心部件,其质量直接影响整车稳定性、寿命与市场竞争力。 但汽车散热基板(尤其是铜基板)尺寸大、端点小、结构密集,且受多重反射与杂光干扰,常规 3D 检测易出现精度和测量范围难
    的头像 发表于 11-20 08:03 407次阅读
    <b class='flag-5'>3D</b>案例丨不良率直降!光子精密<b class='flag-5'>3D</b>工业相机专治汽车散热板测量痛<b class='flag-5'>点</b>

    iSUN3D即将推出单组分弹性树脂3D打印解决方案!

    iSUN3D将在Formnext 2025发布单组分弹性树脂3D打印方案,覆盖设计到交付全流程,解决柔弹性制造成本与效率痛,现场可体验高速打印与限量礼品。
    的头像 发表于 11-17 11:45 863次阅读
    iSUN<b class='flag-5'>3D</b>即将推出单组分弹性树脂<b class='flag-5'>3D</b>打印解决方案!

    一些神经网络加速器的设计优化方案

    特征保留不变,完成和所有相关卷积积以后再加载,最多复用 R*R*M 次。 3.不同网络模型的效果 如图所示,后者相对于前者,减少了
    发表于 10-31 07:14

    【CIE全国RISC-V创新应用大赛】+基于MUSE Pi Pro的3d激光里程计实现

    基于Point-LIO算法的系统设计、实现方法和优化策略。 1. 系统概述 项目目标 利用MUSE Pi Pro开发板和速腾聚创Airy 96线激光雷达传感器,基于Point-LIO算法开发高性能的3D
    发表于 10-24 17:02

    如何通过地址生成器实现神经网络特征的padding?

    对于SiamFC网络结构,我们设计的卷积核宽度为3*3卷积步长为1,则经卷积过后,特征
    发表于 10-22 08:15

    玩转 KiCad 3D模型的使用

    时间都在与 2D 的焊盘、走线和丝印打交道。但一个完整的产品,终究是要走向物理世界的。元器件的高度、接插件的朝向、与外壳的配合,这些都是 2D 视图难以表达的。 幸运的是,KiCad 提供了强大的 3D 可视化功能。它不仅能让你
    的头像 发表于 09-16 19:21 1.2w次阅读
    玩转 KiCad <b class='flag-5'>3D</b>模型的使用

    iTOF技术,多样化的3D视觉应用

    动态模糊,确保高耐光性,同时输出2D(红外)和3D(深度)数据。 ◆ Testing Principles ※ 测量脉冲光的飞行时间,以检测 TOF 相机与被测物体之间的距离。 ◆ ToF 产品
    发表于 09-05 07:24

    3D激光轮廓仪可实现在线3D测量和检测

    Z-Trak™ Express 1K5 系列专为实现经济高效的在线3D测量和检测而设计,具有高速检测能力和实时处理性能。
    的头像 发表于 08-08 17:17 1164次阅读
    <b class='flag-5'>3D</b>激光轮廓仪可实现在线<b class='flag-5'>3D</b>测量和<b class='flag-5'>检测</b>

    海伯森3D闪测传感器,工业检测领域的高精度利器

    随着信息技术的飞速进步,第四次视觉革命深度融合“人”“机”“物”,基于光学原理的3D视觉检测技术迎来爆发式发展,成为工业生产中更高效的检测利器。3D视觉技术通过非接触性、高速性、数据完
    的头像 发表于 06-20 17:46 1605次阅读
    海伯森<b class='flag-5'>3D</b>闪测传感器,工业<b class='flag-5'>检测</b>领域的高精度利器

    3D AD库文件

    3D库文件
    发表于 05-28 13:57 6次下载

    告别漫长等待! 3D测量竟然可以如此的丝滑

    据进行实时处理,快速得到全视角的彩色高精度2D图像和3D。产品优势01高精度的在线3D检测
    的头像 发表于 05-12 18:01 771次阅读
    告别漫长等待! <b class='flag-5'>3D</b>测量竟然可以如此的丝滑

    TPS65735 用于主动快门 3D 眼镜的电源管理 IC数据手册

    TPS65735 设备是用于活动的电源管理单元 (PMU) 快门 3D 眼镜由集成电源路径、线性充电器、LDO、升压转换器、 以及全 H 桥模拟开关,用于一对主动快门中的左右快门作 3D
    的头像 发表于 04-28 09:41 1103次阅读
    TPS65735 <b class='flag-5'>用于</b>主动快门 <b class='flag-5'>3D</b> 眼镜的电源管理 IC数据手册