0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用于处理三维点云的深度学习方法的分析

3D视觉工坊 来源:arxiv 作者:Yulan Guo, Hanyun Wan 2022-11-02 15:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

3D点云学习( Point Clouds)作为近年来的研究热点之一,受到了广泛关注,每年在各大会议上都有大量的相关文章发表。当前,点云上的深度学习变得越来越流行,人们提出了许多方法来解决这一领域的不同问题。国防科技大学郭裕兰老师课题组新出的这篇论文对近几年点云深度学习方法进行了全面综述,是第一篇全面涵盖多个重要点云相关任务的深度学习方法的综述论文,包括三维形状分类、三维目标检测与跟踪、三维点云分割等,并对点云深度学习的机制和策略进行全面的归纳和解读,帮助读者更好地了解当前的研究现状和思路。也提供了现有方法在几个可公开获得的数据集上的全面比较,最后也介绍了未来的研究方向。

a98b47ca-4ca5-11ed-a3b6-dac502259ad0.png

对于3D点云,数据正在迅速增长。大有从2D向3D发展的趋势,比如在opencv中就已经慢慢包含了3D点云的处理的相关模块,在数据方面点云的获取也是有多种渠道, 无论是源于CAD模型还是来自LiDAR传感器或RGBD相机的扫描点云,无处不在。另外,大多数系统直接获取3D点云而不是拍摄图像并进行处理。因此,在深度学习大火的年代,应该如何应用这些令人惊叹的深度学习工具,在3D点云上的处理上达到对二维图像那样起到很好的作用呢?

3D点云应用深度学习面临的挑战。首先在神经网络上面临的挑战:

(1)非结构化数据(无网格):点云是分布在空间中的XYZ点。没有结构化的网格来帮助CNN滤波器

(2)不变性排列:点云本质上是一长串点(nx3矩阵,其中n是点数)。在几何上,点的顺序不影响它在底层矩阵结构中的表示方式,例如, 相同的点云可以由两个完全不同的矩阵表示。如下图所示:

(3)点云数量上的变化:在图像中,像素的数量是一个给定的常数,取决于相机。然而,点云的数量可能会有很大的变化,这取决于各种传感器。

a99ae824-4ca5-11ed-a3b6-dac502259ad0.png

在点云数据方面的挑战:

(1)缺少数据:扫描的模型通常被遮挡,部分数据丢失。
(2)噪音:所有传感器都是嘈杂的。有几种类型的噪声,包括点云扰动和异常值。这意味着一个点有一定的概率位于它被采样的地方(扰动)附近的某一半径范围内,或者它可能出现在空间的任意位置(异常值)。
(3)旋转:一辆车向左转,同一辆车向右转,会有不同的点云代表同一辆车。

a9bc9942-4ca5-11ed-a3b6-dac502259ad0.png

点云学习近年来受到越来越多的关注,因为它在许多领域都有广泛的应用,比如计算机视觉自动驾驶机器人技术。作为人工智能的主要技术之一,深度学习已经成功地用于解决各种二维视觉问题。然而,由于使用深度神经网络处理点云所面临的独特挑战,对点云的深度学习仍处于起步阶段。最近,点云上的深度学习变得越来越流行,人们提出了许多方法来解决这一领域的不同问题。为了激发未来的研究,本文对点云深度学习方法的最新进展进行了综述。它涵盖了三个主要任务,包括三维形状分类,三维目标检测和跟踪以及三维点云分割。我们还提供了一些可公开获得的数据集的比较结果,以及有见地的观察和启发性的未来研究方向。

引言

3D数据在不同的领域有许多应用,包括自动驾驶、机器人、遥感、医疗和设计行业[4]。近年来,深度学习技术在计算机视觉、语音识别、自然语言处理(NLP)、生物信息学等研究领域占据主导地位。但是,在三维点云上进行深度学习仍然面临数个重大挑战[5],例如数据集规模小,维数高和三维点云的非结构化性质。在此基础上,本文重点分析了用于处理三维点云的深度学习方法。

一些公开的数据集也被发布,例如ModelNet [6],ShapeNet [7],ScanNet [8],Semantic3D [9]和KITTI Vision Benchmark Suite[10]。这些数据集进一步推动了对三维点云的深度学习研究,提出了越来越多的方法来解决与点云处理相关的各种问题,包括三维形状分类、三维目标检测与跟踪、三维点云分割等。

这篇论文是第一个专门针对点云的深度学习方法的综述。此外,论文全面涵盖了分类,检测,跟踪和分割等不同应用。图1显示了三维点云的现有深度学习方法的分类。

a9ee28f4-4ca5-11ed-a3b6-dac502259ad0.png

图1:三维点云深度学习方法分类。

这项工作的主要贡献可以概括如下:

· 1)据我们所知,这是第一篇全面涵盖多个重要点云相关任务的深度学习方法的综述论文,包括三维形状分类、三维目标检测与跟踪、三维点云分割等。

·2)相对于已有的综述[11],[12],我们特别关注三维点云的深度学习方法,而不是所有类型的三维数据。

· 3)本文介绍了点云深度学习的最新进展。因此,它为读者提供了最先进的方法。

·4)提供了现有方法在几个可公开获得的数据集上的全面比较(例如,表1、2、3、4),并提供了简要的总结和深入的讨论。

本文的结构如下。第2节回顾了三维形状分类的方法。第3节概述了现有的三维目标检测和跟踪方法。第4节介绍了点云分割的方法,包括语义分割、实例分割和部件分割。最后,第5节总结了论文。

论文还在以下网址上提供了定期更新的项目页面:

https://github.com/QingyongHu/SoTA-Point-Cloud

aa0112f2-4ca5-11ed-a3b6-dac502259ad0.png

图2:三维形状分类网络的时间顺序概览。

aa0c5c70-4ca5-11ed-a3b6-dac502259ad0.png

图3:PointNet的体系结构。

aa29f758-4ca5-11ed-a3b6-dac502259ad0.png

图4:点的局部邻居的连续和离散卷积的图解。(a)代表一个局部邻居;(b)和(c)分别表示三维连续卷积和离散卷积。

aa31cb18-4ca5-11ed-a3b6-dac502259ad0.png

图5:基于图的网络的图解。

aa36f8c2-4ca5-11ed-a3b6-dac502259ad0.png

表1:在ModelNet10/40基准上比较三维形状分类结果。这里,我们只关注基于点的网络,“#params”表示相应模型的参数数量。“OA”表示总体精度,“mAcc”表示表中的平均精度。符号“-”表示结果不可用。

aa5fe07a-4ca5-11ed-a3b6-dac502259ad0.png

图6:按时间顺序概述的最相关的基于深度学习的三维目标检测方法。

aa7d59b6-4ca5-11ed-a3b6-dac502259ad0.png

图7:三类三维目标检测方法的典型网络。从上到下:(a)基于多视图,(b)基于分割,(c)基于视锥的方法。

aab5ab86-4ca5-11ed-a3b6-dac502259ad0.png

表2:在KITTI测试三维检测基准上的三维目标检测结果对比。

aad4ce6c-4ca5-11ed-a3b6-dac502259ad0.png

表3:在KITTI test BEV检测基准上三维目标检测结果对比。

ab10723c-4ca5-11ed-a3b6-dac502259ad0.png

图8:按时间顺序概述了一些最相关的基于深度学习的点云语义分割方法。

ab2c5cea-4ca5-11ed-a3b6-dac502259ad0.png

图9:基于投影方法的中间表示图。

ab9ae250-4ca5-11ed-a3b6-dac502259ad0.png

图10:PointNet++[27]框架的示意图。

aba1da10-4ca5-11ed-a3b6-dac502259ad0.png

图11:有代表性的三维点云实例分割方法的年代概述。

未来方向

表4展示了现有方法在公共基准测试上的结果,包括S3DIS[176]、Semantic3D[9]、ScanNet[102]、SemanticKITTI[177]。需要进一步研究的问题有:

·基于点的网络是最常被研究的方法。然而,点表示自然不具有显式的邻近信息,现有的大多数基于点的方法不得不借助于昂贵的邻近搜索机制(如KNN[52]或ball query [27])。这从本质上限制了这些方法的效率,因为邻居搜索机制既需要很高的计算成本,又需要不规则的内存访问[214]。

·从不平衡数据中学习仍然是点云分割中一个具有挑战性的问题。虽然有几种的方法取得了显著的综合成绩[42]、[170]、[182],但它们在类标很少的情况下表现仍然有限。例如,RandLA-Net[95]在Semantic3D的reduced-8子集上获得了76.0%的整体IoU,而在hardscape类上获得了41.1%的非常低的IoU。

·大多数现有的方法[5]、[27]、[52]、[170]、[171]都适用于小点云(如1m*1m,共4096个点)。在实际中,深度传感器获取的点云通常是巨大的、大规模的。因此,有必要进一步研究大规模点云的有效分割问题。

·已有少数文献[145]、[146]、[167]开始研究动态点云的时空信息。预期时空信息可以帮助提高后续任务的性能,如三维目标识别、分割和完成。

abd31800-4ca5-11ed-a3b6-dac502259ad0.png

表4:S3DIS(包括Area5和6-fold cross validation)[176]、Semantic3D(包括semantic-8和reduced-8子集)[9]、ScanNet[8]和SemanticKITTI[177]数据集的语义分割结果对比。

结论

本文介绍了最先进的三维理解方法,包括三维形状分类,三维目标检测和跟踪,以及三维场景和目标分割。对这些方法进行了全面的分类和性能比较。介绍了各种方法的优缺点,并提出了今后的研究方向。

作者:Yulan Guo, Hanyun Wang, Qingyong Hu, Hao Liu, Li Liu, and Mohammed Bennamoun

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7764

    浏览量

    92694
  • 自动驾驶
    +关注

    关注

    791

    文章

    14673

    浏览量

    176649
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123920

原文标题:3D点云分割、目标检测、分类

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一文读懂 | 三维视觉领域国家级制造业单项冠军——先临三维的品牌布局

    ,推动高精度三维视觉技术的普及应用。2024年,先临三维营业收入超12亿元,业务遍及全球100+个国家和地区。 先临三维的高精度三维视觉技术深度
    的头像 发表于 11-11 14:55 286次阅读
    一文读懂 | <b class='flag-5'>三维</b>视觉领域国家级制造业单项冠军——先临<b class='flag-5'>三维</b>的品牌布局

    构建适用于三维集成系统的互连线长分布模型

    三维集成电路设计中,TSV技术通过垂直互连显著优化了互连线长分布特性。基于伦特定律的经典分析框架,可构建适用于三维集成系统的互连线长分布模型。
    的头像 发表于 08-21 10:41 758次阅读
    构建适<b class='flag-5'>用于</b><b class='flag-5'>三维</b>集成系统的互连线长分布模型

    AI 驱动三维逆向:降噪算法工具与机器学习建模能力的前沿应用

    三维逆向工程领域,传统方法处理复杂数据和构建高精度模型时面临诸多挑战。随着人工智能(AI)技术的发展,降噪算法工具与机器
    的头像 发表于 08-20 10:00 462次阅读
    AI 驱动<b class='flag-5'>三维</b>逆向:<b class='flag-5'>点</b><b class='flag-5'>云</b>降噪算法工具与机器<b class='flag-5'>学习</b>建模能力的前沿应用

    VirtualLab:光学系统的三维可视化

    摘要 为了对光学系统的性质有一个基本的了解,对其组件的可视化和光传播的提示是非常有帮助的。为此,VirtualLab Fusion提供了一个工具来显示光学系统的三维视图。这些工具可以进一步用于检查
    发表于 05-30 08:45

    南方测绘推出实景三维中国整体解决方案

    新型基础测绘与实景三维中国建设持续推进,南方测绘深度聚焦,基于自主研发的SmartGIS平台,打造以地理实体数据为核心的“生产、处理、质检、管理、可视化分析”实景
    的头像 发表于 03-26 16:44 1059次阅读

    三维测量在医疗领域的应用

    三维测量在医疗领域的应用十分广泛,为医疗诊断、治疗及手术规划等提供了重要的技术支持。以下是对三维测量在医疗领域应用的分析: 一、医学影像的三维重建与
    的头像 发表于 12-30 15:21 1096次阅读

    三维测量数据处理流程

    一系列的处理步骤才能转化为有用的信息。 1. 数据采集 三维测量数据处理的第一步是数据采集。这一步骤涉及到使用各种传感器和设备来获取三维空间中的
    的头像 发表于 12-30 15:06 1345次阅读

    三维测量软件的使用技巧

    需要哪些功能,如处理三维建模、数据分析等。 软件兼容性 :确保软件能够与现有的硬件设备兼容,如三维
    的头像 发表于 12-30 15:05 1358次阅读

    常见的三维测量方法和工具

    三维测量是用于获取物体三维几何信息的技术,它在工业制造、建筑、考古、医学等领域有着广泛的应用。以下是一些常见的三维测量方法和工具的概述,以及
    的头像 发表于 12-30 15:02 1929次阅读

    三维测量技术在工业中的应用

    在现代工业生产中,精确的测量和质量控制是保证产品性能和可靠性的关键。随着科技的进步,传统的二测量方法已经无法满足高精度和复杂形状测量的需求。三维测量技术以其高精度、高效率和灵活性,成为工业领域
    的头像 发表于 12-30 15:01 1167次阅读

    传统机器学习方法和应用指导

    开发生物学数据的机器学习方法。尽管深度学习(一般指神经网络算法)是一个强大的工具,目前也非常流行,但它的应用领域仍然有限。与深度学习相比,传
    的头像 发表于 12-30 09:16 1983次阅读
    传统机器<b class='flag-5'>学习方法</b>和应用指导

    南方智能SmartGIS Inspec实景三维质检软件介绍

    新型基础测绘与实景三维中国建设持续推进,南方测绘集团旗下南方智能深度聚焦,基于自主研发的SmartGIS平台,打造以地理实体数据为核心的“生产、处理、质检、管理、可视化分析”实景
    的头像 发表于 12-27 11:20 1963次阅读

    思看科技手持三维激光扫描仪种工作模式介绍

    思看科技手持三维扫描仪有高速、精细、复合及深孔扫描模式,适用于不同场景需求,合理选择模式可快速获取、处理物体三维数据,支持后续制造、设计或修复工作。
    的头像 发表于 12-24 15:32 1491次阅读
    思看科技手持<b class='flag-5'>三维</b>激光扫描仪<b class='flag-5'>三</b>种工作模式介绍

    三维扫描在医疗领域的应用

    三维扫描技术在医疗领域的应用非常广泛,为医疗行业的进步带来了革命性的变化。 一、外科手术规划与模拟 术前分析三维扫描仪可以获取患者身体部位的三维数据,帮助医生进行术前
    的头像 发表于 12-19 14:58 2109次阅读

    三维扫描与建模的区别 三维扫描在工业中的应用

    三维扫描与建模的区别 三维扫描与建模是两种不同的技术,它们在操作过程、输出结果及应用领域上存在显著的区别。 操作过程 : 三维扫描 :主要通过激光或光学扫描设备,获取实物表面的形状、纹理信息等
    的头像 发表于 12-19 14:55 1576次阅读