实行实时3D目标检测的方法讨论-电子发烧友网

基于激光雷达的三维目标检测对于自动驾驶而言是不可避免的选择，因为它与对环境的理解直接相关，从而为预测和运动规划奠定了基础。对于除了自动化车辆之外的许多其他应用领域，例如增强现实、个人机器人或工业自动化，对实时高度稀疏的三维数据进行推断的能力是一个不合适的问题。

我们引入了Complex-YOLO，这是一种最先进的仅针对点云（point clouds）的实时三维目标检测网络。在本研究中，我们描述了一个网络，该网络通过一个特定的复杂的回归策略来估计笛卡尔空间（Cartesian space）中的多类三维立方体，从而扩展YOLOv2（一种用于RGB图像的一个快速二维标准目标检测器）。

因此，我们提出了一个特定的Euler区域提议网络(Euler-Region-Proposal Network，E-RPN)，通过在回归网络中添加一个虚构的和一个真实的分数来估计目标的姿势。这是在一个封闭的复杂空间中结束的，从而避免了单角度估计的奇异性。E-RPN支持在训练过程中进行良好的泛化。

我们在KITTI基准套件上进行的实验表明，我们的性能优于当前领先的三维目标检测方法，尤其在效率方面。我们取得了对汽车、行人和骑车者进行测试的最先进的结果，比最快的竞争者快5倍以上。此外，我们的模型能够同时以高精确度估计所有的8个KITTI类，包括货车、卡车或坐着的行人。

近年来，随着汽车激光雷达传感器的巨大完善，点云处理对自动驾驶而言变得越来越重要。供应商的传感器能够实时提供周围环境的三维点。其优点是直接测量所包含的目标之间的距离。这使我们能够开发出用于自动驾驶的目标检测算法，该算法能够精确地估计出三维中不同目标的位置和航向。与图像相比，激光雷达点云稀疏，其密度分布在整个测量区域中变化。这些点是无序的，它们在本地进行交互，并且主要是不能被孤立分析。点云处理对于基本转换应该是始终保持不变的。

实行实时3D目标检测的方法讨论

Complex-YOLO是一个非常有效的模型，可直接在仅基于激光雷达的鸟瞰RGB视图上进行操作，以估计和精确定位3D多类边界框。该图的上半部分显示了诸如预测目标等基于Velodyne HDL64电云的鸟瞰图，下半部分显示3D边界框被重新投影至图像空间中。注意：Complex-YOLO仅基于激光雷达进行操作，而不需要相机图像作为输入。

一般而言，基于深度学习的目标检测和分类是众所周知的任务，并且在图像的2D边界框回归的建立中得到了广泛应用。研究的重点主要是精确度和效率的权衡。在自动驾驶领域，效率更为重要。因此，最好的目标检测器往往使用区域提议网络（RPN）或类似的基于网格的RPN方法。这些网络非常高效、准确，甚至能够在专用的硬件或嵌入式设备上运行。尽管点云上的目标检测依然很少，但它们正变得越来越重要。这些应用程序需要能够预测3D边界框。目前，主要有三种不同的深度学习方法：

使用多层感知器的直接点云处理。

通过使用卷积神经网络（CNN）将点云转换为体素或图像堆栈。

组合式融合方法。

最近，基于Frustum的网络在KITTI 基准套件中表现出了很好的性能。该模型在3D目标检测方面排名第二，在汽车、行人和骑行者的鸟瞰检测方面同样排名第二。这是唯一的方法，它直接使用Point-Net直处理点云，而不使用激光雷达数据和体素创建中的CNN。

然而，它需要预处理，因此它必须使用相机传感器。基于另一个对标定的相机图像进行处理的CNN，它通过利用这些检测将全局云点最小化到基于截面的已减少点云。这种方法有两个缺点：

模型的精准度在很大程度上依赖于相机图像及其相关的CNN。因此，该方法不可能仅适用于激光雷达数据。

整个管道需要连续运行两种深度学习方法，这会导致运算时间更长而效率更低。参考模型在NVIDIA GTX1080i GPU上大约以7fps的低帧率运行。

与之相反，Zhou等人提出了一种仅适用于激光雷达数据的模型。就这方面而言，它是KITTI上仅使用激光雷达数据进行3D和鸟瞰探测的最佳模型。其基本思想是在网格单元上运行端到端的学习，而不使用人工制作的特征。网络单元格的内部特征是在训练期间利用Pointnet方法学习的。在顶部建立一个预测3D边界框的CNN。尽管拥有很高的精准度，但该模型在TitanX GPU上的最快运算时间为4fps。

Chen等人报道了另一种排名很靠前的方法。其基本思想是利用人工制作的特征将激光雷达点云投影到基于体素的RGB地图上，如密度、最大高度和一个具有代表性的点强度。为了获得具有更高精准度的结果，他们使用了基于激光雷达的鸟瞰图，基于激光雷达的前视图以及基于相机的前视图的多视图方法。这种融合处理需要很长时间，即便在NVIDIA GTX 1080i GPU上也仅为4fps。另一个缺点是需要辅助传感器输入（相机）。

实行实时3D目标检测的方法讨论

空间真实数据分布。上图左侧的样本检测描绘了鸟瞰区域的大小，右侧图显示了《我们准备好了自动驾驶吗？ kitti视觉基准套件》中所注释的2D空间直方图。该分布概述了用于注释的照相机的水平视野以及地图中遗留的盲点。

实行实时3D目标检测的方法讨论

性能比较。该图显示了与运行时间（fps）相关的mAP。所有模型都在Nvidia Titan X或Titan Xp上进行测试。Complex-Yolo的运行速度比KITTI基准测试中最有效的竞争对手快5倍，进而获得准确的结果。我们在一个专用的嵌入式平台(TX2)上对我们的网络进行了测试，并与五种领先的模型进行了比较，结果表明我们的网络具有合理的效率(4fps)。Complex-Yolo是首个用于实时3D目标检测的模型。

本文首次提出了基于激光雷达的点云3D目标检测的第一个实时高效深度学习模型。我们在KITTI基准测试套件中就精准度（如上图所示）而言突显了我们最新的成果，其卓越的效率超过50fps（NVIDIA Titan X）。我们不像大多数主流方法那样需要额外的传感器，例如相机。这一突破是通过引入新的E-RPN（一种借助复杂数字来估计方位的Euler回归方法）实现的。无奇点的封闭数学空间允许鲁棒角度预测。

我们的方法能够在一条前进的道路上同时检测多种类别的目标（例如：汽车、火车、行人、骑行者、卡车、有轨电车、坐着的人等）。这种全新的方法可以在自动驾驶汽车中实现落地应用，并且以此来区别于其他车型。我们甚至在专业的嵌入式平台NVIDIA TX2（4fps）展示了实时性能。在今后的研究工作中，我们计划在回归中加入高度信息，在空间中真正实现独立3D目标检测，并在点云预处理过程中利用速度-空间相关性，以获得更好的分类性能和更高的精准度。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

3D

3D

+关注

关注
9

文章
2753

浏览量
106437
激光雷达

激光雷达

+关注

关注
960

文章
3639

浏览量
186603

友思特C系列3D相机：实时3D点云图像

3D相机

虹科光电

发布于 :2024年01月10日 17:39:25

3D检测系统可检测PCB板针脚高度

够实时输出结果研发了一套3D检测系统。2、方案描述3D检测系统由3D高速相机、激光器、处理系统等

发表于 01-05 10:50

为何PCB设计需要3D功能?

我们带来额外的收益。结语多年来，实时3D图形技术已经彻底地改变了社会与计算机的互动方式。通过3D PCB设计工具，这种变革目前已来到PCB设计领域。它正在改变电子产品的设计与制造方法

发表于 11-01 17:28

中科院3D打印机CEST400|国产工业级3D打印机

的外观设计；双喷头设计，可以打印不同的颜色；中文操作界面，简单易懂；极低的使用和维护成本。中科院3D打印机CASET400特点：全封闭设计，能很好保证成型室温度。成型空间恒温75℃，使产品不会变形。断料检测

发表于 08-10 17:27

3D扫描的结构光

作者：Pedro Gelabert博士；V. Pascal Nelson，德州仪器 (TI) 随着很多全新技术的涌现，人们越来越需要用3D方法来表示现实世界中的物体。特别是机器视觉和机器人技术，它们

发表于 08-30 14:51

如何实行温度实时检测

本人想实行温度实时检测，实时曲线显示，在屏上能手摸上下温度界线，也就是中间一个绿色的长方形区域，上边和下边能手动变化，做为正常温度，中间一条红线

发表于 05-26 04:35

基于ToF的3D活体检测算法研究

人脸。这是由于目前基于RGB等2D空间的主流活体检测方案未考虑光照、遮挡等干扰因素对于检测的影响，而且存在计算量大的缺点。而数迹智能团队研发的3D SmartToF活体

发表于 01-06 07:30

PYNQ框架下如何快速完成3D数据重建

来实现基于这些约束的三维重建的完整管道。　　在这个项目中，作者的目标是朝着实时生成3D视觉数据迈进一步。首先，在CPU上生成3D点云，然后使用Mesh Lab可视化它。由于Mesh L

发表于 01-07 17:25

3D设计软件中怎么快速进行工程计算？

择「体积」，并输入目标值，选择相应的变量，确定后就可以计算出此变量值。通过上面的方法，浩辰3D设计软件可以使用「目标搜寻」来解决工程计算常见问题，将设计场景高度参数化，例如作为设计复杂

发表于 05-06 13:26

浩辰3D的「3D打印」你会用吗？3D打印教程

3D打印技术是综合了三维数字技术、控制技术、信息技术众多技术的创新研发技术，具有设计样式多元化、试制成本低、制作材料丰富等特点。通过数字化设计工具+3D打印技术相结的模式，可以帮助企业高效实现创新

发表于 05-27 19:05

嵌入式3D视觉功能相关资料推荐

如需在汽车工业等生产线使用3D相机自动检测目标体积或目标的多角度视图，则必须快速生成和处理高分辨率的3D数据。配备500万像素大尺寸传感器和

发表于 12-23 07:20

嵌入式3D有何功能呢

如需在汽车工业等生产线使用3D相机自动检测目标体积或目标的多角度视图，则必须快速生成和处理高分辨率的3D数据。配备500万像素大尺寸传感器和

发表于 12-23 07:54

基于深度学习和3D图像处理的精密加工件外观缺陷检测系统

检测，检测准确性和检测稳定性较差、容易误判。基于深度学习和3D图像处理的精密加工件外观缺陷检测系统创新性结合深度学习以及

发表于 03-08 13:59

实时3D艺术最佳实践-灯光指南

的照明技术下看起来更糟。 Unity游戏引擎使灯光工作简单易懂。的手机游戏的表现受到你的照明决定的影响，所以需要使用照明高效。本指南也可在统一学习课程的格式-手臂和统一呈现:3D艺术移动应用程序

发表于 08-02 08:34

谷歌开发pipeline，在移动设备上可实时计算3D目标检测

3月13日消息，谷歌宣布推出 MediaPipe Objectron，这是一种适用于日常物体的移动端实时3D目标检测 pipeline，它能够检测

发表于 03-13 15:41 •2571次阅读

搜索历史

实行实时3D目标检测的方法讨论

评论

友思特C系列3D相机：实时3D点云图像

3D检测系统可检测PCB板针脚高度

为何PCB设计需要3D功能?

中科院3D打印机CEST400|国产工业级3D打印机

3D扫描的结构光

如何实行温度实时检测

基于ToF的3D活体检测算法研究

PYNQ框架下如何快速完成3D数据重建

3D设计软件中怎么快速进行工程计算？

浩辰3D的「3D打印」你会用吗？3D打印教程

嵌入式3D视觉功能相关资料推荐

嵌入式3D有何功能呢

基于深度学习和3D图像处理的精密加工件外观缺陷检测系统

实时3D艺术最佳实践-灯光指南

谷歌开发pipeline，在移动设备上可实时计算3D目标检测