0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大疆、港科大联手!双目3D目标检测实验效果大放送

电子工程师 来源:lp 2019-03-12 09:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

CVPR 2019的文章出来了,今天聊聊双目的 3D object detection。这是一篇来自 DJI (大疆)与港科大合作的文章《Stereo R-CNN based 3D Object Detection for Autonomous Driving》,作者分别是 Peiliang Li,陈晓智(DJI,MV3D的作者)和港科大的 Shaojie Shen 老师。

论文链接,文中称代码将开源

https://arxiv.org/abs/1902.09738

1. Introduction

2018 年在 3D 检测方面的文章层出不穷,也是各个公司无人驾驶或者机器人学部门关注的重点,包含了点云,点云图像融合,以及单目 3D 检测,但是在双目视觉方面的贡献还是比较少,自从 3DOP 之后。

总体来说,图像的检测距离、图像的 density 以及 context 信息,在 3D检测中是不可或缺的一部分,因此作者在这篇文章中挖掘了双目视觉做 3D检测的的潜力。

2.Network Structure

整个网络结构分为以下的几个部分。

1). RPN部分,作者将左右目的图像通过stereoRPN产生相应的proposal。具体来说stereo RPN是在FPN的基础上,将每个FPN的scale上的feature map的进行concat的结构。

2). Stereo Regression,在RPN之后,通过RoiAlign的操作,得到each FPN scale下的left and right Roi features,然后concat相应的特征,经过fc层得到object class, stereo bounding boxes dimension还有viewpoint angle(下图所示) 的值。这里解释一下viewpoint,根据Figure3.,假定物

3). keypoint的检测。这里采用的是类似于mask rcnn的结构进行关键点的预测。文章定义了4个3D semantic keypoint,即车辆底部的3D corner point,同时将这4个点投影到图像,得到4个perspective keypoint,这4个点在3D bbox regression起到一定的作用,我们在下一部分再介绍。

在keypoint检测任务中,作者利用RoiAlign得到的14*14feature map,经过conv,deconv最后得到6 * 28 * 28的feature map,注意到只有keypoint的u坐标会提供2D Box以外的信息,因此,处于减少计算量的目的,作者aggregate每一列的feature,得到6 * 28的output,其中,前4个channel代表4个keypoint被投影到相应的u坐标的概率,后面两个channel代表是left or right boundary上的keypoint的概率。

3. 3D Box Estimation

通过网络回归得到的 2D box 的 dimension,viewpoint,还有 keypoint,我们可以通过一定的方式得到3D box的位置。定义 3D box 的状态x = [x, y, z, θ]。

Figure 5,给出了一些稀疏的约束。包含了特征点的映射过程。这里也体现了keypoint的用处。

上述公式即为约束方程,因此可以通过高斯牛顿的方法直接求解。具体可以参考论文的引文17。这里我们简单证明一下第一个公式。注意,这里的假设都是u,v坐标都已经经过相机内参的归一化了。

4. Dense 3D Box Alignment

这里就回到shenshaojie老师比较熟悉的BA的过程了,由于part 3仅仅只是一个object level的深度,这里文章利用最小化左右视图的RGB的值,得到一个更加refine的过程。定义如下的误差函数

求解可以利用G20或者ceres也可以完成。整个alignment过程其实相对于深度的直接预测是更加robust的,因为这种预测方法,避免了全局的depth estimation中的一些invalid的pixel引起的ill problem的问题。

5. experiment

作者在实验这块达到了双目视觉的state-of-the-art,同时对于各个module也做了很充足的实验(这块请查看原论文)。

下面是图a、b、c为处理结果示例,每幅图像内部上中下三部分,分别为左眼图像检测结果、右眼图像检测结果、鸟瞰视图检测结果。

图a

图b

图c

6. Insight

最后谈谈文章给我的一些 insights,首先,整个文章将传统的 detection 的任务,结合了 geometry constraint 优化的方式,做到了3D位置的估计,想法其实在不少文章sfm-learner之类的文章已经有体现过了,不过用在3Ddetection上面还是比较新颖,避免了做双目匹配估计深度的过程。也属于slam跟深度学习结合的一篇文章,感兴趣的朋友可以继续看看(下面链接)相关文章

arxiv.org/abs/1802.0552

谈几点我个人意义上的不足吧,首先耗时过程 0.28s 的 inference time,不过可能作者的重点也不在这个方面,特征的利用上可以更加有效率,在实现上。其次,能不能采用deep3dbox的方式预测dimension,然后添加入优化项呢...总体来说,是一篇不错的值得一读的文章!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30581

    浏览量

    219588
  • 3D
    3D
    +关注

    关注

    9

    文章

    2990

    浏览量

    113833
  • 图像检测
    +关注

    关注

    0

    文章

    35

    浏览量

    12139

原文标题:大疆、港科大联手!双目3D目标检测实验效果大放送 | CVPR 2019

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人形机器人 3D 视觉路线之争:激光雷达、双目3D - ToF 谁更胜一筹?

    电子发烧友网报道(文 / 吴子鹏)在人形机器人的设计方案中,3D 视觉技术是实现环境感知与智能化决策的核心支撑之一。它能够助力人形机器人完成环境感知与建模、动态目标检测与跟踪、物体操作与精细控制等
    的头像 发表于 04-15 00:14 3525次阅读

    Vitrox的v510i系列的3D AOI光学检测设备

    V510i部署在SMT生产线的 贴片机之后、回流焊炉之前或之后 ,主要用于检测贴装好的电子元件是否存在缺陷。其核心任务是: 3D与2D复合检测 :同时利用
    的头像 发表于 12-04 09:27 115次阅读

    ,带给3D打印行业一场“成人礼”

    布局3D打印是行业周期的回应,巨头未入局凸显行业需成熟,消费级市场快速增长。
    的头像 发表于 11-21 10:11 1134次阅读

    友思特应用 | 基于高精度双目散斑 3D 相机的放射治疗视觉定位应用

    面临挑战。本文将深入探讨基于高精度双目散斑3D相机的视觉定位系统如何革新放疗定位流程,提升治疗的安全性与有效性。
    的头像 发表于 10-30 11:05 175次阅读
    友思特应用 | 基于高精度<b class='flag-5'>双目</b>散斑 <b class='flag-5'>3D</b> 相机的放射治疗视觉定位应用

    iTOF技术,多样化的3D视觉应用

    动态模糊,确保高耐光性,同时输出2D(红外)和3D(深度)数据。 ◆ Testing Principles ※ 测量脉冲光的飞行时间,以检测 TOF 相机与被测物体之间的距离。 ◆ ToF 产品
    发表于 09-05 07:24

    奥比中光发布最新一代3D激光雷达及双目深度相机

    近日,世界机器人大会现场,奥比中光发布最新一代3D激光雷达及双目深度相机,以“场景拓展”与“极限感知”为核心优势,进阶全领域能力矩阵,刷新机器人性能上限,为各类机器人带来更灵活可靠的视觉解决方案。
    的头像 发表于 08-15 15:05 1120次阅读

    3D激光轮廓仪可实现在线3D测量和检测

    Z-Trak™ Express 1K5 系列专为实现经济高效的在线3D测量和检测而设计,具有高速检测能力和实时处理性能。
    的头像 发表于 08-08 17:17 782次阅读
    <b class='flag-5'>3D</b>激光轮廓仪可实现在线<b class='flag-5'>3D</b>测量和<b class='flag-5'>检测</b>

    3D打印能用哪些材质?

    3D打印的材质有哪些?不同材料决定了打印效果、强度、用途乃至安全性,本文将介绍目前主流的3D打印材质,帮助你找到最适合自己需求的材料。
    的头像 发表于 07-28 10:58 2499次阅读
    <b class='flag-5'>3D</b>打印能用哪些材质?

    光子精密双目3D线激光轮廓测量仪,摆脱视觉盲区,1台更比2台强!

    光子精密双目3D线激光轮廓测量仪(GL-8160D),在GL-8000系列的基础上创新升级。GL-8160D采用全新双目单线设计,突破传统
    的头像 发表于 07-16 17:21 1062次阅读
    光子精密<b class='flag-5'>双目</b><b class='flag-5'>3D</b>线激光轮廓测量仪,摆脱视觉盲区,1台更比2台强!

    海伯森3D闪测传感器,工业检测领域的高精度利器

    随着信息技术的飞速进步,第四次视觉革命深度融合“人”“机”“物”,基于光学原理的3D视觉检测技术迎来爆发式发展,成为工业生产中更高效的检测利器。3D视觉技术通过非接触性、高速性、数据完
    的头像 发表于 06-20 17:46 1301次阅读
    海伯森<b class='flag-5'>3D</b>闪测传感器,工业<b class='flag-5'>检测</b>领域的高精度利器

    3D AD库文件

    3D库文件
    发表于 05-28 13:57 6次下载

    奥比中光发布新一代双目3D相机Gemini 435Le

    近日,奥比中光在美国底特律举办的Automate 2025展会上发布Gemini 435Le,获得众多机器人专业人士的关注。作为最新一代工业级双目视觉解决方案,Gemini 435Le双目3D相机在前作基础上针对智能机器人的工业
    的头像 发表于 05-14 17:15 894次阅读

    HT 可视化监控页面的 2D3D 连线效果

    HT 是一个灵活多变的前端组件库,具备丰富的功能和效果,满足多种开发需求。让我们将其效果化整为零,逐一拆解具体案例,帮助你更好地理解其实现方案。 此篇文章中,让我们一起深入探讨 2D3D
    的头像 发表于 04-09 11:28 1113次阅读
    HT 可视化监控页面的 2<b class='flag-5'>D</b> 与 <b class='flag-5'>3D</b> 连线<b class='flag-5'>效果</b>

    3D闪存的制造工艺与挑战

    3D闪存有着更大容量、更低成本和更高性能的优势,本文介绍了3D闪存的制造工艺与挑战。
    的头像 发表于 04-08 14:38 1824次阅读
    <b class='flag-5'>3D</b>闪存的制造工艺与挑战

    3D打印中XPR技术对于打印效果的影响?

    我是3D打印设备的制造商,我想具体了解下3D打印中XPR技术对于打印效果的影响? 或者是否能提供对应的专利信息以备查阅
    发表于 02-18 07:59