0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

第N次在公开场合diss激光雷达的马斯克

电子工程师 来源:lq 2019-04-29 15:20 次阅读

昨天,第 N 次在公开场合 diss 激光雷达的马斯克,再一次让自动驾驶圈对无人车不同的传感器应用方案展开了热议。

实际上,如果站在马斯克的角度,我们其实不难理解他对激光雷达的「痛恨心理」。

毕竟特斯拉是一家面向普通消费者卖车的企业,而不是一家卖自动驾驶技术和解决方案的公司

在至少 3 年内,无论是从成本、技术可靠性、安全性、美观性甚至是用户对自动驾驶的信任度和品味来看,大多数车企的量产车型,都不会把激光雷达纳入考虑范畴。

当然,根据马斯克说话常常打脸的经典表现来看,或许在几年后他会自己站出来反驳自己坚持的观点。

事实上,在「自动驾驶汽车究竟应该用不用激光雷达」这个问题上长时间的争论不休,衍生出了「激光雷达派」与「纯计算机视觉派」。

目前,一个被激光雷达派以及大众普遍接受的观点是,考虑到纯视觉算法在数据形式和精度上的不足,L3 级以上的自动驾驶乘用车必须要采用激光雷达。

当然,从谷歌 Waymo、通用 Cruise,再到百度阿波罗和国内的 Pony.ai、文远知行等自称 L4 级自动驾驶乘用车解决方案的公司,车顶上的激光雷达一直都非常扎眼。

而「计算机视觉派」的重要组成部分则是自动驾驶技术解决方案初创公司,但这个解决方案到底是多高的级别,其实目前没有确切的定论。

通常情况下,「昂贵的成本」和「技术能力」是众多车企与计算机视觉技术公司反对采用激光雷达的主要理由。

譬如作为一家主打摄像头方案的技术创业公司,2017 年 AutoX 的「炫技首秀」就是让一辆只搭载 7 个摄像头的林肯 MKZ 跑在普通公路的车道上。虽然后来受到了来自激光雷达派的「反击」,其创始人兼 CEO 肖健雄也一直坚持以摄像头为主的传感器方案,

此外,部分高精地图创业公司也强调从成本出发,采用低成本的摄像头方案采集高精数据。

综合来看,截至目前自动驾驶圈内最主流的观点虽然是「该有的,一个都不能少」,但不难看出,做车厂的生意,对于计算机视觉公司来说,暂时性抛开激光雷达是个还不错的主意;

而另一层面,对于计算机视觉工程师来说,想要在高级别自动驾驶解决方案上摆脱激光雷达,就要持续研究和验证纯视觉技术方案替代激光雷达的可行性。

因此,当大家还在围观「马斯克骂激光雷达」时,我们想从机器之心擅长的角度出发,看看能否从技术上来「验证」这个看似不太靠谱的观点。

很凑巧,我们发现了一篇来自康奈尔大学的技术论文,作者中 Yan Wang 与 Wei-Lun Chao 均为华人。该论文提出了一种新方法来缩短纯视觉技术架构与激光雷达间的性能差距。

该论文提出的方法,改变了立体摄像机目标检测系统的 3D 信息呈现形式,甚至将其称之为——伪激光雷达数据(pseudo-LiDAR)。

研究者在挡风玻璃两侧各使用一个相对廉价的摄像机,采用其新方法之后,该摄像机在目标检测方面的性能接近激光雷达,且其成本仅为后者的一小部分。研究者发现以鸟瞰图而不是正视图来分析摄像机捕捉到的图像可以将目标检测准确率提升 2 倍,从而使立体摄像机成为激光雷达的可行替代方案,且其成本相比后者要低很多。

研究主题

可靠和稳健的 3D目标检测是自动驾驶系统的基础要求。要想避免与行人、骑自行车的人、汽车相撞,自动驾驶汽车必须第一时间检测出它们。

现有的算法严重依赖激光雷达(LiDAR),它可以提供周边环境的准确 3D 点云。尽管激光雷达的准确率很高,但出于以下原因,自动驾驶行业急需激光雷达的替代品:

首先,激光雷达非常昂贵,给自动驾驶硬件增加了大量费用;

其次,过度依赖单个传感器会带来安全风险,在一个传感器出现故障时利用备用传感器是较优的选择。一个自然的选择是来自立体摄像机或单目摄像机的图像。光学相机性价比较高(比激光雷达便宜了多个数量级),且可以高帧率运行,能够提供稠密深度图,而激光雷达信号只有 64 个或 128 个稀疏旋转激光束。

近期的多项研究探索了在 3D 目标检测中使用单目摄像机和立体深度(视差)估计 [19, 13, 32]。但是,目前主要的成果仍然是激光雷达方法的补充。

例如,KITTI 基准上的一个顶尖算法 [17] 使用传感器融合(sensor fusion)将汽车的 3D 平均精度(AP)从激光雷达的 66% 提升到了激光雷达+单目图像的 73%。而在仅使用图像的算法中,当前最优算法的 AP 仅为 10% [30]。

对后者较差性能的一个直观且流行的解释是基于图像的深度估计准确率较低。

与激光雷达相反,立体深度估计的误差随着深度增加而呈现二阶增长。但是,对激光雷达和立体深度估计器生成的 3D 点云进行视觉对比后发现,这两种数据模态之间存在高质量的匹配,甚至远处的物体也是如此(详见图 1)。

图 1:来自视觉深度估计的伪激光雷达(pseudo-LiDAR)信号。左上:KITTI 街景图像,其中汽车周围的红色边界框是通过激光雷达获取的,而绿色边界框是通过伪激光雷达获取的。左下:估计到的视差图。右:伪激光雷达(蓝色)vs 激光雷达(黄色)。其中伪激光雷达点与激光雷达的点很好地对齐。

解决方案

这篇论文提供了另一种解释——研究者假设立体摄像机和激光雷达之间性能差距的主要原因不在于深度准确率的差异,而是在于在立体摄像机上运行的 ConvNet 3D 目标检测系统的 3D 信息表示。

具体来说,激光雷达信号通常被表示为 3D 点云或者「鸟瞰」视角图,并据此进行处理。在这两种情况下,目标的形状和大小都不会随着深度而发生变化。

而基于图像的深度估计主要是针对每个像素,通常被表示为额外的图像通道,使得远处的对象很小,不易被检测到。更糟糕的是,这种表示的像素近邻将 3D 空间中较远区域的点聚集在一起,这就使得在这些通道上执行 2D 卷积的卷积网络更难推理,以及准确地定位 3D 空间中的物体。

为了验证这一论断,该研究引入了一种适用于立体摄像机 3D 目标检测的两步法。首先将来自立体摄像机或单目摄像机的估计深度图转换为 3D 点云,即模拟激光雷达信号的伪激光雷达;然后利用现有的基于激光雷达的 3D 目标检测流程 [23, 16],直接在伪激光雷达表示上进行训练。

通过改变伪激光雷达的 3D 深度表示,使基于图像的 3D 目标检测算法获得前所未有的准确率提升。具体来说,在 KITTI 基准上获得 0.7 交并比(IoU)的汽车实例在验证集上获得了 37.9% 的 3D AP,比之前最优图像方法的准确率提升了 2 倍。这样就能把基于立体摄像机和基于激光雷达的系统之间的差距减半。

图 2:用于 3D 目标检测的两步 pipeline。给定立体或单目摄像机图像,研究者首先预测深度图,然后将其转换为激光雷达坐标系统中的 3D 点云,即伪激光雷达。然后像处理激光雷达一样处理它,因此任何基于激光雷达的 3D 检测算法都能在其上使用。

研究者对立体深度估计和 3D 目标检测算法的多种组合进行了评估,并得到了非常一致的结果。这表明性能的提升是由于使用了伪激光雷达表示,它较少依赖于 3D 目标检测架构的创新或深度估计技术。

总之,该论文有以下贡献:

首先,通过实验证明,基于立体摄像机和基于激光雷达的 3D 目标检测技术之间的性能差异不是因为估计深度的质量,而是因为表示。

其次,研究者提出了一种新型 3D 目标检测估计深度表示——伪激光雷达,将之前的最优性能提升了 2 倍,达到了当前最佳水平。

这一研究结果表明,在自动驾驶汽车中使用立体摄像头是可能的,这样既能够极大地降低成本,又能够改进安全性能。

论文:Pseudo-LiDAR from Visual Depth Estimation: Bridging the Gap in 3D Object Detection for Autonomous Driving

论文链接:https://arxiv.org/abs/1812.07179

摘要:3D 目标检测是自动驾驶的一项重要任务。如果 3D 输入数据是通过精确但昂贵的激光雷达获得的,那么目前的技术可以获得高度精确的检测率。基于较便宜的单目摄像机或立体摄像机图像数据的方法目前能够达到的准确率较低,这种差距通常被归因于基于图像的深度估计技术缺陷。

然而,在本文中,研究者认为,数据表示(而非其质量)是造成这种差距的主要原因。研究者将卷积神经网络的内部工作原理考虑在内,提出将基于图像的深度图转换为伪激光雷达表示——本质上是模拟激光雷达信号。有了这种表示,我们就能应用当下基于激光雷达的各种不同检测算法。

在流行的 KITTI 基准上,该论文提出的方法在基于图像的性能方面取得了令人印象深刻的改进,超越当前最佳方法,将 30 米范围内的目标检测准确率从当前最佳的 22% 提高到了 74%。截至论文提交时,该论文提出的算法在基于立体图像方法的 KITTI 3D 目标检测排行榜上达到了当前最高水平。

实验

研究者通过不同的深度估计和目标检测算法,在不同的设置下评估了有/没有伪激光雷达的情况下 3D 目标检测的结果(如下表)。伪激光雷达得到的结果显示为蓝色,真实激光雷达的结果显示为灰色。

表 1:3D 目标检测结果。表中显示了汽车分类的 AP_BEV / AP_3D 百分率、对应于鸟瞰图和 3D 目标框检测的平均精度。

表 4:行人和骑车人类别的 3D 目标检测结果。研究者报告了 IoU = 0.5(标准度量)时的 AP_BEV / AP_3D,并将 PSMNET(蓝色)估计的伪激光雷达和激光雷达(灰色)进行比较,两者都使用 F-POINTNET 算法。

图 4:定性比较。研究者使用 AVOD 算法对激光雷达、伪激光雷达和正视图(立体)进行了比较。红色框中的是 Groundtruth,绿色框中的是预测框;伪激光雷达图像(下面一行)中的观测者在最左边向右看。正视图方法(右)甚至错误计算了附近目标的深度,并且完全忽视了远处的目标。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2522

    文章

    47987

    浏览量

    739731
  • 激光雷达
    +关注

    关注

    958

    文章

    3630

    浏览量

    186537
  • 自动驾驶
    +关注

    关注

    773

    文章

    13002

    浏览量

    163139

原文标题:马斯克刚骂了激光雷达,这篇用纯视觉代替激光雷达的名校论文「力挺」了他

文章出处:【微信号:aicapital,微信公众号:全球人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    硅基片上激光雷达的测距原理

    硅基光电子技术的发展可以将激光雷达系统发射模块和接收模块中分立的有源和无源器件集成在芯片上,使激光雷达体积更小、稳定性更强、成本更低,推动激光雷达在自动驾驶等领域的应用。
    发表于 04-08 10:23 112次阅读
    硅基片上<b class='flag-5'>激光雷达</b>的测距原理

    激光雷达龙头图达通落子重庆!项目产能将达40万台

    激光雷达产业链上下游企业集聚,有利于重庆市、西部(重庆)科学城激光雷达产业链强链补链,提高汽车零部件本地配套率。 公开资料显示,图达通是全球图像级激光雷达及解决方案提供商,公司成立于2
    的头像 发表于 12-20 08:40 421次阅读

    【洞见芯趋势】决战智驾,2024年或是激光雷达的天下!

    增长期。 汽车有没有必要装激光雷达,此前业内一直存在不同声音。华为余承东认为激光雷达作为智能汽车的重要感知器件之一,为了保护驾驶者的安全必不可少。特斯拉马斯克则认为激光雷达并非最佳选择
    的头像 发表于 12-14 18:15 211次阅读
    【洞见芯趋势】决战智驾,2024年或是<b class='flag-5'>激光雷达</b>的天下!

    单线激光雷达和多线激光雷达区别

    单线激光雷达和多线激光雷达区别  单线激光雷达和多线激光雷达是两种常用的激光雷达技术。它们在激光
    的头像 发表于 12-07 15:48 2349次阅读

    马斯克的xAI公司寻求融资10亿美元

    马斯克先生在公开场合曾经表达过这样的理念:我们的世界亟需有一家非Google和Microsoft之外的可信赖的人工智能服务提供商来满足日益增长的需求。值得一提的是,当前的OpenAI背后所倚仗的投资大佬正是微软公司。
    的头像 发表于 12-06 10:41 399次阅读

    晶振在激光雷达系统中的作用

    晶振是激光雷达系统中的重要组成部分,对于保证激光雷达的测距精度和稳定性起着重要作用。
    的头像 发表于 10-30 17:48 334次阅读

    行业加速,激光雷达企业月交付超2万台!

    ——速腾聚创,其激光雷达交付量也随之节节攀升,并于8月创造了单月超两万台的激光雷达交付记录。从目前公开市场信息来看,速腾聚创也是第一家宣布实现“单月交付超两万台”的激光雷达公司。 不得
    的头像 发表于 10-13 09:51 305次阅读

    小米2D激光雷达拆解图讲解

    本文档的主要内容详细介绍的是小米的2D激光雷达拆解图和讲解。
    发表于 09-22 08:07

    一文通过AEC-Q102车规级芯片测试认证了解激光雷达核心技术及行业格局

    激光功率较低,信噪比较低、有效距离较短,并且激光扫描范围受微振镜面积限制,视野相对较窄。 2.3.3 Flash 激光雷达 Flash激光雷达,指一
    发表于 09-19 13:35

    激光雷达的基本构成 激光雷达前景分析

    激光雷达的基本构成 激光雷达前景分析 激光雷达基本构成 激光雷达是利用激光信号进行测距的设备,其基本构成包括
    的头像 发表于 08-23 16:28 2239次阅读

    固态激光雷达通常分为哪三种类型?mems固态激光雷达

    固态激光雷达通常分为哪三种类型?mems固态激光雷达  固态激光雷达是一种基于激光技术的高精度测量仪器,它利用激光器发射
    的头像 发表于 08-22 16:45 1849次阅读

    激光雷达是什么 激光雷达介绍

    激光雷达在自动驾驶应用中主要用来探测道路上的障碍物信息,把数据和信号传递给自动驾驶的大脑,再做出相应的驾驶动作,但室外常见的干扰因素如雨、雾、雪、粉尘、高低温等对激光雷达的识别造成了极大的影响。因此
    的头像 发表于 07-14 11:11 3468次阅读

    一年融两轮,这家公司逐鹿泛自动驾驶激光雷达赛道

    2023年,激光雷达赛道热闹非凡。 一方面,禾赛科技正式登陆纳斯达克,“国产激光雷达第一股”诞生;另一方面,越来越多的车企在公开或私下场合都表达将砍掉
    的头像 发表于 06-09 09:57 604次阅读
    一年融两轮,这家公司逐鹿泛自动驾驶<b class='flag-5'>激光雷达</b>赛道

    一文解析激光雷达结构

    激光雷达激光探测及测距系统,是通过发射激光束来探测目标位置、速度等特征量的雷达系统。按扫描维度,激光雷达可分为一维
    发表于 05-10 09:58 5797次阅读
    一文解析<b class='flag-5'>激光雷达</b>结构

    激光雷达和毫米波雷达的优势

    其实传感器之间,因为感知的原理不同,大家的赛道也不同,比如激光雷达的分工就是做精细的感知,做地图构建,检测马路牙子之类的,像扫街车要装激光雷达扫马路牙子。
    发表于 05-04 15:58 648次阅读