0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

TUM&谷歌提出md4all:挑战性条件下的单目深度估计

CVer 来源:CVer 2023-09-04 16:14 次阅读

前言

大家好, 我叫Stefano Gasperini, 在此宣传我们的ICCV 2023的工作, 更多详细信息可查看我们的论文: https://arxiv.org/abs/2308.09711, 和我们的项目网站: https://md4all.github.io.

代码:https://github.com/md4all/md4all

在CVer微信公众号后台回复:md4all,可下载本论文pdf和代码

首先请大家观看这样一个例子:

你能在彩色图片中看到树吗?

942f969e-49aa-11ee-97a6-92fbcf53809c.png

我们的单目深度估计网络在所有条件下都能输出可靠的深度估计值,即使在黑暗中也是如此!

背景

虽然最先进的单目深度估计方法在理想环境下取得了令人印象深刻的结果,但在具有挑战性的光照和天气条件下,如夜间或下雨天,这些方法却非常不可靠。

94a1f568-49aa-11ee-97a6-92fbcf53809c.png

在这些情况下, 传感器自带的噪声、无纹理的黑暗区域和反光等不利因素都违反了基于监督和自监督学习方法的训练假设。自监督方法无法建立学习深度所需的像素的对应关系,而监督方法则可能从传感器真值中(如上图中的 LiDAR 与 nuScenes 的数据样本)中学习到数据瑕疵。

方法

在本文中,我们提出了 md4all 解决了这些安全关键问题。md4all 是一个简单有效的解决方案,在不利和理想条件下都能可靠运行,而且适用于不同类型的监督学习。

952a5ae8-49aa-11ee-97a6-92fbcf53809c.png

我们利用现有方法在完美设置下的工作能力来实现这一目标。因此,我们提供的有效训练信号与输入信号无关。首先,通过图像转换,我们生成一组与正常训练样本相对应的复杂样本。然后,我们通过输入生成的样本并计算相应原始图像上的标准损失,引导网络模型进行自监督学习或完全监督学习。

如上图所示,我们进一步从预先训练好的基线模型中提炼知识,该模型只在理想环境下进行推理,同时向深度模型提供理想和不利的混合输入。

我们的 GitHub 代码库中包含所提方法的实现代码, 欢迎访问:

https://github.com/md4all/md4all

结果

95729150-49aa-11ee-97a6-92fbcf53809c.png

通过 md4all,我们大大超越了之前的解决方案,在各种条件下都能提供稳健的估计。值得注意的是,所提出的 md4all 只使用了一个单目模型,没有专门的分支。

上图显示了在 nuScenes 数据集的挑战性环境下的预测结果。由于场景的黑暗程度和噪声带来的影响,自监督方法 Monodepth2 无法提取有价值的特征(第一行)。有监督的 AdaBins 会学习到来自传感器数据的瑕疵,并造成道路上的空洞预测现象(第二行)。在相同的架构上应用,我们的 md4all 提高了在标准和不利条件下的鲁棒性。

95b86dd8-49aa-11ee-97a6-92fbcf53809c.png

95e37988-49aa-11ee-97a6-92fbcf53809c.png

在本文中,我们展示了 md4all 在标准和不利条件下两种类型的监督下的有效性。通过在 nuScenes 和 Oxford RobotCar 数据集上的大量实验,md4all 的表现明显优于之前的作品(如上图数据所示)。

图像转换

960717bc-49aa-11ee-97a6-92fbcf53809c.png

我们还显示了为训练 md4all 而生成的图像转换示例 (如上图所示)。我们通过向模型提供原始样本和转换样本的混合数据进行数据增强。这样一个模型就能在不同条件下恢复信息,而无需在推理时进行修改。

在此,我们开源共享所有不利条件下生成的图像,这些图像与 nuScenes 和牛津 Robotcar 训练集中的晴天和阴天样本相对应。欢迎访问:

https://forms.gle/31w2TvtTiVNyPb916

这些图像可用于未来深度估计或其他任务的稳健方法。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2526

    文章

    48110

    浏览量

    740114
  • 谷歌
    +关注

    关注

    27

    文章

    5861

    浏览量

    103263
  • 模型
    +关注

    关注

    1

    文章

    2704

    浏览量

    47689

原文标题:ICCV 2023 | TUM&谷歌提出md4all:挑战性条件下的单目深度估计

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    特定温度条件下的应变测量方案

    变测量的准确。因此,用电阻应变计测量高温或低温条件下的应变时,其精度比常温条件下差。<br/>&
    发表于 05-04 17:45

    多内核导航器+Navigator Runtime应对AMP编程挑战

    内核串行执行时间除以多内核执行时间。在理想条件下,8内核系统的加速等于8。但在实际中,由于多内核总线判优、存储器访问时延、高速缓存一致管理、同步以及IPC等多内核开销的影响,典型加速
    发表于 09-02 16:01

    潮湿条件下的触摸和接近感应

    !几十年来,水一直是技术的敌人,因为它具有破坏的影响。已知触摸传感器在与水接触时工作不正常(或根本不工作)。安森美半导体的触摸和接近传感解决方案通过利用差分传感技术简化和加速设计,消除了在潮湿条件下
    发表于 10-11 14:10

    MD5计算hex文件的过程是什么

    大家好, 是否可以在SPC工作室中计算Hex文件或elf的MD5校验和,如果是,请告诉我计算MD5的过程。 提前致谢, ---谢谢&问候,Mujeeb以上来自于谷歌翻译以下为原
    发表于 02-13 08:35

    如何在芯片内同时捕获不同触发条件下的信号

    的64 MB时,在少数地址位置缺少数据,因此要检查为什么这些字丢失,我需要查看不同地址位置的少量信号的状态。由于芯片的深度不能捕获完整的数据,我想在芯片内同时捕获不同触发条件下的信号。如果没有
    发表于 03-15 14:28

    深度负反馈条件下的近似计算

    本文介绍了深度负反馈条件下的近似计算。
    发表于 11-22 19:15 12次下载
    <b class='flag-5'>深度</b>负反馈<b class='flag-5'>条件下</b>的近似计算

    R&amp;amp;amp;S FSC3台式频谱分析仪的主要特点及应用范围

    罗德与施瓦茨的R&amp;amp;S®FSC是一款高性价比,小体积的台式频谱分析仪,它具备罗德与施瓦茨一贯的高品质,可以满足所有重要的频谱分析任务。R&amp;amp;S®FSC应用范
    发表于 12-09 09:41 919次阅读

    欧拉 Summit 2021 安全&amp;amp;可靠性&amp;amp;运维专场:主流备份技术探讨

    在openEuler Summit 2021 安全&amp;可靠性&amp;运维专场上,高冲对为数据安全而生,统信软件备份还原工具分享。
    的头像 发表于 11-10 17:42 1548次阅读
    欧拉 Summit 2021 安全&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;可靠性&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;运维专场:主流备份技术探讨

    存储类&amp;作用域&amp;生命周期&amp;链接属性

    目录前言一、存储类&amp;amp;作用域&amp;amp;生命周期&amp;amp;链接属性的
    发表于 12-09 15:51 5次下载
    存储类&<b class='flag-5'>amp</b>;作用域&<b class='flag-5'>amp</b>;生命周期&<b class='flag-5'>amp</b>;链接属性

    如何区分Java中的&amp;amp;和&amp;amp;&amp;amp;

    首先给i赋值为0,如果i大于10,并且i++等于1,则输出“错误”和i的值。否则输出“正确”和i的值。分别用&amp;和&amp;&amp;运行,观察运行结果的不同。
    的头像 发表于 02-24 10:46 1224次阅读
    如何区分Java中的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;和&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;

    if(a==1 &amp;amp;&amp;amp; a==2 &amp;amp;&amp;amp; a==3),为true,你敢信?

    接下来咱们来尝试解决这个问题。假设 if(a==1&amp;&amp;a==12)是等于 true的,那么a肯定不可能是一个“普通的变量”。它势必要有能力在执行的时候能够动态改动值。
    的头像 发表于 05-08 11:01 754次阅读
    if(a==1 &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; a==2 &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; a==3),为true,你敢信?

    HarmonyOS &amp;amp;amp;amp;润和HiSpark 实战开发,“码”上评选活动,邀您来赛!!!

    出色的系统 助力优秀的设备 为应用开发者带来丰富的体验与想象空间 正如当HarmonyOS遇见润和HiSpark 这万物互联的时代 将由你的&amp;lt; 代码 &amp;gt;来定义
    的头像 发表于 04-11 15:33 830次阅读
    HarmonyOS &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;润和HiSpark 实战开发,“码”上评选活动,邀您来赛!!!

    你使用shell脚本中的2&amp;gt;&amp;amp;1了吗?

    run_cmax > ./starrc_cmax.logs 2>&amp;1中的 2>&amp;1是啥意思?
    的头像 发表于 07-30 14:44 1070次阅读

    摄像机&amp;amp;amp;雷达对车辆驾驶的辅助

    摄像机&amp;amp;雷达担负着可辅助驾驶员安全驾驶的、高级驾驶辅助系统的传感功能。尼得科正在进一步推进摄像机&amp;amp;雷达的高性能化进程。
    的头像 发表于 11-26 10:02 520次阅读
    摄像机&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;雷达对车辆驾驶的辅助

    PatchMatch MVS求解器中深度估计挑战性问题

    本文提出了一种全新的学习型PatchMatch MVS框架,DS-PMNet,并嵌入了DeformSampler。这个框架能够以端到端的方式学习隐含深度分布,指导可变形的深度采样。
    的头像 发表于 01-02 09:25 217次阅读
    PatchMatch MVS求解器中<b class='flag-5'>深度</b><b class='flag-5'>估计</b>的<b class='flag-5'>挑战性</b>问题