0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

单目深度估计开源方案分享

3D视觉工坊 来源:3D视觉工坊 2023-12-17 10:01 次阅读

0. 笔者个人体会

单目深度估计网络可以估计RGB图像的稠密深度图,但大家可以发现大多数模型的深度图并不准确,尤其是物体边界的深度值非常模糊。而且很多深度估计模型只能处理分辨率很小的图像,图像一大就模糊。这就会导致SLAM/SfM等任务生成的3D场景的物体边界质量非常差。

今天笔者将为大家分享一项最新的开源工作PatchFusion,可以产生极高分辨率的单目深度图,还可以助力之前的SOTA方案ZoeDepth等网络涨点!

1. 效果展示

可以看一下单目深度估计效果,这个深度图的分辨率是真的高,物体边界分割的非常干净!

24a44b0a-9c2d-11ee-8b88-92fbcf53809c.jpg

24b509ae-9c2d-11ee-8b88-92fbcf53809c.jpg

2. 具体原理是什么?

PatchFusion是基于图块的框架,具有三个关键组件:

(1)patch式融合网络,通过高层将全局一致的粗略预测与更精细、不一致的图块预测融合到一起;

(2) 全局到局部 (G2L) 模块,为融合网络添加重要上下文,无需patch选择启发式方法;

(3) 一致性感知训练 (CAT) 和推理 (CAI) 方法,强调patch重叠一致性,从而消除后处理。

24b8ef1a-9c2d-11ee-8b88-92fbcf53809c.jpg

3. 和其他SOTA方法对比如何?

分别在UnrealStereo4K、MVS-Synth 和 Middleburry 2014 上做了实验,证明PatchFusion可以生成具有复杂细节的高分辨率深度图。

更重要的一点是,PatchFusion可以增强之前的SOTA方案 ZoeDepth,在 UnrealStereo4K 和 MVS-Synth 上的均方根误差 (RMSE)分别提高了 17.3% 和 29.4%。

24c91eb2-9c2d-11ee-8b88-92fbcf53809c.jpg

审核编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 分辨率
    +关注

    关注

    2

    文章

    989

    浏览量

    41565
  • RGB
    RGB
    +关注

    关注

    4

    文章

    763

    浏览量

    57412
  • SLAM
    +关注

    关注

    22

    文章

    390

    浏览量

    31591

原文标题:这绝对是质量最高的单目深度估计开源方案!

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    摄像头和FPGA的ADAS产品原型系统

    地平线在软件算法上提供了基于深度学习的整体方案,具有高性能、低运算量的特点。在今年智车优行“奇点汽车”发布会上,地平线首次向外界展示了真车环境下,利用摄像头同时实现行人/车辆/车道
    发表于 01-06 18:09

    深度学习开源项目的绘画实现过程

    21小时上手深度学习2-开源项目之绘画
    发表于 05-20 12:31

    PYNQ开源方案

    大学MOOCGoogleZYNQ电子书别的大佬总结的PYNQ入门资料结语微信公众号:PYNQ开源社区开源方案、依元素开源项目这个公众号里收录了很多
    发表于 08-04 08:29

    Firefly RK3399Pro开源主板 + 摄像头,人体特征点检测方案

    ,可以更智能地应用于计算机视觉的相关领域中。方案搭建Firefly RK3399Pro开源主板 + 摄像头方案特点高性能AI处理器采用R
    发表于 04-01 15:55

    基于单目深度估计的红外图像彩色化方法_戈曼

    基于单目深度估计的红外图像彩色化方法_戈曼
    发表于 03-17 10:13 0次下载

    基于单目图像的深度估计算法,大幅度提升基于单目图像深度估计的精度

    双目匹配需要把左图像素和右图中其对应像素进行匹配,再由匹配的像素差算出左图像素对应的深度,而之前的单目深度估计方法均不能显式引入类似的几何约束。由于深度学习模型的引入,双目匹配算法的性
    的头像 发表于 06-04 15:46 3.4w次阅读
    基于单目图像的<b class='flag-5'>深度</b><b class='flag-5'>估计</b>算法,大幅度提升基于单目图像<b class='flag-5'>深度</b><b class='flag-5'>估计</b>的精度

    基于多孔卷积神经网络的图像深度估计模型

    针对在传统机器学习方法下单幅图像深度估计效果差、深度值获取不准确的问题,提出了一种基于多孔卷积神经网络(ACNN)的深度估计模型。首先,利用
    发表于 09-29 16:20 5次下载
    基于多孔卷积神经网络的图像<b class='flag-5'>深度</b><b class='flag-5'>估计</b>模型

    基于深度学习的二维人体姿态估计方法

    基于深度学习的二维人体姿态估计方法通过构建特定的神经网络架构,将提取的特征信息根据相应的特征融合方法进行信息关联处理,最终获得人体姿态估计结果,因其具有广泛的应用价值而受到研究人员的关注。从数据
    发表于 03-22 15:51 5次下载
    基于<b class='flag-5'>深度</b>学习的二维人体姿态<b class='flag-5'>估计</b>方法

    收藏!姿态估计开源项目汇总资料下载

    电子发烧友网为你提供收藏!姿态估计开源项目汇总资料下载的电子资料下载,更有其他相关的电路图、源代码、课件教程、中文资料、英文资料、参考设计、用户指南、解决方案等资料,希望可以帮助到广大的电子工程师们。
    发表于 04-21 08:43 8次下载
    收藏!姿态<b class='flag-5'>估计</b><b class='flag-5'>开源</b>项目汇总资料下载

    结合基扩展模型和深度学习的信道估计方法

    结合基扩展模型和深度学习的信道估计方法
    发表于 06-30 10:43 62次下载

    介绍第一个结合相对和绝对深度的多模态单目深度估计网络

    单目深度估计分为两个派系,metric depth estimation(度量深度估计,也称绝对深度估计
    的头像 发表于 03-21 18:01 2340次阅读

    硬件加速人体姿态估计开源分享

    电子发烧友网站提供《硬件加速人体姿态估计开源分享.zip》资料免费下载
    发表于 06-25 10:27 0次下载
    硬件加速人体姿态<b class='flag-5'>估计</b><b class='flag-5'>开源</b>分享

    AI深度相机-人体姿态估计应用

    我们非常高兴地发布一个新的代码示例,展示虹科AI深度相机SDK的惊人功能。只需6行源代码,您就可以实时准确地估计和跟踪人体姿态!我们最新的代码示例使用AI机器学习技术来识别和跟踪人体的关键点,使您能
    的头像 发表于 07-31 17:42 615次阅读
    AI<b class='flag-5'>深度</b>相机-人体姿态<b class='flag-5'>估计</b>应用

    一种利用几何信息的自监督单目深度估计框架

    本文方法是一种自监督的单目深度估计框架,名为GasMono,专门设计用于室内场景。本方法通过应用多视图几何的方式解决了室内场景中帧间大旋转和低纹理导致自监督深度估计困难的挑战。
    发表于 11-06 11:47 184次阅读
    一种利用几何信息的自监督单目<b class='flag-5'>深度</b><b class='flag-5'>估计</b>框架

    动态场景下的自监督单目深度估计方案

    自监督单目深度估计的训练可以在大量无标签视频序列来进行,训练集获取很方便。但问题是,实际采集的视频序列往往会有很多动态物体,而自监督训练本身就是基于静态环境假设,动态环境下会失效。
    发表于 11-28 09:21 278次阅读
    动态场景下的自监督单目<b class='flag-5'>深度</b><b class='flag-5'>估计</b><b class='flag-5'>方案</b>