0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

介绍一种基于图像的三维重建方法

新机器视觉 来源:计算机视觉工坊 2023-04-12 18:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

介绍

当前,对于一个场景的快速重建是重要的,目标是实现一个快速的、全面的三维重建模型。可以应用于野外的林业资源保护、火灾和地震的灾后抢救、边境安防、油田或者海上平台油气设施、电力设施监测都有十分重要的价值。

现在对于野外覆盖常用卫星。对卫星来说,存在分辨率不足的问题,无法清晰构建出野外的三维场景。而对于较精确的雷达激光扫描重建,既有造价昂贵的缺点,又十分笨重,在野外环境中进行三维重建十分不方便。

随着自动控制、无线传输等技术的发展,无人机的应用领域也越来越多。无人机具备成木低,应用范围广,机动性能好,降低野外作业人员危险等优点。因此基于图像的三维重建方法是解决上述问题的有效手段。

三维重建一直以来就是国内外学者研宄的热点问题,并取得了一些重大的成果。华盛顿大学的GRAIL实验室,采用多核并行技术耗时21小时完成了对罗马城的稀疏点云的重建,成功地实现了对海量数据的大场景稀疏点云的三维重建[1-2]。吴常常实现的VisualSFM算法是较为完善的开源视觉重建算法[3],在该算法使用多核捆绑调整[4]进行参数优化。但是,其对于纹理较弱的场景,不能进行三维重建。

基于深度学习的方法已经引起了人们的广泛关注,并在图像处理中得到了广泛的应用。一些研究者提出了基于深度神经网络的三维重建算法。Ummenhofer等人中提出的 DeMoN 给出了从连续的无约束图像对中恢复图像深度和相机运动的端到端神经网络[5],并且还可以输出表面法线、匹配对之间的光流,该框架由多个编码器-解码器组成。该网络只单纯利用两个图像之间的RGB信息而没有利用几何信息进行估计,三维重建准确度较低,效果不好。

总体框架

本文介绍的方法,整体流程图如图1所示。

f61a245c-d824-11ed-bfe3-dac502259ad0.png

图1.整体流程图

具体步骤如下:

步骤1:首先要对无人机的飞行路径进行之字形规划,无人机拍摄的正射影像可以完全覆盖所需拍摄的场景,进而获取精确、详细的图像序列,无人机在拍摄图像的过程中,实时的将图片与RTK信息回传给地面站。

步骤2:地面站接收无人机拍摄的图片后,将图片按顺序进行排列,并将图像按照每20张分成一个簇。

步骤3:对每个簇中的图片进行提取特征点,并对特征点进行描述。

步骤4:接着进行特征匹配,使用滤波算法来剔除匹配错误的特征点。

步骤5:通过运动恢复结构技术获取相近图像之间的对应关系,初步获取相机在三维空间中的姿态及位置信息。

步骤6:图像中包含GPS信息,利用光束法平差来优化相机姿态参数,得到各个图像簇的稀疏点云。

步骤7:然后,通过恢复每张图像的深度图,基于深度图融合的方法,将这些深度图融合,得到各个图像簇的稠密点云。

步骤8:最后,将各个图像簇的稠密点云进行融合,得到整个场景的三维信息。

具体步骤:

首先,确定无人机拍摄野外场景的具体范围,并对无人机的飞行路径进行规划,这里选用之字形往返式的规划路径方式。这种方式对于无人机的飞行具有简单、便捷的特点,飞行路线大多都是直线,转弯的次数较少,消耗的能量也较少,并且可以完全覆盖所需要拍摄的场景。

此外,无人机所搭载的相机也有一定的要求,需要使用带有RTK载波相位差分技术的照相机,无人机在拍摄场景时,同时可以记录拍摄点位的GPS信息。

在无人机拍摄的图像后,需要将图像以及相应的RTK信息实时回传给地面站。

地面站在接收到无人机拍摄的图片后,将图片按顺序进行排列,这种有序的图像序列,为后续的特征匹配节省很多时间。

如图2所示,图片按顺序排列好之后,将图片按照每20张分成一个簇,后续就是对图像簇进行操作,各个图像簇之间并行处理,提高效率。

f6233fba-d824-11ed-bfe3-dac502259ad0.png

图2. 图像分簇

对每个簇中的图片进行提取特征点,这里提取SIFT特征点,因为SIFT特征具有区分性好,对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性等优点,因此这里使用SIFT特征提取算子对图像集进行特征提取。

提取了图像的特征点之后,需要对图像进特征匹配。在接收图像后已经对图像顺序进行了排序,在特征匹配阶段,只需要对各个图像簇中相邻的两幅图像进行特征匹配,对于n张输入图像,能够将匹配阶段的时间复杂度从O(n2)降低到O(n)。

对于特征匹配,包括多种两两图像之间的匹配算法可供选择。对于基于标量的特征描述符,有暴力匹配、近似最近邻匹配、层级哈希匹配和快速层级哈希匹配四种方式。对于二进制描述符,主要为暴力匹配。暴力匹配对参考图像中的每个特征点,在另一幅待匹配图上计算所有特征点和该点欧式距离,再利用距离比等条件进行剔除,最终得到匹配集。该方法时间复杂度较高,搜索效率较低。

近似最近邻匹配的方法针对大数据集时它的效果要好于暴力匹配。层级哈希匹配和快速层级哈希匹配主要是利用局部敏感哈希将一个图像上的特征点映射成为一个哈希编码,在利用SIFT特征计算两幅图像之间的匹配的时候,对于第一幅图像上的某个特征点,搜索第二幅图像上和该特征点哈希编码的汉明距离小于某个阈值的特征点,然后根据SIFT特征描述符的相似性和比率测试确定最终的匹配。

其中快速层级哈希匹配在速度上更快,利用预先计算好的散列区域,提升了匹配速度。所以, 这里采用快速层级哈希匹配处理两幅图像之间的匹配问题。

在匹配的过程中,会存在一些误匹配的情况,这对后期的三维重建会产生很大的影响,所以这里需要剔除匹配错误的特征点,这里采用RANSAC(Random Sample Consensus,随机抽样一致)算法来剔除误匹配的点。RANSAC算法可以从一组包含“外点”的观测数据集中,通过迭代方式估计数学模型的参数,进而剔除误匹配的点。

RANSAC算法的具体步骤:

(1)首先从数据集中随机选出一组局内点(其数目要保证能够求解出模型的所有参数),计算出一套模型参数。

(2)用得到的模型去测试其他所有的数据点,如果某点的误差在设定的误差阈值之内,就判定其为局内点,否则为局外点,只保留目前为止局内点数目最多的模型,将其记录为最佳模型。

(3)重复执行1,2步足够的次数(即达到预设的迭代次数)后,使用最佳模型对应的局内点来最终求解模型参数,该步可以使用最小二乘法等优化算法。

(4)最后可以通过估计局内点与模型的错误率来评估模型。

在得到图像中特征点的匹配关系后,通过运动恢复结构技术来计算相邻图像之间的对应关系,初步获取相机在三维空间中的姿态及位置信息。

因为无人机拍摄的图像中包含有GPS信息,利用图像和GPS间的约束,使用光束法平差对相机的姿态位置进行优化调整,得到准确的相机位姿以及场景路标点。这里使用全局式SFM(Structure from motion,运动恢复结构)来输出各个图像簇的稀疏点云,因为全局式SFM的重建速度相比于增量式SFM和层级式SFM的重建速度都快,并且重建效果可以达到要求。通过这种方式生成的稀疏点云具有尺寸及地理编码信息。

通过计算出每张图像的深度图,利用深度图融合,来生成三维稠密点云。基于深度图融合的方法,需要首先将每张图像对应起来,即通过旋转、平移等坐标变换对两张图像进行匹配,这些对应信息可以从SFM结果得到,然后再根据同一个空间点在各个深度图中对应的深度信息来共同恢复该空间点的三维位置。如果融合后的点云数量过多,还需要进行三维点云精简处理,进而得到各个图像簇的稠密点云。

根据各所述稠密深度图对应的位移及所述旋转关系,对各个图像簇对应的稠密点云进行融合,在融合的过程中需要剔除一些重叠的点云,进而得到整个场景的三维信息。

总结

本文介绍了基于图像的三维重建方法。首先通过无人机按照规划好的路线拍摄图片,无人机在拍摄完图片的过程中,将图片实时的回传给地面。在地面端接收无人机回传的图片,将接收的图像按顺序进行排列,并将图像按照每20张作为一个簇,分别对每簇中的图像进行提取特征点,并对特征点进行描述。

接着进行特征匹配,使用滤波算法来剔除匹配错误的特征点。根据匹配的特征点,通过运动恢复结构技术获取相邻图像之间的对应关系,初步获取相机在三维空间中的姿态及位置信息。进而利用光束法平差来优化相机姿态参数,得到各个图像簇的稀疏点云。然后,通过恢复每张图像的深度图,基于深度图融合的方法,将这些深度图融合,得到各个图像簇的稠密点云。最后将各个图像簇的稠密点云进行融合,得到整个场景的三维信息。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1203

    浏览量

    42868
  • 编码器
    +关注

    关注

    45

    文章

    3904

    浏览量

    141448
  • RGB
    RGB
    +关注

    关注

    4

    文章

    820

    浏览量

    61522
  • 无人机
    +关注

    关注

    234

    文章

    11138

    浏览量

    193329
  • 激光雷达
    +关注

    关注

    978

    文章

    4377

    浏览量

    195378

原文标题:一文带你理解基于图像的三维重建

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一种基于多次观测融合的可交互三维高斯场景重建框架

    在计算机视觉和机器人领域,如何完整、真实地重建个可交互的三维场景,直是个难题。传统方法往往
    的头像 发表于 09-29 11:12 431次阅读
    <b class='flag-5'>一种</b>基于多次观测融合的可交互<b class='flag-5'>三维</b>高斯场景<b class='flag-5'>重建</b>框架

    航天宏图全栈式3DGS实景三维重建系统解决方案

    表达的核心技术,通过相机、传感器等设备获取物理空间数据,并结合计算机视觉与图形学算法,将二图像转换为三维模型。目前,主流的三维重建方法包括
    的头像 发表于 06-27 09:28 1075次阅读
    航天宏图全栈式3DGS实景<b class='flag-5'>三维重建</b>系统解决方案

    激光三维扫描技术:无喷粉条件下高反光表面三维重建的光学原理与应用

    高反光表面的三维重建是工业检测、文化遗产保护等领域的关键技术瓶颈。传统激光扫描依赖喷粉增强漫反射,但会对精密器件或文物造成不可逆损伤。本文通过融合结构光调制、偏振分析及多视角协同技术,构建无喷粉测量
    的头像 发表于 06-25 10:19 613次阅读

    非接触式激光三维扫描应对镜面反射表面的无喷粉测量方案:原理与创新

    镜面反射表面的三维测量直是光学检测领域的技术难点,传统激光扫描因镜面反射导致的光斑畸变、相位模糊等问题,常需依赖喷粉处理以改善漫反射特性,这对精密器件或文物保护等场景构成限制。本文提出一种融合相位
    的头像 发表于 06-24 13:10 399次阅读
    非接触式激光<b class='flag-5'>三维</b>扫描应对镜面反射表面的无喷粉测量方案:原理与创新

    VirtualLab:光学系统的三维可视化

    配置文件”并选择“系统:三维”作为结果,然后运行模拟。 2.点击视图系统(仅三维显示组件,没有光传播)。 系统:三维(光线结果配置文件)和三维系统视图 这两种
    发表于 05-30 08:45

    奥比中光助力创想三维登顶世界消费级3D扫描仪市场

    Lite及Raptor Pro提供基于自研多核异构三维重建芯片技术的软硬件引擎,助力战略合作伙伴创想三维登顶世界消费级3D扫描仪市场。
    的头像 发表于 04-11 11:38 1263次阅读

    一种基于基础模型对齐的自监督三维空间理解方法

    三维空间理解是推动自动驾驶、具身智能等领域中智能系统实现环境感知、交互的核心任务,其中3D语义占据预测 (Semantic Occupancy Prediction) 对三维场景进行精准的体素级建模。然而,当前主流方法严重依赖大
    的头像 发表于 03-18 15:01 742次阅读
    <b class='flag-5'>一种</b>基于基础模型对齐的自监督<b class='flag-5'>三维</b>空间理解<b class='flag-5'>方法</b>

    使用DLP LightCrafter4500投影结构光进行三维重建遇到的疑问求解

    使用DLP LightCrafter4500 投影结构光进行三维重建,遇到以下问题: (1)投影自己的图片,如何使投影出的图片和原图片的亮度致。它是可以设定LED的亮度,我投影出来的图片亮度很
    发表于 03-03 06:29

    请问DLP LightCrafter 3000在hdmi模式下如何关闭gamma?

    使用LightCrafter进行三维重建时发现有gamma现象,请问能不能控制将其关闭,还有,由于官网上找不到LightCrafter的资料了,希望技术人员能补发些相关技术文档,比如关于投影完图像的触发信号的
    发表于 02-28 07:24

    请问DLP3010投影图像DMD格栅如何模糊化?

    我们在使用500W相机采集投影条纹时,相机的采样率高,把DMD的微镜格栅也采集到,影响到我们三维重建的数据质量,会带来格栅网状的错误数据。 是否有方法可以模糊化这种格栅网格,除了使用更高分辨率的DMD方案,或者使用DLP3310这种伪1080P DMD方案是否也可以?
    发表于 02-27 07:01

    三维测量在医疗领域的应用

    三维测量在医疗领域的应用十分广泛,为医疗诊断、治疗及手术规划等提供了重要的技术支持。以下是对三维测量在医疗领域应用的分析: 、医学影像的三维重建与分析 CT、MRI等影像的
    的头像 发表于 12-30 15:21 1091次阅读

    常见的三维测量方法和工具

    三维测量是用于获取物体三维几何信息的技术,它在工业制造、建筑、考古、医学等领域有着广泛的应用。以下是些常见的三维测量方法和工具的概述,以及
    的头像 发表于 12-30 15:02 1921次阅读

    三维测量技术在工业中的应用

    中不可或缺的部分。 三维测量技术的工作原理 三维测量技术,也称为三维扫描技术,是一种通过捕
    的头像 发表于 12-30 15:01 1163次阅读

    思看科技手持三维激光扫描仪三种工作模式介绍

    思看科技手持三维扫描仪有高速、精细、复合及深孔扫描模式,适用于不同场景需求,合理选择模式可快速获取、处理物体三维数据,支持后续制造、设计或修复工作。
    的头像 发表于 12-24 15:32 1485次阅读
    思看科技手持<b class='flag-5'>三维</b>激光扫描仪<b class='flag-5'>三种</b>工作模式<b class='flag-5'>介绍</b>

    三维扫描与建模的区别 三维扫描在工业中的应用

    三维扫描与建模的区别 三维扫描与建模是两不同的技术,它们在操作过程、输出结果及应用领域上存在显著的区别。 操作过程 : 三维扫描 :主要通过激光或光学扫描设备,获取实物表面的形状、纹
    的头像 发表于 12-19 14:55 1569次阅读