0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

计算机视觉中的双目立体视觉和体积度量

新机器视觉 来源:AI公园 作者:Yauheni Marushko 2022-08-19 16:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读

一个双目立体视觉的常用应用场景的介绍,很基础。

立体视觉

立体视觉意味着人工智能可以通过一对相机来感知图像的深度以及物体的距离。大多数三维相机模型都是基于立体视觉理论和技术的。两台摄像机之间设置一定的距离,这样它们就可以从不同的角度“看”物体。评估两个图像之间的对应关系,人工智能确定到目标的距离,分析,并建立目标的3D结构。

采用立体视觉,不需要红外传感器、声波定位仪、激光雷达等测距传感器,可大大降低了技术解决方案的成本。

271dd538-1f81-11ed-ba43-dac502259ad0.png

主要应用场景:

1、人体姿态和手势识别。

2、3D模型和3D场景的构建。

3、自动驾驶系统的障碍定位和检测。

每个特定的场景都可以改动以解决特定的问题。因此,3D场景重建可以用来测量物体或产品的体积。

在实践中,立体视觉通过两台摄像机分四个阶段实现:

1、畸变校正 — 一种去除图像上透镜的径向和切向畸变的数学方法,以获得未失真的图像。

2、在校正过程中调整相机之间的角度和距离。结果是直线对齐和细化图像,即同一平面的两幅图像共面,其直线对齐方向相同,具有相同的y坐标。

272a7b8a-1f81-11ed-ba43-dac502259ad0.png

3、点匹配过程 — 搜索左、右摄像头点之间的对应关系。在那之后,你会得到有一个视差图 —— 其中的值对应于左右摄像机同一点的图像x坐标的差异。

4、因此,有了相机的几何排列,我们产生了视差图的三角度量。这是重投影阶段,形成深度图,也就是想要的3D场景。

对于前两个阶段,你必须首先计算这一对相机的配置参数。这可以通过各种二值化的标定板自动完成,比如ArUco或ChArUco。这些标定板的主要优点是,即使是单个标定板也能提供足够的一致性来获得相机的姿势。此外,内部的二进制编码使它们特别可靠,因为它可以进行错误检测和纠正。你也可以使用标定板来确定相机下区域的几何形状。

2750bd4a-1f81-11ed-ba43-dac502259ad0.png

体积度量

为了度量体积,你还需要进行下面的步骤:

1、对一组连续的帧进行累积,这将增加错误恢复的弹性,用于对3D场景进行平均或细化。

2、只在场景中选择产品定义的点。这是通过使用颜色分割、模板匹配或神经网络语义分割来实现的。最快的方法是颜色分割。该方法的缺点是将设置绑定到特定的产品上,如果背景颜色和对象不是很清楚,可能会产生不好的结果。如果GPU优化是可能的,那么使用U形卷积神经网络如U-net和高级U-net,或全卷积神经网络会有较高的性能和分割精度。

3、对一个由产品定义的3D点组成的场景进行聚类。每个簇是一个对象。

275f8b72-1f81-11ed-ba43-dac502259ad0.png

277aa70e-1f81-11ed-ba43-dac502259ad0.png

4、为每个簇形成一个凸多边形,消除3d场景对象的边缘缺陷

5、使用线性插值恢复缺失的3D点

6、通过基于场景的几何聚类区域积分来计算单个对象的体积。

279210ec-1f81-11ed-ba43-dac502259ad0.png

7、最后,计算所有物体的总体积。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 立体视觉
    +关注

    关注

    0

    文章

    42

    浏览量

    10033
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47457
  • 自动驾驶
    +关注

    关注

    791

    文章

    14673

    浏览量

    176647

原文标题:计算机视觉中的双目立体视觉和体积度量

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用代理式AI激活传统计算机视觉系统的三种方法

    当前的计算机视觉系统擅长于识别物理空间与流程的事件,却难以诠释场景细节及其意义,也无法推理后续可能发生的情况。
    的头像 发表于 12-01 09:44 344次阅读

    智驾感知系统中立体视觉相对于LiDAR的性能优势

    上一篇我们引用马斯克对于智驾感知的观点,以及分享了LiDAR与双目立体视觉的原理技术知识,下面我们详细介绍一下立体视觉相对于LiDAR的性能优势。
    的头像 发表于 11-11 10:58 1452次阅读
    智驾感知系统中<b class='flag-5'>立体视觉</b>相对于LiDAR的性能优势

    STM32计算机视觉开发套件:B-CAMS-IMX摄像头模块技术解析

    STMicroelectronics用于 STM32开发板的B-CAMS-IMX摄像头模块提供强大的硬件集,可处理多种计算机视觉场景和用例。该模块具有高分辨率500万像素IMX335LQN
    的头像 发表于 10-20 09:46 724次阅读
    STM32<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>开发套件:B-CAMS-IMX摄像头模块技术解析

    双目环视立体视觉系统在智能驾驶行业的应用

    在智能驾驶技术飞速发展的当下,双目立体视觉凭借其独特的感知优势,在 360 环视产品方案以及各类辅助驾驶功能中发挥着关键作用,在最新法规要求与复杂场景下表现突出,为汽车在AEB、NOA、自动泊车等核心场景重构了安全与效率的边界
    的头像 发表于 09-23 11:35 863次阅读

    iTOF技术,多样化的3D视觉应用

    视觉传感器对于机器信息获取至关重要,正在从二维(2D)发展到三维(3D),在某些方面模仿并超越人类的视觉能力,从而推动创新应用。3D 视觉解决方案大致分为立体视觉、结构光和飞行时间 (
    发表于 09-05 07:24

    易控智驾荣获计算机视觉顶会CVPR 2025认可

    近日,2025年国际计算机视觉与模式识别顶级会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美国田纳西州纳什维尔召开。
    的头像 发表于 07-29 16:54 985次阅读

    Bumblebee X 5GigE系列工业相机,多场景下释放工业立体视觉的无限潜力!

    随着智能制造(工业4.0)和柔性生产的发展,工业场景需要更智能的“眼睛”来理解三维空间。FLIRIIS通过提供包含完整立体处理支持的硬件和软件包(从图像校正和对准到基于密集相关的立体映射),使立体视觉
    的头像 发表于 07-11 17:04 892次阅读
    Bumblebee X 5GigE系列工业相机,多场景下释放工业<b class='flag-5'>立体视觉</b>的无限潜力!

    双目视觉在智能驾驶领域的应用

    围绕“双目智驾应用”,我们将推出系列文章深入解析双目视觉如何跨越技术鸿沟,在中国智驾的沃土上生根发芽,探索其赋能未来出行的无限可能。
    的头像 发表于 07-09 16:21 1031次阅读

    智能软件+硬件解决方案克服实时立体视觉的挑战

    立体视觉是一种强大的成像技术,通过使用两台或多台相机以略微不同的角度拍摄,模拟人类通过双眼感知深度的方式,从而捕捉环境的三维结构。这项技术能够提供全视野的高密度三维测量,并在非结构化和动态环境中表
    的头像 发表于 05-16 17:04 480次阅读
    智能软件+硬件解决方案克服实时<b class='flag-5'>立体视觉</b><b class='flag-5'>中</b>的挑战

    中科慧眼三目立体视觉产品的功能优势

    2025年上海国际车展已正式开幕,三目立体视觉产品作为推动智驾平权的关键力量,也在全民智驾时代备受瞩目。
    的头像 发表于 05-06 09:23 1157次阅读

    中科慧眼三目立体视觉相机将亮相2025上海车展

    2025年上海国际车展开幕在即,这场全球瞩目的行业盛会不仅是车企竞技的舞台,更是前沿技术趋势的风向标。随着智能驾驶加速迈向“全民普惠”时代,三目立体视觉技术正以其低成本、高精度、强适配性的优势,成为推动智驾平权的关键力量。
    的头像 发表于 04-19 10:36 1105次阅读

    英飞凌边缘AI平台通过Ultralytics YOLO模型增加对计算机视觉的支持

    计算机视觉的支持,扩大了当前对音频、雷达和其他时间序列信号数据的支持范围。在增加这项支持后,该平台将能够用于开发低功耗、低内存的边缘AI视觉模型。这将给诸多应用领域的机器学习开发人员带来极大的便利,例如工厂可以借此实现对零件的
    的头像 发表于 03-11 15:11 661次阅读
    英飞凌边缘AI平台通过Ultralytics YOLO模型增加对<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的支持

    Arm KleidiCV与OpenCV集成助力移动端计算机视觉性能优化

    等多种应用。然而,这些计算机视觉应用可能很难实现最优化的延迟性能和处理速度,特别是在内存大小、电池容量和处理能力有限的移动设备上难度更高。 而 Arm KleidiCV 便能在其中大显身手。该开源库利用了最新 Arm CPU
    的头像 发表于 02-24 10:15 885次阅读

    AR和VR计算机视觉

    ):计算机视觉引领混合现实体验增强现实(AR)和虚拟现实(VR)正在彻底改变我们与外部世界的互动方式。即便是在引人入胜的沉浸式
    的头像 发表于 02-08 14:29 2153次阅读
    AR和VR<b class='flag-5'>中</b>的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>