0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

单目视觉识别的无限市场潜力

ml8z_IV_Technol 来源:cg 2018-12-01 11:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

对单目来说物体越远,测距的精度越低,硬件上的缺点可以通过算法去弥补,近日有两篇关于单目视觉的研究论文曝光,一篇是单目视频的深度估计,另一篇则是单目3d物体识别,在数据集下测试都取得了不错的效果,我们熟悉的单目摄像头可能一直被低估了。

摄像头是自动驾驶汽车中重要的传感器之一,在自动驾驶过程中的首要任务就是道路识别 ,主要是图像特征法和模型匹配法来进行识别。行驶过程中需要进行障碍物检测和路标路牌识别等,此时车辆上的信息采集便可以运用单目视觉或者多目视觉。

由于很多图像算法的研究都是基于单目摄像机开发的,因此相对于其他类别的摄像机,单目摄像机的算法成熟度更高。基于单目摄像头可以用来定位、目标识别等。但是相比多目,单目有着先天的缺陷,视野信息不能够丰富,单目测距的精度也较低。

不过单目摄像头的作用还未发挥到极致,近日有两篇关于单目视觉的研究,让众多研究者惊艳,原来单目一样可以有不错的表现。

Paper1:

Orthographic Feature Transform for Monocular 3D Object Detection

单目3d物体检测是一件很有挑战性的事情,目前最先进系统的成绩也不及用激光雷达的1/10,剑桥大学的科学家利用单目视觉进行3d物体识别,通过引入正交特征变换,使基于图像的特征映射到正交3D空间,来避免形成图像域,可以全面地推断出各个物体比例尺寸以及相隔的距离。通过在KITTI数据集里测试,发现与前人的Mono3D方法对比,这种方法在鸟瞰图平均精确度、3D物体边界识别上各项测试成绩上均优于对手。

尤其在探测远处物体时要远超Mono3D,远处可识别出的汽车数量更多。甚至在严重遮挡、截断的情况下仍能正确识别出物体。在某些场景下甚至达到了3DOP系统的水平。

在这项工作中,提出的一种新颖的单目三维物体检测方法,基于在鸟瞰视野范围内操作的,减轻了许多不良图像的属性,更易于推断出世界的3D结构。用一种简单的正交特征变换,将基于图像的特征转换为这种鸟瞰视图表示, 并描述了如何使用图像积分有效地实现它,以深二维卷积网络的形式应用于提取的鸟瞰特征,取得了不错的效果,说明单目还有很大可开发的空间。

Paper2:

A Structured Approach to Unsupervised Depth Learning from Monocular Videos

这是谷歌的工程师做的一个研究,他利用单目视频深度估计,自从2014年NIPS上出现第一篇用CNN-based来做单目深度估计,近几年也不断涌现出一些做单目深度估计的文章,有直接依靠深度学习和网络架构得到结果,还有依靠于深度信息本身的性质进行估计,基于CRF和基于相对深度方法的,本篇文章是基于无监督学习单目视频深度估计。文中的方法能够模拟运动物体并产生高质量的深度估计结果,与以前的单目视频无监督学习方法相比,该方法能够恢复移动物体的正确深度。也就说,能够正确地恢复与自身运动车辆相同速度的移动汽车的深度。因为一台相对静止的车辆,往往会表现出与地面相同的无线深度特征,解决了高动态场景中的问题。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 摄像头
    +关注

    关注

    61

    文章

    5136

    浏览量

    103681
  • 视觉识别
    +关注

    关注

    3

    文章

    111

    浏览量

    17424
  • 自动驾驶
    +关注

    关注

    795

    文章

    15073

    浏览量

    182075

原文标题:被低估的单目视觉识别

文章出处:【微信号:IV_Technology,微信公众号:智车科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    安富利中国荣获瑞萨电子2025年度大众市场潜力

    近期,安富利中国凭借在大众市场的的卓越表现与创新突破,荣获合作伙伴瑞萨电子(Renesas)授予的“2025年度大众市场潜力奖”。该奖项旨在表彰安富利在大众市场领域所展现的高速成长潜力
    的头像 发表于 02-06 13:59 739次阅读

    目视觉是如何实现深度估计的?

    [首发于智驾最前沿微信公众号]自动驾驶的纯视觉方案中,目摄像头因无法直接感知深度,在环境理解上存在根本局限,双目视觉技术在此需求下应运而生。它通过模拟人眼,利用双摄像头的视差来推算距离,将二维图像
    的头像 发表于 12-31 09:45 795次阅读
    双<b class='flag-5'>目视觉</b>是如何实现深度估计的?

    2025年半导体芯片技术多领域创新突破,应用前景无限

    芯片等方面的创新,为行业发展注入新动力,展现出强大创新活力和广阔市场潜力。 详细内容 半导体芯片硬件与软件优化技术 AI芯片发展 :台积电计划增建三座2纳米厂,预计资本支出达500亿美元,约70%用于先进制程研发及扩产,以满足AI芯片
    的头像 发表于 12-17 11:18 1836次阅读

    华秋输出的GERBER别的软件无法正确识别

    ,卡住了。 这个是华秋识别的,可以看到是正确的。 下面是AD,KICAD、工厂锡膏机识别的,都一样的,统一少了太多东东。
    发表于 12-17 10:46

    UV紫外相机在工业视觉检测中的应用

    UV紫外相机通过捕捉紫外信号和激发荧光反应,解决常规相机无法识别的隐形缺陷和标记,广泛应用于工业视觉检测。
    的头像 发表于 10-21 09:45 782次阅读

    WTK6900HD哭声识别产品在中婴儿产品中的应用

    本文将深入介绍唯创知音推出的WTK6900HD语音识别芯片如何在婴儿哭声识别领域掀起一场技术革命。 一、婴儿哭声识别的技术背景与市场潜力 处于婴幼儿时期的孩子,每天哭啼都会让家长们头疼
    的头像 发表于 10-10 16:50 798次阅读
    WTK6900HD哭声<b class='flag-5'>识别</b>产品在中婴儿产品中的应用

    智能电网升级浪潮下,新洁能NCE65T1K2K功率器件的应用价值与市场潜力

    市场潜力巨大,这款核心元件以精准的性能适配,成为推动电网升级的“隐形基石”。​当前智能电网面临双重挑战:一方面,风能、太阳能等可再生能源大规模接入,导致电网电压
    的头像 发表于 09-10 11:13 5179次阅读
    智能电网升级浪潮下,新洁能NCE65T1K2K功率器件的应用价值与<b class='flag-5'>市场潜力</b>​

    iTOF技术,多样化的3D视觉应用

    市场潜力的信心。 ◆ Features 独特的结构设计(结合ISP)→ 显着降低外部计算要求和集成成本。 芯片内的逻辑电路→实现高分辨率,满足严格的低功耗要求。 独特的芯片结构和测试原理→有效抑制
    发表于 09-05 07:24

    基于凌智视觉识别模块的基于目视觉的目标物测量装置

    1.视觉测量整体方案本视觉测量系统采用目视觉技术实现目标物距离
    的头像 发表于 07-31 15:35 1210次阅读
    基于凌智<b class='flag-5'>视觉</b><b class='flag-5'>识别</b>模块的基于<b class='flag-5'>单</b><b class='flag-5'>目视觉</b>的目标物测量装置

    目视觉在智能驾驶领域的应用

    围绕“双目智驾应用”,我们将推出系列文章深入解析双目视觉如何跨越技术鸿沟,在中国智驾的沃土上生根发芽,探索其赋能未来出行的无限可能。
    的头像 发表于 07-09 16:21 1559次阅读

    基于LockAI视觉识别模块:C++人脸识别

    本文基于RV1106做成的LockAI视觉识别模块,采用 LZ-Picodet 模型训练的人脸检测模型 LZ-Face,以及ArcFace人脸识别模型,实现人脸识别系统。 源代码:ht
    发表于 07-01 12:01

    基于LockAI视觉识别模块:C++人脸识别

    本文基于RV1106做成的LockAI视觉识别模块,采用LZ-Picodet模型训练的人脸检测模型LZ-Face,以及ArcFace人脸识别模型,实现人脸识别系统。
    的头像 发表于 07-01 10:09 1198次阅读
    基于LockAI<b class='flag-5'>视觉</b><b class='flag-5'>识别</b>模块:C++人脸<b class='flag-5'>识别</b>

    基于LockAI视觉识别模块:手写数字识别

    手写数字识别是一种经典的模式识别和图像处理问题,旨在通过计算机自动识别用户手写的数字。 本文将教会你如何使用基于RV1106的 LockAI视觉识别
    发表于 06-30 16:45

    基于LockAI视觉识别模块:手写数字识别

    手写数字识别是一种经典的模式识别和图像处理问题,旨在通过计算机自动识别用户手写的数字。本文将教会你如何使用基于RV1106的LockAI视觉识别
    的头像 发表于 06-30 15:44 1361次阅读
    基于LockAI<b class='flag-5'>视觉</b><b class='flag-5'>识别</b>模块:手写数字<b class='flag-5'>识别</b>

    智慧出入时代,BLE如何令门锁化身“智能安防管家”?

    随着物联网、人工智能等技术的发展,智能门锁市场潜力巨大。蓝牙智能门锁融合了BLE通信技术、生物识别及物联网功能,实现离线可用、超低功耗和便捷快速的设备配对。
    的头像 发表于 06-12 10:56 1261次阅读
    智慧出入时代,BLE如何令门锁化身“智能安防管家”?