0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

三维视觉将成为人工智能的“杀手级应用”

MEMS 来源:未知 作者:伍文辉 2018-04-03 11:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Google人工智能机器学习首席科学家李飞飞在Google I/O开发者大会表示人工智能将成为“第四次工业革命的驱动力”,它将改变人类生活、工作和沟通的方式。在人工智能的三个阶段“弱人工智能—强人工智能—超人工智能”的发展中,视觉信息的获取是必不可少的,机器从对物体的识别到场景的理解都必须先获取其三维信息以及位置关系。三维视觉将成为人工智能的“杀手级应用”。

在过去十年间,人类在对图像识别和图像标注等基础视觉领域已经取得了重大进展,基于这种二维图像视觉在诸如人脸识别、工业检测、安防以及汽车ADAS等方面得到了广泛的应用,成为人工智能的一些重要落地应用。随着人工智能的发展,二维信息无法满足对真实场景的充分理解,所以各个大厂都在着力研究三维视觉的技术,如Intel的RealSense、Apple的TrueDepth,以及诸多厂家面向无人驾驶的多线激光雷达等,这些技术都在帮助机器获取一个至关重要信息——深度信息,来实现三维人脸识别、手势识别、获知物体间的空间关系,以及视觉导航、路径规划、主动避障等工作。

三维视觉在强人工智能阶段必将是不可获取的组成部分,是机器智能和企业变革的重要技术。接下来我们就三维视觉的技术方案给做一个系统介绍。

其中三角测距中的非编码方式的方案常见于工业检测领域,这种方案我们暂且不讨论。我们在这一期着重讨论其它几种方式的近距离三维视觉方案。

近距离三维感知设备我们称之为深度相机,其中双目相机即是利用双摄像头模拟人眼,通过计算空间中同一个物体在两个相机成像的视差来获得物体离相机的距离。

而ToF(Time of Flight)即飞行时间法,其测距原理是通过连续发射经过调制的特定频率的光脉冲到被观测物体上,然后接收从物体反射回去的光脉冲,通过探测光脉冲的飞行(往返)时间来计算被测物体离相机的距离。

三角法测距中的采用编码方式的方案业内均定义为结构光方式。结构光法不依赖于物体本身的颜色和纹理,是采用主动投影编码图案(比如散斑、条纹光等)的方法来实现快速鲁棒的匹配特征点,能够获得较高的精度,也大大扩展了适用范围。

苹果iPhone X的“齐刘海”——TrueDepth系统

iPhone X通过前置点阵投影器(也就是结构光投影仪)将超过30000个肉眼不可见的光点(红外激光散斑点)投影到人脸,再根据红外镜头接收到的反射光点,计算得到人脸三维图。

这种空间编码方式,是向空间投射了单幅随机的激光衍射斑点,但是由于这些点并不能覆盖空间上所有的区域,势必在某些位置无法获取到三维信息,导致其精度是有一定限制的,通常为毫米级精度,这也是为什么iPhone X只是获取了人脸的大致模型,在其FaceID应用中实际上只是应用了结构光方案判断解锁手机的是一个真实的人,而非平面照片或视频,作为一种活体判断防止被攻击破解的手段。

这类散斑结构光的方案被国内奥比中光、华捷艾米等企业采用。主要应用于体感交互、手势识别、人脸识别活体检测等领域。

那是否有方案可以实现高精度的三维数据呢?答案是肯定的。这就是我们接下来要讲的动态结构光的时间编码方案,此种方案的深度相机的原理如下:

它同样由一个摄像机和一个结构光投影仪组成,结构光投影仪向被测物体投射多组明暗相间的光栅图像(随时间可调制),摄像机同时拍摄经被测物体表面调制而变形的多组光栅图像,通过一定算法计算出被测物体的三维数据。

这种动态结构光方案的三维视觉其实在工业界早有应用,主要应用在逆向工程、三维检测、三维建模等领域,这就是传统的三维扫描仪,既然将它称为仪器,也就可想而知其体积通常比较大,价格也很昂贵。

那是否存在一种深度相机方案,其精度高,体积小,价格也不那么高呢?答案也是肯定的。这个就是MEMS微振镜的方案(MEMS:微机电系统)。MEMS微振镜是一种将可动结构芯片化的执行器,工作时芯片内部的镜面可以高速摆动,以实现激光束的高速扫描。

基于MEMS微振镜的深度相机与传统的三维扫描仪最大的区别是结构光投影方式上,三维扫描仪采用DLP、LCOS等进行动态结构光的投影,而此深度相机是采用MEMS微振镜与激光来进行扫描投影。

采用MEMS微振镜的投影方式,不仅克服了体积和成本上的缺点,同时由于这种投影系统是激光扫描式,投影并无光学放大镜头,也就没有焦距的概念,是一个无需调焦的系统(free-focus projector),这也就使得基于MEMS微振镜深度相机的工作范围要比三维扫描仪要大很多。

基于MEMS微振镜的深度相机可以实现亚毫米级,甚至更高的深度精度,相比较同样小体积的散斑静态结构光方案的深度相机,精度提升有至少一个数量级。而相比同样精度的三维扫描仪,其体积小、重量轻、无需调焦等优势特点扩展了高精度三维视觉的应用场景。

以下将结构光的三维视觉方案做一个综合对比:

MEMS深度相机所采集的亚毫米精度数据可以满足三维人脸识别需求,实现真正用三维数据来作为识别判定依据。而非像iPhoneX中三维信息只能用于活体判断,也避免出现如新闻中所报道的母子二人均可解锁iPhone X的情况。

同时这种高精度深度相机所采用的MEMS微振镜尺寸通常只有几个毫米,功耗也只有几十毫瓦,非常适合集成于如智能手机、平板电脑等便携式的设备中,为其增加三维人脸识别、三维扫描建模等功能。目前采用这种技术方案的国内外厂家有Intel的RealSense,知微传感(Zhisensor)的Argus等。

随着人工智能对视觉传感器的需求越来越高,高精度的三维视觉产品也将会越来越普及,在不远的将来,机器拥有比人类更敏锐的视觉感知的确是完全可能的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • iPhone X
    +关注

    关注

    0

    文章

    79

    浏览量

    6738
  • 三维视觉
    +关注

    关注

    1

    文章

    21

    浏览量

    1899

原文标题:比iPhone X更牛X的三维视觉技术

文章出处:【微信号:MEMSensor,微信公众号:MEMS】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一文读懂 | 三维视觉领域国家制造业单项冠军——先临三维的品牌布局

    先临三维科技股份有限公司成立于2004年,是三维视觉领域国家制造业单项冠军、国家专精特新“小巨人”企业。公司专注于高精度三维
    的头像 发表于 11-11 14:55 315次阅读
    一文读懂 | <b class='flag-5'>三维</b><b class='flag-5'>视觉</b>领域国家<b class='flag-5'>级</b>制造业单项冠军——先临<b class='flag-5'>三维</b>的品牌布局

    机器视觉三维成像技术简介(一)

    本文讨论了机器视觉三维成像技术,涵盖了各种成像技术的原理、特点、优缺点及应用场景等内容。关键要点包括: 1. 三维成像技术分类 2. 飞行时间法(ToF) 3. 结构光 4. 激光
    的头像 发表于 10-20 14:04 391次阅读
    机器<b class='flag-5'>视觉</b><b class='flag-5'>三维</b>成像技术简介(一)

    导远科技收获三维视觉技术客户批量订单

    导远科技近期成功获得国内知名三维视觉技术客户的批量订单。该客户旗下三维扫描仪产品已在三维设计、工业检测、文物保护、医疗健康等全球市场拥有卓越口碑。
    的头像 发表于 09-03 17:16 634次阅读

    AI 驱动三维逆向:点云降噪算法工具与机器学习建模能力的前沿应用

    三维逆向工程领域,传统方法在处理复杂数据和构建高精度模型时面临诸多挑战。随着人工智能(AI)技术的发展,点云降噪算法工具与机器学习建模能力的应用,为三维逆向工程带来了创新性解决方案,显著提升
    的头像 发表于 08-20 10:00 469次阅读
    AI 驱动<b class='flag-5'>三维</b>逆向:点云降噪算法工具与机器学习建模能力的前沿应用

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能
    发表于 08-07 14:23

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模
    发表于 07-04 11:10

    索尼FCB-ER8530:三维建模与视觉感知的跨界融合

    在数字化浪潮中,三维建模技术正重塑工业设计、文化遗产保护与智慧城市管理等领域,而索尼FCB-ER8530一体化摄像机模组凭借其4K超高清成像与智能感知能力,成为这一进程中的关键硬件支撑。 三维
    的头像 发表于 05-19 17:30 452次阅读

    视智造助力高校人工智能和机器视觉课程落地

    人工智能浪潮下,机器视觉成为未来产业升级的重点技术,对培养新型创新人才意义重大。
    的头像 发表于 04-19 15:37 1186次阅读

    奥比中光亮相第四届中国三维视觉大会

    近日,奥比中光携最新技术成果亮相第四届中国三维视觉大会(China3DV 2025)。作为国内三维视觉领域最高规格的学术研讨盛会,本届中国三维
    的头像 发表于 04-15 09:18 946次阅读

    人工智能视觉识别技术的应用领域及场景

    人工智能视觉识别技术的应用领域及场景
    的头像 发表于 03-14 11:41 2313次阅读

    告别人工检测!casaim自动化三维激光扫描

    casaim自动化三维激光扫描技术通过集成传感器、智能算法和自动化控制系统,解决了传统人工检测的诸多问题。
    的头像 发表于 03-12 13:20 554次阅读
    告别<b class='flag-5'>人工</b>检测!casaim自动化<b class='flag-5'>三维</b>激光扫描

    三维测量在医疗领域的应用

    技术可以对CT(计算机断层扫描)、MRI(磁共振成像)等医学影像进行三维重建,生成病灶或器官的三维模型。 这些模型为医生提供了更为直观、立体的视觉信息,有助于医生更准确地了解患者的解剖结构和病变情况。 医学影像分析 : 通过
    的头像 发表于 12-30 15:21 1102次阅读

    三维测量软件的使用技巧

    在现代工业和科研领域,三维测量技术已经成为不可或缺的一部分。它能够提供精确的空间数据,帮助工程师和研究人员更好地理解和设计复杂的三维结构。 选择合适的三维测量软件 功能需求分析 :根据
    的头像 发表于 12-30 15:05 1366次阅读

    三维扫描与建模的区别 三维扫描在工业中的应用

    三维扫描与建模的区别 三维扫描与建模是两种不同的技术,它们在操作过程、输出结果及应用领域上存在显著的区别。 操作过程 : 三维扫描 :主要通过激光或光学扫描设备,获取实物表面的形状、纹理信息等
    的头像 发表于 12-19 14:55 1586次阅读