0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ToF技术实现人机交互和3D重建功能,与AI相结合解锁更多新场景

牵手一起梦 来源:电子工程世界 作者:佚名 2020-04-23 14:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

游戏玩家在游戏设备前徒手对空做着各种动作,轻松扮演各种虚拟世界的游戏角色;各色机器人在各种场景中自主导航,轻松避障快速移动实现自主清扫、快递或巡视等多种特定目标任务;卡车司机在午后昏昏欲睡之际,在驾驶舱不断传来警示声音下停下车来休息以保安全……这些都是在我们生活中越来越多的现实科技应用场景,而ToF(飞行时间法)正在成为这些众多创新应用的关键赋能科技之一。

ToF从最初手机摄像端的潮流应用迅速走进大众视野,并在各个应用领域初显峥嵘。据IHS Markit报告,基于ToF方案的多方面优势,预计2022年ToF市场规模将达到15亿美元,占3D传感市场的50%左右。ADI工业市场经理李佳在近日接受采访时也认为,作为3D深度视觉领域三大主流方案之一,ToF技术除了应用在手机上之外,也在VR/AR手势交互、汽车电子ADAS、安防监控以及新零售等多个领域都开始大显身手,有望推动新一波3D智能感知应用创新。

生态蓬勃发展,推动ToF技术新一波3D智能感知应用

众所知周,ToF在与双目和结构光对比中,最大的优点在于测距,它的深度计算精度往往不随距离改变而变化,而且基本都能够保持在厘米级别。因此在包含大范围运动的场景下,ToF适用度非常高。2010年之前,ToF技术多应用于宇宙测量、高精显微镜等科研领域,随着发光元器件性能的大幅提高,自动驾驶、VR/AR、工业机器人物联网等行业逐渐兴起,进一步带动了ToF应用市场发展。“就目前而言,ToF匹配度最高的应用场景包括自动驾驶中行车环境的测距、感知,工业领域人机协同安全距离的监测,机器视觉,物流行业的体积、计算,机器人的导航等等,都充分了利用了ToF传感器在精准定位和距离测算上的优势。”李佳指出。

脉冲式ToF是其中一种景深测量技术,为了精确同步光脉冲,每秒需要对数百万个像素执行这些计算,并且还要根据工作条件进行调整,这对混合信号电路设计与应用而言极具挑战,ADI是为数不多拥有技术专长、可提供兼具高性能和成本效益的ToF解决方案的公司之一。在2014年,ADI开始为国外某知名AR眼镜定制ToF技术,该产品成功落地并实现人机交互和3D重建功能;2016-2017年,ADI ToF技术用于车内手势识别;2018年,ADI ToF技术开始与国内某品牌手机合作并成功批量上市……“到目前为止,ADI的ToF技术和产品不仅涵盖了从工业、消费到汽车等,应用的边界拓展仍在继续,未来更大空间、更高分辨率深度数据与强大的分类算法以及AI相结合,将会解锁更多新的场景。”李佳表示。

ToF技术实现人机交互和3D重建功能,与AI相结合解锁更多新场景

ADI ToF方案应用发展时间轴

在过去一段时间内,ToF应用逐渐呈现出加速落地的态势。如SLAM(同步定位与建图)对在机器人的自主定位和导航中开始发挥主动作用,有效推动了人机交互的实现;ADI所开发的ToF模块结合影像传感器和VGA ToF传感器模块与内建图像处理器方案,为汽车倒车系统、开门防护系统、停车辅助系统及盲点侦测等应用提供更大范围的碰撞侦测预防。 “要更进一步提升ToF技术的行业大规模应用,始终需要上中下游产业链伙伴们一起配合,包括光学、电、芯片级、电路级以及模组厂等,甚至还有一些应用需要专业团队来开发、适配整个方案。” 李佳指出。据悉,ADI已经和Arrow推出了3D飞行时间开发套件,并与远景智能等多家软件方案公司合作推出满足丰富应用场景的完整解决方案。

ToF技术实现人机交互和3D重建功能,与AI相结合解锁更多新场景

ADI ToF产业链

ADI ToF模拟前端核心芯片解析,构筑精确测量硬件平台

通常而言,ToF技术根据调制方法的不同,可以分为两种:脉冲调制和连续波调制。两种ToF调制方法都有各自的优缺点,需要根据实际应用用例综合考量的点包括测量距离、使用系统的环境、精度要求、热/功耗限制、外形大小以及电源问题等。据李佳介绍,ADI的ToF解决方案目前主要采用CCD传感器的脉冲原理方式,CCD作为一个全局曝光器件,在室外远距离场景下,具有非常良好的性能。同时CCD作为全局曝光的传感器,又是窄快门曝光,对于外界抗干扰性能非常强。

ToF技术实现人机交互和3D重建功能,与AI相结合解锁更多新场景

户外环境下CMOS ToF系统(850 nm光源)与ADI的CCD ToF系统在识别人与三脚架的效果对比。

具体来看,ADI的ToF解决方案使用了高性能ToF CCD和集成了12位ADC、深度处理器(将来自CCD的原始模拟图像信号处理成深度/像素数据),以及高精度时钟发生器(为CCD和激光器生成驱动时序)的ToF模拟处理前端。ToF CCD主芯片ADDI903x系列具有很好的性能,传感器将采集的光信号转换成电信号,运用深度计算把最终距离信息送到SOC处理,然后将数据提供给算法适配,整个过程涉及传感器、镜头、发射器件、平台、应用等。对硬件厂商而言,需要和模组厂配合打造小型化、集成度高的产品来适配应用厂商,然后适应不同的应用场景。

ToF技术实现人机交互和3D重建功能,与AI相结合解锁更多新场景

ADI CCD ToF 前端芯片ADDI903x提供的功能

由于ADI ToF系统级解决方案使用了分辨率为640×480的ToF图像传感器,因此其分辨率比市面上大部分其他ToF解决方案的分辨率高4倍。同时,这款系统级ToF解决方案与CMOS解决方案相比,在同样的尺寸或同样的成本下,可提供更高的系统性能。例如高解析度,在光线复杂的环境中,可以更好的区分主体与背景。得益于针对940nm发光波段而设计的CCD架构,ADI ToF解决方案也可以更精确的捕捉运动环境中的画面。

除了前端芯片和传感器外,根据CCD的需求也会需要比较多的光电器件,而ADI的ToF解决方案周边器件均是ADI公司的产品。“ADI ToF系统级解决方案不建议客户在使用时进行太多修改,因为该系统中的每一个模块都是ADI长期和合作伙伴磨合完成已达到的系统最佳整体性能状态。”李佳特别强调道。

ToF技术实现人机交互和3D重建功能,与AI相结合解锁更多新场景

ADI ToF方案的完整系统组成

寻找并解决潜在技术痛点,探索ToF应用更广路径

越来越多的应用场景为ToF打开了一个又一个风口,但相关的挑战也可能因而出现,例如同一场景下多个ToF应用终端如何避免干扰,特别是对于汽车、工业等这一类的专业级场景,ToF传感系统的设计不仅需要在精度、范围、响应时间、分辨率、成本、功耗以及可用封装要求之间取得平衡,而且需要针对不同的实际情况中出现的各种不可控的因素,对传感系统的灵活性及抗干扰性等方面进行一些定制化的设计,比如添加一些高可靠性的滤波及抗干扰器件和模块,并加载相关的软件算法,从而保证系统有足够的能力去应对不同类型的突发状况。

试想如果多个自主式机器人在同一大型仓库里分拣货物,或者两辆自动驾驶的汽车同时接近交叉路口,ToF摄像头无法消除相互光源的干扰,那么使用ToF技术进行精确深度测量的应用范围将会严重受限(ADI发展路线图预计将实现64个摄像头同时近程检测的场景)。就算是在消费端,随着各种应用增多,设备间的干扰也将是实实在在的现实问题。因此,ADI认为ToF系统中的防干扰或消除干扰能力将会越来越重要。据透露,ADI目前采用了一项正在申请专利的算法,它能够避开或消除所有无关的光信息,仅使用自身激光源的光信息,所以能给出正确的深度信息。深度处理器采用伪随机化算法和特殊的图像处理功能,可以消除多机干扰。因此,可以在同个环境中使用多个ADI ToF系统。

ToF技术实现人机交互和3D重建功能,与AI相结合解锁更多新场景

干扰抑制算法

除此之外,随着3D算法进一步成熟,数据分析将被用来收集大量关于人们行为的有效信息,这种技术可能最先应用于楼宇控制应用,例如门禁系统。垂直安装的传感器增加了深度信息,这意味着可以非常准确地计算人数。另一个用例是智能自动门开启,它可以对人进行区分,只有在检测到真人时才开启。ADI目前也正在开发人员计数和真人区分的软件算法,通过使用深度信息,可以在许多具有挑战性的条件下对人进行高精度的分类,例如在光线暗淡或没有环境光的环境中,在人口密度较大的地区,以及在人员着装复杂的情况下。最重要的是,几乎可以消除人员计数错误。

ToF技术实现人机交互和3D重建功能,与AI相结合解锁更多新场景

使用深度传感技术的人员跟踪算法

本文总结

对于很多技术而言,技术的成熟度并非技术普及的唯一因素,还与技术的成本和产业链协同有很大的关系。在过去的2019年里,ToF技术不断被领先手机厂商广泛采用,在技术的演进道路上走出了关键一步。未来如何通过技术手段去真正实现成本、功耗、体积、速度、寿命、稳定性以及抗干扰能力等多方面的平衡,达到一个相对目前来说更为优化的水平,进而实现ToF技术实际应用中可靠性的成倍提升,是ToF技术普及乃至整个市场健康发展的前提,也是诸如ADI这类ToF技术系统级解决方案提供商需要考虑的研究重点。

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ADI
    ADI
    +关注

    关注

    150

    文章

    46087

    浏览量

    271298
  • AI
    AI
    +关注

    关注

    90

    文章

    38346

    浏览量

    297479
  • TOF
    TOF
    +关注

    关注

    9

    文章

    522

    浏览量

    38197
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    图扑软件 3D 场景预加载应用实现

    预加载是在进入正式场景之前提前加载所需模型、材质、图片等资源的技术手段,其核心价值在于消除资源加载等待,确保场景首次渲染即可完整呈现,从而提供无缝、流畅的用户体验。在复杂的 Web 3D
    的头像 发表于 12-01 16:04 101次阅读
    图扑软件 <b class='flag-5'>3D</b> <b class='flag-5'>场景</b>预加载应用<b class='flag-5'>实现</b>

    3D传感器到立体相机,解锁工业应用新可能

    3D传感器是实现深度感知的核心技术。这些传感器广泛应用于多种常见的3D视觉技术中,例如立体相机、激光雷达(LiDAR)、飞行时间(
    的头像 发表于 11-28 17:03 1626次阅读
    从<b class='flag-5'>3D</b>传感器到立体相机,<b class='flag-5'>解锁</b>工业应用新可能

    CIE全国RISC-V创新应用大赛 呼吸机人机交互系统

    )、CMake 3.16、串口调试工具;​ 3. 原有系统版本:基于 Qt 开发的呼吸机人机交互 V2.0 版本(含参数设置、数据监测、报警提示、历史数据查询等功能)。​ 三、适配过程​ (一)开发环境搭建
    发表于 11-12 15:07

    仅使用智能手机在NVIDIA Isaac Sim中重建场景

    使用 iPhone 拍摄照片,到利用 3DGUT 进行 3D 场景重建,再到将重建场景导入 N
    的头像 发表于 11-10 14:03 472次阅读

    重构未来自适应人机交互的创新技术

    人机交互的概念可以追溯到工业革命时期,在当时机器开始取代人类劳动。然而,直到20世纪中叶,人机交互领域才受到广泛关注。人机界面(HMI)是人与机器之间交互的关键点,形成了用户可以控制复
    的头像 发表于 10-31 16:30 800次阅读
    重构未来自适应<b class='flag-5'>人机交互</b>的创新<b class='flag-5'>技术</b>

    大模型驱动下的人机交互革命,“超拟真人互动” 让玩具读懂你的情绪

    电子发烧友网报道(文/黄山明)日前,在大湾区AI玩具生态大会上,百度智能云正式发布基于“超拟真人互动”理念的智能硬件多模态交互解决方案。该方案通过大模型与多模态技术的深度融合,从技术
    的头像 发表于 10-31 09:21 6162次阅读
    大模型驱动下的<b class='flag-5'>人机交互</b>革命,“超拟真人互动” 让玩具读懂你的情绪

    边聊安全 | 人机交互功能安全的影响

    上海磐时PANSHI“磐时,做汽车企业的安全智库”人机交互功能安全的影响HMI,HumanMachineInterface,也就是大家熟知的人机接口。近年来,HMI的功能也随着汽车智
    的头像 发表于 09-05 16:21 21次阅读
    边聊安全 | <b class='flag-5'>人机交互</b>对<b class='flag-5'>功能</b>安全的影响

    iTOF技术,多样化的3D视觉应用

    。这些技术与人工智能 (AI相结合,正在改变各行各业和人类生活方式的运营范式。 With the proliferation of 3D perception technologi
    发表于 09-05 07:24

    串口屏:重塑人机交互的开发革命

    。我们致力于通过技术创新,让每个设备都能拥有出色的用户界面,让创意不再受技术限制。 探索串口屏的无限可能,开启人机交互新纪元
    发表于 08-28 14:56

    人机交互:连接人类与数字世界的桥梁

    )等技术的发展,人机交互已经从传统的键盘鼠标操作,演进为语音识别、手势控制、脑机接口等更自然、更智能的交互方式。   人机交互的发展历程 早期的人机
    的头像 发表于 08-11 15:21 1728次阅读

    声学技术如何重构人机交互生态

    人机交互的底层逻辑。随着非线性声学计算与强化学习的深度融合,声音交互正从“听得见”迈向“听得懂”,并逐渐成为 AI 时代的重要接口。
    的头像 发表于 04-14 13:50 859次阅读

    零知开源——ESP32语音交互系统(AI小智)开发教程

    小智AI聊天机器人是一个基于嵌入式硬件与人工智能技术深度融合的智能交互系统。该项目以ESP32开发板为核心,结合语音唤醒、自然语言处理、音频解码播放及图形化
    的头像 发表于 03-29 15:33 1w次阅读
    零知开源——ESP32语音<b class='flag-5'>交互</b>系统(<b class='flag-5'>AI</b>小智)开发教程

    康谋分享 | 3DGS:革新自动驾驶仿真场景重建的关键技术

    3DGS技术为自动驾驶仿真场景重建带来突破,通过3D高斯点精确表达复杂场景的几何和光照特性,显著
    的头像 发表于 03-05 09:45 4944次阅读
    康谋分享 | <b class='flag-5'>3</b>DGS:革新自动驾驶仿真<b class='flag-5'>场景</b><b class='flag-5'>重建</b>的关键<b class='flag-5'>技术</b>

    腾讯混元3D AI创作引擎正式发布

    AI技术,能够根据用户提供的提示词或图片,直接生成高质量的3D模型。这一功能极大地降低了3D内容创作的门槛,使得即使是缺乏专业
    的头像 发表于 01-23 10:33 1011次阅读

    腾讯混元3D AI创作引擎正式上线

    或上传一张图片,该引擎便能迅速生成与之对应的3D模型。这一功能极大地降低了3D内容创作的门槛,使得更多用户能够轻松涉足这一领域。 除了基础的3D
    的头像 发表于 01-22 10:26 995次阅读