0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

手势识别在车内交互领域能否焕发新生?

电子工程师 来源:未知 作者:李倩 2018-04-24 09:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2017年9月7日,中德合璧的拜腾汽车横空出世,致力于做国内版“特斯拉”的这家公司,除了在南京设有生产基地外,整个产品平台、产品设计、产品技术和配件等都在慕尼黑。

发布会上,拜腾推出了将于2019年面世的首款产品-纯电动中型SUV车型,这辆车最大的亮点是——配有一款尺寸惊人的液晶屏,具体尺寸是长125厘米、高25厘米。

这块屏幕在2018CES上大出风头,但隐藏在其背后的,还有另外一项功能:动态手势操控。

什么是动态手势操控?这还得从手势本身说起。

手势是人手或者手和手臂结合产生的多种动作,通常分为静态手势和动态手势。简单来说,静态手势只需要判断某个时间点上手势的外形特征即可,而动态手势则需采集一段时间内持续的动作,进行分析,增加了时间信息和动作特征。因此动态手势识别的难度要大于静态手势。

手势识别通常是出现在VR/AR领域,原本多用于家庭娱乐、智能穿戴领域,但由于价格高昂,此项技术一直没有大规模应用。而原本在此领域扮演重要角色的手势识别,也没能大展身手。那么作为一个新的应用场景,手势识别在车内交互领域能否焕发新生?

《高工智能汽车》采访了凌感科技(Usens)美国产品和运营副总裁王亚明,来听听他怎么说。

王亚明毕业于麻省理工学院,有20年的软件和嵌入式系统经验。此前曾担任美国微软、Intel风河公司、联发科的高层,担任产品总监和企业高级管理,现任凌感科技美国公司总经理。

手势识别的二三事儿

手势识别的实现方式,经历了二维到三维的转变。二维手型识别,也称静态二维手势识别,识别的是手势中最简单的一类。只能识别出几个静态的手势动作,比如握拳或者五指张开。这种手势识别本身是通过视觉分析算法,得到预设图像和拍摄图像的差异,然后理解手势的含义。

更确切的来讲,是一种手形识别,而非手势,因为手势是三维动态的。二维手势识别拓展性差、控制感弱,因此通常只用来实现一些简单的功能。

另外一种二维手势识别,通过更先进的计算机视觉算法,具有了追踪手势运动的能力,体验上从纯粹的状态控制,变成了比较丰富的平面控制。

为了实现更丰富场景的应用,手势识别引入了三维的方式。三维的手势识别主要是增加了Z轴的信息,即目标的距离。二维的图像在得到距离值后,便可以构建出立体的模型,通过追踪不同时刻目标物体的三维立体形态变化,识别、认识不同的形态,也就可以到更多与之相匹配的的标准含义。这就直接丰富了手势识别的数量、类型。

三维手势识别的实现方式,通常有三种,结构光(Structure Light)、光飞时间(Time of Flight)、多角成像(Multi-camera)。结构光是通过激光投射器投射激光束,经过光栅打到物体上产生折射的位移,然后用摄像头来采集图样,通过图样的位移变化,算出物体的位置、深度信息。这种方式使用的最佳范围是1米到4米。

光飞时间的方式是用CMOS传感器接收发光原件发射到物体上的反射光,然后通过光子的飞行时间计算距离,这种方式简单,不需要计算机视觉方面的能力。

还有一种就是多角成像的原理,使用两个或者两个以上的摄像头同时摄取图像,模拟人类视觉,得到目标物体的距离信息,类似于双目测距。这种技术依赖于计算机视觉算法来匹配两张图片里的相同目标,相对前两种技术而言,性价比较高。

结缘拜腾

凌感科技成立于2013年,是一家为AR/VR提供三维人机交互解决方案的高科技公司,目前已经在硅谷、北京、杭州、深圳等地设立研发及运营中心。其核心技术通过识别手部22个关键点,26个自由度,辨别手部姿态,实现全手势识别。

引以为傲的Inside-out追踪技术,检测人头部的旋转及运动位移,实现6自由度位置跟踪,真实还原人在现实世界中的体验效果,是VR沉浸感不可或缺的重要指标之一。

凌感科技在传统的消费者领域,手势识别的能力较强,但由于诸多原因,VR/AR并没有如人们想象的一样快速的成长起来,行业进入了较长的蛰伏期。

汽车的车内交互方式,通常有语音、手势、触控、物理摁键等方式,随着汽车的智能化来临,前两种方式逐渐有取代传统交互方式的趋势。

其中,车内手势交互属于新事物,在存量车中较为少见,大多出现在一些新的概念车中。相比于传统的AR/VR领域,车内手势识别目前主要停留在简单动作识别层面,要求可靠稳定、快速响应。

凌感科技的车内交互之路,源于一次偶然。拜腾汽车在推出新款车型时,准备在车上加入手势识别的功能。

拜腾汽车采用了50英寸共享全面屏,对这款屏幕的操作方式,公司希望可以实现手势动态操控。即驾驶员可通过手势,完成原有触控、摁键要完成的功能。

对于原来做车内手势识别的企业而言,这种需求完成难度大,对手势识别的精准度、稳定性以及响应速度都提出了更高的要求,同时在功能的丰富性方面也不可同日而语。

但对于做AR/VR手势识别出身的凌感科技而言,车载手势识别从功能丰富性上是做了减法,需要适应的是车载要求的一些规范。

由于凌感科技主要做的是软件算法层面的工作,且手势识别的方式有TOF、多角成像等方式,硬件层面只需要找相应符合要求的摄像头生产商即可。因此,满足汽车要求的产品方案,并不难产。

彼时业内符合其要求的,并没有几家,凌感科技接受了工作邀请,并且完成了其车载手势识别的第一次尝试。应用在拜腾汽车上的手势识别,有“开始”、“拖曳”、“指向”、“菜单”、“OK”五个手势,驾驶员只需要伸出右手,完成相应动作即可进行操控。

跟拜腾的合作比较顺利,也让公司意识到,除了传统领域,正在兴起的智能汽车交互,也将会是另外一个市场。

TOF景深、单目IR

凌感科技目前提供的针对车载手势交互的产品中,支持2种模组。其手势识别可支持的使用范围包括,主副驾驶、后排乘客交互的多种场景。

其中在主驾驶位上的交互,包含中控屏、HUD的交互,副驾驶位和中控屏的交互,以及后排乘客和乘客屏的交互。

交互的方式主要有:

• 命令式手势(Gesture):接听电话, 调节音量, 选取歌曲等

• 2D动态交互:操作2D图形界面, 娱乐, 社交, 工作

• 3D动态交互:操作图形界面, 娱乐, 社交

凌感科技美国产品和运营副总裁王亚明表示,就目前而言,车内手势交互限于硬件条件(液晶大屏尚未普及),只完成少数简单几项的功能,并不丰富。

但手势识别本质上可以大大提升车内操控的体验,并不需要驾驶员分心,去观察传统触控、摁键完成操控的位置以及功能,操作人员仅仅需要记住相应功能的手势,即可完成操控。

而随着车内大屏的更新换代,越来越多的功能需要触控去完成,对于驾驶的安全有一定的影响,如果能用手势代替原有的操控,将会大大提升驾乘体验,

同时,相比于车内的另外一种交互方式——语音交互,手势识别也有其它的一些优势。语音交互是通过机器识别人类语言,完成功能响应。

一方面,语音识别由于人类语言的多样性,识别算法的有效性,准确性,很难达到通识天下语言,无往而不利。

另外一方面,人类的一些操控行为,并不一定能全部用语言描述。比如对持续性命令的执行(调节音量,调节音视频播放速度、进度等),较难量化的命令,语音识别就存在一定的局限性。

这类似于鼠标之于PC,其重要性很难被取代。

因此,手势识别在未来的车内交互领域,重要性一定会逐步体现。国际上一些传统的汽车OEM厂商,已经在其高端车上搭载了一些简单的手势识别功能,其它车企也在观望、试探阶段。

王亚明相信,随着汽车智能化的发展,手势识别一定会广泛进入汽车市场。

车内手势识别的萌芽期

当然,手势识别的上车之路,还需要一定的过程。比如,最常见的就是手势识别方案的成本、可靠性,准确性,体验是否能达到厂商的要求。

公司目前针对汽车手势识别,有两种方案,一种是摄像头放置在中控位,一种是在车顶位。

中控位的方式ToF景深模组和单目IR模组都适合。优势是能获得比较清晰的手区域图像, 遮挡小, 适合提取全手骨骼。不同车型的设置不一样, 安装的位置和角度需要根据实际车型调整, 算法也需要相应进行一定定制。

车顶位的方式适用深度摄像头(比如BMW采用了这种方式) , 优势是能够很好的控制水平方向距离, 适合手指类的动态操作、 点击等。 劣势是需要动作标准,否则随意地动作遮挡会多。

王亚明表示,无论哪种方式,都需要同车企深度合作,在汽车设计早期就进入共同的研发阶段。而这,不仅需要公司的实力过硬,同时产品的功能也能够丰富,多样。

由于手势识别需要深度学习以及视觉的实时处理,对于硬件的算力也有一定的要求。通常的做法是分享汽车ECU算力或者配置单独处理器。前者容易适配,改装容易、价格便宜,主机厂商也乐意,但需要手势识别部分的算力不占用太多资源。后者成本高昂,主机厂商接受度较低。

手势识别初期在少量欧美高端车上的应用,给全球其它车企起到了一定的示范作用。目前国内的一些车企也在筹划手势识别进车的事宜,手势识别进入汽车的速度可能会超出外界想象。

因此公司未来也会将更多的注意力以及重心放在汽车手势识别领域。同时,由于国内是全球最大的汽车消费、生产市场,公司的重心也转移到了国内。目前凌感科技全球共有60余人的团队,其中2/3在中国,王亚明表示,其非常看好未来手势识别在车内的应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 手势识别
    +关注

    关注

    8

    文章

    232

    浏览量

    48723
  • 智能汽车
    +关注

    关注

    30

    文章

    3231

    浏览量

    109149

原文标题:始于AR/VR,邂逅智能汽车,结缘拜腾后的uSens灵感迸发 | GGAI专访

文章出处:【微信号:ilove-ev,微信公众号:高工智能汽车】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    瑞丰光电亮相2025 DVN上海国际汽车内饰与座舱研讨会

    10月30日,瑞丰光电受邀亮相第六届2025DVN(上海)国际汽车内饰&座舱研讨会并发表演讲,围绕《Mini LED技术方案在汽车座舱应用与创新》,全面展示了瑞丰在车载显示领域的创新路径与技术布局。
    的头像 发表于 11-04 15:06 221次阅读

    【技术讨论】智能戒指手势交互:如何优化PCBA成本与实现<20ms低延迟?

    元件的小批量贴片,如何有效控制加工损耗与成本? 低延迟手势识别:目标是将传感器数据采集、姿态解算到蓝牙指令发出的端到端延迟控制在10ms以内。在软件层面,除优化传感器FIFO与中断服务程序(ISR)外
    发表于 10-18 13:04

    XenG202G | 挥手手势识别参考设计(三维)

    WEMAKERFSMART-赋予万物感知的灵魂-矽典微ICLEGENDMICROXenG202G挥手手势识别(三维)毫米波传感器特征手势识别:非接触式控制,高精度
    的头像 发表于 08-29 08:25 414次阅读
    XenG202G | 挥手<b class='flag-5'>手势</b><b class='flag-5'>识别</b>参考设计(三维)

    矽典微新品发布 | 三大创新:极致小型化AiP、手势交互新升级、开发套件开放赋能

    、ONELAB毫米波传感器开发套件以及XenG系列挥手手势识别传感器。徐鸿涛博士在演讲中表示,毫米波感知正处在技术创新与大规模商用的关键拐点,其在智能家居、智慧出行
    的头像 发表于 08-29 08:25 1454次阅读
    矽典微新品发布 | 三大创新:极致小型化AiP、<b class='flag-5'>手势</b><b class='flag-5'>交互</b>新升级、开发套件开放赋能

    人机交互:连接人类与数字世界的桥梁

    )等技术的发展,人机交互已经从传统的键盘鼠标操作,演进为语音识别手势控制、脑机接口等更自然、更智能的交互方式。   人机交互的发展历程 早
    的头像 发表于 08-11 15:21 1699次阅读

    如何打造一个属于自己的手势识别应用

    上一期小编给大家介绍了和MediaPipe的相遇之路,本期小编将带着大家一起来动手,如何打造一个属于自己的手势识别应用。
    的头像 发表于 07-29 10:12 975次阅读
    如何打造一个属于自己的<b class='flag-5'>手势</b><b class='flag-5'>识别</b>应用

    基于恩智浦Mi.MX RT700 MCU实现手势识别开发

    小编最近接了活,要在我们最新的MCU产品RT700上做手势识别的开发,可能小伙伴们才听过RT700,小编先来简单介绍一下。
    的头像 发表于 07-22 11:17 1768次阅读
    基于恩智浦Mi.MX RT700 MCU实现<b class='flag-5'>手势</b><b class='flag-5'>识别</b>开发

    瑞丰光电亮相DVN东京国际汽车照明研讨会

    近日,瑞丰光电受邀亮相DVN(东京)国际汽车照明研讨会。本次研讨会,瑞丰光电在现场展示了多项前沿技术并发表主题演讲,详细介绍了在车载光学领域的技术应用实践,以及在车内外显示交互的最新进
    的头像 发表于 06-16 17:17 881次阅读

    离线语音交互赋能车载氛围灯:NRK3502芯片引领人车关系新纪元

    分散驾驶员的注意力。随着智能网联技术的发展,NRK3502语音识别芯片的引入,为车载氛围灯赋予了更智能、更便捷的交互方式。NRK3502芯片在车载灯上的性能1.离线
    的头像 发表于 04-30 18:16 485次阅读
    离线语音<b class='flag-5'>交互</b>赋能车载氛围灯:NRK3502芯片引领人车关系新纪元

    佛瑞亚车携手Smart Eye推出车内安全生物识别认证技术

    和人脸识别技术的车内安全生物识别认证。这项全球领先技术与其他前沿解决方案于4月在上海车展FORVIA佛瑞亚展台进行展示。
    的头像 发表于 04-29 17:03 1787次阅读

    智能语音交互方案在客服领域的应用

    在当今数字化浪潮中,客服领域正经历着前所未有的变革,智能语音交互方案凭借其高效、便捷的特性,成为推动这一变革的核心力量。其中,语音识别模型优化私部署方案与语音合成声音定制方案作为两大核心,正深刻改变
    的头像 发表于 04-11 14:35 630次阅读

    ​多模态交互技术解析

    多模态交互 多模态交互( Multimodal Interaction )是指通过多种感官通道(如视觉、听觉、触觉等)或多种交互方式(如语音、手势、触控、眼动等)与计算机系统进行自然、
    的头像 发表于 03-17 15:12 3543次阅读

    GOM三维3D扫描仪让木质文化遗产焕发新生

    挪威文化历史博物馆在其修复工作中融入现代3D扫描技术,让数百年的历史焕发新生。文化历史博物馆的工作文化历史博物馆是奥斯陆大学的一个院系。凭借其在文化历史管理、研究和传播方面的丰富专业知识,该博
    的头像 发表于 02-13 11:51 740次阅读
    GOM三维3D扫描仪让木质文化遗产<b class='flag-5'>焕发</b><b class='flag-5'>新生</b>

    基于语音识别的智能会议系统具备哪些交互功能

    标贝科技专注智能语音交互领域多年,在语音识别和语音合成领域有着多项大型企业合作案例,标贝与多个智能会议系统厂商合作,成功将语音识别技术在智能
    的头像 发表于 12-20 10:35 900次阅读

    标贝智能语音识别在智能会议场景中的落地案例

    标贝科技专注智能语音交互领域多年,在语音识别和语音合成领域有着多项大型企业合作案例,标贝与多个智能会议系统厂商合作,成功将语音识别技术在智能
    的头像 发表于 12-20 10:31 1032次阅读
    标贝智能语音<b class='flag-5'>识别在</b>智能会议场景中的落地案例