0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

结合现有的输入方法,眼动追踪开启了丰富的人机直觉交互新体验

wgsB_OsramOpto 2017-12-25 14:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

通过视线接触进行信息交互,凭直觉操控电子设备。

强大的电脑芯片、高效的红外 LED 以及现代化的摄像传感器,让先前复杂的眼动追踪系统如今能够适应电子消费品应用程序的各种需要。借助这些系统,电子设备可以检测用户的眼球运动,从而识别用户的下一步意图。结合现有的输入方法,眼动追踪开启了丰富的人机直觉交互新体验。

▲视线接触激活图标。眼动追踪,结合现有的输入功能,开启了全新的电子设备操控方式。(图片来源:欧司朗)

几十年来,键盘和鼠标一直是我们操控电脑的传统工具。随着智能手机、平板电脑等移动设备的诞生,人们需要借助新技术与这类没有配备键盘和鼠标的微型电脑进行有效交流。由此,触摸屏成为一项关键技术,使得这些电子产品更加友好;而语音识别技术的加入,则使其更为直观。

先知先觉的设备

随着物联网的普及,我们需要交互的电子设备数量也将与日俱增。智能家居便是一个典型示例,声控恒温器已开始运用其中。未来,我们还可以直接与机器人进行交互。除交互式工业机器人之外,家庭助理机器人和医疗助理机器人也在研发当中。而今,设备可以通过触摸屏接收指令,也可以通过内置式耳机收听指令。借助眼动追踪系统,它们还能检测到用户正在注视的对象,从而预测用户的下一步意图。这将为直观的人机交互开启无限可能。

在很多领域,眼动追踪的硬件条件已然具备

眼动追踪系统可以检测人的眼球运动以及注视方向。起初,人们开发眼动追踪系统是出于市场调研、行为分析和合用性研究的目的。此外,在帮助那些双手无法操作电脑的用户方面,它们的应用已有一段时间。其中许多系统使用红外光照射用户眼睛,并通过摄像机获取图像,然后根据图像数据计算眼球运动。因此,这些系统需要特制的高质量摄像机、光源和软件,有时还需要加装硬件加速器来处理海量的图像数据。而今天,借助极其强大的芯片、紧凑型摄像传感器和现代化的高功率 LED,可以将眼动追踪功能集成到智能手机等电子设备上。其实,在许多电子设备上,都搭载着摄像传感器和红外光源,只不过它们是用来实现面部识别、虹膜识别等其他功能。因此,接下来需要的就是一款合适的软件,将眼动追踪作为一个附加功能加以集成。

发展现状

目前,各个领域均在开发各种新概念,意在促进眼动追踪作为一项新型人机接口技术的应用。在具有眼动追踪功能的智能手机和平板电脑屏幕上,已经可以通过视线接触激活图标或移动游戏人物。具有眼动追踪功能的游戏电脑使玩家在游戏场景中更为身临其境。在一些系统中,玩家可以通过眼球动作控制游戏人物的视角,而无需使用鼠标或触控板。眼动追踪同样也可以用于常规电脑 —— 如通过眼球动作实现文档滚动查看。此外,在智能家居行业,有多种方式可以通过眼动追踪技术与各种设备交互。例如,具有眼动追踪功能的智能电视已经问世。汽车领域也已提出这些系统的可能应用,其中的一个典型示例便是驾驶员助理系统,它可以监测驾驶员的眼球运动,从而及时检测到疲劳驾驶的信号。眼动追踪功能也可以用于监测驾驶员的注视方向,从而确定其正专注前方路况还是注意力分散。这类信息将有助于避免道路上出现紧急情况。

电子消费品行业的眼动追踪系统

上述应用中的现代化眼动追踪系统基于红外 LED (IRED) 和高分辨率摄像传感器,它们分别用于照射人眼和记录眼球反射的光线。然后,由图像处理算法根据这些原始数据计算瞳孔的位置,再由专用软件利用屏幕等参照物的位置信息确定用户所注视的具体位置。红外照明可以确保虹膜与瞳孔之间所需的对比度,不管眼睛是什么颜色,在黑暗中或屏幕背光非常明亮时尤其如此。

▲眼动追踪系统使用红外光照射人眼,并利用摄像传感器捕捉图像。所捕捉的图像数据则用于确定瞳孔的位置,并用来计算用户注视的方向。(图片来源:欧司朗)

这些系统目前的最远探测距离为一米。智能手机和平板电脑的工作距离通常在 30 cm 左右,而台式电脑则通常在 60 cm 左右。屏幕分辨率对应于眼睛的光栅尺寸,平板电脑约为 1 cm,电脑则约为 2 cm。所用的红外 LED数量以及发射器和摄像头的具体排列取决于应用的类型,即工作距离的长短和覆盖面积的大小。此外,还会因所采用的眼动追踪软件而有所不同,这是因为几何设计也要看各种算法能否可靠地检测瞳孔的转向。一般而言,发射器和摄像传感器须按特定角度进行布局,彼此之间需保持一定距离,以避免眼镜的眩光或者光线从眼球到传感器的直接反射。距离越大,信号质量越好,用户与设备间最佳距离的选择空间就越灵活。

用于眼动追踪系统的红外 LED

不同于大多需要使用特定波长的虹膜扫描仪,眼动追踪系统可以在较宽的光谱范围内运行。通常,这些系统需要借助现有的虹膜扫描或面部识别系统,并搭配波长为 850 nm 或 810 nm的 IRED。人眼可感知波长为 850 nm 的 IRED 发出的微弱红外光。许多眼动追踪解决方案制造商更倾向于采用 940 nm 的 IRED,因为裸眼看不到这种光。然而,940 nm 设计现在还存在弊端:目前通用的摄像传感器针对可见光进行了优化,但在红外光谱范围内灵敏度则更低。波长为 940 nm 时,灵敏度降低十分明显(图 3),因此需要增强红外照射,以达到与 850 nm 光源一样的信号强度。鉴于红外照明的广泛应用,摄像头制造商正在研发红外灵敏度高的新版本。

结合现有的输入方法,眼动追踪开启了丰富的人机直觉交互新体验

▲在 850 nm 和 940 nm 之间时,针对可见光优化过的标准摄像传感器的灵敏度大幅度下降。配备 940 nm IRED 的眼动追踪系统的优势在于:几乎不被人眼所感知。大多数情况下,需要使用更高的工作电流来补偿下降的信号水平。(图片来源:欧司朗)

理想状态下,双眼应位于摄像传感器的捕捉区域内。整个眼球需被均匀照射,这一点很重要。所需红外光照射强度取决于工作距离,即便对于移动设备,也可能需要数瓦的功率。为尽量减少高工作电流下的热输出,发射器在脉冲模式下工作。尽管如此,热管理仍是设计重点之一,在更轻薄的智能手机和平板电脑中尤为如此。因此,IRED 效率是除光输出外的另一个重要因素。效率越高,产生的热就越少。

针对这类应用,欧司朗特别开发了Oslon Black 系列产品,其中 SFH 4715A 的光电效率达到创纪录的48%。这款 850 nm 发射器在 1 A 工作电流下典型光输出为 770 mW,是目前此工作电流下效率最高的 IRED。如果需要,还可以采用纳米堆叠技术,在一颗芯片上提供两个发射中心,堆叠布置,获得更高的输出。工作电流为 1 A 时,SFH 4715AS 的典型光输出为 1340 mW。它提供 90 度和 150 度发射角两种版本,涵盖许多不同的设计。Oslon Black 版本在 1 A 工作电流下光输出为 990 mW,是理想的 940 nm 光源。

▲Oslon Black SFH 4715AS 的波长为 850 nm,是迄今为止功率最大的 IRED。工作电流为 1 A 时,其发光功率为 1340 mW。得益于其纤薄的外形,不仅能安装在最新智能手机中,还可以用于下一代设备。(图片来源:欧司朗)

Oslon Black 的一个特性为其仅 2.3 mm 的元件高度,因此它不仅适用于今天的智能手机,也适用于下一代更为纤薄的电子设备。

像其他红外光源应用一样,眼动追踪系统必须符合人眼安全标准。普通用户接触的红外辐射量相对较低。然而,技术人员近距离观看红外光源时需留意风险。眼动追踪系统上关联有一个接近传感器,可确保这种情况下 IRED 会自动关闭。有关光学系统安全设计的详细信息,可参阅《欧司朗人眼安全应用注释》等文献。

我们周围有太多复杂的电子设备,需要新的技术实现直观的人机交互。红外照明和摄像传感器为交互技术奠定了良好的基础,使设备能“看到”用户并理解用户的意图。眼动追踪示例展示了如何在硬件基础上通过软件方案实现新的交互类型。硬件组件的创新也正驱动着这一发展。例如,采用波长为 940 nm 的光源便是其中一种发展趋势。因此,欧司朗不断扩展在人脸识别、眼动追踪等应用方面的产品组合。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 眼动追踪
    +关注

    关注

    0

    文章

    19

    浏览量

    6922

原文标题:眼动追踪:一种全新的人机交互方式

文章出处:【微信号:OsramOpto,微信公众号:欧司朗光电半导体】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    索尼基于时识科技Speck2f芯片打造可穿戴追踪系统

    传统帧式相机长期受高功耗瓶颈制约,可穿戴设备难以实现持续追踪。近日,索尼研究团队基于时识科技(SynSense)Speck2f芯片,成功研发出全球首个全集成、电池供电的可穿戴
    的头像 发表于 12-04 17:05 563次阅读

    电EOG人机交互会是未来交互的一种主流吗?

    HUIYING基于的人机交互系统概述基于电(EOG)的人机交互系统(HMI)的研发源于对非侵入式、高精度且持久可穿戴的医疗辅助设备的需求。传统
    的头像 发表于 11-07 18:01 3488次阅读
    <b class='flag-5'>眼</b>电EOG<b class='flag-5'>人机交互</b>会是未来<b class='flag-5'>交互</b>的一种主流吗?

    大模型驱动下的人机交互革命,“超拟真人互动” 让玩具读懂你的情绪

    ,全方位重构智能硬件的人机交互范式,为行业提供从技术底层到商业应用的完整路径。   从人机交互的技术演进逻辑来看,经历文本
    的头像 发表于 10-31 09:21 6116次阅读
    大模型驱动下<b class='flag-5'>的人机交互</b>革命,“超拟真人互动” 让玩具读懂你的情绪

    【启扬方案】基于启扬RK3588的移动AI数字人,助力智能交互新体验

    在数字化浪潮席卷的今天,人机交互的边界不断被打破。移动AI数字人通过深度融合的人工智能、高拟真图像渲染以及人机交互能力,重塑人机交互新形态。图片来源于网络移动AI数字人的主控需求1.集
    的头像 发表于 10-16 17:29 1040次阅读
    【启扬方案】基于启扬RK3588的移动AI数字人,助力智能<b class='flag-5'>交互</b><b class='flag-5'>新体验</b>

    苏宁易购 API 开启苏宁易购店铺智慧零售新体验

    能店铺实现数据驱动决策、个性化服务和高效运营,从而开启一场智慧零售的新体验。本文将逐步解析这一技术如何重塑零售生态,帮助店铺提升竞争力。 API 的核心作用:连接与赋能 API是苏宁易购开放平台的关键工具,它允许第三方开发
    的头像 发表于 09-02 14:37 370次阅读

    人机交互:连接人类与数字世界的桥梁

    )等技术的发展,人机交互已经从传统的键盘鼠标操作,演进为语音识别、手势控制、脑机接口等更自然、更智能的交互方式。   人机交互的发展历程 早期的人机交互主要依赖命令行界面(CLI),用
    的头像 发表于 08-11 15:21 1699次阅读

    高通基于5G-A技术开启“万兆浦江”智慧文旅新体验

    测试终端成功实现下行峰值速率突破8.4Gbps的里程碑。此次合作不仅展现5G-A技术的强大潜力,更开启“万兆浦江”智慧文旅新体验,并为全球智慧文旅的高质量发展提供
    的头像 发表于 06-24 09:59 1068次阅读

    开源鸿蒙开发新体验,开鸿Bot系列今日开启预售!

    技术支持与配套文档资源支持、打造开源鸿蒙开发者的“标准配置”等,这将进一步降低开发者参与开源鸿蒙生态建设的门槛。 开鸿Bot系列的推出,开启开源鸿蒙在桌面操作系统领域的新探索。作为集学习、开发、验证
    发表于 05-16 14:13

    北京理工大学:研究机界面智能传感硬件——从可穿戴到仿生

      交互界面(Eye-machine interface, EMI)作为沉浸式人机交互的重要一环,已被应用于VR/AR、自动驾驶、脑机接口、生物医学等领域。但现有EMI传感硬件正在
    的头像 发表于 04-25 18:42 680次阅读
    北京理工大学:研究<b class='flag-5'>眼</b>机界面智能传感硬件——从可穿戴到仿生

    具身智能工业机器人人机交互设计:重新定义人机协作新体验

    在工业 4.0 时代,机器人不再是冰冷的机械臂,而是成为与人类协同创造价值的 “智能伙伴”。富唯智能凭借具身智能工业机器人人机交互设计,突破传统操作界面的局限,通过自然语言、手势识别、力控反馈等多模态交互技术,构建了安全、高效、人性化的协作生态,为柔性制造、智慧工厂提供
    的头像 发表于 04-07 15:02 881次阅读

    ​多模态交互技术解析

    。它的核心目标是模拟人类多感官协同的沟通方式,提供更高效、灵活和人性化的人机交互体验。 核心特点 多通道融合 :整合多种输入/输出方式(如语音+手势+视觉)。 自然交互 :模仿人类多感官协作,降低学习成本。 情境感知 :
    的头像 发表于 03-17 15:12 3551次阅读

    酒店智能门锁解决方案:打造安全高效的智慧住宿新体验

    酒店智能门锁解决方案:打造安全高效的智慧住宿新体验
    的头像 发表于 03-13 14:23 1169次阅读
    酒店智能门锁解决方案:打造安全高效的智慧住宿<b class='flag-5'>新体验</b>

    AR互动与传统的交互方式相比更加丰富多元

    AR 互动的另一个显著特点,是其丰富多元的互动方式。与传统的交互方式相比,AR 互动不再局限于鼠标、键盘、触摸屏等有限的输入方式,而是通过多种先进的技术手段,实现更加自然、
    的头像 发表于 03-10 17:48 869次阅读
    AR互动与传统的<b class='flag-5'>交互</b>方式相比更加<b class='flag-5'>丰富</b>多元

    探秘定制锂电池实体店:开启专属电力新体验

    定制锂电池实体店为我们提供一种全新的电池选择方式,让我们能够摆脱传统锂电池的束缚,拥有一款真正符合自己需求的专属电力解决方案。如果你正在为电池的适配性、性能等问题烦恼,不妨走进身边的定制锂电池实体店,开启属于你的专属电力新体验
    的头像 发表于 01-15 17:06 930次阅读
    探秘定制锂电池实体店:<b class='flag-5'>开启</b>专属电力<b class='flag-5'>新体验</b>

    Tata Communications发布Kaleyra AI:重塑客户互动新体验

    全球通信技术巨头Tata Communications近日宣布,即将推出其革命性的人工智能驱动产品组合——Kaleyra AI,旨在为客户互动领域带来颠覆性的全新体验。 Kaleyra AI作为
    的头像 发表于 12-23 18:24 1032次阅读