0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

探析人机自然交互研究的最新进展

mK5P_AItists 来源:cc 2019-02-25 14:15 次阅读

随着信息技术的发展,在传统物理键盘之外,触屏、虚拟现实等新型交互接口不断出现,在提高了交互自然性的同时,却显著降低了交互的性能。如何兼顾交互的自然性和高效性,成为人机交互研究中的难题。

在信息技术领域,“胖手指”这一术语专指由于手指本身的柔软,以及点击时对于屏幕显示内容的遮挡,在触屏上点击时往往难以精确控制落点位置的问题。随着信息技术的飞速发展、新型交互方式的不断涌现,在人机交互研究领域,这类问题日益成为研究的热点。

近日获得中国计算机学会(CCF)优秀博士学位论文奖的研究成果中,清华大学博士易鑫试图以深化的贝叶斯方法解决人机自然交互行为噪声带来的意图推理难题,为解决“胖手指”问题带来了新的思路。

易鑫的导师——清华大学计算机系教授、全球创新学院院长史元春告诉《中国科学报》:“这算是我们向让机器理解人类行为迈出的一小步。”

兼顾交互的自然性和高效性

贝叶斯方法也称为贝叶斯定理,它所呈现的公式可以让人们通过已知的条件概率(通常是因果方向的)计算未知的概率,因而成为很多进行概率推理的现代人工智能系统的基础。

而对于易鑫来说,在他以人机交互研究为主题的博士学位论文中,与贝叶斯方法相关的关键词是“文本输入”。易鑫告诉《中国科学报》:“文本输入是人机交互中最基本的任务之一,是人向计算机表达交互意图的重要途径。”而在进行文本输入意图推理时,目前最常用的方法——经典统计解码方法,其本质也是贝叶斯方法。

随着信息技术的发展,在传统物理键盘之外,触屏、虚拟现实等新型交互接口不断出现,在提高了交互自然性的同时,却显著降低了交互的性能。“如何兼顾交互的自然性和高效性,成为人机交互研究中的难题。”易鑫说。

人机交互研究的一大特点是与实际需求或应用场景联系非常紧密。在数十年以前,人机界面就经历了从命令行界面到图形用户界面的演变。

易鑫介绍说,命令行界面的优点是由于物理键盘输入相对较高的准确率,以及几乎不需要冗余的操作,所以熟练的用户可以达到非常高的交互效率。但是,其缺点在于交互非常不直观,用户需要记忆大量的指令,有时甚至需要具备计算机领域的专业知识和技能,才能达到较高的使用效率。

为了改进这一问题,研究者提出了图形用户界面。图形用户界面的一大优势是摆脱了抽象的命令,显著降低了用户的学习和认知成本。然而,由于图形用户界面的基本操作是指点,即用户需要使用鼠标操作屏幕指针来选择交互目标,因而其往往对用户指点操作的精度有较高的要求。

易鑫告诉记者,多年来人机界面的发展趋势是越来越强调交互的自然性,即用户的交互行为与其生理和认知的习惯相吻合,并随之出现了触摸交互界面,以及近年来的体感交互、虚拟现实等三维交互界面。三维交互界面的优势是进一步提升了人机界面的自然性,但其挑战则在于完全缺乏触觉反馈,导致用户动作行为中的噪声相对较大,难以进行交互意图的准确推理,从而限制了交互输入的准确度。

“此前,也有研究者尝试采用贝叶斯方法解决文本输入中兼顾交互的自然性和高效性这一难题,但往往仅考虑了落点位置信息,作用有限。”易鑫告诉记者,为此,他在自己的研究中面向多种输入接口,从点击模型精度优化(提升计算精度)、面向不确定性输入映射的计算方法扩展(扩展计算方法)和文本输入手部动作建模(扩充先验知识)等方面优化了文本输入的基本贝叶斯方法,相应的技术也大幅提高了自然文本输入的交互性能。

触屏设备上的模型优化

易鑫在其研究中,针对触屏软键盘这一文本输入接口上的胖手指难题,提出了触屏软键盘上精度优化的点击模型。

他告诉《中国科学报》,在日常生活中,虽然智能手机智能手表等触屏设备正变得越来越普遍,但由于触摸操作的不准确性,在触屏上点击小尺寸目标仍然十分困难。而其不准确性主要来自两方面原因:一是用户点击行为中的噪声,也常常被称为“胖手指”问题,二是点击位置识别算法的误差。

为了测量用户在智能手机上触摸时的落点偏差,易鑫和他的同伴从校园招募了多名被试人员。在实验中,他们主要关注两个问题:一是落点偏差是否随着目标位置的不同而不同,二是拇指和食指两种点击姿势下的偏差模式是否一致。最终,他们发现,在使用食指和拇指点击时,点击偏差都会受到目标位置的影响,其中后者受到的影响更为显著。

基于触摸落点位置的高精度识别方法,易鑫在论文中进一步建立了接口尺寸与输入速度、准确率和落点分布的作用关系,提升了软键盘输入贝叶斯方法中点击模型与输入行为的吻合程度,定量描述了当用户在宽度为2.0到4.0厘米的超小尺寸全键盘上进行文本输入时的行为特征。

用户实验结果证明,基于该精度优化的点击模型的贝叶斯方法能支持用户在宽度仅为3.5厘米的智能手表全键盘上达到与智能手机软键盘相当的、每分钟35个英文单词的输入速度和近100%的准确率。此外,点击模型的精度优化也能将手机软键盘的文本输入错误率降低23%。

另外,易鑫还在研究中定量分析了点击模型和语言模型的能力分别对文本输入的贝叶斯方法识别效果的影响,为点击模型的精度优化提供了依据和理论指导。

在行为中发现知识

“如果单纯就文本输入问题而言,特别是涉及自然的人机交互方式,易鑫所做的工作在国际上是领先的。”在对易鑫的研究进行评价时,史元春用词十分严谨。

可以作为佐证的成果之一是,易鑫对于空中文本输入的研究。空中文本输入对于后桌面时代交互(如虚拟现实、移动手机)是一个有潜力和被期待的交互需求。在这方面,虽然十指盲打是人们在日常生活中最高效和最习惯的输入方式,但针对基于该能力的空中裸手十指盲打技术的研究,此前尚没有人取得很好的效果。

而易鑫在研究中提出了一种使得空中裸手十指盲打成为可能的新型技术ATK。结果证明,ATK在输入速度和准确率方面都超过了已有的空中文本输入技术,第一次较好地实现了这一已经提出数十年的交互概念。

对于下一步的研究,易鑫的设想之一是,研究贝叶斯方法与大数据机器学习类方法的融合。他表示,虽然贝叶斯方法在目前的研究中取得了不错的效果,但是其模型的参数还是基于少量(数十人)的样本训练而来。随着原型的迭代和可用数据的增多,大数据机器学习类方法将有机会在意图推理中发挥重要的作用。然而,为了保持模型的可解释性与可推广性,需要探索贝叶斯方法与大数据机器学习类方法的有机融合方法,将“黑盒子”与“白盒子”结合起来,以达到精度和推广性的同步优化。

史元春告诉记者,与人机交互领域贝叶斯方法的应用相比,机器学习领域的贝叶斯方法主要是在数据中发现知识,而人机交互则是在行为中发现知识。她正主持进行的一项“十三五”国家重点研发计划中的前沿基础类研究项目,就是开展人机交互自然性的计算原理的研究,致力于探索使机器可以理解人类表达方式的能力。“易鑫的研究也是我们这项研究中的一部分。”史元春说。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机交互
    +关注

    关注

    12

    文章

    1120

    浏览量

    54746
  • 虚拟现实
    +关注

    关注

    15

    文章

    2234

    浏览量

    92063

原文标题:向机器理解人类行为迈出一小步

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    广东的5G-A、信号升格和低空经济,又有新进展

    了两地的5G/5G-A、智算等数字基础设施建设,深入了解了他们在信号升格和低空经济方面的最新进展。活动一共持续了三天,前后跑了8个项目,虽然很累,但收获满满。接下
    的头像 发表于 04-19 08:05 100次阅读
    广东的5G-A、信号升格和低空经济,又有<b class='flag-5'>新进展</b>!

    百度首席技术官王海峰解读文心大模型的关键技术和最新进展

    4月16日,以“创造未来”为主题的Create 2024百度AI开发者大会在深圳国际会展中心成功举办。百度首席技术官王海峰以“技术筑基,星河璀璨”为题,发表演讲,解读了智能体、代码、多模型等多项文心大模型的关键技术和最新进展
    的头像 发表于 04-18 09:20 174次阅读
    百度首席技术官王海峰解读文心大模型的关键技术和<b class='flag-5'>最新进展</b>

    四个50亿+,多个半导体项目最新进展

    来源:全球半导体观察,谢谢 编辑:感知芯视界 Link 近日,半导体行业多个项目迎来最新进展,其中浙江丽水特色工艺晶圆制造项目、浙江中宁硅业硅碳负极材料及高纯硅烷系列产品项目、晶隆半导体材料及器件
    的头像 发表于 02-27 09:35 461次阅读

    两家企业有关LED项目的最新进展

    近日,乾富半导体与英创力两家企业有关LED项目传来最新进展
    的头像 发表于 01-15 13:37 322次阅读

    语音识别技术最新进展:视听融合的多模态交互成为主要演进方向

    多种模态(声学、语言模型、视觉特征等)进行联合建模,基于深度学习的多模态语音识别取得了新进展。   多模态交互的原理及优势   多模态交互技术融合了多种输入方式,包括语音、手势、触摸和眼动等,使用户可以根据自己的喜好和习惯
    的头像 发表于 12-28 09:06 1474次阅读
    语音识别技术<b class='flag-5'>最新进展</b>:视听融合的多模态<b class='flag-5'>交互</b>成为主要演进方向

    国星光电LED器件封装及其应用产品项目最新进展

    近日,国星光电LED器件封装及其应用产品项目传来新进展
    的头像 发表于 11-03 14:19 438次阅读

    VisionFive 2 AOSP最新进展即将发布!

    非常开心地在这里和大家提前预告,我们即将发布VisionFive 2 集成 AOSP的最新进展!请大家多多期待吧~ 此次通过众多社区成员的支持和贡献(https://github.com
    发表于 10-08 09:15

    利好补锂应用的新一轮材料创新正在发生

    近期,德方纳米、万润新能各自披露了补锂剂的最新进展
    的头像 发表于 09-14 09:55 686次阅读

    三大MLED项目“动起来” Mini LED项目传来最新进展

    日前,博敏电子与穿越光电等企业有关Mini LED的项目传来最新进展
    的头像 发表于 08-14 14:15 1060次阅读

    常温超导最新进展 韩国室温超导体“LK-99”撤回论文

    常温超导最新进展 韩国室温超导体“LK-99”撤回论文 有业界人士认为超导跟人工智能一样都能被视为第四次工业革命的奇点,近期室温超导概念非常火爆,我们一起看看常温超导最新进展。 上一次室温超导
    的头像 发表于 08-02 17:22 2278次阅读

    ASML***的最新进展

    、与 Mike在SEMICON 上的一些讨论以及 ASML 最近的财报电话会议中的一些内容。以分享了ASML光刻机的最新进展
    的头像 发表于 07-30 10:39 1808次阅读
    ASML***的<b class='flag-5'>最新进展</b>

    PMD在获得镜面三维形状方面的最新进展

    0摘要 相位测量偏转法(PMD)具有动态范围大、非接触式操作、全场测量、采集速度快、精度高、自动数据处理。我们回顾了 PMD 的最新进展。下面介绍几种基于条纹反射的 PMD 方法,介绍 PMD
    的头像 发表于 06-29 10:01 1167次阅读
    PMD在获得镜面三维形状方面的<b class='flag-5'>最新进展</b>

    2023汽车电子创新技术研讨会圆满落幕:探讨汽车电子的最新进展、应用趋势与挑战

    、凌鸥创芯(晶丰明源)、顺络电子、芯科集成 、华邦电子、茂睿芯、芯派科技、芯海科技、东方中科等多家国内外知名企业的专家和领导共同参与,探讨汽车电子创新技术的最新进展、应用趋势和挑战。会议干货满满,现场精彩纷呈!!!     会议的开始,电子发烧友网
    发表于 06-14 17:41 919次阅读
    2023汽车电子创新技术研讨会圆满落幕:探讨汽车电子的<b class='flag-5'>最新进展</b>、应用趋势与挑战

    碳纳米管薄膜光探测器最新进展

    、碳纳米管薄膜红外探测器以及碳纳米管光电集成研究方面的最新进展。 图1 碳纳米管探测器和光电集成 碳纳米管材料由于具有高红外吸收系数(3×10⁵ cm⁻¹)、高迁移率(10⁵ cm² V s⁻¹)、基底
    的头像 发表于 06-12 17:02 373次阅读
    碳纳米管薄膜光探测器<b class='flag-5'>最新进展</b>

    清华大学在超快激光微纳制造领域获得新进展

    近日,清华大学机械系在超快激光微纳制造领域获得新进展,提出了基于超快激光等离激元分子调节实现自下而上的微纳功能器件加工制造策略,并揭示了激光诱导等离激元与材料的非线性作用机理,利用超快激光激发纳米腔等离激元效应
    的头像 发表于 05-31 14:38 568次阅读
    清华大学在超快激光微纳制造领域获得<b class='flag-5'>新进展</b>