0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是无声语音接口?

SSDFans 来源:SSDFans 2023-04-28 10:16 次阅读

可穿戴设备依赖于具有标准物理能力的人机界面,如语音、触摸或运动。虽然这种形式的机器交互适用于大多数消费者,但残疾人可能很难或无法操作标准的可穿戴设备。为了使更多人能够使用可穿戴设备,研究人员正在研究新的人机界面。

最近,康奈尔大学的一个团队发表了一篇论文,描述了一副为不能发声的用户配备了无声语音接口(SSI)的智能眼镜。本文将讨论无声语音接口和来自康奈尔大学的可穿戴原型。

什么是无声语音接口?

无声语音接口(Silent speech interface,简称SSI)允许人们无需发声就能与机器互动。虽然AI助手(如苹果的Siri)等技术是通过声音交流工作的,但SSI通过与语音相关的动作来完成交流。

SSI技术通过嘴巴和舌头的运动而不是声音来识别语音。为了做到这一点,SSI依赖于各种不同的传感器,包括放置在嘴巴附近的振动传感器,用于检测人们嘴巴的振动,以及跟踪和分类与语音相关运动的摄像头。在许多情况下,这些信息会被机器学习算法处理,该算法会解释嘴巴的动作,并将其翻译成文字。

虽然大多数人可能找不到SSI的用途,但这项技术对于因疾病或受伤而失声的人来说是必不可少的,可以让他们更容易地交流。例如,患有声带损伤或影响语言的神经系统疾病的患者可以从SSI中获益良多。

康奈尔大学开发无摄像头SSI眼镜

最近,康奈尔大学的研究人员在SSI技术方面取得了重大进展,发明了基于SSI的智能眼镜。

该系统被称为EchoSpeech,是一种新颖的、侵入性最小的SSI技术,它使用低功率有源声学传感来捕捉由无声语音引起的细微皮肤变形,并将这些信息转换为可操作的数据。这款智能眼镜的原型建立在康奈尔大学之前对一种类似的声学传感可穿戴设备(“EarIO”)的研究基础上,EarIO可以从耳朵内追踪面部运动。

cf967ebe-e4fb-11ed-ab56-dac502259ad0.png

该系统依靠安装在眼镜框架上的一系列扬声器和麦克风向皮肤发射听不见的声波。发出的声波产生沿多条路径传播的回声,并被系统解释推断为佩戴者的无声语音。EchoSpeech完全可以在标准的智能手机上运行,只需要1到6分钟的训练数据,并以73.3 mW的低功耗实时运行。该团队的深度学习算法可以实时分析回声,准确率约为95%。

该系统通过12名用户研究进行了评估,成功展示了识别31个独立命令和三到六位连接数字的能力,单词错误率(WER)分别为4.5%(标准3.5%)和6.1%(标准4.2%)。此外,在行走和噪声注入等场景中测试了系统的鲁棒性。

更私密、低功耗、易使用

大多数SSI技术使用面部摄像头,从用户和与其交流的人那里收集数据。除了造成隐私问题外,可穿戴摄像头还会收集高带宽视频数据。

由于EchoSpeech不需要可穿戴摄像机,设备只捕捉音频数据,这比图像或视频数据需要的带宽要少得多,并且可以通过蓝牙实时发送到手机。隐私信息永远不会脱离用户的控制,因为数据是在智能手机上本地处理的(不用在云中处理)。研究人员表示,纯音频传感器的电池效率也更高:音频传感器可以工作10个小时,而摄像头只能工作30分钟。

康奈尔大学的研究小组表示,他们发现EchoSpeech在很多应用中都有应用价值,从默念密码来解锁智能手机,到跳过播放列表中的歌曲。该设备还可以与智能手机配对,在说话不方便的地方与他人交谈,比如嘈杂的餐厅或安静的图书馆。研究人员表示,该界面与手写笔和CAD等设计软件兼容,从而消除了对鼠标和键盘的需求。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机界面
    +关注

    关注

    5

    文章

    499

    浏览量

    43730
  • SSI
    SSI
    +关注

    关注

    0

    文章

    37

    浏览量

    19097
  • 可穿戴设备
    +关注

    关注

    55

    文章

    3731

    浏览量

    165900

原文标题:什么?无声语音接口?

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是单片机语音芯片?

    芯片的定义。1、单片机,又称为微控制器,是一个将微处理器、存储器、I/O接口等集成在一块芯片上的计算机系统。它具有体积小、功耗低、集成度高等特点。2、语音芯片,主要
    的头像 发表于 12-07 08:53 321次阅读
    什么是单片机<b class='flag-5'>语音</b>芯片?

    ADA4075在使用过程中出现有时无声、有时有声的现象是怎么回事?

    ADA4075在使用过程中出现有时无声、有时有声现象 ADA4075在使用中出现了类似受潮的现象,温度高时芯片正常工作,温度低时会出现无声。但是芯片本身防潮等级MSL1,实际储存中也不存在高潮
    发表于 11-17 07:26

    LT8627SP: 18V/16A 配有超链噪声参考数据表的逐步自下无声3型开关 ADI

    电子发烧友网为你提供ADI(ADI)LT8627SP: 18V/16A 配有超链噪声参考数据表的逐步自下无声3型开关相关产品参数、数据手册,更有LT8627SP: 18V/16A 配有超链噪声
    发表于 10-11 18:46
    LT8627SP: 18V/16A 配有超链噪声参考数据表的逐步自下<b class='flag-5'>无声</b>3型开关 ADI

    LT8650SP:双频道6A、42V、同步双向双向自下无声开关2和6.2微A ADI

    电子发烧友网为你提供ADI(ADI)LT8650SP:双频道6A、42V、同步双向双向自下无声开关2和6.2微A相关产品参数、数据手册,更有LT8650SP:双频道6A、42V、同步双向双向自下无声
    发表于 10-09 19:17
    LT8650SP:双频道6A、42V、同步双向双向自下<b class='flag-5'>无声</b>开关2和6.2微A ADI

    LT8645S/LLT8646S:65V,8A同步双向无声继下开关2,2.5微A 日光时数据表 LT8645S/LLT8646S:65V,8A同步双向无声继下开关2,2.5微A 日光时数据表

    电子发烧友网为你提供ADI(ADI)LT8645S/LLT8646S:65V,8A同步双向无声继下开关2,2.5微A 日光时数据表相关产品参数、数据手册,更有LT8645S/LLT8646S:65V
    发表于 10-07 17:53
    LT8645S/LLT8646S:65V,8A同步双向<b class='flag-5'>无声</b>继下开关2,2.5微A 日光时数据表 LT8645S/LLT8646S:65V,8A同步双向<b class='flag-5'>无声</b>继下开关2,2.5微A 日光时数据表

    LT8640S-2/LLT8643S-2:42V,6A同步式继式自下无声开关,2.5微A 日光时数据表 LT8640S-2/LLT8643S-2:42V,6A同步式继式自下无声开关,2.5微A 日光时数据表

    电子发烧友网为你提供ADI(ADI)LT8640S-2/LLT8643S-2:42V,6A同步式继式自下无声开关,2.5微A 日光时数据表相关产品参数、数据手册,更有LT8640S-2
    发表于 10-07 17:50
    LT8640S-2/LLT8643S-2:42V,6A同步式继式自下<b class='flag-5'>无声</b>开关,2.5微A 日光时数据表 LT8640S-2/LLT8643S-2:42V,6A同步式继式自下<b class='flag-5'>无声</b>开关,2.5微A 日光时数据表

    语音识别技术:未来人机交互的重要接口

    随着科技的快速发展,人类对机器的操控方式也在不断寻求创新。其中,语音识别技术作为人机交互的重要接口,正在越来越多地被应用于各个领域。本文将深入探讨语音识别技术的发展历程、技术原理以及未来的应用前景
    的头像 发表于 09-19 18:13 526次阅读

    语音芯片」常见的OTP芯片故障分析

    OTP芯片故障分析丨语音芯片出现故障主要有以下三种情况:1.声音播放不完整,只能播放一个字或者一点点,语音乱报,不按指令播报。2.声音沙哑,不清晰,有杂音。3.通电后,发指令无声音输出。
    的头像 发表于 09-15 11:53 428次阅读

    索尼组合音响MCH-VX880叁碟CD右声道无声故障维修

    索尼组合音响MCH-VX880叁碟CD右声道无声故障检查维修心得
    发表于 08-18 15:45 3次下载

    索尼组合音响MCH-VX880叁碟CD右声道无声故障维修

    *附件:索尼组合音响MCH 880VXCD右声道到无声维修.pdf
    发表于 08-18 10:06

    深度学习在语音增强中的应用

    随着科学技术的发展,语音作为新一代人机交互方式,成为人和智能设备、语音助手交流的重要接口,然而在真实环境中,语音信号不可避免的被各种噪声所干扰,除了各种环境噪声,声波在封闭空间中的衰减
    的头像 发表于 07-11 09:39 915次阅读
    深度学习在<b class='flag-5'>语音</b>增强中的应用

    AI语音处理-文字合成语音功能

    这篇文章就介绍华为云提供的语音合成服务使用方法,利用提供的API接口完成语音合成功能,将合成的语音下载下来。
    的头像 发表于 07-08 09:50 1632次阅读
    AI<b class='flag-5'>语音</b>处理-文字合成<b class='flag-5'>语音</b>功能

    基于一种新型的用于无声语音识别的贴片式智能传感器

    摘要:电子科技大学和格拉斯哥大学的研究人员合作开发了一种用于无声语音识别的贴片式智能传感器件,可以检测到说话时细微的喉咙振动,借助深度学习将其转化为可读的单词,这为语音控制和人机界面智能感知开辟
    的头像 发表于 06-17 10:27 819次阅读

    Cibus Tabula E-Ink的Alexa语音接口

    电子发烧友网站提供《Cibus Tabula E-Ink的Alexa语音接口.zip》资料免费下载
    发表于 06-16 11:48 0次下载
    Cibus Tabula E-Ink的Alexa<b class='flag-5'>语音</b><b class='flag-5'>接口</b>

    市面上常见的语音芯片的IO口有哪些作用

    语音芯片的IO口有哪些作用? 语音芯片的IO口一般有多种用途,包括以下几种: 1. 语音输入:可以通过外部麦克风接口,将外部声音信号输入到语音
    的头像 发表于 05-23 15:57 1255次阅读
    市面上常见的<b class='flag-5'>语音</b>芯片的IO口有哪些作用