人工智能技术的精进与开发无疑对人工智能的应用至关重要,而人工智能除了在与生活强关联方面的应用,回应少数群体的需求也将成为人工智能发展的必然方向。
近日,加州大学伯克利分校的研究人员表示,他们正在使用无声语言和收集肌肉活动的传感器来训练人工智能。其中,无声语言是用肌电图(EMG)检测的,电极则放在脸和喉咙上。研究人员表示,该模型的重点是研究被称之为“沉默语音”的模型,该模型可以检测到人们想说、但没说出声的话。
研究人员相信,他们的方法可以为那些无法发出声音的人提供大量的应用,并且可以支持人工智能助手或其他对语音命令做出响应的设备进行沉默语音检测。
尽管设想美好,但想真正实现却并不容易:首先,在收集数据时,研究者会先在实验者的脸上等部位贴8个贴片,每个贴片都是一个“监视肌肉变化”的传感器。
随后,研究人员需要录制一段实验者的有声语音,并与肌电图进行对应这种方法能够将肌肉的变化情况、和语音的类型对应起来。然后使用WaveNet解码器生成音频语音预测。在记录数据的过程中,还要再录制一段“对口型”的肌电图,但不需要发声,也就是“沉默语音”。
与用发声肌电数据训练的基线相比,该方法在书中句子转录的单词错误率下降了64%到4%,错误率比基线减少了95%。此外,为了推动这一领域的进一步研究,研究人员还开发了一个由近20小时面部肌电数据组成的数据集。
这项题为“无声语音的数字发声”的研究论文,在近日举行的自然语言处理经验方法(EMNLP)活动上,获得了最佳论文奖。
研究小组的论文写道:“数字化无声语音有着广泛的潜在应用。”例如,它可以用来制造一种类似于蓝牙耳机的设备,它允许人们在不干扰周围人的情况下进行电话交谈。而显然,这种设备在环境噪音太大无法捕捉到可听语音或保持沉默的环境中将具有重要作用。
责任编辑:xj
-
智能
+关注
关注
8文章
1745浏览量
121888 -
AI
+关注
关注
89文章
38090浏览量
296415 -
数字化
+关注
关注
8文章
10310浏览量
66528
发布评论请先 登录
语音输出模块是什么?自控语音播报
语音识别---大家怎么看呢?
Air8000 TTS开源,语音合成从此“零距离”!
芯知识|语音芯片发码无声解析:上电无声、连发指令才响的三大根源及解决之道
芯知识|语音芯片“无声之谜”:当DACL波形正常,功放开启却无声音时……
蓝牙语音遥控器:智能家居的智慧控制核心
国星光电荣获2025 IDC中国未来数字工业领航者奖项
蓝牙语音遥控器 低功耗芯片选型HS6621CxC/OM6621
数字时钟系统:城市脉动中的无声指挥家
从datasheet到量产:WT2000P替代ISD录音方案的PCB布局优化与EMI防护全记录
ISD系列录音芯片无缝替代方案-唯创知音WT2000P

失语者的未来:无声语音的数字发声
评论