加州大学伯克利分校的研究人员已经开发出一种能够检测“无声语音”的AI模型。该模型基于数字语音预测单词并生成合成语音。肌电图(EMG)的电极位于脸部和喉咙,用于检测无声语音。
研究人员断言,该模型可以为无法发出可听语音的人们启用许多应用程序,并可以帮助AI工具和其他响应语音命令的设备进行语音检测。
该小组指出,以数字方式为无声语音发声具有广泛的应用。例如,它可以生成类似于蓝牙耳机的工具,该工具可以使个人继续通话,而不会打扰周围的人。当环境声音太大而无法捕获可听见的语音或必须保持安静时,这种设备将非常有用。
口头阅读AI是可以从静音语音中捕获单词的AI的另一个示例。它可以为监视设备供电,并支持聋人的用例。
研究人员使用了一种方法,其中将所需语句的音频输出目标从发声录音转换为无声录音。然后,使用WaveNet解码器生成音频语音预测。
通过比较发声的EMG数据和基线训练的数据,发现发声的EMG方法在从书中转录句子时,单词错误率降低了64%至4%,而基线降低了95%。研究人员开源了约20小时的面部EMG数据集,以鼓励对该领域进行进一步研究。
在其他工作中,中国的研究人员建立了讽刺检测模型,该模型在多模式Twitter数据集上提供SOTA性能。Masakhane开放源代码非洲语言翻译项目的成员已发布了 有关低资源机器翻译的 案例研究。
责任编辑:lq
-
解码器
+关注
关注
9文章
1203浏览量
42864 -
蓝牙耳机
+关注
关注
21文章
5687浏览量
65001 -
AI
+关注
关注
89文章
38091浏览量
296589
发布评论请先 登录
研究人员复兴针孔相机技术以推动下一代红外成像发展
【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用
任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?
无刷直流电机双闭环串级控制系统仿真研究
最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)
芯知识|语音芯片“无声之谜”:当DACL波形正常,功放开启却无声音时……
研究人员开发出基于NVIDIA技术的AI模型用于检测疟疾
《AI Agent 应用与项目实战》----- 学习如何开发视频应用
NVIDIA助力初创公司BioTuring发布新型AI模型
Qwen大模型助力开发低成本AI推理方案
一种高灵敏的化学检测系统
AI模型部署边缘设备的奇妙之旅:目标检测模型
研究人员利用激光束开创量子计算新局面

研究人员已经开发出一种能够检测“无声语音”的AI模型
评论