0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

失语者的未来:无声语音的数字发声

ss 来源:陈述根本 作者:陈根 2020-11-30 15:26 次阅读

人工智能技术的精进与开发无疑对人工智能的应用至关重要,而人工智能除了在与生活强关联方面的应用,回应少数群体的需求也将成为人工智能发展的必然方向。

近日,加州大学伯克利分校的研究人员表示,他们正在使用无声语言和收集肌肉活动的传感器来训练人工智能。其中,无声语言是用肌电图(EMG)检测的,电极则放在脸和喉咙上。研究人员表示,该模型的重点是研究被称之为“沉默语音”的模型,该模型可以检测到人们想说、但没说出声的话。

研究人员相信,他们的方法可以为那些无法发出声音的人提供大量的应用,并且可以支持人工智能助手或其他对语音命令做出响应的设备进行沉默语音检测。

尽管设想美好,但想真正实现却并不容易:首先,在收集数据时,研究者会先在实验者的脸上等部位贴8个贴片,每个贴片都是一个“监视肌肉变化”的传感器。

随后,研究人员需要录制一段实验者的有声语音,并与肌电图进行对应这种方法能够将肌肉的变化情况、和语音的类型对应起来。然后使用WaveNet解码器生成音频语音预测。在记录数据的过程中,还要再录制一段“对口型”的肌电图,但不需要发声,也就是“沉默语音”。

与用发声肌电数据训练的基线相比,该方法在书中句子转录的单词错误率下降了64%到4%,错误率比基线减少了95%。此外,为了推动这一领域的进一步研究,研究人员还开发了一个由近20小时面部肌电数据组成的数据集。

这项题为“无声语音的数字发声”的研究论文,在近日举行的自然语言处理经验方法(EMNLP)活动上,获得了最佳论文奖。

研究小组的论文写道:“数字化无声语音有着广泛的潜在应用。”例如,它可以用来制造一种类似于蓝牙耳机的设备,它允许人们在不干扰周围人的情况下进行电话交谈。而显然,这种设备在环境噪音太大无法捕捉到可听语音或保持沉默的环境中将具有重要作用。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能
    +关注

    关注

    8

    文章

    1680

    浏览量

    116935
  • AI
    AI
    +关注

    关注

    87

    文章

    26413

    浏览量

    264021
  • 数字化
    +关注

    关注

    8

    文章

    7700

    浏览量

    60870
收藏 人收藏

    评论

    相关推荐

    情感语音识别的挑战与未来趋势

    一、引言 情感语音识别是一种通过分析和理解人类语音中的情感信息来实现智能交互的技术。尽管近年来取得了显著的进步,但情感语音识别仍然面临着诸多挑战。本文将探讨情感语音识别所面临的挑战以及
    的头像 发表于 11-30 11:24 245次阅读

    情感语音识别的现状与未来趋势

    情感语音识别是一种涉及多个学科领域的前沿技术,包括心理学、语言学、计算机科学等。它通过分析人类语音中的情感信息,实现更加智能化和个性化的人机交互。本文将探讨情感语音识别的现状与未来趋势
    的头像 发表于 11-28 17:22 367次阅读

    基于数字语音存储回放及GSM语音传输系统设计

    电子发烧友网站提供《基于数字语音存储回放及GSM语音传输系统设计.pdf》资料免费下载
    发表于 11-17 16:48 0次下载
    基于<b class='flag-5'>数字</b>化<b class='flag-5'>语音</b>存储回放及GSM<b class='flag-5'>语音</b>传输系统设计

    ADA4075在使用过程中出现有时无声、有时有声的现象是怎么回事?

    ADA4075在使用过程中出现有时无声、有时有声现象 ADA4075在使用中出现了类似受潮的现象,温度高时芯片正常工作,温度低时会出现无声。但是芯片本身防潮等级MSL1,实际储存中也不存在高潮
    发表于 11-17 07:26

    情感语音识别技术的挑战与未来发展

    情感语音识别技术作为人工智能领域的重要分支,已经取得了显著的进展。然而,在实际应用中,情感语音识别技术仍面临许多挑战。本文将探讨情感语音识别技术的挑战与未来发展。
    的头像 发表于 11-16 16:48 210次阅读

    情感语音识别技术的现状与未来

    一、引言 情感语音识别技术是近年来人工智能领域的研究热点之一,它通过分析人类语音中的情感信息,为智能客服、心理健康监测、娱乐产业等多个领域提供了重要的支持。本文将探讨情感语音识别技术的现状和
    的头像 发表于 11-15 16:36 279次阅读

    情感语音识别技术的应用与未来发展

    的应用、未来发展趋势以及面临的挑战。 二、情感语音识别技术的应用 人机交互:情感语音识别技术在人机交互领域有着广泛的应用。例如,智能客服可以通过分析用户的语音情感,提供更加贴心和个性化
    的头像 发表于 11-12 17:30 363次阅读

    科普语音芯片和语音合成芯片的不同之处

     可发声芯片分为语音芯片和语音合成芯片,二者在技术和用途上不同。语音合成芯片能将任意文字实时转换并朗读出来,支持所有中文文本合成,无需烧录语音
    的头像 发表于 10-31 15:42 259次阅读

    单片机如何使用DAC发声

    如何使用DAC发声,为什么我用软件导出来的语音文件,放到程序中不能发出声音,人家的例程就行
    发表于 10-27 08:18

    语音识别技术:现状、挑战与未来发展

    一、引言 语音识别技术是一种将人类语音转化为计算机可读文本的技术,它在许多领域都有广泛的应用,如智能助手、智能家居、医疗诊断等。本文将探讨语音识别技术的现状、挑战和未来发展。 二、
    的头像 发表于 10-12 16:57 1199次阅读

    语音识别技术:原理、应用与未来

    语音识别的原理、当前的应用情况以及对未来的展望。 二、语音识别原理 语音识别技术主要涉及两个主要步骤:特征提取和模式匹配。在特征提取阶段,算法从输入的音频信号中提取出与
    的头像 发表于 09-19 18:30 1176次阅读

    语音合成技术的简介与未来发展

    语音合成是一种通过计算机技术生成人类可听的语音的技术。它将文本转换为语音,从而实现语音交互。本文将介绍语音合成技术的概念、现状以及
    的头像 发表于 09-15 18:17 808次阅读

    基于一种新型的用于无声语音识别的贴片式智能传感器

    了新的机遇。 关键词:智能人工喉咙,压阻传感器,无声语音识别,深度学习,人机界面       声带是咽部组织的褶皱,是人类发声的主要结构。在说话和唱歌等发声动作中,声带通过与空气相互作
    的头像 发表于 06-17 10:27 811次阅读

    语音识别技术的概念及应用前景

    智能语音技术是人工智能应用最成熟的技术之一,并拥有交互的自然性,就是让智能设备听懂人类的语音。它是一门涉及数字信号处理、人工智能、语言学、数理统计学、声学、情感学及心理学等多学科交叉的科学。智能
    发表于 05-27 09:41

    什么是无声语音接口?

    可穿戴设备依赖于具有标准物理能力的人机界面,如语音、触摸或运动。
    的头像 发表于 04-28 10:16 1020次阅读
    什么是<b class='flag-5'>无声</b><b class='flag-5'>语音</b>接口?