0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

失语者的未来:无声语音的数字发声

ss 来源:陈述根本 作者:陈根 2020-11-30 15:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能技术的精进与开发无疑对人工智能的应用至关重要,而人工智能除了在与生活强关联方面的应用,回应少数群体的需求也将成为人工智能发展的必然方向。

近日,加州大学伯克利分校的研究人员表示,他们正在使用无声语言和收集肌肉活动的传感器来训练人工智能。其中,无声语言是用肌电图(EMG)检测的,电极则放在脸和喉咙上。研究人员表示,该模型的重点是研究被称之为“沉默语音”的模型,该模型可以检测到人们想说、但没说出声的话。

研究人员相信,他们的方法可以为那些无法发出声音的人提供大量的应用,并且可以支持人工智能助手或其他对语音命令做出响应的设备进行沉默语音检测。

尽管设想美好,但想真正实现却并不容易:首先,在收集数据时,研究者会先在实验者的脸上等部位贴8个贴片,每个贴片都是一个“监视肌肉变化”的传感器。

随后,研究人员需要录制一段实验者的有声语音,并与肌电图进行对应这种方法能够将肌肉的变化情况、和语音的类型对应起来。然后使用WaveNet解码器生成音频语音预测。在记录数据的过程中,还要再录制一段“对口型”的肌电图,但不需要发声,也就是“沉默语音”。

与用发声肌电数据训练的基线相比,该方法在书中句子转录的单词错误率下降了64%到4%,错误率比基线减少了95%。此外,为了推动这一领域的进一步研究,研究人员还开发了一个由近20小时面部肌电数据组成的数据集。

这项题为“无声语音的数字发声”的研究论文,在近日举行的自然语言处理经验方法(EMNLP)活动上,获得了最佳论文奖。

研究小组的论文写道:“数字化无声语音有着广泛的潜在应用。”例如,它可以用来制造一种类似于蓝牙耳机的设备,它允许人们在不干扰周围人的情况下进行电话交谈。而显然,这种设备在环境噪音太大无法捕捉到可听语音或保持沉默的环境中将具有重要作用。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能
    +关注

    关注

    8

    文章

    1745

    浏览量

    121888
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296415
  • 数字化
    +关注

    关注

    8

    文章

    10310

    浏览量

    66528
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    无声的守护:医疗设备电源滤波器的生命线作用

    无声的守护:医疗设备电源滤波器的生命线作用|深圳维爱普
    的头像 发表于 09-28 11:50 355次阅读

    “芯”声代,智未来—VS680本地语音交互系统 #语音交互 #芯片

    语音交互
    深蕾半导体
    发布于 :2025年09月17日 10:59:30

    语音玩具MCU有哪些?留声机读卡芯片发声IC案例介绍

    语音MCU-CK6159A设计的留声机驱动电路
    的头像 发表于 08-28 18:24 607次阅读
    <b class='flag-5'>语音</b>玩具MCU有哪些?留声机读卡芯片<b class='flag-5'>发声</b>IC案例介绍

    语音输出模块是什么?自控语音播报

    语音输出模块(VoiceOutputModule)是一种将数字信号或文本信息转换为人类可听语音的硬件/软件组件。相当于设备的“嘴巴”,让机器能够通过声音与人进行交互。 一、工作原理 1.输入接收
    的头像 发表于 08-13 15:20 614次阅读

    语音识别---大家怎么看呢?

    语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等
    发表于 08-09 10:54

    Air8000 TTS开源,语音合成从此“零距离”!

    技术不应有围墙,创新需要共生长。Air8000宣布TTS应用源代码全面开放,开发可自由定制语音风格、优化合成效果,让文字与声音的对话,不再受限于黑箱算法。 TTS (Text-to-Speech
    的头像 发表于 07-03 16:33 445次阅读
    Air8000 TTS开源,<b class='flag-5'>语音</b>合成从此“零距离”!

    芯知识|语音芯片发码无声解析:上电无声、连发指令才响的三大根源及解决之道

    在嵌入式语音方案开发中,广州唯创电子语音芯片(如WT系列)以其高性价比和易用性广受青睐。但当开发遭遇“上电发码无声”或“必须连发两次指令才有声音”的问题时,往往陷入调试困境。本文将深
    的头像 发表于 06-19 09:14 549次阅读
    芯知识|<b class='flag-5'>语音</b>芯片发码<b class='flag-5'>无声</b>解析:上电<b class='flag-5'>无声</b>、连发指令才响的三大根源及解决之道

    芯知识|语音芯片“无声之谜”:当DACL波形正常,功放开启却无声音时……

    信号“通道冲突”这一关键陷阱。一、无声故障的典型表现与诊断盲点“正常”的表象:工程师用示波器检测语音芯片(如广州唯创电子某型号)的关键引脚:供电电压稳定,逻辑通信正常
    的头像 发表于 06-13 08:53 639次阅读
    芯知识|<b class='flag-5'>语音</b>芯片“<b class='flag-5'>无声</b>之谜”:当DACL波形正常,功放开启却<b class='flag-5'>无声</b>音时……

    蓝牙语音遥控器:智能家居的智慧控制核心

    和OM6621芯片的强大性能,开发能够轻松打造高品质的遥控器产品,满足市场多样化需求。未来,随着技术的不断突破,蓝牙语音遥控器必将在智能家居领域绽放更大光芒,为用户创造更便捷、舒适的生活方式。
    发表于 06-01 20:24

    国星光电荣获2025 IDC中国未来数字工业领航奖项

    未来数字工业领航——云原生软件创新先锋”奖项,标志着国星光电在工业软件领域的生态协同能力和创新实践成果获得权威认可。
    的头像 发表于 05-27 11:42 1027次阅读

    蓝牙语音遥控器 低功耗芯片选型HS6621CxC/OM6621

    HS6621CxC和OM6621芯片的强大性能,开发能够轻松打造高品质的遥控器产品,满足市场多样化需求。未来,随着技术的不断突破,蓝牙语音遥控器必将在智能家居领域绽放更大光芒,为用户创造更便捷、舒适的生活方式。
    发表于 05-22 15:23

    解码未来数字编码器如何重塑智能世界

    标题:《解码未来数字编码器如何重塑智能世界》 在数字化浪潮席卷全球的今天,每一个微小的信号转换都可能成为推动技术革命的关键。而在这场无声的变革中,
    的头像 发表于 04-07 08:44 588次阅读
    解码<b class='flag-5'>未来</b>:<b class='flag-5'>数字</b>编码器如何重塑智能世界

    数字时钟系统:城市脉动中的无声指挥家

    数字时钟从孤立设备进化为智能节点,它承载的功能已超越计时本身。这些跳动的数字如同现代社会的标点符号,在厂房、街巷、云端划定出精密的时间网格,让庞杂的都市系统得以和谐共振。
    的头像 发表于 03-02 09:35 894次阅读

    从datasheet到量产:WT2000P替代ISD录音方案的PCB布局优化与EMI防护全记录

    在如今的社会,智能语音产品已逐渐普遍融入人们的生活,智能语音产品已经逐渐替代了许多“哑巴产品”。而智能语音产品之所以能发声,主要也是因为产品加入了
    的头像 发表于 02-23 15:26 720次阅读
    从datasheet到量产:WT2000P替代ISD录音方案的PCB布局优化与EMI防护全记录

    ISD系列录音芯片无缝替代方案-唯创知音WT2000P

    01背景:在如今的社会,智能语音产品已逐渐普遍融入人们的生活,智能语音产品已经逐渐替代了许多“哑巴产品”。而智能语音产品之所以能发声,主要也是因为产品加入了
    的头像 发表于 12-26 17:33 1218次阅读
    ISD系列录音芯片无缝替代方案-唯创知音WT2000P