0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究人员已经开发出一种能够检测“无声语音”的AI模型

倩倩 来源:文财网 作者:文财网 2020-12-17 10:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

加州大学伯克利分校的研究人员已经开发出一种能够检测“无声语音”的AI模型。该模型基于数字语音预测单词并生成合成语音。肌电图(EMG)的电极位于脸部和喉咙,用于检测无声语音。

研究人员断言,该模型可以为无法发出可听语音的人们启用许多应用程序,并可以帮助AI工具和其他响应语音命令的设备进行语音检测。

该小组指出,以数字方式为无声语音发声具有广泛的应用。例如,它可以生成类似于蓝牙耳机的工具,该工具可以使个人继续通话,而不会打扰周围的人。当环境声音太大而无法捕获可听见的语音或必须保持安静时,这种设备将非常有用。

口头阅读AI是可以从静音语音中捕获单词的AI的另一个示例。它可以为监视设备供电,并支持聋人的用例。

研究人员使用了一种方法,其中将所需语句的音频输出目标从发声录音转换为无声录音。然后,使用WaveNet解码器生成音频语音预测。

通过比较发声的EMG数据和基线训练的数据,发现发声的EMG方法在从书中转录句子时,单词错误率降低了64%至4%,而基线降低了95%。研究人员开源了约20小时的面部EMG数据集,以鼓励对该领域进行进一步研究。

在其他工作中,中国的研究人员建立了讽刺检测模型,该模型在多模式Twitter数据集上提供SOTA性能。Masakhane开放源代码非洲语言翻译项目的成员已发布了 有关低资源机器翻译的 案例研究。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1203

    浏览量

    42864
  • 蓝牙耳机
    +关注

    关注

    21

    文章

    5687

    浏览量

    65001
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296589
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    研究人员复兴针孔相机技术以推动下代红外成像发展

    研究人员运用具有数百年历史的针孔成像原理,开发出一种无需透镜的高性能中红外成像系统。这种新型相机能够在大范围距离内和弱光条件下拍摄极其清晰的照片,使其在传统相机难以应对的场景中发挥重要
    的头像 发表于 11-17 07:40 58次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    一种快速反应能力,是直接的感知;灵感是一种通过思考和探索获得的创造性想法,是一种创意。 AI怎么模拟直觉与灵感呢?四、AI代替人类的假说
    发表于 09-17 11:45

    任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?

    开发个简单的语音指令应用程序。 竞赛参与 参加Kaggle等数据科学和AI竞赛。这些竞赛通常会提供真实的数据集和具有挑战性的问题,例如预测疾病的风险、分析电商用户的行为等。通过参
    发表于 07-08 17:44

    无刷直流电机双闭环串级控制系统仿真研究

    Madlab进行BLDC建模仿真的方法,并且也提出了很多的建模仿真方案。例如有研究人员提出采用节点电流法对电机控制系统进行分析,通过列写m函数,建立BLDC控制系统真模型,这种方法实质上是一种整体建模
    发表于 07-07 18:36

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    端侧离线 AI 智能硬件作为 AI 技术的重要载体之,凭借其无需依赖网络即可实现智能功能的特性,在些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK
    发表于 07-04 11:14

    芯知识|语音芯片“无声之谜”:当DACL波形正常,功放开启却无声音时……

    信号“通道冲突”这关键陷阱。无声故障的典型表现与诊断盲点“正常”的表象:工程师用示波器检测语音芯片(如广州唯创电子某型号)的关键引脚:
    的头像 发表于 06-13 08:53 643次阅读
    芯知识|<b class='flag-5'>语音</b>芯片“<b class='flag-5'>无声</b>之谜”:当DACL波形正常,功放开启却<b class='flag-5'>无声</b>音时……

    研究人员开发出基于NVIDIA技术的AI模型用于检测疟疾

    疟疾曾度在委内瑞拉销声匿迹,但如今正卷土重来。研究人员已经训练出模型来帮助检测这种传染病。
    的头像 发表于 04-25 09:58 733次阅读

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    基石。 Neuron Studio打造全流程站式开发体验,为AI应用开发按下加速键 AI 应用的开发
    发表于 04-13 19:52

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    再次感谢发烧友提供的阅读体验活动。本期跟随《AI Agent 应用与项目实战》这本书学习如何构建开发个视频应用。AI Agent是一种智能
    发表于 03-05 19:52

    NVIDIA助力初创公司BioTuring发布新型AI模型

    癌症研究人员公布了一种能够提供细胞级癌细胞映射图和可视化图像的新型 AI 模型。科学家希望这能揭示某些细胞间的关系以及引发癌细胞生长的诱因。
    的头像 发表于 02-14 10:08 591次阅读

    Qwen大模型助力开发低成本AI推理方案

    阿里巴巴的开源Qwen2.5模型近期在AI领域引发了广泛关注。这模型的推出,为斯坦福大学与伯克利大学的研究人员提供了强大的技术支持,使他
    的头像 发表于 02-12 09:19 983次阅读

    基于Arm Neoverse平台的处理器革新生成式AI体验

    Llama 是个专为开发者、研究人员和企业打造的开源大语言模型 (LLM) 库,旨在推动生成式 AI 的创新、实验及可靠地扩展。
    的头像 发表于 01-03 15:31 1156次阅读
    基于Arm Neoverse平台的处理器革新生成式<b class='flag-5'>AI</b>体验

    一种高灵敏的化学检测系统

    近日,美国加州大学伯克利分校、劳伦斯伯克利国家实验室和Adamas Nanotechnologies公司等机构的研究人员将量子传感与液滴微流控技术相结合,开发出一种高灵敏的化学检测
    的头像 发表于 01-02 11:35 711次阅读
    <b class='flag-5'>一种</b>高灵敏的化学<b class='flag-5'>检测</b>系统

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    的是百度的Picodet模型,它是一种基于深度卷积网络(DNN)的轻量级目标检测模型,具有非常高的检测精度,可以在低算力设备进行实时的端到端
    发表于 12-19 14:33

    研究人员利用激光束开创量子计算新局面

    演示设备 威特沃特斯兰德大学(Wits)的物理学家利用激光束和日常显示技术开发出一种创新的计算系统,标志着在寻求更强大的量子计算解决方案方面取得了重大飞跃。 该大学结构光实验室的研究人员取得的这
    的头像 发表于 12-18 06:24 580次阅读
    <b class='flag-5'>研究人员</b>利用激光束开创量子计算新局面