0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高通语音识别系统近乎完美

机器人技术与应用 来源:未知 作者:胡薇 2018-05-30 09:37 次阅读

近日,在美国波士顿举行的Re-Work深度学习峰会上,美国高通公司人工智能研究人员克里斯·洛特(Chris Lott)展示了其团队在语音识别系统方面的新进展。

新语音识别系统识别单词和短语的准确率达到了95%,可在智能手机或其他便携设备上运行,包含两个神经网络:循环神经网络(RNN)和卷积神经网络(CNN)。循环神经网络利用其内存来处理输入信息,而卷积神经网络则模仿人类大脑中神经元之间的联系方式来处理信息。

洛特称,现在大多数语音识别系统在云端进行运算过程。手机中的麦克风和芯片智能音箱如谷歌Home和亚马逊Echo,以及配置微软Cortana 语音助手的Windows电脑,可以让语音识别系统接倾听一些热门词汇,例如“OK Google”或Hey Cortana,从而接受一系列语音指令。但是,它们不会分析这些指令,而只是将这些指令传输到运行复杂机器学习算法的强大远程服务器上。

对于某些用户来说,将其语音数据上传到云端,这样会让他们担心隐私方面的问题。亚马逊Alexa和谷歌Assistant均会录制语音片段,然后将它们发送出去进行分析。它们会一直保留这些语音片段,直到用户选择删除它们。这两家公司均表示,它们录制语音是为了改善其服务,提供更加个性化的语音回答。

但是,在某些情况下,录制语音无法保护用户的隐私。在2016年,亚利桑那州调查一宗谋杀案的侦探在被告人的同意下访问了一台亚马逊Echo智能音箱中的语音数据。

洛特称,高通的这种语音识别系统直接在设备上处理数据,这样做除了可以保护用户的隐私之外,还具有多方面的好处。由于它不必将数据上传到云端,它对于指令的反应速度更快。由于它不需要连接互联网,因此它变得更加稳定。

“我们努力按照某种神经网络的形式来处理整个端到端系统。”他说,“这样可以让用户与设备的互动变得更加自然。”

洛特的话不无道理。在2016年,谷歌开发了一款离线语音识别系统,它的速度是同时期其在线语音识别系统的7倍。这个离线语音识别系统利用语音数据进行了大约2000个小时的训练,它的大小为20.3兆,在智能手机上运行,准确率为86.5%。

当然,这种设备端语音识别系统也有自身的局限性。离线工作的算法无法连接互联网,并搜索问题的答案。而且,它们无法像云端系统那样随着数据的积累不断地改进。

但是,洛特认为,高通的解决方案是面向未来的。“现在很多计算过程发生在云端,但是我们认为这个过程应该直接在设备上进行。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 高通
    +关注

    关注

    76

    文章

    7147

    浏览量

    187798
  • 语音识别系统

    关注

    0

    文章

    17

    浏览量

    10402

原文标题:高通宣称其语音识别系统准确率高达95%

文章出处:【微信号:robotmagazine,微信公众号:机器人技术与应用】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    解决方案:智能公交识别系统无线传输方案

    无线传输识别系统
    北京东用科技有限公司
    发布于 :2023年12月13日 11:59:34

    基于DSP的车载语音识别系统方案设计

    电子发烧友网站提供《基于DSP的车载语音识别系统方案设计.pdf》资料免费下载
    发表于 11-08 09:14 0次下载
    基于DSP的车载<b class='flag-5'>语音</b><b class='flag-5'>识别系统</b>方案设计

    离线语音识别和控制的工作原理及应用

    :   1.信号采集   离线语音识别系统的第一步是信号采集。声音信号通过麦克风(传感器)以电信号的形式被捕捉到,这是后续处理的基础。   2.预处理   预处理阶段包括去除噪声、回声消除、降噪等处理
    发表于 11-07 18:01

    ADSP-BF531在嵌入式语音识别系统中的应用

    电子发烧友网站提供《ADSP-BF531在嵌入式语音识别系统中的应用.pdf》资料免费下载
    发表于 10-23 10:45 2次下载
    ADSP-BF531在嵌入式<b class='flag-5'>语音</b><b class='flag-5'>识别系统</b>中的应用

    语音识别系统的单片机控制

    电子发烧友网站提供《语音识别系统的单片机控制.pdf》资料免费下载
    发表于 10-13 11:22 8次下载
    <b class='flag-5'>语音</b><b class='flag-5'>识别系统</b>的单片机控制

    基于DSP的指纹识别系统

    电子发烧友网站提供《基于DSP的指纹识别系统.pdf》资料免费下载
    发表于 10-12 09:24 1次下载
    基于DSP的指纹<b class='flag-5'>识别系统</b>

    LD3320的嵌入式语音识别系统的应用电路原理图

    电子发烧友网站提供《LD3320的嵌入式语音识别系统的应用电路原理图.pdf》资料免费下载
    发表于 10-11 09:38 3次下载
    LD3320的嵌入式<b class='flag-5'>语音</b><b class='flag-5'>识别系统</b>的应用电路原理图

    深度学习在语音识别中的应用及挑战

    的挑战。 二、深度学习在语音识别中的应用 1.基于深度神经网络的语音识别:深度神经网络(DNN)和循环神经网络(RNN)是深度学习在语音
    的头像 发表于 10-10 18:14 475次阅读

    基于STM32的指纹识别系统设计与实现

    电子发烧友网站提供《基于STM32的指纹识别系统设计与实现.pdf》资料免费下载
    发表于 10-10 11:02 3次下载
    基于STM32的指纹<b class='flag-5'>识别系统</b>设计与实现

    基于OMAP5912的嵌入式非特定人连续语音识别系统

    电子发烧友网站提供《基于OMAP5912的嵌入式非特定人连续语音识别系统.pdf》资料免费下载
    发表于 10-09 15:21 0次下载
    基于OMAP5912的嵌入式非特定人连续<b class='flag-5'>语音</b><b class='flag-5'>识别系统</b>

    基于DTW算法语音识别系统仿真及DSP实现

    电子发烧友网站提供《基于DTW算法语音识别系统仿真及DSP实现.pdf》资料免费下载
    发表于 10-08 11:52 0次下载
    基于DTW算法<b class='flag-5'>语音</b><b class='flag-5'>识别系统</b>仿真及DSP实现

    基于GMM的实时说话人识别系统

    电子发烧友网站提供《基于GMM的实时说话人识别系统.pdf》资料免费下载
    发表于 10-08 10:19 0次下载
    基于GMM的实时说话人<b class='flag-5'>识别系统</b>

    语音识别系统的基本结构及分类介绍

    自动语音识别技术,简单来说其实就是利用计算机将语音信号自动转换为文本的一项技术。这项技术同时也是机器理解人类言语的第一个也是很重要的一个过程。
    发表于 09-14 09:35 1238次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别系统</b>的基本结构及分类介绍

    使用Jetson Nano构建人脸识别系统

    电子发烧友网站提供《使用Jetson Nano构建人脸识别系统.zip》资料免费下载
    发表于 07-06 11:37 0次下载
    使用Jetson Nano构建人脸<b class='flag-5'>识别系统</b>

    语音识别唤醒词的技术与应用

    语音识别唤醒词是指一种特定的语音指令,能够唤醒智能语音助手或语音识别系统。这种特定的
    的头像 发表于 06-24 04:02 866次阅读