0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高通语音识别系统近乎完美

机器人技术与应用 来源:未知 作者:胡薇 2018-05-30 09:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,在美国波士顿举行的Re-Work深度学习峰会上,美国高通公司的人工智能研究人员克里斯·洛特(Chris Lott)展示了其团队在语音识别系统方面的新进展。

新语音识别系统识别单词和短语的准确率达到了95%,可在智能手机或其他便携设备上运行,包含两个神经网络:循环神经网络(RNN)和卷积神经网络(CNN)。循环神经网络利用其内存来处理输入信息,而卷积神经网络则模仿人类大脑中神经元之间的联系方式来处理信息。

洛特称,现在大多数语音识别系统在云端进行运算过程。手机中的麦克风和芯片,智能音箱如谷歌Home和亚马逊Echo,以及配置微软Cortana 语音助手的Windows电脑,可以让语音识别系统接倾听一些热门词汇,例如“OK Google”或Hey Cortana,从而接受一系列语音指令。但是,它们不会分析这些指令,而只是将这些指令传输到运行复杂机器学习算法的强大远程服务器上。

对于某些用户来说,将其语音数据上传到云端,这样会让他们担心隐私方面的问题。亚马逊Alexa和谷歌Assistant均会录制语音片段,然后将它们发送出去进行分析。它们会一直保留这些语音片段,直到用户选择删除它们。这两家公司均表示,它们录制语音是为了改善其服务,提供更加个性化的语音回答。

但是,在某些情况下,录制语音无法保护用户的隐私。在2016年,亚利桑那州调查一宗谋杀案的侦探在被告人的同意下访问了一台亚马逊Echo智能音箱中的语音数据。

洛特称,高通的这种语音识别系统直接在设备上处理数据,这样做除了可以保护用户的隐私之外,还具有多方面的好处。由于它不必将数据上传到云端,它对于指令的反应速度更快。由于它不需要连接互联网,因此它变得更加稳定。

“我们努力按照某种神经网络的形式来处理整个端到端系统。”他说,“这样可以让用户与设备的互动变得更加自然。”

洛特的话不无道理。在2016年,谷歌开发了一款离线语音识别系统,它的速度是同时期其在线语音识别系统的7倍。这个离线语音识别系统利用语音数据进行了大约2000个小时的训练,它的大小为20.3兆,在智能手机上运行,准确率为86.5%。

当然,这种设备端语音识别系统也有自身的局限性。离线工作的算法无法连接互联网,并搜索问题的答案。而且,它们无法像云端系统那样随着数据的积累不断地改进。

但是,洛特认为,高通的解决方案是面向未来的。“现在很多计算过程发生在云端,但是我们认为这个过程应该直接在设备上进行。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 高通
    +关注

    关注

    78

    文章

    7761

    浏览量

    200586
  • 语音识别系统

    关注

    0

    文章

    22

    浏览量

    11058

原文标题:高通宣称其语音识别系统准确率高达95%

文章出处:【微信号:robotmagazine,微信公众号:机器人技术与应用】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    语音识别IC分类,语音识别芯片的工作原理

    语音识别芯片,也叫语音识别集成电路,是一种集声音存储、播放、录音及语音识别功能于一体的专用芯片。
    的头像 发表于 01-14 15:22 509次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>IC分类,<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片的工作原理

    什么是离线语音识别芯片(离线语音识别芯片有哪些优点)

    指令的识别与响应。无论是在家庭还是嘈杂的工业场合,这一类芯片都可以实现准确率的智能语音交互,这种离线控制方式为用户提供了极大的便利。
    的头像 发表于 10-31 15:27 765次阅读

    水下目标智能识别系统平台全面解析

    水下目标智能识别系统平台全面解析
    的头像 发表于 10-17 17:09 569次阅读
    水下目标智能<b class='flag-5'>识别系统</b>平台全面解析

    语音识别系统的技术核心:从声音到文字的智能转换

          语音识别技术,也称为自动语音识别(ASR),其核心目标是将人类语音信号转换为对应的文本或指令。随着人工智能的发展,
    的头像 发表于 09-05 14:04 1074次阅读

    EASY EAl Orin Nano(RK3576) whisper语音识别训练部署教程

    1Whisper简介Whisper是OpenAI开源的,识别语音识别能力已达到人类水准自动语音识别系统。Whisper作为一个通用的
    的头像 发表于 07-25 15:21 1055次阅读
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>语音</b><b class='flag-5'>识别</b>训练部署教程

    EASY EAl Orin Nano(RK3576) whisper语音识别训练部署教程

    Whisper是OpenAI开源的,识别语音识别能力已达到人类水准自动语音识别系统。Whisper作为一个通用的
    的头像 发表于 07-17 14:55 2117次阅读
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>语音</b><b class='flag-5'>识别</b>训练部署教程

    水下目标智能识别系统软件平台

    水下目标智能识别系统软件平台
    的头像 发表于 07-16 15:28 736次阅读
    水下目标智能<b class='flag-5'>识别系统</b>软件平台

    基于FPGA的数字识别系统设计

    在图像处理领域,图像识别是较为困难而关键的技术。这项技术被广泛的应用到娱乐、工业、军事等领域。本次设计数字识别系统已经在车牌识别、运动员号码识别等多处运用。本
    的头像 发表于 07-16 14:28 2083次阅读
    基于FPGA的数字<b class='flag-5'>识别系统</b>设计

    火车车号识别系统的基本原理是什么?

    火车车号识别系统基于先进的计算机视觉和深度学习技术,实现了对铁路车辆信息的自动化采集与识别。该系统主要由数据采集、图像处理、特征提取和智能识别四大模块组成,能够高效准确地
    的头像 发表于 07-07 10:55 1168次阅读

    铁路车号识别系统的基本原理与应用

    铁路车号识别系统是铁路运输智能化管理的关键技术之一,它通过自动化手段实现对货运列车的高效精准识别,为矿区及铁路运输管理提供了重要的技术支撑。以下从系统原理、核心组件及技术优势三个方面展开说明。 一
    的头像 发表于 07-07 10:30 1486次阅读
    铁路车号<b class='flag-5'>识别系统</b>的基本原理与应用

    无人机AI视觉行为识别系统

    无人机AI视觉行为识别系统 随着无人机技术的快速发展和计算机视觉领域的突破性进展,无人机AI视觉行为识别系统应运而生。传统监控系统受限于固定视角和有限覆盖范围,难以满足现代社会对全方位、智能化监控
    的头像 发表于 07-04 16:53 1279次阅读

    铁路车号智能识别系统AI助力铁路高效运转

    识别系统
    jf_84977585
    发布于 :2025年06月27日 16:24:19

    正面吊集装箱识别系统技术解析#人工智能

    识别系统
    jf_84977585
    发布于 :2025年06月23日 17:24:24

    龙门吊箱号识别系统助力码头智能化升级#龙门吊箱号识别系统

    识别系统
    jf_60141436
    发布于 :2025年05月26日 11:05:07