电子发烧友网 > 音视频及家电 > 正文

语音识别技术将使得人与机器的沟通成为可能

2019年10月17日 10:49 次阅读

(文章来源:OFweek)

语音识别已成为人与机器通过自然语言交互重要方式之一,本文将从语音识别的原理以及语音识别算法的角度出发为大家介绍语音识别的方案及详细设计过程。

语言作为人类的一种基本交流方式,在数千年历史中得到持续传承。近年来,语音识别技术的不断成熟,已广泛应用于我们的生活当中。语音识别技术是如何让机器“听懂”人类语言?本文将为大家从语音前端处理、基于统计学语音识别和基于深度学习语音识别等方面阐述语音识别的原理。

随着计算机技术的飞速发展,人们对机器的依赖已经达到一个极高的程度。语音识别技术使得人与机器通过自然语言交互成为可能。最常见的情形是通过语音控制房间灯光、空调温度和电视的相关操作等。并且,移动互联网、智能家居、汽车、医疗和教育等领域的应用带动智能语音产业规模持续快速增长,2018年全球智能语音市场规模将达到141.1亿美元。

语音识别技术将使得人与机器的沟通成为可能

目前,在全球智能语音市场占比情况中,各巨头市场占有率由大到小依次为:Nuance、谷歌、苹果、微软和科大讯飞等。

接下来对语音识别相关技术进行介绍,为了便于整体理解,首先,介绍语音前端信号处理的相关技术,然后,解释语音识别基本原理,并展开到声学模型和语言模型的叙述,最后,展示我司当前研发的离线语音识别demo。前端的信号处理是对原始语音信号进行的相关处理,使得处理后的信号更能代表语音的本质特征。

语音活动检测(Voice Activity DetecTIon, VAD)用于检测出语音信号的起始位置,分离出语音段和非语音(静音或噪声)段。VAD算法大致分为三类:基于阈值的VAD、基于分类器的VAD和基于模型的VAD。

基于阈值的VAD是通过提取时域(短时能量、短时过零率等)或频域(MFCC、谱熵等)特征,通过合理的设置门限,达到区分语音和非语音的目的;基于分类的VAD是将语音活动检测作为(语音和非语音)二分类,可以通过机器学习的方法训练分类器,达到语音活动检测的目的;基于模型的VAD是构建一套完整的语音识别模型用于区分语音段和非语音段,考虑到实时性的要求,并未得到实际的应用。

在生活环境中通常会存在例如空调、风扇等各种噪声,降噪算法目的在于降低环境中存在的噪声,提高信噪比,进一步提升识别效果。

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

AI语音智能机器人开发实战第四期-眼睛灯编码与实现

主题简介及亮点:第四期直播内容是"AI语音识别机器人"眼睛灯编码与实现,通过直接讲解如何编写代码去实现各个子模块的功能。
发烧友学院发表于 2019-02-27 00:00 0次阅读
AI语音智能机器人开发实战第四期-眼睛灯编码与实现

谷歌推出全新的离线语音识别模型

语音识别是Siri、Alexa和Google等智能手机的重要组成部分,但这些语音识别系统有一个很大的....
发表于 2019-10-17 10:30 47次阅读
谷歌推出全新的离线语音识别模型

29页PPT,详细介绍Ouroboros的语音AI芯片

阿里达摩院发布一款名为Ouroboros的语音AI芯片。 据官方表示,这款芯片是业界首款专门用于语音合成算法的AI芯片...
发表于 2019-10-16 16:32 158次阅读
29页PPT,详细介绍Ouroboros的语音AI芯片

声音前处理技术可助力智能语音的市场发展

谈到智能语音,早已不是什么新鲜的事情,国外有如:苹果Siri,微软小娜,Google Assista....
发表于 2019-10-16 16:11 33次阅读
声音前处理技术可助力智能语音的市场发展

虚拟现实技术在人机交互领域的新体验

现在的科技发展是真的很快,随着科技的发展又出现了一个新的词汇,那就是虚拟现实全景,很多人都不知道它是....
发表于 2019-10-14 15:12 65次阅读
虚拟现实技术在人机交互领域的新体验

人机交互新时代下语音合成技术还需趋利避害

今年以来,我国连续第三次将人工智能写入政府工作报告之中,且提出“智能+”新概念;国内35所高校成功建....
发表于 2019-10-13 09:01 59次阅读
人机交互新时代下语音合成技术还需趋利避害

口音已成为语音识别技术发展的一大难题

语音对于人机交互的重要性毋庸置疑,无论是国内外企业,都在语音识别的速度、准确度以及多语种方面持续创新....
发表于 2019-10-12 14:30 136次阅读
口音已成为语音识别技术发展的一大难题

智能语音交互系统是智能音箱的核心技术

世界巨头都在争夺智能音箱通往AI的这个超级入口,但并不代表这个入口就已经足够的成熟,只是巨头们不想错....
发表于 2019-10-12 14:25 280次阅读
智能语音交互系统是智能音箱的核心技术

快商通首席科学家:语音识别的后半段路,从语言处理...

发表于 2019-10-11 23:11 52次阅读
快商通首席科学家:语音识别的后半段路,从语言处理...

银行服务业将推动语音识别技术的市场发展

据Marketsandmarkets的语音识别市场的最新报告显示,该市场未来五年(2019年-202....
发表于 2019-10-11 10:22 576次阅读
银行服务业将推动语音识别技术的市场发展

如何利用MCU实现语音识别?

在万物互联的世界中,越来越多能够理解语音内容的电子设备逐渐进入我们的视线。在智能手机、平板电脑和笔记本等拥有S...
发表于 2019-10-11 06:58 25次阅读
如何利用MCU实现语音识别?

如何利用Tensorflow编写一个基本的端到端...

这一方法会计算出音频信号的短时傅里叶变换(Short-time Fourier Transform)....
发表于 2019-10-09 15:08 209次阅读
如何利用Tensorflow编写一个基本的端到端...

人工智能时代下语音识别技术将成为趋势

语音识别是人工智能趋势潮头,从2011年iPhone4S手机首次搭载Siri,语音助手正式登上历史舞....
发表于 2019-10-08 16:29 73次阅读
人工智能时代下语音识别技术将成为趋势

语音识别的现状如何?

语音识别技术的最重大突破是隐含马尔科夫模型Hidden Markov Model的应用。从Baum提出相关数学推理,经过Labiner等...
发表于 2019-10-08 14:29 59次阅读
语音识别的现状如何?

基于GPRS技术的污水处理监测系统设计

GPRS无线网络可为系统提供了简单有效的通信传输手段。中国移动GPRS系统可提供广域的无线IP连接。....
发表于 2019-10-04 17:06 518次阅读
基于GPRS技术的污水处理监测系统设计

谷歌宣布开源Android语音识别转录工具 ——...

无限流媒体音频带来了一大挑战。在许多国家,网络数据非常昂贵,并且在互联网较差的地方,带宽可能有限。L....
发表于 2019-10-01 17:03 232次阅读
谷歌宣布开源Android语音识别转录工具 ——...

语音识别系统市场前景及发展趋势

在新兴产业市场需求的推动下,语音识别的市场也是十分具有看头的,有研究机构指出,预计到2020年,全球....
发表于 2019-10-01 09:53 93次阅读
语音识别系统市场前景及发展趋势

语音识别系统功能_语音识别系统的应用

对比语音识别技术的两个发展方向,由于基于不同的运算平台,因此具有不同的特点。大词汇量连续语音识别系统....
发表于 2019-10-01 09:21 54次阅读
语音识别系统功能_语音识别系统的应用

语音识别芯片的原理_语音识别芯片有哪些

语音识别芯片也叫语音识别IC,与传统的语音芯片相比,语音识别芯片最大的特点就是能够语音识别,它能让机....
发表于 2019-10-01 08:46 59次阅读
语音识别芯片的原理_语音识别芯片有哪些

智能家居新的增长点——离线语音

在阿里巴巴以天猫精灵的智能音箱为核心载体,大举进军智能家居市场的形势下,也许带给业界的有两点思考:智....
发表于 2019-09-30 15:07 268次阅读
智能家居新的增长点——离线语音

智能人机交互系统能为你的生活带来什么便利?

众所周知,人工智能从感知智能到认知智能就是要让机器人能够理解,能够思考,能够交流。这是目前人工智能研....
发表于 2019-09-30 11:15 314次阅读
智能人机交互系统能为你的生活带来什么便利?

重庆电力人机交互自助业务智能终端预计11月正式投...

重庆电力物资公司今年以来,着力优化营商环境,以为供应商提供优质服务为导向,通过建立健全管理体制,培养....
发表于 2019-09-30 11:12 325次阅读
重庆电力人机交互自助业务智能终端预计11月正式投...

郑州大学在人机交互传感器研究方面取得进展

该研究利用摩擦纳米发电机技术,发展了一种基于呼吸的自驱动人机交互传感器。由气流驱动的摩擦纳米发电机能....
发表于 2019-09-30 11:10 289次阅读
郑州大学在人机交互传感器研究方面取得进展

新一代人工智能创新试验区迎来又一轮的扩围

“近期,市有关方面与科技部进行了初步的沟通,计划依托高新区申报新一代人工智能创新发展试验区。为了给试....
发表于 2019-09-30 10:48 339次阅读
新一代人工智能创新试验区迎来又一轮的扩围

电子纸显示屏的人机交互体验怎么实现?

电子纸显示屏是一种全新显示屏,具有功耗低、阅读舒适等优点。作为一种新型显示屏技术,电子纸显示屏催生了众多创新性...
发表于 2019-09-29 09:43 89次阅读
电子纸显示屏的人机交互体验怎么实现?

赛普拉斯加码车载与物联网两大市场

就汽车产业而言,赛普拉斯认为,汽车自动化、电动化、网联化以及人机交互这四大方面将迎来巨大变革,而这些....
发表于 2019-09-28 07:10 453次阅读
赛普拉斯加码车载与物联网两大市场

智能语音将成为未来商业变革的核心技术

过去几年,谷歌、微软、亚马逊、百度等全球科技巨头纷纷押注语音赛道,投影在人们面前的是接踵而至的明星语....
发表于 2019-09-27 16:46 294次阅读
智能语音将成为未来商业变革的核心技术

语音识别的下一段路应该怎么走

人工智能的发展需要与深度学习和大数据紧密结合,中国在数据资源这一方面的优势,是毋庸置疑的。
发表于 2019-09-27 10:24 92次阅读
语音识别的下一段路应该怎么走

新一代人工智能创新试验区扩围在即

近期,市有关方面与科技部进行了初步的沟通,计划依托高新区申报新一代人工智能创新发展试验区。为了给试验....
发表于 2019-09-27 09:58 385次阅读
新一代人工智能创新试验区扩围在即

AI语音识别技术在未来将应用于方方面面

在互联网人工智能时代,各种语音识别技术正变得越来越智能化和成熟,生活中的手机经常被用于语音识别,而S....
发表于 2019-09-26 17:03 136次阅读
AI语音识别技术在未来将应用于方方面面

语音识别技术将助力农业大数据的高效采集

华智水稻生物技术公司旗下研发的华智育种管家APP,在通过结合百度AI语音自训练平台的模型训练能力与长....
发表于 2019-09-26 16:28 73次阅读
语音识别技术将助力农业大数据的高效采集

如何打破物联网市场高度分散化的现状?

物联网是赛普拉斯的两张名片之一,赛普拉斯对物联网市场的愿景是:打造一个智能化的IoT平台,把所有的东....
发表于 2019-09-26 11:19 427次阅读
如何打破物联网市场高度分散化的现状?

阿里云的语音2.0技术将实现多种物联网设备的语音...

在北京举办的2019阿里云数字地产峰会上,阿里云发布分布式语音解决方案2.0,赋能硬件合作伙伴,以语....
发表于 2019-09-25 16:48 246次阅读
阿里云的语音2.0技术将实现多种物联网设备的语音...

当下语音识别技术的市场发展突飞猛进

近年来,语音识别技术取得了重大进展,并已开始从实验室走向人们的生活。 预计在未来10年内,语音识别技....
发表于 2019-09-25 16:40 210次阅读
当下语音识别技术的市场发展突飞猛进

FreeNeb进军语音界主攻声纹+语音新战场

近年来,全球智能语音市场呈现连年增长的趋势,预计到2020年,全球市场规模将达到191.7亿美元——....
发表于 2019-09-25 16:40 160次阅读
FreeNeb进军语音界主攻声纹+语音新战场

语音识别技术正趋向于智能化方向的发展

在互联网人工智能时代,各种语音识别技术正变得越来越智能化和成熟,生活中的手机经常被用于语音识别,而S....
发表于 2019-09-25 10:45 85次阅读
语音识别技术正趋向于智能化方向的发展

工业机器人的组成结构是怎样的

工业机器人作为一种稳定性较好、可编程、柔性高的机器,到在今天的中国几乎所有的制造行业当中都能看到工业....
发表于 2019-09-25 09:33 231次阅读
工业机器人的组成结构是怎样的

基于嵌入式系统的LCD人机交互菜单该怎么设计?

    近年来,LCD显示器的普及和微处理器向大容量的发展使嵌入式系统的人机交互功能得到了显著的提高。在...
发表于 2019-09-25 06:31 51次阅读
基于嵌入式系统的LCD人机交互菜单该怎么设计?

目前的语音识别技术发展到了什么程度

我们现在的语音识别技术发展到了什么程度?现在确实有非常多的智能设备都使用了语音操控的功能,但是无论是....
发表于 2019-09-24 16:41 98次阅读
目前的语音识别技术发展到了什么程度

离线语音控制并不等于本地语音识别

木瓜电子可以为国内各大家电产商提供离线语音控制的模块和芯片产品,但是没有本地语音识别的方案。这两者区....
发表于 2019-09-23 16:27 103次阅读
离线语音控制并不等于本地语音识别

我国5G商用已经全面展开,将加快网络建设深化融合...

今年以来,世界主要国家加快5G商用,把产业应用作为5G融合创新的重要场景和主阵地,抢抓实体经济数字化....
发表于 2019-09-23 14:27 420次阅读
我国5G商用已经全面展开,将加快网络建设深化融合...

日本东芝公司在语音识别技术上获得重大突破

据日媒报道,日本东芝公司宣布,已开发出使用人工智能(AI)将会议及演讲语音立即转换成易于阅读的文字,....
发表于 2019-09-23 10:53 124次阅读
日本东芝公司在语音识别技术上获得重大突破

人工智能通过语音技术来听懂人类的语言

你可能发现这样的场景,当你坐在沙发上说一声“打开电视机”,不需要遥控器,你就可以尽情观赏电视节目;跟....
发表于 2019-09-23 10:48 92次阅读
人工智能通过语音技术来听懂人类的语言

2019年语音识别技术行业市场发展现状分析

语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生理学、心....
发表于 2019-09-23 10:45 254次阅读
2019年语音识别技术行业市场发展现状分析

离线语音识别控制之命令式语音控制

木瓜电子的销售团队在众多企业推广离线语音控制方案时,经常需要跟用户解释说明在线云端语音识别和我们的离....
发表于 2019-09-20 16:38 97次阅读
离线语音识别控制之命令式语音控制

人工智能七个模式分别应用或以不同的组合应用

超个性化模式被定义为使用机器学习来开发每个个体的文件,然后让该文件学习并随着时间的推移适应各种各样的....
发表于 2019-09-19 11:00 438次阅读
人工智能七个模式分别应用或以不同的组合应用

信息隐私是语音识别技术发展的牺牲品吗

今年以来,科技巨头苹果、谷歌、亚马逊、脸书和微软的语音助手或软件无一例外被爆出“监听门”。有专家表示....
发表于 2019-09-18 16:23 184次阅读
信息隐私是语音识别技术发展的牺牲品吗

未来语音识别技术的发展趋势会如何

语音识别主要趋于远场化和融合化的方向发展,但在远场可靠性还有很多难点没有突破,比如多轮交互、多人噪杂....
发表于 2019-09-18 10:24 165次阅读
未来语音识别技术的发展趋势会如何

目前语音识别的技术现状是怎样的

目前,主流语音识别框架还是由 3 个部分组成:声学模型、语言模型和解码器,有些框架也包括前端处理和后....
发表于 2019-09-18 10:19 133次阅读
目前语音识别的技术现状是怎样的

智能家居的发展方向的四个点

因此可以预见,近年来,将会有很多智能家居平台级厂商相互合作,更多的产品和组件可以实现多平台的互联互通....
发表于 2019-09-17 15:53 561次阅读
智能家居的发展方向的四个点

提升语音识别技术将是智能音箱发展的关键

随着智能家居概念的推广,智能音箱被企业寄予“入口”的厚望,引起大众的关注。尽管智能音箱在国内销量一直....
发表于 2019-09-17 10:32 149次阅读
提升语音识别技术将是智能音箱发展的关键

未来语音识别技术的发展趋势将会怎样

语音识别主要趋于远场化和融合化的方向发展,但在远场可靠性还有很多难点没有突破,比如多轮交互、多人噪杂....
发表于 2019-09-16 16:02 147次阅读
未来语音识别技术的发展趋势将会怎样

语音助手的发展将改变用户的生活方式

汽车的发展也是越来越迅速了,每一年汽车行业都有新东西跟大众见面,而如今的语音交互技术也是越来越好了,....
发表于 2019-09-16 15:58 128次阅读
语音助手的发展将改变用户的生活方式

阿里开源自研语音识别模型DFSMN使用技巧指南

重磅!阿里开源自研语音识别模型DFSMN,准确率高达9604%...
发表于 2019-09-16 06:53 87次阅读
阿里开源自研语音识别模型DFSMN使用技巧指南

设计一个语音识别的模块

我在网上搜索了很多资料,发现都是出于入门级的。并不能够达到我的要求。 我想问问是不是我想的不可实现 1:制定关键...
发表于 2019-09-12 22:34 446次阅读
设计一个语音识别的模块

AI语音识别市场规模怎么样?

语音语义识别是指通过语音信号处理和语义识别,使得计算机自动理解人类口述语言的技术。语音识别主要步骤为信号搜集、...
发表于 2019-09-11 11:52 123次阅读
AI语音识别市场规模怎么样?

通用型AI语音识别芯片音旋风611如何?

近日,国产原生芯片品牌探境科技宣布全球首款通用型AI语音识别芯片——音旋风611(英文名称:Voitist611)目前正式进...
发表于 2019-09-11 11:52 212次阅读
通用型AI语音识别芯片音旋风611如何?

人工智能语音芯片行业的发展趋势如何?

人工智能是近三年来最受关注的核心基础技术,将深刻的改造各个传统行业。人工智能在图像识别、语音识别领域的应用自20...
发表于 2019-09-11 11:52 279次阅读
人工智能语音芯片行业的发展趋势如何?

「Trifo」在德国柏林IFA家电展上推出了新品...

“我们认为做产品一定是刚开始要切入一个千家万户都需要的刚需类产品。什么是刚需类产品?陪你说笑话不是刚....
发表于 2019-09-11 10:34 1160次阅读
「Trifo」在德国柏林IFA家电展上推出了新品...

泛在电力物联网建设进入大规模招标阶段

电力行业专家在接受上证报采访时表示,泛在电力物联网建设目的,一方面是要提高电网内部业务信息化水平,另....
发表于 2019-09-10 10:15 437次阅读
泛在电力物联网建设进入大规模招标阶段

谷歌推出全新低功耗的离线语音识别模型

语音识别是Siri、Alexa和Google等智能手机的重要组成部分,但这些语音识别系统有一个很大的....
发表于 2019-09-09 15:48 119次阅读
谷歌推出全新低功耗的离线语音识别模型

AI助力语音识别技术获得突飞猛进的发展

随着人工智能技术的不断突破,AI也更多的应用于人类生活。在谈人工智能的时候,一定不能不谈语音识别,在....
发表于 2019-09-09 15:44 105次阅读
AI助力语音识别技术获得突飞猛进的发展

第18届世界商业领袖圆桌会议举行

新加坡国立大学终身教授、IEEE Fellow、快商通首席科学家李海洲,阿里巴巴CEO助理、集团副总....
发表于 2019-09-09 11:20 948次阅读
第18届世界商业领袖圆桌会议举行

对于语音助手分类的三个层次你了解多少

现在的手机都是有着手机语音助手,虽说有时候语音助手的识别率并不是很高,但是在某种方面来说,语音助手的....
发表于 2019-09-06 16:09 139次阅读
对于语音助手分类的三个层次你了解多少

从大的方面来说语音交互可以分为三大主线

相信大家如今在用智能手机的时候,很多时候都会用语音助手来帮助自己。但其实你知道,如今大部分汽车的汽车....
发表于 2019-09-06 16:02 87次阅读
从大的方面来说语音交互可以分为三大主线

人工智能的到来人类会失去工作吗

机器人取代流水线工人、快译机取代翻译、虚拟主播取代主持人、智慧医疗取代放射科医生,随着人工智能技术的....
发表于 2019-09-05 16:05 499次阅读
人工智能的到来人类会失去工作吗

谷歌研发语音识别转文字工具Live Transc...

谷歌在其开源博客中宣布开源 Android语音识别转录工具——Live Transcribe的语音引....
发表于 2019-09-04 16:24 104次阅读
谷歌研发语音识别转文字工具Live Transc...

德累斯顿工业大学在人类语音识别领域的创新

在许多家庭中,没有语言助理的生活是不可想象的 - 他们可以打开或关闭设备,报道来自世界各地的新闻或知....
发表于 2019-09-04 16:18 190次阅读
德累斯顿工业大学在人类语音识别领域的创新

人机交互的发展为触控应用领域带来新机遇

2019年世界机器人大会圆满召开,为观众带来叹为观止的场景应用,机器人端茶倒水、跳舞、导航引路,随着....
发表于 2019-09-04 11:14 753次阅读
人机交互的发展为触控应用领域带来新机遇

语音识别搭配AI技术将提升孩子的阅读能力

关于移动设备和应用程序对于孩子的正面和负面影响仍存在争论,有些家长将其当做更好的学习工具,而有些家长....
发表于 2019-09-04 11:03 66次阅读
语音识别搭配AI技术将提升孩子的阅读能力

搜狗的语音+唇语新技术让语音识别更加准确

搜狗AI正在朝着这一步迈进:由人类说一段话,AI根据唇形和语音准确识别内容。最近搜狗与清华天工研究院....
发表于 2019-09-04 10:58 89次阅读
搜狗的语音+唇语新技术让语音识别更加准确