0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音识别技术的发展史

454398 来源:工程师吴畏 2019-04-30 11:49 次阅读

从前年开始,海外谷歌、亚马逊、苹果、微软、三星,国内阿里、小米、京东等都已先后涉足智能音箱这一领域。随着其快速发展,作为核心技术之一的语音识别技术也逐步进入人们的视线,本篇我们就来谈谈语音识别技术。

语音识别技术简介

语音识别,也被称为自动语音识别(Automatic Speech Recognition,ASR)技术,就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术,也就是让机器听懂人类的语音。

所谓听懂,有两层意思,一是指把用户所说的话逐词逐句转换成文本;二是指正确理解语音中所包含的要求,作出正确的应答。

语音识别技术目前在桌面系统、智能手机、导航设备等嵌入式领域均有一定程度的应用。

语音识别系统及过程

不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统的实现过程如下图所示。

语音识别的基本过程有两个部分组成。一是学习和训练,二是识别过程。

训练(Training):预先分析出语音特征参数,制作语音模板(Template)并存放在语音参数库中。

识别(Recognition):待识语音经过与训练时相同的分析,得到语音参数,将它与库中的参考模板一一比较,并采用判决的方法找出最接近语音特征的模板,得出识别效果。

语音识别系统的分类

(1)根据对说话人说话方式的要求,可以分为孤立字(词)语音识别系统,连接字语音识别系统以及连续语音识别系统。

孤立单词识别(Isolated Word Recognition):识别的单元为字、词或短语,它们组成识别的词汇表(Vocabulary),对它们中的每一个通过训练建立模板或模型。

连续单词识别(Connected Word Recognition):以比较少的词汇为对象,能够完全识别每个词。识别的词汇表和标准样板或模型也是字、词或短语,但识别时可以是它们中间几个的连续。

连续语音识别(Continuous Speech Recognition):以多数词汇为对象,待识语音是一些完整的句子。虽不能完全准确识别每个单词,但能够理解其意义,连续语音识别也叫会话语音识别。可理解为在语音识别之后,根据语言学知识来推断语音的含义内容。

(2)根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统。

特定人语音识别(Speaker-Dependent):语音识别的标准模板或模型只适应于某个人。实际上,该模板或模型就是该人通过输入词汇表中的每个字、词或短语的语音建立起来的。其他人使用时,需同样建立自己的标准模板或模型。

非特定人语音识别(Speaker-Independent):语音识别的标准模板或模型适应于指定的某一范畴的说话人(比如标准普通话),标准模板或模型由该范畴的多个人通过训练而产生。识别时可供参加训练的发音人使用,也可供未参加训练的同一范畴的发音人使用。

(3)根据词汇量大小,可以分为有限词汇以及无限词汇量语音识别系统。

有限词汇识别:按词汇表中字、词或短句个数的多少,大致分为:100以下小词汇量;100-1000中等词汇量;1000以上为大词汇量。

无限词汇识别(全音节识别):当识别基元为汉语普通话中对应所有汉字的可读音节时,称其为全音节语音识别,是实现无线词汇或中文文本输入的基础。

语音识别技术的“前世今生”

下面我们来看看语音识别技术的“前世今生”:

(1)起始阶段

1952年AT& T Bell实验室实现了一个单一发音人孤立发音的十个英文数字的语音识别系统,方法主要是度量每个数字的元音音段的共振峰。

1960年英国的Denes等人研究成功了第一个计算机语音识别系统。在此期间,提出的一些思想沿用至今。

理论:模式识别思想、动态规划算法、时间规划算法、动态因素跟踪法。

(2)快速发展阶段

70年代孤立词发音和孤立语句发音的识别成为了可行的有用技术,大规模的语音识别研究在这个时期得到很大的发展。

80年代研究的重点转向了词汇量的积累,以及连续的语音识别,也就是从传统的基于标准模板匹配的技术思路转变基于统计模型的技术思路。此外,再次提出了将神经网络技术引入语音识别的技术思路。

理论:声学模型—隐马尔科夫模型(Hidden Markov Model,HMM)

语言模型—N-gram模型

(3)应用开发

90年代,语音识别研究的重点转向自然语言的识别处理,任务转移到航空旅行信息的索取。同时,语音识别技术不断应用于电话网络,增强话务员服务和自动化。

2000年以来,人机语音交互成为研究的焦点。研究重点包括即兴口语的识别和理解,自然口语对话,以及多语种的语音同声翻译。

理论:声学模型—隐马尔科夫模型—深度神经网络(Deep Neural Network,DNN)

语言模型—N-gram模型—反馈神经网络(Feedback Neural Network,FNN)

语音识别领域公司

科大讯飞,腾讯,百度,苏州思必驰,捷通华声,云知声等等。

结语

随着语音识别技术的不断发展,无论是Siri、Echo,还是其他的智能语音助手都可以接触和管理消息、邮件和日程帐号,还能控制联网家居,播放音乐,甚至完成网络搜索或者更多的事情。而我们,只需满怀期待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    37

    文章

    1635

    浏览量

    111835
收藏 人收藏

    评论

    相关推荐

    浅谈情感语音识别技术发展与未来趋势

    一、引言 情感语音识别是一种新兴的人工智能技术,它通过分析人类语音中的情感信息,实现人机之间的情感交互。本文将探讨情感语音
    的头像 发表于 11-30 11:06 372次阅读

    情感语音识别技术发展与挑战

    一、引言 情感语音识别是人工智能领域的重要研究方向,它通过分析人类语音中的情感信息,实现人机之间的情感交互。本文将探讨情感语音识别
    的头像 发表于 11-28 18:26 259次阅读

    离线语音识别及控制是怎样的技术

    引言:  随着人工智能的飞速发展,离线语音识别技术成为了一项备受瞩目的创新。离线语音识别
    发表于 11-24 17:41

    情感语音识别技术发展与跨文化应用

    一、引言 情感语音识别是人工智能领域的前沿研究领域,它通过分析人类语音中的情感信息,实现更加智能化和个性化的人机交互。随着技术的不断发展,情
    的头像 发表于 11-22 10:54 256次阅读

    情感语音识别技术的挑战与未来发展

    情感语音识别技术作为人工智能领域的重要分支,已经取得了显著的进展。然而,在实际应用中,情感语音识别技术
    的头像 发表于 11-16 16:48 217次阅读

    情感语音识别技术发展趋势与前景

    一、引言 情感语音识别技术是近年来人工智能领域的研究热点之一,它通过分析人类语音中的情感信息实现更加智能化和个性化的人机交互。本文将探讨情感语音
    的头像 发表于 11-16 16:13 251次阅读

    情感语音识别技术的应用与未来发展

    一、引言 随着科技的飞速发展,情感语音识别技术已经成为人机交互的重要发展方向。情感语音
    的头像 发表于 11-12 17:30 367次阅读

    语音识别技术的行业应用与发展趋势

    一、引言 随着科技的不断发展语音识别技术已经渗透到各个行业中,并逐渐改变着人们的生活方式。本文将探讨语音
    的头像 发表于 10-18 16:10 372次阅读

    语音识别技术的优化与发展趋势

    一、引言 语音识别技术是一种将人类语音转化为计算机可理解数据的技术。随着人工智能和深度学习的发展
    的头像 发表于 10-12 18:33 413次阅读

    语音识别技术:现状、挑战与未来发展

    一、引言 语音识别技术是一种将人类语音转化为计算机可读文本的技术,它在许多领域都有广泛的应用,如智能助手、智能家居、医疗诊断等。本文将探讨
    的头像 发表于 10-12 16:57 1214次阅读

    语音识别技术的应用及优化

    一、引言 语音识别技术是一种能够让计算机“听懂”人类语言的技术。随着科技的不断发展语音
    的头像 发表于 10-10 17:26 1010次阅读

    语音识别技术的现状及发展趋势

    一、引言 随着科技的快速发展语音识别技术得到了广泛应用。语音识别
    的头像 发表于 09-28 16:55 1933次阅读

    语音识别技术的进步与挑战

    一、引言 在当今数字化时代,语音识别技术已经成为人机交互的重要方式之一。本文将探讨语音识别技术
    的头像 发表于 09-22 18:29 455次阅读

    语音识别发展 Python进行语音识别案例

      摘要:随着信息化时代的快速到来以及计算机技术的不断完善发展语音识别在众多领域都得到了应用,同时语音
    发表于 07-19 14:32 4次下载

    语音识别技术的概念及应用前景

    解决的问题,就是使得设备可以用听觉感知周围的世界,用声音和人做最自然的交互,让操控和生活更为便捷。 智能语音的基础在于通过神经网络技术,提升语音识别
    发表于 05-27 09:41