0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音识别技术的发展史

454398 来源:工程师吴畏 2019-04-30 11:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从前年开始,海外谷歌、亚马逊、苹果、微软、三星,国内阿里、小米、京东等都已先后涉足智能音箱这一领域。随着其快速发展,作为核心技术之一的语音识别技术也逐步进入人们的视线,本篇我们就来谈谈语音识别技术。

语音识别技术简介

语音识别,也被称为自动语音识别(Automatic Speech Recognition,ASR)技术,就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术,也就是让机器听懂人类的语音。

所谓听懂,有两层意思,一是指把用户所说的话逐词逐句转换成文本;二是指正确理解语音中所包含的要求,作出正确的应答。

语音识别技术目前在桌面系统、智能手机、导航设备等嵌入式领域均有一定程度的应用。

语音识别系统及过程

不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统的实现过程如下图所示。

语音识别的基本过程有两个部分组成。一是学习和训练,二是识别过程。

训练(Training):预先分析出语音特征参数,制作语音模板(Template)并存放在语音参数库中。

识别(Recognition):待识语音经过与训练时相同的分析,得到语音参数,将它与库中的参考模板一一比较,并采用判决的方法找出最接近语音特征的模板,得出识别效果。

语音识别系统的分类

(1)根据对说话人说话方式的要求,可以分为孤立字(词)语音识别系统,连接字语音识别系统以及连续语音识别系统。

孤立单词识别(Isolated Word Recognition):识别的单元为字、词或短语,它们组成识别的词汇表(Vocabulary),对它们中的每一个通过训练建立模板或模型。

连续单词识别(Connected Word Recognition):以比较少的词汇为对象,能够完全识别每个词。识别的词汇表和标准样板或模型也是字、词或短语,但识别时可以是它们中间几个的连续。

连续语音识别(Continuous Speech Recognition):以多数词汇为对象,待识语音是一些完整的句子。虽不能完全准确识别每个单词,但能够理解其意义,连续语音识别也叫会话语音识别。可理解为在语音识别之后,根据语言学知识来推断语音的含义内容。

(2)根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统。

特定人语音识别(Speaker-Dependent):语音识别的标准模板或模型只适应于某个人。实际上,该模板或模型就是该人通过输入词汇表中的每个字、词或短语的语音建立起来的。其他人使用时,需同样建立自己的标准模板或模型。

非特定人语音识别(Speaker-Independent):语音识别的标准模板或模型适应于指定的某一范畴的说话人(比如标准普通话),标准模板或模型由该范畴的多个人通过训练而产生。识别时可供参加训练的发音人使用,也可供未参加训练的同一范畴的发音人使用。

(3)根据词汇量大小,可以分为有限词汇以及无限词汇量语音识别系统。

有限词汇识别:按词汇表中字、词或短句个数的多少,大致分为:100以下小词汇量;100-1000中等词汇量;1000以上为大词汇量。

无限词汇识别(全音节识别):当识别基元为汉语普通话中对应所有汉字的可读音节时,称其为全音节语音识别,是实现无线词汇或中文文本输入的基础。

语音识别技术的“前世今生”

下面我们来看看语音识别技术的“前世今生”:

(1)起始阶段

1952年AT& T Bell实验室实现了一个单一发音人孤立发音的十个英文数字的语音识别系统,方法主要是度量每个数字的元音音段的共振峰。

1960年英国的Denes等人研究成功了第一个计算机语音识别系统。在此期间,提出的一些思想沿用至今。

理论:模式识别思想、动态规划算法、时间规划算法、动态因素跟踪法。

(2)快速发展阶段

70年代孤立词发音和孤立语句发音的识别成为了可行的有用技术,大规模的语音识别研究在这个时期得到很大的发展。

80年代研究的重点转向了词汇量的积累,以及连续的语音识别,也就是从传统的基于标准模板匹配的技术思路转变基于统计模型的技术思路。此外,再次提出了将神经网络技术引入语音识别的技术思路。

理论:声学模型—隐马尔科夫模型(Hidden Markov Model,HMM)

语言模型—N-gram模型

(3)应用开发

90年代,语音识别研究的重点转向自然语言的识别处理,任务转移到航空旅行信息的索取。同时,语音识别技术不断应用于电话网络,增强话务员服务和自动化。

2000年以来,人机语音交互成为研究的焦点。研究重点包括即兴口语的识别和理解,自然口语对话,以及多语种的语音同声翻译。

理论:声学模型—隐马尔科夫模型—深度神经网络(Deep Neural Network,DNN)

语言模型—N-gram模型—反馈神经网络(Feedback Neural Network,FNN)

语音识别领域公司

科大讯飞,腾讯,百度,苏州思必驰,捷通华声,云知声等等。

结语

随着语音识别技术的不断发展,无论是Siri、Echo,还是其他的智能语音助手都可以接触和管理消息、邮件和日程帐号,还能控制联网家居,播放音乐,甚至完成网络搜索或者更多的事情。而我们,只需满怀期待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    39

    文章

    1803

    浏览量

    115559
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    语音识别芯片有哪些(语音识别芯片AT680系列)

    在人工智能技术飞速发展的今天,语音识别芯片作为人机交互的重要桥梁,正逐渐成为各类智能设备不可或缺的核心部件。与传统的语音芯片不同,
    的头像 发表于 11-14 17:11 1024次阅读

    什么是离线语音识别芯片(离线语音识别芯片有哪些优点)

    离线语音识别芯片,是一种集成了语音信号采集、前端处理和本地识别功能的专用集成电路,无须联网也可以进行语音控制。它内设先进的数字信号处理模块及
    的头像 发表于 10-31 15:27 267次阅读

    如何选择合适的语音识别芯片型号

    语音识别芯片(又称语音识别IC)是现代智能设备的核心组件,与传统语音芯片相比,其最大特点是能够主动识别
    的头像 发表于 10-30 16:32 461次阅读

    语音识别系统的技术核心:从声音到文字的智能转换

          语音识别技术,也称为自动语音识别(ASR),其核心目标是将人类语音信号转换为对应的文
    的头像 发表于 09-05 14:04 554次阅读

    瑞芯微RK3576语音识别算法

    1.语音识别简介语音识别技术,也被称为自动语音识别
    的头像 发表于 08-15 15:13 1856次阅读
    瑞芯微RK3576<b class='flag-5'>语音</b><b class='flag-5'>识别</b>算法

    语音识别---大家怎么看呢?

    语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,
    发表于 08-09 10:54

    语音识别芯片选型有哪些技术参数要注意

    语音识别芯片的使用场景越来越多涉及的范围也越来越广!那么语音芯片的选型就很重要了,选型不对直接影响产品的使用体验,下面小编从不同的维度来给大家介绍语音
    的头像 发表于 06-23 17:31 673次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片选型有哪些<b class='flag-5'>技术</b>参数要注意

    普强信息入选2024语音识别技术公司TOP30榜单

    普强凭借在语音识别领域多年的技术积淀与持续的创新突破,成功入选“2024语音识别技术公司TOP3
    的头像 发表于 04-18 17:25 1005次阅读

    半导体材料发展史:从硅基到超宽禁带半导体的跨越

    半导体材料是现代信息技术的基石,其发展史不仅是科技进步的缩影,更是人类对材料性能极限不断突破的见证。从第一代硅基材料到第四代超宽禁带半导体,每一代材料的迭代都推动了电子器件性能的飞跃。 1 第一代
    的头像 发表于 04-10 15:58 2304次阅读

    厂家芯资讯|广州唯创电子语音识别芯片技术解析

    ​一、公司及产品概述作为国内领先的语音芯片研发企业,深耕语音技术领域25年,其产品以高稳定性、低功耗和多场景适应性著称。公司推出的语音识别
    的头像 发表于 03-19 08:46 649次阅读
    厂家芯资讯|广州唯创电子<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片<b class='flag-5'>技术</b>解析

    语音识别技术在通信领域中的应用实例

    语音识别技术也被称为自动语音识别(Automatic Speech Recognition,ASR),是通过计算机对
    的头像 发表于 02-21 17:12 1066次阅读

    详解语音识别技术在通信领域中的应用

    语音识别技术也被称为自动语音识别(Automatic Speech Recognition,ASR),是通过计算机对
    的头像 发表于 02-21 17:05 1032次阅读
    详解<b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>技术</b>在通信领域中的应用

    离线语音识别技术引领智能语音灯具市场——NRK3502

    智能语音灯具集高科技与人性化设计,内置NRK3502离线语音识别芯片,支持远场识别与自定义指令,提供便捷智能体验,推动智能家居行业发展
    的头像 发表于 12-30 15:04 1212次阅读
    离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>技术</b>引领智能<b class='flag-5'>语音</b>灯具市场——NRK3502

    基于语音识别的智能会议系统具备哪些交互功能

    标贝科技专注智能语音交互领域多年,在语音识别语音合成领域有着多项大型企业合作案例,标贝与多个智能会议系统厂商合作,成功将语音
    的头像 发表于 12-20 10:35 895次阅读

    浅谈显示屏的发展史

    显示器如今已成为日常办公、娱乐不可或缺的一部分,它是人们与机器之间交互的窗口,随着显示器技术的不断发展,也让人机交互体验提升了一个又一个新的台阶,时至今日,历经超100年的发展。从早期的黑白世界到彩色世界,显示器走过了漫长而艰辛
    的头像 发表于 12-18 09:12 3767次阅读