0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音识别技术的分类及识别方法

jf_78858299 来源:自动化控制技术控 作者:控侯成敬 2023-04-13 16:03 次阅读

语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车联网也得到了充分的引用,例如在翼卡车联网中,只需按一键通客服人员口述即可设置目的地直接导航,安全、便捷。

语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),(迅 捷ocr文字识别软件)其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

主 要 分 类

根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别(isolated word recognition),关键词识别(或称关键词检出,keyword spotting)和连续语音识别。其中,孤立词识别 的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界”这两个词。

根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比针对特定人的识别困难得多。

另外,根据语音设备和通道,可以分为桌面(PC)语音识别、电话语音识别和嵌入式设备(手机、PDA等)语音识别。不同的采集通道会使人的发音的声学特性发生变形,因此需要构造各自的识别系统。

识 别 方 法

语音识别方法主要是模式匹配法。在训练阶段,用户将词汇表中的每一词依次说一遍,并且将其特征矢量作为模板存入模板库。在识别阶段,将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。

存 在 问 题

1、口音和噪声

语音识别中最明显的一个缺陷就是对口音和背景噪声的处理。

2、语义错误

通常语音识别系统的实际目标并不是误字率。我们更关心的是语义错误率,就是被误解的那部分话语。

3、单通道和多人会话

一个好的会话语音识别器必须能够根据谁在说话对音频进行划分,还应该能弄清重叠的会话(声源分离)。

4、其他领域变化

如:来自声环境变化的混响、硬件造成的伪影、音频的编解码器和压缩伪影、采样率的变化、会话者的年龄不同。

5、上下文相关联判断识别

人类聊天容易基于上下文做判断。机器目前很难做到。

和自然语言识别的区别

语音识别是自然语言识别的一个方向。

广义的“自然语言处理”包含了“语音”,或者说“语音”也是“自然语言”的一种。狭义的“自然语言处理”是指处理及理解文本,简单的理解就是:语音识别的结果成了自然语言处理的原材料来源之一,自然语言处理的结果又成了语音生成的原材料。

它是区别指令式语音而命名,其基本原理都是一致。自然语音识别亮点是自然语言理解功能,即用户可以按照个人的语言习惯,用自己惯用的语气、惯用的词,将需要被识别的语音任务说出来即可。自然语音识别与指令式语音识别主要区别是词库大小及处理方式,指令语音所有处理都是本地进行,自然语音识别目前基本都是采用云处理方式,这样其语音库及处理能力是指令语音无法比拟的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别技术

    关注

    0

    文章

    52

    浏览量

    12780
  • ASR
    ASR
    +关注

    关注

    2

    文章

    34

    浏览量

    18620
  • OCR
    OCR
    +关注

    关注

    0

    文章

    137

    浏览量

    16128
收藏 人收藏

    评论

    相关推荐

    电阻识别方法

    电阻识别方法
    发表于 08-02 21:59

    模式识别的关键技术

    领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安验证方式。而且利用基因算法训练连续隐马尔柯夫模型的语音识别方法现已成
    发表于 12-11 14:17

    LightningChart.NET识别方法

    结构工程中一种非常常见的识别方法,用于识别潜在的结构完整性问题,例如隐藏的物体或空隙。这是一种识别机械问题的
    发表于 08-31 06:11

    一种基于数据融合的身份识别方法

    针对单一生物特征身份识别由于传感器噪音及特征破损等缺陷导致识别率低的问题,从信息融合角度出发,提出一种基于语音和人脸的多生物特征身份识别方法。分别提取
    发表于 01-15 15:23 16次下载

    基于贝叶斯分类研究肌肉动作模式识别方法

    采用贝叶斯分类研究肌肉动作模式识别方法 提出了一种结合AR 模型和贝叶斯分类的肌电信号动作模式识别方法。首先将采集到的肌电信号进行预处理,提取AR 系数作为
    发表于 02-22 16:11 25次下载

    TDK贴片磁珠的型号识别方法

    TDK贴片磁珠的识别方法
    发表于 03-10 17:36 4457次阅读
    TDK贴片磁珠的型号<b class='flag-5'>识别方法</b>

    色环电阻识别方法

    色环电阻识别方法 首先,从电阻的底端,
    发表于 07-17 17:42 1.2w次阅读
    色环电阻<b class='flag-5'>识别方法</b>

    硬盘标识识别方法

    硬盘标识识别方法 Seagate硬盘的编号比较简单,其识别方法为:"ST+硬盘尺寸+容量+主标识+副标识+接口类型"。    为了另大家容易理解,简单的
    发表于 09-04 12:56 6240次阅读

    常用塑料识别方法

    常用塑料识别方法
    发表于 11-19 10:30 495次阅读

    电容的识别方法

    电容的识别方法 电容的识别方法与电阻的识别方法基本相同,分直标法、色标法和数标法3种。 电容的基本单位用法拉(F)表示,其它单位还
    发表于 02-06 18:13 5900次阅读

    电容识别方法及换算

    电容的识别方法与电阻的识别方法基本相同,分直标法、色标法和数标法3种。 电容的基本单位用法拉(F)表示,其它单位还有:毫法(mF
    发表于 06-10 11:57 2573次阅读

    语音情感识别方法

    为有效利用语音情感词局部特征,提出了一种融合情感词局部特征与语音语句全局特征的语音情感识别方法。该方法依赖于
    发表于 11-23 11:16 0次下载

    基于帧级特征的端到端说话人识别方法

    现有的说话人识别方法仍存在许多不足。基于话语级特征输入的端到端方法由于语音长短不一致需要将输入处理为同等大小,而特征训练加后验分类的两阶段方法
    发表于 05-08 16:57 4次下载

    结合MFCC和特征的语音情感识别方法

    语音情感识别中提取梅尔频率倒谱系数(MFC℃)会丢失谱特征信息,导致情感识别准确率较低。为此,提出一种结合MFCC和语谱图特征的语音情感识别方法
    发表于 06-11 11:02 22次下载

    电容的识别方法与电阻的识别方法.pdf

    识别方法: 电容的识别方法与电阻的识别方法基本相同分直标法、色标法和数标法3种电容的基本单位用法拉(F)表示其它单位还有:毫法(mF)、微法(uF)、纳法(nF)、皮法(pF)其中:1法拉=103
    发表于 10-17 09:40 5次下载