电子发烧友网>电子资料下载>人工智能>ASR语音识别技术的介绍应用和优势及实际案例分析

ASR语音识别技术的介绍应用和优势及实际案例分析

3217109 2018-10-17 | pdf | 0.98 MB | 次下载 | 免费

资料介绍

　　ASR（Automatic Speech Recognition）自动语音识别技术是基于关键词语列表识别的技术。每次识别的过程，就是把用户说出的语音内容，通过频谱转换为语音特征，和这个关键词语列表中的条目进行一一匹配，最优匹配的一条作为识别结果。比如在手机的应用中，这个关键词语列表的内容就是电话本中的人名/手机的菜单命令/T 卡中的歌曲名称等，不论这个列表的条目内容是什么，只需要用户设置相关的寄存器，就可以把相应的待识别条目内容以字符形式传递给识别引擎。

　　识别引擎不关心关键词语列表中的关键词语的内容，可以是命令，人名，歌曲名字，操作指令等等任何的汉字字符串。

　　每条关键词语最大可以支持的字数，从算法角度是限制在30字以内。但是从实际情况来看，用户一口气说超过8个字以上的条目时，几乎肯定会出现说错字 /说漏字/说多字/打嗝/停顿等情况，这些情况都会严重影响识别并造成识别错误。因而一般来说如果要获得理想的识别效果，建议每条关键词语的字数不要过长，避免影响效果。

　　ASR技术最重要的意义在于提供了一种脱离按键、鼠标的基于语音的用户界面，使得用户对于产品的操作更自然，相对手动控制更加快捷、方便，可用于智能家电、智能穿戴，声控智能玩具等诸多领域。

　　目前在线语音识别方案价格较高，产品接入复杂周期冗长，响应时间受网络影响。本方案提供的是基于大量语音数据库的非特定人声离线语音识别。本方案具有成本优势，接入简单周期短，识别响应速度快（0.5秒以内），不需要连接网络。整体方案成熟、稳定、可靠，可以让传统产品快速升级智能语音功能。

　　离线语音识别技术，是基于关键词语列表识别的技术。只需要设定好要识别的关键词语列表，通过语音识别系统就可以对用户说出的关键词语进行识别，不需要用户作任何录音训练。