0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于语音识别在人工智能时代作用和分析介绍

英特尔物联网 来源:djl 2019-09-11 10:39 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

智能时代,语音识别

神经网络深度学习

语音识别技术方便于长辈们融入海量数据的互联网时代,成为长辈们与外界交流的一大利器。不过,千万不要认为在未来人工智能时代中的语音识别仅仅是单纯运用到手机聊天中的识别录入文字。语音识别技术随着深度学习及高性能计算的不断发展,正逐渐从实验室迈向工业领域。

语音识别简史

1952年,美国AT&T贝尔实验室开发出了第一个基于电子计算机的语音识别系统Audrey,其可以识别10个英文数字,准确率为98%;进入60年代,语音识别领域的两大突破是线性预测编码,以及动态时间规整技术;

在60年代后期,隐马尔可夫模型被Leonard E. Baum等人提出,HMM的提出是语音识别历史上的一个重大突破,使当时语音识别的错误率大大降低;李开复等人则在1988年第一次实现了基于HMM的大词汇量语音识别系统Sphinx。

另一方面,早在上世纪80年代,人工神经网络已经被引入语音识别。起初人工神经网络的结构多为简单的多层感知机,但受限于当时的计算能力以及语音数据的稀少,人工神经网络并没有在识别率上带来很大的提升。

近年来,随着计算能力的提升和语音数据的增加,神经网络被广泛应用于语音识别任务中。深度神经网络技术的出现,也进一步提高了大规模连续语音识别的性能,目前已经成为学术界和工业界研究的热点内容之一。

语音识别的技术支持

目前,在语音识别领域广泛采用的神经网络有时延神经网络、深度神经网络、卷积神经网络、递归神经网络以及基于长短期记忆的RNN等。

通常将这些深度神经网络模型与HMM模型结合构建完整的声学模型,并结合语言模型等提升语音识别性能。

在语言模型方面,虽然传统的N元模型一直是主流技术,但基于神经网络的语言模型从2012年开始被较为广泛的研究,如RNN-LM、LSTM-LM等。

鉴于基于神经网络的语言模型的计算量较大,一般先利用N元模型初始化,然后再用基于神经网络的语言模型重打分,即神经网络语言模型并不直接用于解码,而是在基线系统解码结果的基础上进行得分重估。

同时,RNN-CTC的出现使得语音识别摆脱了传统方法中声学模型、语言模型、解码器等模块化的束缚,通过采用对输入输出序列直接建模的方法,只需训练一个神经网络模型即可进行识别,因此被称为端到端语音识别。

端到端的模型可以解决传统方法中各个模型训练目标不一致的问题。另外,由于实际中可获取的文本数据比语音数据多得多,所以往往还会用文本数据训练一个更好的语言模型,与CTC神经网络结合使用。

深度神经网络用于人工智能应用的问题在于其实时率等性能指标还需有待提高,但是端到端语音识别开辟了人工智能的一个新方向,而且训练的过程相对简单,因此人工智能方向上的端到端识别将会是未来的技术趋势之一。此外人工智能再进一步改进网络结构、改进训练方法,逐步使人工智能性能达到工业水平和要求,进入商用阶段指日可待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4829

    浏览量

    106843
  • 语音识别
    +关注

    关注

    39

    文章

    1804

    浏览量

    115584
  • 人工智能
    +关注

    关注

    1813

    文章

    49773

    浏览量

    261749
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI人工智能语音识别控制模块:自定义命令词,全维度落地应用场景

    AI人工智能语音识别控制模块是一种集成了语音识别、自然语言处理和智能控制功能的电子设备或系统。用
    的头像 发表于 12-03 16:34 453次阅读

    语音识别芯片有哪些(语音识别芯片AT680系列)

    人工智能技术飞速发展的今天,语音识别芯片作为人机交互的重要桥梁,正逐渐成为各类智能设备不可或缺的核心部件。与传统的语音芯片不同,
    的头像 发表于 11-14 17:11 1043次阅读

    什么是离线语音识别芯片(离线语音识别芯片有哪些优点)

    离线语音识别芯片,是一种集成了语音信号采集、前端处理和本地识别功能的专用集成电路,无须联网也可以进行语音控制。它内设先进的数字信号处理模块及
    的头像 发表于 10-31 15:27 294次阅读

    如何选择合适的语音识别芯片型号

    语音识别芯片(又称语音识别IC)是现代智能设备的核心组件,与传统语音芯片相比,其最大特点是能够主
    的头像 发表于 10-30 16:32 474次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:23

    关于人工智能处理器的11个误解

    应用,以及哪些是真实情况而哪些只是炒作,仍存在诸多误解。GPU是最佳的人工智能处理器尽管GPU在人工智能的实现过程中发挥了关键作用,而且如今它们的应用也极为广泛,但将其推
    的头像 发表于 08-07 13:21 887次阅读
    <b class='flag-5'>关于</b><b class='flag-5'>人工智能</b>处理器的11个误解

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模
    发表于 07-04 11:10

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    人工智能快速发展的今天,语音机器人逐渐成为人们生活和工作中的得力助手。明远智睿SSD2351开发板凭借强大性能与丰富功能,为语音机器人的发展注入新动力,成为该领域的变革力量。 SSD2351开发板
    发表于 05-28 11:36

    人工智能视觉识别技术的应用领域及场景

    人工智能视觉识别技术的应用领域及场景
    的头像 发表于 03-14 11:41 2319次阅读

    语音识别技术在通信领域中的应用实例

    语音识别技术也被称为自动语音识别(Automatic Speech Recognition,ASR),是通过计算机对语音信号进行
    的头像 发表于 02-21 17:12 1081次阅读

    详解语音识别技术在通信领域中的应用

    语音识别技术也被称为自动语音识别(Automatic Speech Recognition,ASR),是通过计算机对语音信号进行
    的头像 发表于 02-21 17:05 1040次阅读
    详解<b class='flag-5'>语音</b><b class='flag-5'>识别</b>技术在通信领域中的应用

    【「嵌入式系统设计与实现」阅读体验】+ 基于语音识别智能杯垫

    项目二维码下图 该作品通过采集饮水数据,多种交互方式,数据分析处理,提醒用户定期饮水,达到保持健康的作用。 主要功能是语音识别。 ASR-PRO语音
    发表于 01-02 18:15

    基于语音识别智能会议系统具备哪些交互功能

    标贝科技专注智能语音交互领域多年,在语音识别语音合成领域有着多项大型企业合作案例,标贝与多个智能
    的头像 发表于 12-20 10:35 905次阅读

    标贝智能语音识别在智能会议场景中的落地案例

    标贝科技专注智能语音交互领域多年,在语音识别语音合成领域有着多项大型企业合作案例,标贝与多个智能
    的头像 发表于 12-20 10:31 1038次阅读
    标贝<b class='flag-5'>智能</b><b class='flag-5'>语音</b><b class='flag-5'>识别在</b><b class='flag-5'>智能</b>会议场景中的落地案例