0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅析语音识别技术的发展历程

汽车玩家 来源:旺龙ITLONG、eepw、个人图书 作者:旺龙ITLONG、eepw、个 2022-02-07 10:43 次阅读

语音识别,通常称为自动语音识别,主要是将人类语音中的词汇内容转换为计算机可读的输入,也有可能是按键、二进制编码或者字符序列。但是,我们一般理解的语音识别其实都是狭义的语音转文字的过程,简称语音转文本识别,主要是识别和确认发出语音的人而非其中所包含的内容。

语音识别的目的就是让机器听懂人类口述的语言,包括了两方面的含义:一是逐字逐句听懂而不是转化成书面的语言文字;二是对口述语言中所包含的命令或请求加以领会,做出正确回应,而不仅仅只是拘泥于所有词汇的正确转换。

语音识别系统根据对输入语音的限制分类,可以将识别系统分为三类:

①特定人语音识别系统,仅考虑对于专人的话音进行识别。

②非特定人语音系统,识别的语音与人无关,通常要用大量不同人的语音数据库对识别系统进行学习。

③多人的识别系统,通常能识别一组人的语音,或者成为特定组语音识别系统,该系统仅要求对要识别的那组人的语音进行训练。

根据从说话的方式考虑,也可以将识别系统分为三类:

①孤立词语音识别系统,孤立词识别系统要求输入每个词后要停顿。

②连接词语音识别系统,连接词输入系统要求对每个词都清楚发音,一些连音现象开始出现。

③连续语音识别系统,连续语音输入是自然流利的连续语音输入,大量连音和变音会出现。

在过去5-10年,随着技术快速迭代,语音识别市场在我国得到飞快发展,目前处于深度神经网络阶段。如今,语音识别主流厂商主要使用端到端的算法,在实验环境准确率可高达99%以上,为推动新基建发展,5G人工智能云计算等作为辅助核心基础设施的核心技术得到进一步加速发展,带动语音识别迎来迎来了更加广阔的发展空间,智能家居智能音箱智能车载和智能硬件等等都得到很好的广泛应用。

语音识别主要趋于远场化和融合化的方向发展,但在远场可靠性还有很多难点没有突破,比如多轮交互、多人噪杂等场景还有待突破,还有需求较为迫切的人声分离等技术。新的技术应该彻底解决这些问题,让机器听觉远超人类的感知能力。这不能仅仅只是算法的进步,需要整个产业链的共同技术升级,包括更为先进的传感器和算力更强的芯片

单从远场语音识别技术来看,仍然存在很多挑战,包括:

回声消除技术。由于喇叭非线性失真的存在,单纯依靠信号处理手段很难将回声消除干净,这也阻碍了语音交互系统的推广,现有的基于深度学习的回声消除技术都没有考虑相位信息,直接求取的是各个频带上的增益,能否利用深度学习将非线性失真进行拟合,同时结合信号处理手段可能是一个好的方向。

噪声下的语音识别仍有待突破。信号处理擅长处理线性问题,深度学习擅长处理非线性问题,而实际问题一定是线性和非线性的叠加,因此一定是两者融合才有可能更好地解决噪声下的语音识别问题。

语音识别的目的是让机器可以理解人类,因此转换成文字并不是最终的目的,如何将语音识别和语义理解结合起来可能是未来更为重要的一个方向。语音识别里的LSTM已经考虑了语音的历史时刻信息,但语义理解需要更多的历史信息才能有帮助,因此如何将更多上下文会话信息传递给语音识别引擎是一个难题。

让机器听懂人类语言,仅靠声音信息还不够,“声光电热力磁”这些物理传感手段,下一步必然都要融合在一起,只有这样机器才能感知世界的真实信息,这是机器能够学习人类知识的前提条件;而且,机器必然要超越人类的五官,能够看到人类看不到的世界,听到人类听不到的世界。

未来,相信在国家政策的强力扶持下,能够加速在垂直行业的渗透和布局,也相信在供应商和开发者共同努力下,语音识别技术能够更好地与其他语音交互技术及软件功能融合,为消费者提供更优质的体验。

文章整合自:旺龙ITLONG、eepw、个人图书馆

审核编辑:鄢孟繁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    37

    文章

    1635

    浏览量

    111838
  • 机器
    +关注

    关注

    0

    文章

    756

    浏览量

    40491
  • 二进制编码
    +关注

    关注

    0

    文章

    7

    浏览量

    2961
收藏 人收藏

    评论

    相关推荐

    语音识别技术历程及工作原理

    语音识别的本质是一种基于语音特征参数的模式识别,即通过学习,系统能够把输入的语音按一定模式进行分类,进而依据判定准则找出最佳匹配结果。
    的头像 发表于 03-22 16:58 837次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>的<b class='flag-5'>技术</b><b class='flag-5'>历程</b>及工作原理

    浅谈情感语音识别技术发展与未来趋势

    一、引言 情感语音识别是一种新兴的人工智能技术,它通过分析人类语音中的情感信息,实现人机之间的情感交互。本文将探讨情感语音
    的头像 发表于 11-30 11:06 379次阅读

    情感语音识别技术发展与挑战

    一、引言 情感语音识别是人工智能领域的重要研究方向,它通过分析人类语音中的情感信息,实现人机之间的情感交互。本文将探讨情感语音识别
    的头像 发表于 11-28 18:26 266次阅读

    离线语音识别及控制是怎样的技术

    引言:  随着人工智能的飞速发展,离线语音识别技术成为了一项备受瞩目的创新。离线语音识别
    发表于 11-24 17:41

    情感语音识别技术的挑战与未来发展

    情感语音识别技术作为人工智能领域的重要分支,已经取得了显著的进展。然而,在实际应用中,情感语音识别技术
    的头像 发表于 11-16 16:48 218次阅读

    情感语音识别技术发展趋势与前景

    一、引言 情感语音识别技术是近年来人工智能领域的研究热点之一,它通过分析人类语音中的情感信息实现更加智能化和个性化的人机交互。本文将探讨情感语音
    的头像 发表于 11-16 16:13 253次阅读

    情感语音识别的前世今生

    的支持。本文将探讨情感语音识别的前世今生,包括其发展历程、应用场景、面临的挑战以及未来发展趋势。 二、情感
    的头像 发表于 11-12 17:33 342次阅读

    情感语音识别技术的应用与未来发展

    一、引言 随着科技的飞速发展,情感语音识别技术已经成为人机交互的重要发展方向。情感语音
    的头像 发表于 11-12 17:30 371次阅读

    语音识别技术的行业应用与发展趋势

    一、引言 随着科技的不断发展语音识别技术已经渗透到各个行业中,并逐渐改变着人们的生活方式。本文将探讨语音
    的头像 发表于 10-18 16:10 377次阅读

    语音识别技术的优化与发展趋势

    一、引言 语音识别技术是一种将人类语音转化为计算机可理解数据的技术。随着人工智能和深度学习的发展
    的头像 发表于 10-12 18:33 417次阅读

    语音识别技术:现状、挑战与未来发展

    一、引言 语音识别技术是一种将人类语音转化为计算机可读文本的技术,它在许多领域都有广泛的应用,如智能助手、智能家居、医疗诊断等。本文将探讨
    的头像 发表于 10-12 16:57 1228次阅读

    语音识别技术的应用及优化

    一、引言 语音识别技术是一种能够让计算机“听懂”人类语言的技术。随着科技的不断发展语音
    的头像 发表于 10-10 17:26 1013次阅读

    语音识别技术的进步与挑战

    一、引言 在当今数字化时代,语音识别技术已经成为人机交互的重要方式之一。本文将探讨语音识别技术
    的头像 发表于 09-22 18:29 456次阅读

    语音识别技术:未来人机交互的重要接口

    随着科技的快速发展,人类对机器的操控方式也在不断寻求创新。其中,语音识别技术作为人机交互的重要接口,正在越来越多地被应用于各个领域。本文将深入探讨
    的头像 发表于 09-19 18:13 526次阅读

    语音识别发展 Python进行语音识别案例

      摘要:随着信息化时代的快速到来以及计算机技术的不断完善发展语音识别在众多领域都得到了应用,同时语音
    发表于 07-19 14:32 4次下载