0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智能语音语义在产业化方面有哪些应用

机器人创新生态 来源:未知 作者:工程师郭婷 2018-09-04 14:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

智能语音发展如火如荼

根据《2018中国智能语音行业前景研究报告》,2017年中国的智能语音市场规模已经达到了105.71亿元,比2016年增长了70%,而2018年这个规模预计将继续扩大三分之一,达到159.7亿元。

国内的行业规模越来越大,但从技术角度看,目前的智能语音发展到了什么阶段呢?我们先从头开始说。

上世纪50年代到60年代,语音识别研究着眼于单个字词到连续语音的识别,当时最大的困境是对相关数据的计算能力的低下,这直接导致该时期研究进展极其缓慢。到了70年代,计算机性能大幅提升,之前的问题便不复存在,并且随着计算机软硬件技术的高速发展,该研究已不再受困于计算能力,人们便开始将研究重点放在数据算法的优化提升上,并将这一方向保持至今。

简单来讲,这个方向的问题解决方案是基于一个框架,通过对框架内的各部分进行改进,最终向着识别的极限正确率迈进。各部分中,声学模型和语言模型的构建,则是整个方案中的研究焦点。

80年代末李开复将隐马尔科夫模型与高斯混合模型(GMM)相结合进行语音识别建模,开发出世界上第一个“非特定人连续语音识别系统”,即SPHINX系统。随后,主流的GMM-HMM技术框架的发展日益稳定,但语音识别效果难以转向应用化的局面长时期没有被打破,这意味着语音识别技术又遇到了瓶颈。

转机出现在2006年。这一年,深度学习的概念被辛顿提出,深度神经网络(Deep Neural Network,DNN)研究因此而复苏。2009年,辛顿和他的学生将深度神经网络应用于语音的声学建模上并获得成功。到了2010年前后,微软研究院的俞栋、邓力等人将深度学习在图像领域的突破移植到语音识别领域,使识别错误率降低了20%以上。从此,基于GMM-HMM的语音识别框架被打破,人们开始转向基于DNN-HMM的语音识别模型的研究。

从2011年到2018年,以深度神经网络为基础的语音识别建模技术迅速发展,语音识别乃至语音交互行业呈现出这样一个现象:全世界范围内的企业的建模技术万变不离“深度神经网络”这一宗,虽大同小异但又各显神通。

技术篇:语音识别和NLP技术仍不成熟

智能语音语义包含语音合成、语音识别和自然语言处理(NLP)三项主要技术。

语音合成技术发展最早,应用已较为普遍,除了合成音仍偏机械之外,基本不存在太大技术问题;语音识别在2012年卷积神经网络(CNN)应用之后,准确率大幅提升,已经在C端、B端得到了广泛应用,但效果和体验还不够理想;NLP技术虽然在搜索引擎中早有应用,但在人机交互领域仍属于浅层处理。

语音识别“鲁棒性“问题显著

在生物学中,有个术语叫做“鲁棒性”,是指系统在扰动或不确定的情况下,仍能保持它的特征行为。这一问题在语音识别领域也存在。

语音识别整个过程包含语音信号处理、静音切除、声学特征提取、模式匹配等多个环节。由于语音信号的多样性和复杂性,系统只能在一定限制条件下才能获得满意效果。在真实使用场景中,考虑到远场、方言、噪音、断句等问题,准确率会大打折扣。目前业内普遍宣称的97%识别准确率,更多的是人工测评结果,只在安静室内的进场识别中才能实现。

要解决语音识别鲁棒性问题,需要在技术和产品两方面进行优化。一方面,在语音增强、麦克风阵列以及说话人分离等多项技术领域持续投入,并结合后端语义,促进对上下文的理解,从而提升识别效果;另一方面,需要从产品设计上进行优化,比如通过进一步交互,使语音识别变得更为准确。

语义分析仍是浅层处理

NLP技术大致包含三个层面:词法分析、句法分析、语义分析,三者之间既递进又相互包含。

词义消歧是NLP技术的最大瓶颈。机器在切词、标注词性、并识别完后,需要对各个词语进行理解。由于语言中往往一词多义,人在理解时会基于已有知识储备和上下文环境,但机器很难做到。虽然系统会对句子做句法分析,可以在一定程度上帮助机器理解词义和语义,但实际情况并不理想。

目前,机器对句子的理解还只能做到语义角色标注层面,即标出句中的句子成分和主被动关系等,它属于比较成熟的浅层语义分析技术。未来要让机器更好地理解人类语言,并实现自然交互,还是需要依赖深度学习技术,通过大规模的数据训练,让机器不断学习。当然,在实际应用领域中,也可以通过产品设计来减少较为模糊的问答内容,以提升用户体验。

由于人工智能技术对数据依赖性极高,因此,这一领域的技术进步和产业化推进是一种协同关系——通过工程化的方法提升技术效果和体验,从而促进产业化应用,再根据实际应用中的数据和反馈,反过来推动技术实现突破。那么,智能语音语义在产业化方面都有哪些应用领域,又存在哪些问题?

应用篇:C端提升体验,B端提升效率

以问答和聊天为服务形式,智能语音语义在多个使用场景和行业领域都有广泛应用,我们可以简单从C端和B端两个方向分别来看。

C端应用方面,主要用于移动设备、汽车、家居三大场景,用来变革原有人机交互方式;B端则针对垂直行业需求,提升人工效率,比如帮助医生做电子病历录入,或代替部分人力工作,比如回答大部分简单重复的客服问题。由于两大领域解决的问题不同,因此遇到的挑战也各不相同。

特别地,在智能机器人的应用方面,目前的机器人与用户一般都会采用相互问答的小型对话形式进行交流。为实现上方便,问答对话的领域将被进行合理的限制。

除迎宾和问候语外,一般设计为4个问题域:有关时间、日期和星期的问答,有关全世界各大城市所在时区和当地时间的问答,100以内的数学四则运算题目的问答,没有关系机器人的身世、本领等自身情况的问答。对于每个限定的问题域,相应词汇表的大小是有限的。在限定领域、有限词汇的条件下,机器人基本可以与观众进行自由问答,并可以在不同的问题与之间相互切换。系统工作流程图如下:

智能语音语义在产业化方面有哪些应用

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    31494

    浏览量

    223807
  • 语音识别
    +关注

    关注

    39

    文章

    1825

    浏览量

    116251
  • 智能语音
    +关注

    关注

    11

    文章

    829

    浏览量

    50350

原文标题:智能语音主题月开启,DNN时代语音技术的突破口在哪?

文章出处:【微信号:robotplaces,微信公众号:机器人创新生态】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    氟硫一号横空出世 固态电池产业化迎来核心材料新突破

    电子发烧友网综合报道 双碳目标驱动新能源产业高速发展的当下,固态电池凭借高安全、高能量密度的特性,成为动力电池与储能领域的下一代核心技术方向,但其规模产业化进程却因核心材料短板屡屡
    的头像 发表于 04-17 13:47 2427次阅读

    RT-Thread亮相AUTOSAR中国日:国产操作系统与AUTOSAR标准融合的产业化实践

    近日,2026第七届软件定义汽车论坛暨AUTOSAR中国日上,RT-Thread创始人兼睿赛德CEO熊谱翔先生发表题为《赋能SDV新生态:RT-ThreadRTOS与AUTOSAR融合的产业化路径
    的头像 发表于 03-23 19:24 500次阅读
    RT-Thread亮相AUTOSAR中国日:国产操作系统与AUTOSAR标准融合的<b class='flag-5'>产业化</b>实践

    中篇・实战篇:十大核心新材料赛道产业化全景拆解

    本文内容源自《2026新材料行业与技术前沿发展趋势》报告第4章「典型新材料发展趋势:核心赛道产业化进展与前景」、第5章「新材料核心技术前沿趋势:研发范式变革与技术突破方向」,为全文核心主体内容。承接上篇《定调篇》独家提出的「堡垒材料、主权材料、融合材料」三大战线框架,基
    的头像 发表于 03-20 07:31 1726次阅读
    中篇・实战篇:十大核心新材料赛道<b class='flag-5'>产业化</b>全景拆解

    工信部:28项传感器国家重点研发计划成果入选产业化试点名单(附全名单)

    今日(1月23日),工业和信息部发布《工业和信息部办公厅关于公布2025年度国家重点研发计划高新技术成果产业化试点名单的通知》,通知中,公布了2025年度国家重点研发计划高新技术成果产业化
    的头像 发表于 01-23 18:06 3900次阅读
    工信部:28项传感器国家重点研发计划成果入选<b class='flag-5'>产业化</b>试点名单(附全名单)

    格陆博科技亮相EMB产业化落地专题研讨会

    12月25日,由汽车制动网主办的“EMB产业化落地专题研讨会”在上海浦东隆重举行。本次会议汇聚了国内顶尖的汽车主机厂、核心零部件企业及产业链伙伴,共同聚焦EMB的规模应用。格陆博科技 作为国内线控制动领域的优秀企业,应邀出席盛
    的头像 发表于 01-05 17:29 908次阅读
    格陆博科技亮相EMB<b class='flag-5'>产业化</b>落地专题研讨会

    请问WWDT和IWDT保护系统方面有哪些不同?

    WWDT和IWDT保护系统方面有哪些不同?
    发表于 12-10 06:43

    电子谷机器人线束|人形机器人“神经脉络”,稳定护航产业化

    当人形机器人精准抓取零件、平稳迈步前行、默契配合人类完成复杂作业时,鲜有人留意到,藏在金属关节与智能模块之间的线束,正悄然承担着“生命线”的使命。随着人形机器人产业化浪潮加速,这份“隐形使命”被赋予
    的头像 发表于 12-05 08:00 898次阅读
    电子谷机器人线束|人形机器人“神经脉络”,稳定护航<b class='flag-5'>产业化</b>

    位移传感器工控自动方面有哪些具体的应用?

    位移传感器工控自动方面有着广泛的应用,以下是一些具体的应用场景: 一、机械加工与数控机床 机械加工和数控机床领域,位移传感器用于精确控制机械部件的位置和运动轨迹。例如,在数控机床
    的头像 发表于 10-29 18:26 923次阅读

    道尼尔海翼携手西门子工业软件推动低空经济产业化发展

    中德合作再谱新篇!道尼尔海翼无锡有限公司与西门子工业软件强强联手,以数字技术共同赋能低空经济产业化发展。此举标志着双方合作迈入了“广度拓展、深度融合”的新阶段。
    的头像 发表于 10-23 17:36 1450次阅读

    加氢站和电力系统,谁是AEM产业化破局的关键?

    AEM(阴离子交换膜)电解水制氢技术目前正处于商用的关键阶段,全球氢能市场的波动对于新技术的影响显而易见,但经过早期的商用实践,AEM制氢技术也众多的市场方向中,找到了突破口。 加氢站与电力储能,成为AEM规模应用适配度较高的场景,二者相较之下,谁是AEM
    的头像 发表于 09-25 17:21 977次阅读
    加氢站和电力系统,谁是AEM<b class='flag-5'>产业化</b>破局的关键?

    2025世界机器人大会亮点:ADI探讨具身智能产业化应用技术挑战

    芯片与解决方案的专业视角,分享了ADI如何为具身智能产业化进程提供坚实的底层支撑。 具身智能,这个承载着将AI赋予物理实体的宏大愿景,正站在从实验室突破走向产业规模
    的头像 发表于 08-15 15:53 2938次阅读
    2025世界机器人大会亮点:ADI探讨具身<b class='flag-5'>智能</b><b class='flag-5'>产业化</b>应用技术挑战

    旭派动力斩获“钠电产业化先锋奖”:硬核实力领跑新赛道!

    近日,备受瞩目的2025中国钠电科技与产业发展大会上,浙江旭派动力科技有限公司(以下简称“旭派动力”)凭借其钠电池产业化领域的卓越贡献与领先实践,荣膺大会授予的“钠电
    的头像 发表于 08-11 14:14 1331次阅读
    旭派动力斩获“钠电<b class='flag-5'>产业化</b>先锋奖”:硬核实力领跑新赛道!

    固态电池技术路线及产业化进展

    固态电池技术路线及产业化进展
    的头像 发表于 08-01 06:36 1370次阅读
    固态电池技术路线及<b class='flag-5'>产业化</b>进展

    无喷粉三维扫描高反光场景的产业化实践:激光偏振技术如何重塑精密测量

    精密制造、文物保护等领域,高反光场景下的三维测量长期面临技术瓶颈。传统喷粉测量虽能改善效果,但存在损伤物体、污染环境等弊端,难以满足产业化需求。激光偏振技术的突破,推动无喷粉三维扫描高反光场景
    的头像 发表于 07-07 09:42 866次阅读
    无喷粉三维扫描<b class='flag-5'>在</b>高反光场景的<b class='flag-5'>产业化</b>实践:激光偏振技术如何重塑精密测量

    敏芯股份入选江苏省国家专利产业化样板企业培育库

    近日,根据国家知识产权局、工业和信息部、中国人民银行、金融监管总局、中国证监会联合印发的《专利产业化促进中小企业成长计划实施方案》(以下简称“《实施方案》”),江苏省知识产权局公布了全省进入国家专利产业化样板企业培育库名单,敏
    的头像 发表于 06-20 17:49 1327次阅读