在人类的感官通道中,视觉占据最主要的位置,听觉次之,但在信息传递中,听觉语言的综合利用率要远高于视觉符号。因此,更接近于人类本能的交互方式--语音交互受到广泛关注。目前,随着智能语音技术的发展和应用场景的不断丰富,人机交互方式已经开始从键盘、鼠标以及触摸式的图形交互,向语音模式转变,并且随着搭载量和使用率的提升,未来有望成为人机交互最主要的入口。
底层技术持续增强
智能语音包含语音识别、语义理解、自然语言生成以及语音合成等环节。其中,语音识别是率先商业化、应用最成熟的人工智能技术之一。根据信通院数据,全球智能语音识别错误率连续降低,从2008年的23.6%降低到2017年的5.5%。
与此同时,国内厂商也在不断刷新准确率的上限。2018年6月,阿里巴巴推出语音识别模型DFSMN,准确率高达96.04%;科大讯飞也在同期宣布讯飞语音识别率提升至98%;2017年11月,百度大脑推出新款语音识别模型--“基于复数CNN网络的语音增强和声学建模一体化的端到端语音识别模型”,打破了传统远场语音识别技术的流程,将语音识别准确率提高30%以上。
应用场景丰富多元
在国家大力发展人工智能产业的战略引导下,以及企业技术能力提升和市场需求不断扩张的驱动下,智能语音技术在智能家居、车载环境、在线教育、医疗、呼叫中心等各个场景均有落地化应用。据中国电子信息产业发展研究院预测,未来三年智能语音市场将保持25%以上的增速,到2021年预计达到194.8亿元。
例如,在智能家居方面,语音声控的应用增强了终端设备控制家居的简便性、易用性、互动性和娱乐性。目前,众多参与者以智能音箱作为智能家居语音交互的切入口。例如接入阿里智能家居平台的天猫精灵、提供智能家居控制入口的小度音箱、连接小米智能家居生态的小爱智能音箱等等。
再如,在智能车载方面,从安全因素考虑,车载智能语音应用将是未来市场的刚需场景,如媒体娱乐、行车导航、信息查询、即时通讯等等。2016年11月,科大讯飞发布智能车载系统飞鱼助理,并于2017年11月发布2.0版本,该系统通过对语音引擎、生态引擎、云+端服务进行深度整合,并赋予智能人机交互方式,来为用户提供人脸识别、AI虚拟助手、声源定位、非全时免唤醒+上下文理解、自定义唤醒词、XTTS等功能。
另外,在随身设备方面,随着设备功能的多元化,人们迫切需求摆脱传统输入设备的束缚,以智能手机为例,有关数据显示,到2023年智能手机配备语音交互功能的比例将达到90%以上。并且据IDC预测,到2020年随身设备的智能语音渗透率将达到68%。可见,智能语音拥有丰富的应用场景,渗透率也会不断提高。
图:2020年智能语音渗透率预测

数据来源:IDC
创业及资本渐趋理性
智能语音市场参与者主要为科技巨头及传统智能语音企业,行业集中度较高。科技巨头在语音行业的布局多为对外开放语音生态系统,对内则在自身产品中实现AI First。例如,百度Dueros开放平台、阿里AliGenie开发者平台、腾讯的智能语音平台腾讯云小微等等。传统智能语音企业已在语音行业深耕多年,1999年成立的科大讯飞市场占有率已然位列第一,除了面向教育、司法、医疗、城市等领域推出智能语音解决方案以外,还向硬件方面拓展,推出了翻译机、学习机、录音笔等相关产品。
此外,科技巨头和传统智能语音企业出于构建生态、积累数据等方面的考虑,大都提供开放平台,而初创企业则可以借此发挥后发优势。虽然头部企业已经处于绝对优势,但随着应用场景的丰富,行业机会仍不断涌现,智能语音初创企业也吸引了资本市场的关注。据<华秋创服>不完全统计,2000-2019年,共有55家智能语音方案企业获得融资,共计157笔,平均成立1.7年后获得第一笔融资,获投企业主要分布在北京、广东、上海等地;从时间分布来看,2015年开始进入融资高峰期,2019年有所下降,一定程度上反映了智能语音企业的创业热潮正逐渐趋于理性,市场也越来越重视企业的核心技术和落地能力。
图:2000-2019年智能语音方案企业获投笔数

数据来源:华秋创服
图:2000-2019年获投智能语音方案企业地区分布

数据来源:华秋创服
市场前景广阔 技术仍待突破
IDC数据显示,智能语音在我国人工智能市场中的份额占有22%的比重。场景应用的普遍化,促使整个行业开始从发展初期向成熟期迈进。虽然科大讯飞、百度等占据了市场近七成的份额,但是,随着应用场景的拓宽,整个市场规模仍会不断扩大。
不可否认的是,虽然智能语音技术飞速发展,但在实际应用环境中,语音信号往往伴随着环境噪声和混响,使得语音识别的性能急剧下降。例如,讯飞中英文语音识别准确率分别达到98%和95%,但在有方言、噪音、口音和远场情况下,提高语音识别准确率仍有较大的提升空间。再如机器翻译,虽然实时高效,但距离会议同传以及高水平翻译所讲究的“信、达、雅”仍存在较大差距。可见,虽然语音识别等某一技术环节已经取得较大发展,但面对应用场景的复杂性,智能语音技术仍有待突破。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
智能语音
+关注
关注
11文章
823浏览量
50062
发布评论请先 登录
相关推荐
热点推荐
蓝牙室内定位核心技术解析:RSSI 与 AOA 的测距原理对比与精度升级逻辑
本文解析蓝牙室内定位核心技术,对比RSSI与AOA的测距原理,深入探讨从RSSI到AOA在精度、误差控制和硬件适配方面的升级逻辑,揭示两者如何互补满足不同场景需求。
广州唯创电子WTK6900H-24SS语音识别芯片:智能语音控制赋能台灯创新应用 | 语音IC厂家
在智能家居快速发展的今天,语音交互技术正在深刻改变人们与家居设备的互动方式。台灯作为日常生活中不可或缺的照明工具,其智能化升级已成为行业发展
广州唯创电子WTK6900H-32N语音识别芯片:智能语音控制赋能LED灯带创新应用 | 语音IC厂家
芯片,凭借其卓越的性能和精准的识别能力,在LED灯带控制领域展现出强大的应用价值,为智能照明系统带来了革命性的创新突破。一、核心技术优势1.1高性能语音识别引擎WT
语音机器人交互系统:核心技术与应用挑战
语音机器人交互系统是融合多学科技术的复杂工程,其核心目标是实现人与机器间的自然、流畅语音对话。该系统已广泛应用于智能客服、
【「DeepSeek 核心技术揭秘」阅读体验】+混合专家
感谢电子发烧友提供学习Deepseek核心技术这本书的机会。
读完《Deepseek核心技术揭秘》,我深受触动,对人工智能领域有了全新的认识。了解Deepseek-R1 、Deepseek-V3
发表于 07-22 22:14
芯资讯|广州唯创电子WTK6900P语音识别芯片:离线语音交互的革新者
智能家电、工业控制、消费电子等领域提供了低门槛、高可靠性的语音交互解决方案。以下从核心技术、性能优势及行业应用三个层面,深度解析其核心竞争力。一、核
芯资讯|广州唯创电子WTV系列语音芯片:以技术创新赋能智能语音交互
,WTV-380与WTV-890两款语音芯片凭借其超长内置音频时长和出色的性能表现,成为工业控制、智能家电、公共服务等领域的明星产品。一、核心技术:突破存储限制,满足多样
芯资讯|基于广州唯创电子语音芯片的烟雾报警器语音方案技术解析
在智能家居与物联网(IoT)技术快速发展的背景下,语音播报功能已成为烟雾报警器等安防设备提升用户体验的核心技术之一。广州唯创电子凭借其WTV

智能语音创投趋缓 核心技术仍需升级
评论