电子发烧友网报道(文/李弯弯)智能语音是智能时代人机交互的关键接口,近几年随着各行业场景需求爆发式增长,技术突破和应用落地不断深入。从全球范围来看,2022年全球智能语音产业规模将达351.2亿美元,保持33.1%的高速增长。
根据德勤统计数据,2022年我国智能语音市场将达341亿元,同比增长13.4%。我国智能语音产业整体发展环境积极向好。工信部信息技术发展司副司长王威伟表示,智能语音产业作为新一代信息技术和人工智能产业的重要组成部分,必将迎来更大的发展机遇。
智能语音技术,是实现人机语言的通信,包括语音识别技术(ASR)和语音合成技术(TTS)。智能语音技术的研究以语音识别技术为开端,可以追溯到20世纪50年代。随着信息技术的发展,智能语音技术已经成为人们信息获取和沟通最便捷、最有效的手段。
从当前的发展情况来看,语音合成技术发展最早,应用已较为普遍,除了合成音仍偏机械之外,基本不存在太大技术问题;语音识别在2012年卷积神经网络(CNN)应用之后,准确率大幅提升,已经在C端、B端得到广泛应用,但效果和体验仍有待提高。
比如语音识别鲁棒性问题显著,语音识别整个过程包含语音信号处理、静音切除、声学特征提取、模式匹配等多个环节。由于语音信号的多样性和复杂性,系统只能在一定限制条件下才能获得满意效果。在真实使用场景中,考虑到远场、方言、噪音等问题,准确率就会打折。
为了解决语音识别鲁棒性问题,企业从多方面进行优化,一是在语音增强、麦克风阵列以及说话人分离等技术领域投入,并结合后端语义,促进对上下文的理解,从而提升识别效果;另一方面是从产品设计上进行优化,比如通过进一步交互,使语音识别变得更为准确。
在语音识别方面,视听融合的多模态交互技术是技术演进的主要方向。据介绍,科大讯飞多模语音增强技术融合语音与视觉的多模感知,让高噪音场景下的语音交互跨过实用门槛,率先在车载、会议、地铁购票和医疗挂号等场景落地。此外,针对低资源语音识别难题,海天瑞声和科大讯飞分别从语音数据和算法层面推动技术进步。
当前智能语音应用场景正在迅速铺开。据德勤统计数据,预计到2030年,智能语音消费级和企业级应用市场将分别超过700亿元和千亿元的规模。
在汽车领域,智能语音已成人机交互关键环节,并从车内交互衍生车外交互,从单模交互走向多模交互,从被动交互发展为主动交互,为车企提供全栈技术赋能。思必驰此前表示,在中高端车型的车载设备中,具备语音交互能力的中控大屏能为车主带来高清且流畅的智能体验。
另外相对更平民化的传统车型而言,智能网联化成本高,中控大屏的智能化程度有限。针对更多车型智能化改造,思必驰推出了针对前装市场的车载“智能收放机”软硬一体化方案(联网版、蓝牙版),打造无屏版智能中控,围绕“云+管+端+手”四个维度,分别为整车赋予智能化的改造,这将有利于扩大智能语音在汽车领域的应用。
智能语音在教育和医疗领域也已经取得较大规模的应用,比如,在教育领域,科大讯飞全球中文学习平台已覆盖全球183个国家,吸引300多万海外中文学习爱好者使用;在医疗领域,2022年疫情期间,科大讯飞电话机器人助力全国31个省112个地市疫情排查,累计服务超1.1亿人次;智能外呼和智医助理可用于独居老人、留守儿童的日常关爱和兜底保障。
除此之外,智能语音在城市和工业领域也有很好的应用前景。姚建铨院士此前指出,智能语音与建设智慧城市的要求吻合,可以实现各种语音高效转换和智能处理,为智慧城市进一步建设带来新的机遇。在工业领域,我国打造了包括国家智能语音创新中心在内的一批语音技术创新国家队, 开展工业声学、多语种、AI语音芯片等关键共性技术研究工作。
可想而知,随着智能语音关键技术的不断突破,以及各企业、研究团队在各行业各领域的应用探索,未来智能语音的将会在更多场景中实现规模化应用,市场规模也将随之增长。
根据德勤统计数据,2022年我国智能语音市场将达341亿元,同比增长13.4%。我国智能语音产业整体发展环境积极向好。工信部信息技术发展司副司长王威伟表示,智能语音产业作为新一代信息技术和人工智能产业的重要组成部分,必将迎来更大的发展机遇。
智能语音技术,是实现人机语言的通信,包括语音识别技术(ASR)和语音合成技术(TTS)。智能语音技术的研究以语音识别技术为开端,可以追溯到20世纪50年代。随着信息技术的发展,智能语音技术已经成为人们信息获取和沟通最便捷、最有效的手段。
从当前的发展情况来看,语音合成技术发展最早,应用已较为普遍,除了合成音仍偏机械之外,基本不存在太大技术问题;语音识别在2012年卷积神经网络(CNN)应用之后,准确率大幅提升,已经在C端、B端得到广泛应用,但效果和体验仍有待提高。
比如语音识别鲁棒性问题显著,语音识别整个过程包含语音信号处理、静音切除、声学特征提取、模式匹配等多个环节。由于语音信号的多样性和复杂性,系统只能在一定限制条件下才能获得满意效果。在真实使用场景中,考虑到远场、方言、噪音等问题,准确率就会打折。
为了解决语音识别鲁棒性问题,企业从多方面进行优化,一是在语音增强、麦克风阵列以及说话人分离等技术领域投入,并结合后端语义,促进对上下文的理解,从而提升识别效果;另一方面是从产品设计上进行优化,比如通过进一步交互,使语音识别变得更为准确。
在语音识别方面,视听融合的多模态交互技术是技术演进的主要方向。据介绍,科大讯飞多模语音增强技术融合语音与视觉的多模感知,让高噪音场景下的语音交互跨过实用门槛,率先在车载、会议、地铁购票和医疗挂号等场景落地。此外,针对低资源语音识别难题,海天瑞声和科大讯飞分别从语音数据和算法层面推动技术进步。
当前智能语音应用场景正在迅速铺开。据德勤统计数据,预计到2030年,智能语音消费级和企业级应用市场将分别超过700亿元和千亿元的规模。
在汽车领域,智能语音已成人机交互关键环节,并从车内交互衍生车外交互,从单模交互走向多模交互,从被动交互发展为主动交互,为车企提供全栈技术赋能。思必驰此前表示,在中高端车型的车载设备中,具备语音交互能力的中控大屏能为车主带来高清且流畅的智能体验。
另外相对更平民化的传统车型而言,智能网联化成本高,中控大屏的智能化程度有限。针对更多车型智能化改造,思必驰推出了针对前装市场的车载“智能收放机”软硬一体化方案(联网版、蓝牙版),打造无屏版智能中控,围绕“云+管+端+手”四个维度,分别为整车赋予智能化的改造,这将有利于扩大智能语音在汽车领域的应用。
智能语音在教育和医疗领域也已经取得较大规模的应用,比如,在教育领域,科大讯飞全球中文学习平台已覆盖全球183个国家,吸引300多万海外中文学习爱好者使用;在医疗领域,2022年疫情期间,科大讯飞电话机器人助力全国31个省112个地市疫情排查,累计服务超1.1亿人次;智能外呼和智医助理可用于独居老人、留守儿童的日常关爱和兜底保障。
除此之外,智能语音在城市和工业领域也有很好的应用前景。姚建铨院士此前指出,智能语音与建设智慧城市的要求吻合,可以实现各种语音高效转换和智能处理,为智慧城市进一步建设带来新的机遇。在工业领域,我国打造了包括国家智能语音创新中心在内的一批语音技术创新国家队, 开展工业声学、多语种、AI语音芯片等关键共性技术研究工作。
可想而知,随着智能语音关键技术的不断突破,以及各企业、研究团队在各行业各领域的应用探索,未来智能语音的将会在更多场景中实现规模化应用,市场规模也将随之增长。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
智能语音
+关注
关注
11文章
823浏览量
50064
发布评论请先 登录
相关推荐
热点推荐
2025年市场规模将达290亿!AI 玩具成行业新风口
工信部最新发布会释放重磅信号:2024 年我国 AI 玩具市场规模达 246 亿元,2025 年预计飙升至 290 亿元!
Cat.1蜂窝模组正成为两轮车智能化的关键技术支撑
北斗定位能力,Cat.1蜂窝模组的应用将迎来爆发式增长。根据预测,新国标将带动Cat.1蜂窝模组需求超5000万片,渗透率有望突破96% 。这一预测基于2025年上半年电动两轮车销量达3232.5万台,同比增长29.5%的数据
《人民日报:智能制造装备亮眼表现因何来》:今年上半年中国传感器市场规模突破2000亿
近日,《人民日报》刊发《智能制造装备亮眼表现因何来》,内容中提及我国传感器产业的几项关键数据: 今年上半年,中国传感器市场规模突破2000亿元,智能
中国传感器市场规模突破4000亿!工信部产业研究院最新数据出炉
市场规模首次超过4000亿元——达4061.2亿元,同比增长11.4%。赛迪顾问预计,到2027年,中国传感器市场规模有望达到5793.4亿元。 具体到各传感器细分领域,在2024年中国传感器市场细分份额中,压力传感器以71
端侧AI+低成本模组,中国厂商将改写全球玩具市场规则
。 市场爆发与技术重构的双重机遇 全球AI玩具市场规模预计在2033年突破600亿美元,中国作为核心增长极,2025年市场规模预计
视频监控设备市场规模猛涨,高清网络监控摄像头带来创新
我国视频监控设备需求和市场发展迅速。据统计,2015年中国视频监控设备市场规模为553.5亿元,到2020年已增长到982.8亿元。疫情后,无人化智能安防技术和应用场景进一步拓宽,预计
软件定义音频的关键优势
当前,新能源汽车的市场渗透率持续上升,智能化水平不断深化。作为智能座舱体验的重要组成部分,车载声学展现出巨大的增长潜力。预计到2025年,全球车载声学系统
AI赋能边缘网关:开启智能时代的新蓝海
,可完成电力负荷精准预测、故障快速定位。据市场研究机构预测,到2025年,AI边缘网关市场规模将突破千亿美元,年复合增长率超过60%。
产业
发表于 02-15 11:41
高盛上调人形机器人市场规模预测
高盛在最新研究报告中,对人形机器人行业市场规模做出了显著上调的预测。报告指出,到2035年,该市场规模有望达到380亿美元,这一数字远超此前预测的60亿美元。 高盛表示,此次调整预测的核心推动
全球半导体市场规模预测
%的同比增长。这一数字显示出半导体市场在技术创新、需求增长以及政策推动等多重因素作用下的强劲发展势头。 展望2025年,全球半导体市场规模将进一步扩大,预计

智能语音关键技术不断突破,市场规模将超千亿!
评论