0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百亿美元市场的语音识别为何如此受青睐?

高工智能汽车 来源:电子发烧友网 作者:工程师谭军 2018-07-12 10:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

有数据显示,到2020年,全球语音市场规模预计将达到 191.7 亿美元。语音识别作为研究人工智能的方向之一,随着语音交互技术的发展,语音AI芯片也随之诞生。现在不论是互联网巨头,还是AI 初创公司,都陆续宣布进军芯片领域。

回头看国内车载语音市场,真正开始发展可以说是在2013年。在此之前,车内语音部分的运用最多也就是听音乐和广播,虽然车载语音已经出现,但系统还处于初级阶段,准确率还不够高,市场普及度很低。

2013年是一个转折点,行业开始变革,更多人开始关注车载语音市场的发展。2015年之后侧重云端方向,和智能汽车、车联网的发展方向相关,产品形态也越来越标准。

2016年,随着人工智能领域的发展,很多公司在智能语音部分加大了力度, 特别是对语音芯片的研发。今年更是语音芯片“爆发”的一年,并且在之后的一段时间,语音芯片还会持续作为热点。

多场景、低功耗

不同的语音技术公司研发语音芯片的考虑可能都不太一样,大体上来讲有几方面原因。

首先是快速集成和低功耗的需要。语音芯片能够更好地将本地功能进行集成,同时由于现在涉及深度学习的计算量巨大,终端设备对功耗的要求也很高,低功耗的芯片成为市场需求。

其次是IoT时代下多样化场景的需要。物联网场景下,设备形态是多样化的,需要一个硬件载体,成本低,算力强,同时能承载多样化终端设备的需求,芯片在这个过程中扮演着核心的角色。

此外还有盈利的目的。任何语音技术公司,推出产品或者技术、以及软硬件一体化的方案,最终都是为了盈利。研发语音芯片也不例外,现在正是物联网时代推动产品落地的时间点,增加硬件功能之后的产品会带来更高的市场效益。

语音芯片,从IOT到车载

不久前,云知声,思必驰、出门问问等语音技术公司相继发布了自己的AI芯片计划。

5月16日,云知声发布了首款面向物联网领域的AI芯片UniOne,同时,亿咖通和云知声签署了战略合作,将携手在UniOne芯片的基础上打造车规级AI芯片,这一芯片可以为用户与车之间提供更深层次的智能语音交互能力。

5月24日,出门问问发布了国内首款已经量产的AI语音芯片模组“问芯”Mobvoi A1,它可以帮助传统家电厂商获得远场语音交互的能力,之后会在创维电视和微鲸电视上实现合作落地。

6月26日,智能语音技术公司思必驰宣布已完成新一轮融资,并宣布已与某芯片巨头在AI芯片方面达成合作,双方将成立合资公司,并且适用于智能语音交互的AI芯片已在研发过程中。

虽然语音技术公司陆续宣布自己在研发语音芯片,但高工智能汽车咨询了多家语音技术公司以及主机厂,了解到现在还没有专门针对车载领域的语音芯片。

云知声芯片负责人李霄寒博士介绍,云知声5月16日发布的这款芯片是UniOne 系列芯片中的第一款,从语音AI切入,芯片命名“雨燕”,主要面向的是IoT领域,适合智能家电、智能车载等多个人机交互场景。目前在积极推进车规级芯片设计,预计明年推出符合车规要求的“雨燕”产品。

另一家语音公司思必驰宣布研发的AI芯片,也不是专门针对车载领域的语音芯片,预计下半年流片;出门问问推出“问芯”Mobvoi A1是语音芯片模组,即语音模组和芯片的结合,最先是在智能家居领域,也不是针对车载领域的语音芯片。

现在市场上推出的“语音芯片”可以称作是传统芯片的“智能化”,将芯片和语音技术融合在一起,相比传统的芯片和语音技术独立而言,语音和芯片一体化之后,二者相互结合,如果芯片能够和语音技术很好地匹配,不仅能够解决兼容性的问题,同时还能实现降低功耗需求。

车规级的语音芯片是市场需求

车载领域的语音芯片首先一定要满足车规的技术要求,通过温度、稳定性的测试才可以上车,研发出可以通过车规的语音芯片还存在难点。

技术上,开发芯片本身就有一定的难度。软件和芯片要结合在一起,其实就是把交互的东西放到硬件载体上,配比和兼容就是有难度的,还要做到识别速度快、适配不同的CPU、最后到实现量产,都需要强大的技术支撑。

虽然现在缺乏车载领域的语音芯片,随着汽车智能化以及车载语音交互的发展,未来车规级的语音芯片会成为市场需求。

吉利汽车负责HMI的相关人士表示,现在车载语音控制能力还远远不够,就目前已经上市的车型而言,语音的在线控制识别速度很慢,而本地词库又很少,自然语音状况下语音内容和词库无法匹配,就会出现无法识别或识别有误。

而目前市面上推出“云+端+芯片”或者“云端芯”一体化的芯片,优化了网络识别的能力,但本地识别的能力依旧比较差,识别速度慢,用户是比较难接受的。

语音芯片需要提高本地识别功能,但未来比较理想的是,随着网络传输速度的完善,研发出能够将本地识别和在线识别结合在一起的语音芯片。

亿咖通相关人士表示,随着车联网,人工智能的发展,车载芯片性能远远不能满足汽车娱乐和多样化交互功能需求。语音作为车载系统的刚需和亮点,更希望有强劲的硬件加速能力和适应力的平台,车规级智能语音芯片会是大势所趋。

响应速度和识别率如何提升

最近,首款搭载“祺云概念”智联系统的中期换代车型传祺GS4搭载的智能语音控制系统,用户发出语音指令,系统便能在1.2秒内快速反应。官方宣称,速度和灵敏度远超同级。

传祺智能语音控制系统能够在正常环境中实现95%识别正确率并具备多方言口音普通话的识别能力,离线语音识别能力、汽车训练的麦克阵列降噪能力、语音打断技术、可见即可说、自定义语音唤醒等多项核心技术能力。

针对传祺GS4智能语音控制系统这一大卖点,有业内人士表示:“在网速、使用环境、车机CPU、内存等各方面最佳工况时,达到1.2S响应、95%识别率并不难。”

而在实际应用中,车辆噪音、网速波动、车机后台多进程、硬件资源被占用、第三方执行器件延迟等等,都会造成语音控制系统延迟

科大讯飞相关人士表示:“影响语音识别响应时间有:音频后端检测、网络传输、引擎处理和应用处理四个方面。”

音频后端点检测是影响语音响应速度最重要的部分,也是不可减少和用时最长的部分。讲完一句语音指令,系统需要800ms-1000ms静音段来识别讲话是否结束,减少这个时间,则会带来体验下降。例如,用户说话停顿,系统误认为用户已经说完了,导致错误的识别结果。

引擎处理,车机硬件配置低或其它进程占用CPU、内存等硬件资源,导致语音处理进程没有足够的系统资源,引起处理延迟。

通过升级车机硬件和优化引擎算法两种方案可以有效解决问题,但升级硬件配置需要增加成本,所以主机厂更加倾向于,优化引擎算法,在低成本硬件平台上实现高效语音系统应用。

网络速度慢、不稳定也是会导致语音识别延迟的一大因素。通过提升网络传输速率,如未来的5G通讯,也可以有效减少延迟。

除此之外,优化信源(地图、音乐、电台等等)和第三方执行器件(开车内灯、开天窗、座椅加热等等),也能减少语音控制系统延迟,提升用户体验。

语音控制、触屏、机械按键等都属于控制层,最终做出执行反馈的是信源和第三方执行器件。如果信源和第三方执行器件运行缓慢,也会影响用户对语音控制系统的体验。

目前,车载领域已经量产的语音产品大多数响应时间在1.5s-3s之间,当响应时间达到2s以上时,用户能够感觉到明显的延迟。

低NVH可提高识别率

识别率对用户体验至关重要,识别率太低、不准确,用户好似对牛弹琴,不但不能体现语音控制系统的便利性,反而会成为鸡肋配置。

主机厂相关人士表示:“提升语音识别率除了技术方面,降低车辆NVH也是一个重要的途径。”

车辆行驶中,外界环境噪音、发动机震动噪音、胎噪、风噪、车身共振等等都会影响语音指令识别率,所以除了不断对语音系统优化之外,降低车辆NVH也是提升语音识别率和用户体验的方法之一。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53534

    浏览量

    459083
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296579
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261508
  • 车联网
    +关注

    关注

    76

    文章

    2695

    浏览量

    93592

原文标题:“语音AI芯片”持续发酵,车载语音去向何处?| GGAI深度

文章出处:【微信号:ilove-ev,微信公众号:高工智能汽车】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    语音识别芯片有哪些(语音识别芯片AT680系列)

    在人工智能技术飞速发展的今天,语音识别芯片作为人机交互的重要桥梁,正逐渐成为各类智能设备不可或缺的核心部件。与传统的语音芯片不同,语音识别
    的头像 发表于 11-14 17:11 1025次阅读

    政策多次提及,零碳园区为何如此重要?氢能源如何进入?

    11月10日,《国家发展改革委、国家能源局关于促进新能源消纳和调控的指导意见》发布。意见指出,推进零碳园区建设。 这是2025年国家层面第三次明文支持零碳园区建设,不难看出国家的支持力度,那么,零碳园区为何如此重要呢?从目前发展情况来看,氢能源又该如何与零碳园区融合发展?
    的头像 发表于 11-12 15:16 204次阅读
    政策多次提及,零碳园区<b class='flag-5'>为何如此</b>重要?氢能源如何进入?

    什么是离线语音识别芯片(离线语音识别芯片有哪些优点)

    离线语音识别芯片,是一种集成了语音信号采集、前端处理和本地识别功能的专用集成电路,无须联网也可以进行语音控制。它内设先进的数字信号处理模块及
    的头像 发表于 10-31 15:27 267次阅读

    如何选择合适的语音识别芯片型号

    语音识别芯片(又称语音识别IC)是现代智能设备的核心组件,与传统语音芯片相比,其最大特点是能够主动识别
    的头像 发表于 10-30 16:32 461次阅读

    瑞芯微RK3576语音识别算法

    1.语音识别简介语音识别技术,也被称为自动语音识别(AutomaticSpeechRecogni
    的头像 发表于 08-15 15:13 1856次阅读
    瑞芯微RK3576<b class='flag-5'>语音</b><b class='flag-5'>识别</b>算法

    语音识别---大家怎么看呢?

    语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,
    发表于 08-09 10:54

    CYUSB3014无法识别为USB3.0设备怎么解决?

    我开发了一款CYUSB3014硬件,但是我在烧录了syncfifo示例代码后,板卡只能被识别为USB2.0设备。我确认我的线材是支持USB3.0的,并且我检查了19.2Mhz的晶振工作正常
    发表于 04-30 07:24

    电网波动测试为何如此重要?

    电网中常会因雷击、短路故障、大功率设备启动、电网切换或负载突变等原因,可能会导致如设备停机、异常重启、医疗设备断电危及患者等严重后果,那么该如何避免呢?电网中常会因雷击、短路故障、大功率设备启动、电网切换或负载突变等原因,出现电压暂降(Dip)、短时中断(Interruption)或电压波动(Variation),可能会导致如设备停机、异常重启、医疗设备断电
    的头像 发表于 03-31 11:40 451次阅读
    电网波动测试<b class='flag-5'>为何如此</b>重要?

    语音识别技术在通信领域中的应用实例

    语音识别技术也被称为自动语音识别(Automatic Speech Recognition,ASR),是通过计算机对语音信号进行分析和
    的头像 发表于 02-21 17:12 1067次阅读

    详解语音识别技术在通信领域中的应用

    语音识别技术也被称为自动语音识别(Automatic Speech Recognition,ASR),是通过计算机对语音信号进行分析和
    的头像 发表于 02-21 17:05 1033次阅读
    详解<b class='flag-5'>语音</b><b class='flag-5'>识别</b>技术在通信领域中的应用

    空调语音控制方案NRK3501语音识别芯片-让智能生活触手可及!

    NRK3501语音识别芯片支持离线语音控制空调,精准识别,远场降噪,最多支持200条离线指令,5米内识别率92%,让智能家居更便捷舒适。
    的头像 发表于 01-07 11:40 1255次阅读
    空调<b class='flag-5'>语音</b>控制方案NRK3501<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片-让智能生活触手可及!

    【「嵌入式系统设计与实现」阅读体验】+ 基于语音识别的智能杯垫

    语音命令Q 识别,适用于智能家居控制、玩具、人机交互等多个领域。该模块以其高识别率、低功耗和易于集成的特点受到广大开发者的青睐。 主要技术及功能有: 磁力搅拌、重量采集、
    发表于 01-02 18:15

    离线语音识别技术引领智能语音灯具市场——NRK3502

    智能语音灯具集高科技与人性化设计,内置NRK3502离线语音识别芯片,支持远场识别与自定义指令,提供便捷智能体验,推动智能家居行业发展。
    的头像 发表于 12-30 15:04 1212次阅读
    离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b>技术引领智能<b class='flag-5'>语音</b>灯具<b class='flag-5'>市场</b>——NRK3502

    全金属航空插头:工业领域的“钢铁侠”,为何备受青睐

    在工业领域的舞台上,各种连接元件争奇斗艳,而全金属航空插头犹如一位坚不可摧的“钢铁侠”,以其独特的魅力赢得了众多工程师的青睐为何全金属航空插头能在工业领域中脱颖而出,成为最受欢迎的连接元件之一?让我们一探究竟。
    的头像 发表于 12-25 11:46 839次阅读

    基于语音识别的智能会议系统具备哪些交互功能

    标贝科技专注智能语音交互领域多年,在语音识别语音合成领域有着多项大型企业合作案例,标贝与多个智能会议系统厂商合作,成功将语音
    的头像 发表于 12-20 10:35 895次阅读