0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅析智能音箱为什么听不懂人话?

h1654155149.6853 来源:亿欧网 作者:亿欧网 2021-06-09 17:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当你字正腔圆地对着智能音箱发问,得到的却是让人一脸懵逼的回答。使用过智能音箱或其它语音助手的朋友,对这一场景都不会陌生。

怀疑自己被割了智商税的你可能会问:智能音箱为什么听不懂人话?它能变聪明吗?

想解答这个问题,我们需要先了解智能音箱听懂语音的工作原理

语音、文本、图片、视频,这些信息对于机器来说,属于“非结构化数据”,无法直接理解。机器能够理解并作出反馈的,是“结构化数据”。

简单理解二者之间的区别与关系,非结构化数据相当于写了一段文本的word文档,而结构化数据则是将这段文本进行总结归纳的excel文档。

当我们向智能音箱提问时,智能音箱会先将语音转化为文字,然后将文字形成结构化数据理解并反馈,最后再将文本转化成语音输出答案。

三大流程对应着3种技术,其中ASR(自动语音识别)和TTS(处理结果转化成语音输出)技术相对成熟,像ASR已广泛应用在语音转文字、语音输入法、智能翻译笔等应用上。据中科院2019年的测试,国内四家主流智能音箱品牌ASR识别率均在94%以上。

智能音箱听不懂我们的话,问题主要出在NLP(理解文字的意思并进行处理)环节上。

AI在拿到文本后,需要进行语料清洗、分词、词性标注、实体命名识别、去除停用词等一系列操作,才能将文本正确转化为结构化数据,并作出反应。

智能音箱今天已经可以比较“智能“地处理明确的指令问题,比如打开电视,今天天气怎么样,设定闹钟等。

但在开放性语境下,智能音箱错误频出。这是因为口语文本经常会出现歧义,机器难以理解,特别是在处理同音字繁多、语法复杂的中文时,歧义的现象尤其多见。

比如“帮我上一个半小时之后的闹钟”,音箱基本没法识别是半小时还是一个半小时。再比如“帮我预定一家餐厅不要日本菜“,AI大概率无法理解“不要”在句子中的含义。

面对复杂的自然语言,AI想要辨别、理解、消除歧义,必须要分析海量“语料”,也就是对人类语言的实例进行学习。

供AI学习的语料,主要有三种来源:

第一是AI算法企业根据需求自己构造的“语料库”,比如针对特定功能,需要构造人名库、地名库、歌手名库、歌曲名库等。

第二是从互联网上大量抽取的文本,最常见的是从社交网络中抽取,以便机器理解最新的口语表达方式。

最后则是用户在与产品交互过程中产生的数据,像我们与智能音箱对话的部分内容,会被上传进厂商的语料库,供AI进行学习。

那如果长时间和智能音箱对话,是不是能让智能音箱更懂我呢?

答案是很难。一般来说,所有的训练学习过程,都是在AI算法商一端完成的。算法商会根据所有用户的数据,对AI进行训练、更新,而非针对某个特定用户。

所以,要想让智能音箱听懂你个人习惯性的语病、倒装、口头禅等等,目前的最好办法,是自己手动录入,指定它该作出什么反应。

虽然智能音箱技术还没完全成熟,但在互联网巨头眼中,它却是必须攻下来的阵地。 2019年的中国智能音箱市场经历了爆发式增长,总出货量4589万台,同比增长109.7%。其中阿里的天猫精灵,百度的小度音箱,小米的小爱音箱,三家占据了9成以上市场份额。

智能音箱在出货量上涨的同时却没给巨头们带来利润。2019年,百度副总裁景鲲向媒体表示,百度是通过补贴维持了小度音箱的低价。而另据业内人士估算,每卖一台小爱音箱,小米只赚1块钱。

巨头们的底层逻辑是,智能音箱很有可能成为未来家庭的控制中心,所以要用现在的低价策略换取未来物联网时代的入场券。这样的策略确实能带来销量的增加,但切实解决用户的痛点才能保证产品使用率。

编辑:jq

为了提高智能音箱在用户生活中的不可替代性,厂商都在费尽心思给智能音箱增加新的功能,因为谁也不想看到当物联网时代真正到来的时候,用户家中的智能音箱上已经落满了厚厚的灰尘。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41115

    浏览量

    302608
  • ASR
    ASR
    +关注

    关注

    2

    文章

    45

    浏览量

    19453
  • TTS
    TTS
    +关注

    关注

    0

    文章

    66

    浏览量

    11592
  • 智能音箱
    +关注

    关注

    31

    文章

    1796

    浏览量

    80959

原文标题:智能音箱为什么听不懂人话?

文章出处:【微信号:电子工程世界,微信公众号:电子工程世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    面对 DDR3 缺货涨价,RK3308 智能音箱如何稳量保供?PSRAM 替代方案全解析

    RK3308 智能音箱采用 PSRAM 替代 DDR3,解决缺货问题,降低成本稳定量产
    的头像 发表于 04-13 15:32 1262次阅读
    面对 DDR3 缺货涨价,RK3308 <b class='flag-5'>智能</b><b class='flag-5'>音箱</b>如何稳量保供?PSRAM 替代方案全解析

    智能音箱:一碰即连的魔法背后——无锡迪仕DH627赋能TWS互联

    随着智能家居生态的完善,蓝牙音箱已不再满足于单一的播放功能,用户更渴望设备间能够实现无缝连接与互动。TWS(真无线立体声)技术让两个音箱组成立体声成为可能,但传统的按键配对方式繁琐且易出错。无锡迪仕
    的头像 发表于 04-10 15:31 1977次阅读

    高性价比智能音箱方案 RK3308 搭配 PSRAM 替代 DDR3

    受全球芯片供应链影响,DDR3内存持续缺货、价格一路上涨,已经严重影响智能音箱的正常量产。瑞芯微RK3308凭借四核A35、内置硬件VAD、支持8麦阵列等特性,是目前智能音箱和语音中控
    的头像 发表于 03-30 16:59 457次阅读
    高性价比<b class='flag-5'>智能</b><b class='flag-5'>音箱</b>方案 RK3308 搭配 PSRAM 替代 DDR3

    当星闪遇见AI语音:破解智能家居“听不懂、联不稳”两大痛点

    智能家电的通信还在纠结传统Wi-Fi与蓝牙的局限,当语音交互还停留在“听懂基础指令”的阶段,明裕丰基于启英泰伦CI1302AI语音芯片和海思WS63V100,推出MYF-F63AI01星闪+AI
    的头像 发表于 03-18 16:35 501次阅读
    当星闪遇见AI语音:破解<b class='flag-5'>智能</b>家居“<b class='flag-5'>听不懂</b>、联不稳”两大痛点

    疆鸿智能DEVICENET转PROFIBUS网关:让欧姆龙温度仪表对话西门子

    不同的“方言”——这边是DEVICENET,那边是PROFIBUS,彼此听不懂,生产线就只能“各自为政”。 最近在某橡胶提炼厂的技改中,我们就遇到了这样的“语言隔阂”。一侧是新引入的炼胶设备,采用DEVICENET协议;另一侧是西门子PLC统领的PROFIBUS-DP网络,负责整线逻辑控
    的头像 发表于 03-11 15:47 172次阅读
    疆鸿<b class='flag-5'>智能</b>DEVICENET转PROFIBUS网关:让欧姆龙温度仪表对话西门子

    35+语种、200+方言、30000+客户:唯创知音正在让AI语音交互真正“飞入寻常百姓家 ”

    智能家居的语音控制早已不是新鲜事,但你是否遇到过这样的尴尬:爷爷奶奶说着一口地道方言,智能音箱却频频"听不懂";出海产品面对泰语、印尼语用户,只能尴尬地用英文应付;断网时,所谓
    的头像 发表于 02-04 12:07 484次阅读
    35+语种、200+方言、30000+客户:唯创知音正在让AI语音交互真正“飞入寻常百姓家 ”

    音箱硬件设计指南:功放与 AEC 回采的 6 大关键要点

    造成的。         功放设计和 AEC 电路回采是智能音箱设计中极为关键的环节,它们直接影响着音箱的音质、稳定性以及整体性能。今天,我们就结合嘉兴禾润和上海类比的功放产品,来和大家分享在这两方面的 6 点设计经验心得,让你
    的头像 发表于 11-19 15:05 1103次阅读
    <b class='flag-5'>音箱</b>硬件设计指南:功放与 AEC 回采的 6 大关键要点

    霍尔元件在智能音箱中的应用:以迪仕科技DH627赋能TWS智能互联新体验

    随着智能音频设备的快速发展,用户对蓝牙音箱,尤其是真无线立体声(TWS, True Wireless Stereo)智能音箱的操作便捷性、功耗表现和可靠性提出了更高要求。在这一背景下,
    的头像 发表于 11-18 16:43 1887次阅读

    智能音箱蓝牙与WiFi模块的ESD防护方案

    智能音箱的日常使用中,高度依赖无线连接功能,其中WiFi与蓝牙模块是其实现远程操控、语音交互及多设备联动的基础。而这类高频通信模块对静电放电(ESD)极为敏感,ESD可能直接导致无线模块失效,引发连接中断、数据传输出错等问题。ESD防护设计直接影响整机的可靠性与使用寿命
    的头像 发表于 09-24 14:55 5299次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>音箱</b>蓝牙与WiFi模块的ESD防护方案

    智能音箱麦克风与扬声器的ESD防护方案

    在上一期内容中,我们围绕智能音箱的核心交互部件 —— 按键,深入解析了其ESD(静电放电)防护需求与针对性解决方案,明确了ESD 防护对保障智能音箱稳定运行的重要性。
    的头像 发表于 09-08 16:41 4827次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>音箱</b>麦克风与扬声器的ESD防护方案

    智能音箱按键的ESD防护方案

    在上一期内容中,我们已对智能音箱的内部结构与工作原理进行了详细解析,明确了静电放电(ESD)是电子器件失效的最常见诱因。智能音箱的接口、按键、传感器等多个与外界接触或信号传输的部位,均
    的头像 发表于 09-08 16:34 4901次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>音箱</b>按键的ESD防护方案

    智能音箱接口的ESD防护方案

    智能音箱是从传统音箱升级而来的新型产品,它是由传感器、IC芯片、锂电池、外设配件等电子元件组成,除基础的音乐播放功能外,它还集成了查询天气、语音控制、出行玩乐信息检索等网络功能,其中语音识别是最核心的技术亮点。最核心的功能是语音
    的头像 发表于 09-08 16:34 4604次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>音箱</b>接口的ESD防护方案

    倒相式音箱的设计与调试

        扬声器技术跨越电、力、声三个学科,其失真约为功放的十倍,因而成为音响系统的瓶颈。为克服“声音短路”,低音扬声器还必须有合适的音箱配合,才能很好地工作。市售高档音箱中,扬声器和分频器的价格只占
    发表于 06-23 15:19 1次下载

    同步电机失步浅析

    纯分享帖,需要者可点击附件免费获取完整资料~~~*附件:同步电机失步浅析.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内容!
    发表于 06-20 17:42

    会“说话”的空气管家:NRK3301让加湿器音箱秒变智能生活中枢

    告别繁琐操作,一句‘打开加湿器’就能享受舒适湿度,NRK3301语音模块让加湿器音箱秒懂你的需求,智能生活从此开口即来。
    的头像 发表于 06-12 15:11 955次阅读
    会“说话”的空气管家:NRK3301让加湿器<b class='flag-5'>音箱</b>秒变<b class='flag-5'>智能</b>生活中枢