0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅析智能音箱为什么听不懂人话?

h1654155149.6853 来源:亿欧网 作者:亿欧网 2021-06-09 17:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当你字正腔圆地对着智能音箱发问,得到的却是让人一脸懵逼的回答。使用过智能音箱或其它语音助手的朋友,对这一场景都不会陌生。

怀疑自己被割了智商税的你可能会问:智能音箱为什么听不懂人话?它能变聪明吗?

想解答这个问题,我们需要先了解智能音箱听懂语音的工作原理

语音、文本、图片、视频,这些信息对于机器来说,属于“非结构化数据”,无法直接理解。机器能够理解并作出反馈的,是“结构化数据”。

简单理解二者之间的区别与关系,非结构化数据相当于写了一段文本的word文档,而结构化数据则是将这段文本进行总结归纳的excel文档。

当我们向智能音箱提问时,智能音箱会先将语音转化为文字,然后将文字形成结构化数据理解并反馈,最后再将文本转化成语音输出答案。

三大流程对应着3种技术,其中ASR(自动语音识别)和TTS(处理结果转化成语音输出)技术相对成熟,像ASR已广泛应用在语音转文字、语音输入法、智能翻译笔等应用上。据中科院2019年的测试,国内四家主流智能音箱品牌ASR识别率均在94%以上。

智能音箱听不懂我们的话,问题主要出在NLP(理解文字的意思并进行处理)环节上。

AI在拿到文本后,需要进行语料清洗、分词、词性标注、实体命名识别、去除停用词等一系列操作,才能将文本正确转化为结构化数据,并作出反应。

智能音箱今天已经可以比较“智能“地处理明确的指令问题,比如打开电视,今天天气怎么样,设定闹钟等。

但在开放性语境下,智能音箱错误频出。这是因为口语文本经常会出现歧义,机器难以理解,特别是在处理同音字繁多、语法复杂的中文时,歧义的现象尤其多见。

比如“帮我上一个半小时之后的闹钟”,音箱基本没法识别是半小时还是一个半小时。再比如“帮我预定一家餐厅不要日本菜“,AI大概率无法理解“不要”在句子中的含义。

面对复杂的自然语言,AI想要辨别、理解、消除歧义,必须要分析海量“语料”,也就是对人类语言的实例进行学习。

供AI学习的语料,主要有三种来源:

第一是AI算法企业根据需求自己构造的“语料库”,比如针对特定功能,需要构造人名库、地名库、歌手名库、歌曲名库等。

第二是从互联网上大量抽取的文本,最常见的是从社交网络中抽取,以便机器理解最新的口语表达方式。

最后则是用户在与产品交互过程中产生的数据,像我们与智能音箱对话的部分内容,会被上传进厂商的语料库,供AI进行学习。

那如果长时间和智能音箱对话,是不是能让智能音箱更懂我呢?

答案是很难。一般来说,所有的训练学习过程,都是在AI算法商一端完成的。算法商会根据所有用户的数据,对AI进行训练、更新,而非针对某个特定用户。

所以,要想让智能音箱听懂你个人习惯性的语病、倒装、口头禅等等,目前的最好办法,是自己手动录入,指定它该作出什么反应。

虽然智能音箱技术还没完全成熟,但在互联网巨头眼中,它却是必须攻下来的阵地。 2019年的中国智能音箱市场经历了爆发式增长,总出货量4589万台,同比增长109.7%。其中阿里的天猫精灵,百度的小度音箱,小米的小爱音箱,三家占据了9成以上市场份额。

智能音箱在出货量上涨的同时却没给巨头们带来利润。2019年,百度副总裁景鲲向媒体表示,百度是通过补贴维持了小度音箱的低价。而另据业内人士估算,每卖一台小爱音箱,小米只赚1块钱。

巨头们的底层逻辑是,智能音箱很有可能成为未来家庭的控制中心,所以要用现在的低价策略换取未来物联网时代的入场券。这样的策略确实能带来销量的增加,但切实解决用户的痛点才能保证产品使用率。

编辑:jq

为了提高智能音箱在用户生活中的不可替代性,厂商都在费尽心思给智能音箱增加新的功能,因为谁也不想看到当物联网时代真正到来的时候,用户家中的智能音箱上已经落满了厚厚的灰尘。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296532
  • ASR
    ASR
    +关注

    关注

    2

    文章

    44

    浏览量

    19371
  • TTS
    TTS
    +关注

    关注

    0

    文章

    62

    浏览量

    11453
  • 智能音箱
    +关注

    关注

    31

    文章

    1794

    浏览量

    80539

原文标题:智能音箱为什么听不懂人话?

文章出处:【微信号:电子工程世界,微信公众号:电子工程世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    音箱硬件设计指南:功放与 AEC 回采的 6 大关键要点

    造成的。         功放设计和 AEC 电路回采是智能音箱设计中极为关键的环节,它们直接影响着音箱的音质、稳定性以及整体性能。今天,我们就结合嘉兴禾润和上海类比的功放产品,来和大家分享在这两方面的 6 点设计经验心得,让你
    的头像 发表于 11-19 15:05 304次阅读
    <b class='flag-5'>音箱</b>硬件设计指南:功放与 AEC 回采的 6 大关键要点

    霍尔元件在智能音箱中的应用:以迪仕科技DH627赋能TWS智能互联新体验

    随着智能音频设备的快速发展,用户对蓝牙音箱,尤其是真无线立体声(TWS, True Wireless Stereo)智能音箱的操作便捷性、功耗表现和可靠性提出了更高要求。在这一背景下,
    的头像 发表于 11-18 16:43 1328次阅读

    H6922升压芯片在户外拉杆音箱方案的应用

    随着人们生活水平的提高,音箱的用途越来越广泛,在靓丽的长者达人广场舞群体身旁,在户外的商业活动场合,在各种专业的弹奏演唱表演现场等,总会出现各式各样的户外拉杆音箱。 接下来,惠海半导体带大家介绍一套
    发表于 10-10 09:38

    智能音箱蓝牙与WiFi模块的ESD防护方案

    智能音箱的日常使用中,高度依赖无线连接功能,其中WiFi与蓝牙模块是其实现远程操控、语音交互及多设备联动的基础。而这类高频通信模块对静电放电(ESD)极为敏感,ESD可能直接导致无线模块失效,引发连接中断、数据传输出错等问题。ESD防护设计直接影响整机的可靠性与使用寿命
    的头像 发表于 09-24 14:55 4363次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>音箱</b>蓝牙与WiFi模块的ESD防护方案

    智能音箱麦克风与扬声器的ESD防护方案

    在上一期内容中,我们围绕智能音箱的核心交互部件 —— 按键,深入解析了其ESD(静电放电)防护需求与针对性解决方案,明确了ESD 防护对保障智能音箱稳定运行的重要性。
    的头像 发表于 09-08 16:41 4221次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>音箱</b>麦克风与扬声器的ESD防护方案

    智能音箱按键的ESD防护方案

    在上一期内容中,我们已对智能音箱的内部结构与工作原理进行了详细解析,明确了静电放电(ESD)是电子器件失效的最常见诱因。智能音箱的接口、按键、传感器等多个与外界接触或信号传输的部位,均
    的头像 发表于 09-08 16:34 4266次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>音箱</b>按键的ESD防护方案

    智能音箱接口的ESD防护方案

    智能音箱是从传统音箱升级而来的新型产品,它是由传感器、IC芯片、锂电池、外设配件等电子元件组成,除基础的音乐播放功能外,它还集成了查询天气、语音控制、出行玩乐信息检索等网络功能,其中语音识别是最核心的技术亮点。最核心的功能是语音
    的头像 发表于 09-08 16:34 4217次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>音箱</b>接口的ESD防护方案

    倒相式音箱的设计与调试

        扬声器技术跨越电、力、声三个学科,其失真约为功放的十倍,因而成为音响系统的瓶颈。为克服“声音短路”,低音扬声器还必须有合适的音箱配合,才能很好地工作。市售高档音箱中,扬声器和分频器的价格只占
    发表于 06-23 15:19 0次下载

    同步电机失步浅析

    纯分享帖,需要者可点击附件免费获取完整资料~~~*附件:同步电机失步浅析.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内容!
    发表于 06-20 17:42

    会“说话”的空气管家:NRK3301让加湿器音箱秒变智能生活中枢

    告别繁琐操作,一句‘打开加湿器’就能享受舒适湿度,NRK3301语音模块让加湿器音箱秒懂你的需求,智能生活从此开口即来。
    的头像 发表于 06-12 15:11 606次阅读
    会“说话”的空气管家:NRK3301让加湿器<b class='flag-5'>音箱</b>秒变<b class='flag-5'>智能</b>生活中枢

    NRK3502语音识别芯片:重塑热水器智能交互新体验

    告别繁琐按键,NRK3502语音芯片让热水器听懂人话:98%精准识别浴室指令,离线操作不惧断网,老人孩子都能轻松声控,为厂商打造差异化智能产品。
    的头像 发表于 06-06 15:53 460次阅读

    科技云报到:从鹦鹉学舌到灵魂对话,AI的「人话革命」

    科技云报到:从鹦鹉学舌到灵魂对话,AI的「人话革命」
    的头像 发表于 03-11 14:26 520次阅读

    WT3000A在线AI语音芯片方案在智能蓝牙音箱中的应用

    随着物联网(IoT)和人工智能(AI)技术的快速发展,智能家居设备逐渐成为现代家庭的重要组成部分。智能蓝牙音箱作为智能家居的核心设备之一,其
    的头像 发表于 02-25 17:10 801次阅读

    AI眼镜热潮涌起,百镜大战能否复刻智能音箱辉煌

    联想到数年前的智能音箱“百团大战”,同样由硅谷科技巨擘(如谷歌、亚马逊)拉开序幕,吸引了众多互联网巨头与科创企业的积极参与,共同推动了智能音箱的普及浪潮。
    的头像 发表于 01-23 15:53 1529次阅读

    蓝牙音箱的EMC问题与解决方法

    随着科技的进步和人们对高品质生活的追求,蓝牙音箱作为一种便携、无线、智能的音频设备,逐渐走进了我们的生活。无论是在家庭、办公室,还是在户外活动中,蓝牙音箱都以其卓越的音质和便捷的连接方式,为用户带来了极致的听觉享受。
    的头像 发表于 01-07 11:38 2602次阅读
    蓝牙<b class='flag-5'>音箱</b>的EMC问题与解决方法