亚马逊Echo大获成功,远场语音交互技术在其中究竟扮演了什么

39度创意研究所 2017-05-26 16:00 次阅读

关于远场语音交互,声智科技 CEO 陈孝良告诉雷锋网:“语音是最简单、最自然的人机交互方式,同时也是技术难度最大的交互方式,特别是语音交互从近场走向远场落地到真实场景,必须考虑噪声、混响、回声等声学问题,以及数据差异引入的机器学习模型问题,这些都是保证自由人机交互的核心技术。”

但是网络上横跨声学和计算机学科的教育资源太少,李智勇老师的这篇文章不仅揭示了远场语音交互的核心技术,还对商业化落地的路径进行了深入的解读,无论是语音交互的技术人员,还是产品经理,都值得一读。

手机之后国外各大巨头非常罕见的步调一致的在做同一件事情:智能音箱。而这一切最初的驱动力来自于Amazon Echo,但有意思的事情是Amazon Echo这产品根本没做任何的功能上的创新,听歌、看新闻、设闹钟、说笑话、控制家电等所有东西都可以在手机上找到替代品,它唯一的变化只是把语音交互的方式从近场升级为远场,并把精度和速度打磨到非常优秀的程度。只是这么一点点变化,似乎就要创造一个无比巨大的行业,那远场语音交互为什么有这么大的威力?

语音交互等价于远场语音交互

极端的讲法是世界上并不存在一种方式叫近场语音交互,语音交互基本等价于远场语音交互。事实证明过去很多年里各种近场语音交互的尝试(比如Siri)并没获得很好的进展,甚至简单实用的语音输入法也没能成为主流。从应用场景来看远场和近场的核心差别是拉开和语音设备的距离后,双手再也没用了。这样和触屏就可以彻底的差异化,可以彻底的发挥语音的快捷优势。想象下面的场景:

在微信里给一个人打视频电话,如果用手机那是下面这样的过程

亚马逊 Echo大获成功,远场语音交互技术在其中究竟扮演了什么角色? | 深度

如果变成远场语音,那核心步骤会变成两个

亚马逊 Echo大获成功,远场语音交互技术在其中究竟扮演了什么角色? | 深度

显然在这两种场景下便利程度是完全不一样的,这种便利理论上讲在近场的情形下同样存在,但核心点在于近场时就需要挑战用户根深蒂固的触屏习惯,这很难。触屏虽然大流行,但显然并没能在笔记本上挑战键盘鼠标的既有地位。这不单是偏好问题,也与各种应用与特定交互方式的绑定有关。触屏虽然好用,但并不能完全在Office上用起来,所以如果Office根深蒂固,那么键盘鼠标就根深蒂固。所以我们说,语音交互基本等价于远场语音交互,一旦它真的成为主流交互方式,培养了用户习惯,那反过来才可能在近场的场景(比如近场的Siri)下占有一席之地。

远场语音交互的核心技术

远场语音交互如果变的无处不在,那Amazon Alexa(以及同类产品)会变成新一代的Android,那个时候整个生态会像下面这样:

亚马逊 Echo大获成功,远场语音交互技术在其中究竟扮演了什么角色? | 深度

这个时候Alexa这样的系统同时覆盖了传统上Android和应用商店的角色,在其上面则会有新的今日头条、新的O2O等。而如果要把Alexa所依托的技术进行细分的话,那么基本上是三层:

前端的声学部分(算法+阵列)

识别

NLU

这样一来远场语音交互就正好面临一大一小两个瓶颈:

亚马逊 Echo大获成功,远场语音交互技术在其中究竟扮演了什么角色? | 深度

第一个瓶颈是眼下就要解决的问题,即在语义仍然有限制的条件下,打造偏命令控制的产品,这个时候产品的ID很难拟人化(想想Echo,Airpods这些产品),一旦拟人用户的潜在期望就会无限拔高,你也就不可能做出非常满足用户体验的产品。

第二个瓶颈则具有一定的不确定性,具有探索性质,我们仍然还不知道什么时候自然语言理解中可以体现出真的智能,但确实只有这点做了突破,并且同计算机视觉进行融合才能真的做好拟人的机器人。

而为了解决第一个瓶颈事实上需要做好的事情有两个:

一个是前端声学算法软硬件的持续优化

一个是通过获取的数据重新训练云端的ASR

这个过程可以用下图橙色的部分来概括。

亚马逊 Echo大获成功,远场语音交互技术在其中究竟扮演了什么角色? | 深度

上述这个看着并不太长的链条其实复杂度非常高,它即跨越不同的学科(声学部分属于经典物理,识别部分则属于CS),也需要打穿软硬件。

在算法层面只是前端就需要处理大量经典问题,比如降噪、去混响、回声抵消、Beamforming等。加不加这些算法的音频信号差异极大,如:

亚马逊 Echo大获成功,远场语音交互技术在其中究竟扮演了什么角色? | 深度

(具体效果试听可以参照http://soundai.com/demo.html)

而我们经常说的麦克风阵列即使抛开算法不论,单只在硬件层次上也远不是标准品:

亚马逊 Echo大获成功,远场语音交互技术在其中究竟扮演了什么角色? | 深度

上图是一款强调通用性的麦克风阵列,通过USB连接可以随便连接到笔记本、PAD、手机上进行使用。同样的阵列还可以做成线性、L型、球形,最终的目的都是匹配特定的场景,让最终远场交互的精度最优。

亚马逊 Echo大获成功,远场语音交互技术在其中究竟扮演了什么角色? | 深度

如果进一步下探,那就会出现更为底层的选择,比如是用驻极体麦克风还是用MEMS的,是用数字的还是用模拟的。

亚马逊 Echo大获成功,远场语音交互技术在其中究竟扮演了什么角色? | 深度

再进一步挖掘,麦克风从特性上还可以进一步细分,比如:

亚马逊 Echo大获成功,远场语音交互技术在其中究竟扮演了什么角色? | 深度

所有上面这些点如果不能一一理顺,那就没法给用户输出一种综合性的体验,单点最优在远场语音交互这里价值很小,相当于必要不充分条件。只有能够综合,并且能够优化单点才真的能够解决当前产品落地中的实际问题。

技术和商业上的正反馈

几乎所有大公司都感受到了远场语音交互背后的价值,所以纷纷试水:继亚马逊、Google之后,微软宣布了自己的智能音箱产品,预计苹果也会宣布自己的相似产品。但是远场语音交互的落地却可能比大家期望的要慢。核心点就在于技术-商业上的正反馈需要一定的启动周期。显然的技术不好用,产品体验就不好;而反过来产品没销量技术就缺乏打磨的场景,内容配套也就不会跟上。这种互锁状态就会形成一个冷启动周期,在这个周期里做技术的公司打磨自己的技术,在没那么大量的产品上落地,产品公司则接受技术现实,打磨自己的产品。这样一来整个远场语音交互很可能会跑下面的曲线:

亚马逊 Echo大获成功,远场语音交互技术在其中究竟扮演了什么角色? | 深度

这个过程是可以和过去很多商业现实验证的,比如2007年iPhone发布,小米手机则要迟到2011年,这期间的4年可以看成是智能手机的启动期,一旦这个市场启动后则进入一个高速增长期,小米手机的销量迅速从2012的700多万台增加到2014年的6000多万台。

远场语音交互的这个技术-商业正反馈当前还处在非常初期的阶段,亚马逊的Echo(各种型号)如果2017年的销量真的逼近2000万台,那基本上可以认为在美国,技术-商业的正反馈第一回合完成。而在国内,同品类产品销量都还处在几万、十几万量级的水平,这个技术-商业的正反馈远未完成。

当然这并非坏事,在格局已定的市场上,后来者是没有机会的;只有在这种充满未知的领域上,创业者才真的有颠覆性的机会。如果回退到20年前,联想、门户相对于现在的BAT都是巨无霸型公司,要资源有资源,要渠道有渠道,要人有人但很有意思的事情是BAT最终崛起了。

小结

手机的触屏把很多人塑造成了低头族,远场语音交互估计会塑造出许多和机器说话的人。那时候语言不再只是人和人的交互手段。

39度创意研究所 技术专区

关注电子发烧友微信

有趣有料的资讯及技术干货

下载发烧友APP

打造属于您的人脉电子圈

关注发烧友课堂

锁定最新课程活动及技术直播
收藏 人收藏
分享:

评论

qjsdxx
比较可怕
06-05 11:36

相关推荐

亚马逊echo智能音箱首拆解真相

2014年11月,亚马逊推出了一款全新概念的智能音箱:Echo,这款产品最大的亮点是将智能语音交互技....

发表于 12-29 16:59 次阅读 0条评论
亚马逊echo智能音箱首拆解真相

echo什么意思_@echo off的作用

本文介绍了echo在Linux和dos中的含义及应用,以及@echo的作用。英文原义:EchoPro....

发表于 11-21 23:36 次阅读 0条评论
echo什么意思_@echo off的作用

国外达人破解亚马逊Echo成监听设备 可远程窃听你发出的一切声音

现在的“智能音箱”之所以称为智能,是因为它时时刻刻可以听到你说话。于是信息安全就是个大问题,之前亚马....

发表于 08-03 15:38 次阅读 0条评论
国外达人破解亚马逊Echo成监听设备 可远程窃听你发出的一切声音

苹果HomePod给亚马逊带来危机感:后者将升级Echo配置抗衡HomePod

就像10年前初代iPhone所做的一样,苹果刚刚推出的HomePod又把智能音箱的身价拉到了349美....

发表于 07-16 11:31 次阅读 0条评论
苹果HomePod给亚马逊带来危机感:后者将升级Echo配置抗衡HomePod

亚马逊存在感不强?Echo有望升级与苹果HomePod匹敌

就像10年前初代iPhone所做的一样,苹果刚刚推出的HomePod又把智能音箱的身价拉到了349美....

发表于 07-15 15:09 次阅读 5条评论
亚马逊存在感不强?Echo有望升级与苹果HomePod匹敌

亚马逊全新Echo音箱年底前推出 目光瞄准同期上市的HomePod

亚马逊发明的智能音箱(Echo),成为获得行业高度评价的罕见创新,引发了许多科技公司的模仿。其中苹果....

发表于 07-14 15:42 次阅读 0条评论
亚马逊全新Echo音箱年底前推出 目光瞄准同期上市的HomePod

为回应苹果HomePod:亚马逊将发布新款Echo音箱

亚马逊发明的智能音箱(Echo),成为获得行业高度评价的罕见创新,引发了许多科技公司的模仿。其中苹果....

发表于 07-14 10:18 次阅读 0条评论
为回应苹果HomePod:亚马逊将发布新款Echo音箱

亚马逊Echo产品大集合 究竟应该选择哪款Echo?

以前,支持语音控制的扬声器和家庭智能助手还是科幻小说和电影中的情节。而最近几年,这些情节已经变成了现....

发表于 07-12 16:40 次阅读 0条评论
亚马逊Echo产品大集合 究竟应该选择哪款Echo?

谁才是最好的智能音箱?Google Home还是亚马逊Echo?

Google Home智能音箱发布现在已经有一年多的时间了,而从那时开始,这个市场就发生了翻天覆地的....

发表于 07-08 09:59 次阅读 0条评论
谁才是最好的智能音箱?Google Home还是亚马逊Echo?

相比于自家的Alexa而言 亚马逊似乎不大关心Echo智能音箱的竞争力

据Android Authority网站报道,在研究目前最好的智能温控器时,科技作者大卫·艾梅尔(D....

发表于 07-05 11:08 次阅读 0条评论
相比于自家的Alexa而言 亚马逊似乎不大关心Echo智能音箱的竞争力

智能音箱怎么选?HomePod还是Echo还是Google Home?

智能音箱、虚拟语音助手或智能家庭扬声器,不管你喜欢叫它们什么,现在它都是一种非常热门又很酷的产品。许....

发表于 06-30 09:47 次阅读 0条评论
智能音箱怎么选?HomePod还是Echo还是Google Home?

掘金消费物联网 Synaptics拿出三大杀手锏

未来10年人机界面技术的主要应用领域由智能手机转向消费物联网,为了在这一波增长大势中取得先机,人机界....

发表于 06-28 15:28 次阅读 3条评论
掘金消费物联网 Synaptics拿出三大杀手锏

亚马逊第二代智能音箱Echo Show评测汇总:非常成功 或将大有所为

5月12日,亚马逊推出了第二代智能音箱Echo Show,与第一代Echo相比,最大的特点是多了一块....

发表于 06-28 10:45 次阅读 0条评论
亚马逊第二代智能音箱Echo Show评测汇总:非常成功 或将大有所为

亚马逊Echo Show即将出货 现宣布支持第三方摄像头

据国外媒体报道,亚马逊于本周四宣布,即将出货的亚马逊Echo Show,可以兼容部分第三方智能家居摄....

发表于 06-26 17:44 次阅读 0条评论
亚马逊Echo Show即将出货 现宣布支持第三方摄像头

智能音箱大战:苹果刚出世的HomePod够不够资格跟谷歌和亚马逊的PK?

说到智能音箱,我们首先想到的肯定是亚马逊 Echo 和 Google Home 的大获成功,不过智能....

发表于 06-14 15:43 次阅读 0条评论
智能音箱大战:苹果刚出世的HomePod够不够资格跟谷歌和亚马逊的PK?

从苹果HomePod亚马逊Echo谷歌Home看智能音箱:你的智能音箱有多安全?

上周,苹果在WWDC大会上公布了备受期待的智能音箱HomePod,再次将人工智能问题推向了高潮。

发表于 06-14 15:23 次阅读 0条评论
从苹果HomePod亚马逊Echo谷歌Home看智能音箱:你的智能音箱有多安全?

三足鼎立之势:苹果HomePod竟与亚马逊Echo、谷歌Home不是一路人

智能家居和智能扬声器市场的竞争,其实早已展开,而随着苹果HomePod的正式亮相,竞争已经变得更加激....

发表于 06-12 08:48 次阅读 0条评论
三足鼎立之势:苹果HomePod竟与亚马逊Echo、谷歌Home不是一路人

苹果HomePod、亚马逊Echo、谷歌Home哪个好?三款智能音箱对比

据CNET网站报道,毋庸置疑的是,与亚马逊Echo或谷歌Home相比,苹果HomePod是更好的音箱....

发表于 06-07 16:20 次阅读 0条评论
苹果HomePod、亚马逊Echo、谷歌Home哪个好?三款智能音箱对比

苹果挑战亚马逊 智能音箱大战为何外热内冷?

当前亚马逊Echo音箱的语音助手Alexa它的智能化表现已经把Google Assistant、Co....

发表于 06-07 13:49 次阅读 0条评论
苹果挑战亚马逊 智能音箱大战为何外热内冷?

亚马逊新Echo智能音箱将发布:加入显示屏,旧款正打折促销

亚马逊Echo系列语音助手在北美市场颇为畅销,自然它的下一代产品也就颇受关注。最近,亚马逊已经在官方....

发表于 05-09 21:47 次阅读 0条评论
亚马逊新Echo智能音箱将发布:加入显示屏,旧款正打折促销