从蓝海杀成红海的语音科技，如何才能转化成智能家庭的入口-电子发烧友网

从蓝海杀成红海的语音科技，如何才能转化成智能家庭的入口

各种调查数据显示，智能家居市场规模在未来几年，将会突破万亿，巨大蛋糕吸引了众多玩家参与，也涌现出众多创新企业，然而，要实现智慧的生活，这其中涉及到跨平台、跨品牌等互联互通是基础，处在产业链核心断的公司积极搭建生态建设，在这个智能家居市场整顿中，谁能聚拢更多第三方资源，谁就占住主导权，一个简单的语音人机交互对话场景中，机器稳中带皮的表现算是我们对于智能音箱最基本层面、最直观的认识了。而事实上，这并非智能音箱的最终形态。

智能音箱大混战从前年开始，已经在作为中国硅谷科技的前沿的巨头间打得焦头烂额。然而一直被全球认为是消费潜力巨大的中国市场，却在智能音箱领域陷入尴尬的境地。目前为止，国内还未出现单品销量突破1000万台的智能音箱产品。

互联网巨头眼中，智能音箱被定义为是继PC电脑图形化系统+键鼠外设交互方式、智能手机+触屏操作交互方式之后的新形态交互方式，是后互联网时代的下一个超级入口。看整个互联网技术，就是数字技术颠覆性的变革和机会。我们最近在大力的推语音（智能音箱），其实都是一样的，智能音箱的工作原理：人发出指令——音箱对声音处理识别——传输服务器作出回应——传回智能音箱或者其他服务器——得出结果（其他设备开始运行）。

毫无疑问语音是未来一个互联网入口。有效的抢占了下一个互联网的超级入口就意味着在互联网的下一个时代里会拥有更多的主动权和话语权，因此被誉为下一个互联网超级入口的智能音箱产业早已形成巨头环伺的竞争形态。

目前，各品牌的智能音箱除了充当语音交互方式的闹钟设定、天气提醒查询、翻译、算数等基本生活小助手之外，同时还兼顾路况、百科查询，点外卖、叫专车等贴身小管家一职。技能的拓展性、应用场景的适应性在不断增强。

仅仅在深圳南山区一公里以内，就有112家公司做语音智能。”有如此之多的公司在做智能音箱，但真正成为了产品用户的公司却少之又少，对于智能硬件来说，没有销量，都是空谈。有人曾用这么一句话形容目前国内的智能音箱市场：行业爆款转身变成了鸡肋。

在智能音箱领域，用户体验是经常被强调的点，语音交互与服务内容则是竞争核心。而智能音箱行业发展的最大瓶颈则是AI技术的不成熟。目前AI技术虽愈加火爆，但仍处于弱人工智能阶段，其语音识别、语音合成、自然降噪等技术仅仅处于“可用”阶段，远未能满足人类的深度体验。

在智能音箱使用之前，需要加入局域网，而这一步需要在相应的手机app中操作才能实现。虽然这只是初始的一步，却反映出手机在智能家居体系中的重要地位。与小巧便携的手机相比，智能音箱显得臃肿了很多，尤其是对于许多经常出差的商务人士而言，智能音箱的使用率更是大打折扣。

在智能音箱背后，真正起作用的是语音助手，语音助手的背后则是基于大数据的人工智能。而人类是情感动物，智能音箱发展到今天之所以还没有成为人们生活中的常态，是由于AI技术还停留在机械化阶段，无法消解人类的孤独感。

尽管现在的AI音箱能够完成人类的一些指令，但想要进一步发展，需要完成从机械式执行到情感式对话的转变。要实现这一点，就需要AI技术更加成熟，需要AI朝着人性化的方向发展。

术硬伤难以突破：语义识别以及中文语言识别

智能音箱相关分析表示：在对话方式上，一些中国制造商生产的设备语音识别准确率低，中文自然语言的整体理解和反应依旧不够成熟，这是阻碍普及的一个关键原因。

语义识别是目前智能音箱的一个痛点，但也是AI技术的一大问题。AI可以下围棋战胜李世石，但它现在不一定能听明白每个人在讲什么。＂

因为智能音箱的语音技术可以分为三个阶段：噪声抵消、语音识别，和语义识别。相对于国外，我国在于AI智能语音助理上的发展水平暂处于相对落后的状态。而对于智能家居这种产品来说，其技术核心是依赖语音声控，背后是人工智能的智能识别能力与深度学习能力。

虽然现在国内在相关技术上已经有一定的突破，比如科大讯飞，思必驰等公司都是具备语音识别能力的厂商。但当前，国内的智能音箱厂商还没有人工智能方面的平台优势，可以像亚马逊、谷歌那样跨越多个垂直领域进行资源整合的能力。

另外，除了在技术实力的原因以外，其语义识别的主要问题在于中国复杂的语言环境。

目前市面上的AI音箱只支持中文普通话交互，与中国的人文环境有所差异，实际情况却不如想象中那般简单：中国地域广袤，方言语系多样，据不完全统计，仅彼此不能相互沟通的方言就有80多种。

虽然普通话已经普及了几十年，但截至今日，仍有不少人不会说普通话；而夹杂方言的“伪普通话”更是多如牛毛。在语境方面，也不利于机器的语音学习和大数据手机。相比国外的智能产品，我国在本土智能音箱的发展过程中，仅在语言关方面，就需要多耗费数倍的研发精力。

因此，由于智能音箱在汉语的语音识别和语义交互等对话式交互技术还尚未成熟，都严重影响着用户体验。在目前的过渡阶段，提高音箱耳机产品本身的性能才是企业的重中之重。而只有当语言交互界面技术成型，并发展为标准服务时，智能音箱在有可能在中国市场真正普及起来实际上，国内对于人工智能的技术还没有使用习惯，智能音箱算是整个AI领域发展较为快速的。其实，我们也能从中看出一大问题，就是智能音箱的核心价值没有标准化，没有抓取到用户的核心需求，很多人都是在为智能而不是音质等需求买单，总的来说，不论关键在不在于技术，而是如何让技术符合你的生活需求，AI需要实实在在的应用。

尽管今年互联网巨头在智能音箱上价格战剧烈，但智能音箱发展仍呈现差异化的几个方向，这主要源于智能音箱品牌全品类布局与差异化布局。在十几家智能音箱品牌的二三十款音箱中呈现出4个特点：入门mini产品、大众产品、高端产品、儿童产品。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人机交互

人机交互

+关注

关注
12

文章
1127

浏览量
54758
智能语音

智能语音

+关注

关注
10

文章
759

浏览量
48362

原文标题：从蓝海创新到红海突围：智能语音核实能飞入寻常百姓家

文章出处：【微信号：mojay_semi，微信公众号：茂捷半导体】欢迎添加关注！文章转载请注明出处。

ADUCM350可以同时处理生物阻抗信号、声音转化成的电流信号吗？

请问，ADUCM350可以同时处理生物阻抗信号、声音转化成的电流信号吗？ ADUCM350可以处理惯性传感器收集的运动信号吗？同时收集和处理生物阻抗、声音、运动信号，除了评估套装（EVAL-ADUCM350EBZ)以外，还需要购买其他配套的评估板吗？

发表于 01-11 07:10

怎么用verdi将fsdb格式的波形转化成txt呢？

和大家分享一个小技巧，你在debug问题的时候，是不是也曾经想过将波形中的某些信号转化成txt，然后用txt的值复现某些波形或者与理论值对比。

发表于 01-10 09:19 •872次阅读

怎么用verdi将fsdb格式的波形<b class='flag-5'>转化成</b>txt呢？

oracle将clob转化成string

将CLOB（Character Large Object）转换为字符串是一种常见的需求，特别是在处理大文本数据时。Oracle数据库提供了几种方法和函数来实现这个转换过程。本文将详细介绍这些方法和函数，并提供示例代码和使用提示。一、使用DBMS_LOB包 DBMS_LOB是Oracle提供的一个内置包，提供了许多操作LOB类型（包括CLOB）的函数。使用DBMS_LOB.GETLENGTH函数获取CLOB的长度： DECLARE v_clob CLOB; v_length NUMBER; BEGIN v_clob := 'This is a sample CLOB.'; v_length := DBMS_LOB.GETLENGTH(v_clob); DBMS_OUTPUT.PUT_LINE(

发表于 11-21 11:24 •4604次阅读

求助，关于OPT3001传感器读出数据异常问题

根据数据写出驱动，这个读出来的数据怎么转化成光照强度呢

发表于 11-06 06:01

51单片机如何将程序转化成硬件变化？

51单片机如何将程序转化成硬件变化

发表于 11-01 08:19

云盘转镜像报错的问题处理

某运营商将云盘转化成镜像报错，操作日志如下图所示。

发表于 09-20 11:04 •309次阅读

YXC晶振提供基于Realtek的会议终端智能语音解决方案

数字信号是按特定的编码规则组成的信号，需要专门的解码芯片去处理,最后转化成人们熟悉的声音，此时为了保持音频同步的问题，选择在声卡芯片外置一颗扬兴科技有源晶振YSO110TR 24.576MHZ，语音

发表于 09-19 17:59 •1112次阅读

YXC晶振提供基于Realtek的会议终端<b class='flag-5'>智能</b><b class='flag-5'>语音</b>解决方案

如何将220V交流电转化成12V直流电呢？有哪些方法？

直流12V应用于很多场合，那么如何将220V交流电转化成12V直流电，其实有很多种方法，可以用反激式、正激式、AD-DC、阻容降压等方法实现，下面介绍几种方法。

发表于 08-12 15:35 •1.6w次阅读

如何将220V交流电<b class='flag-5'>转化成</b>12V直流电呢？有哪些方法？

语音识别唤醒词：让智能设备主动“听”你的声音

，为用户提供更加便捷、智能的交互体验。本文将深入探讨语音识别唤醒词的意义、技术原理以及在家庭生活、商业和物联网等领域的广泛应用前景。一、语音识别唤醒词的意义：传统的

发表于 08-07 20:21 •1233次阅读

verilog语言的可综合性和仿真特性

综合就是将HDL语言转化成与，非，或门等等基本逻辑单元组成的门级连接。因此，可综合语句就是能够通过EDA工具自动转化成硬件逻辑的语句。

发表于 06-28 10:39 •950次阅读

如何开发智能家居语音控制方案

，多轮对话及意图理解，识别相应速度极快，采用此款方案设计的智能语音空调，使用离线唤醒指令，系统响应可短至0.8s以内（指从指令识别到设备动作完成），而传统语音控制方案往往需要2-3s，

发表于 05-31 09:50

语音识别技术的概念及应用前景

一种最自然的交互方式，和IOT结合可以解决IOT控制中配网麻烦、需要中心的一些痛点，又可以让设备互联后共同为用户提供服务，实现一个语音入口设备控制全部IOT设备，非常方便。特别是随着专用智能语

发表于 05-27 09:41

ASIC物理设计流程概述

Physical design是将电路描述（circuit description）转化成物理版图（physical layout）的过程。

发表于 05-23 14:39 •738次阅读

语音识别技术发展的驱动力：语音数据的采集和处理

语音识别技术是一项基于人工智能的技术，通过计算机对人的语音进行分析和处理，将语音转化成文字，以此达到自动化处理的目的。

发表于 05-15 09:27 •743次阅读

语音识别芯片or语音提示芯片哪款更贴近生活

都有哪些优缺点呢? 语音识别芯片语音识别芯片只需要上位机发送文本信息就可以了，这些文本信息会转化成为语音信号，相比语音提示芯片有更好的灵活

发表于 05-10 16:23 •305次阅读

搜索历史