0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2018年Q3中国最火的智能音箱!秘密竟然是远场语音技术

章鹰观察 来源:电子发烧友原创 作者:章鹰 2019-01-19 00:01 次阅读

本站原创,作者:章鹰,电子发烧友执行副主编。

美国研究公司Strategy Analytics近日发布了《2018年第三季度全球智能音箱市场报告》。报告显示,全球智能音箱出货量第三季度达到2270万,同比增长197%,创历史新高。亚马逊在第三季度依然市场占有率最高,占据了32%的份额,谷歌以23%的份额紧追其后。百度的加入改变了全球智能音箱的市场格局,市场占有率猛增至8%,进入全球前四名。

“据IDC统计,2018年第三季度,搭载百度DuerOS的智能音箱在中国市场出货量第一名,小度系列智能硬件在中国市场增速最快,市场份额增至24%。百度在远场语音技术上有很大的突破。我们和Duer OS生态一起发展,上周Duer OS产品的出货量突破2亿。这与百度远场语音技术的突破是密切相关的。“百度语音部门负责人在1月16日深圳举办的百度大脑硬件及平台发布会现场表示。

远场语音技术三大关键点

2017年年初,各家开发厂商针对远场语音技术进行军备竞赛,智能音箱的市场大战,从2017年开始到现在,是从近场语音技术到远场语音技术的过度阶段,厂商会介绍自己的远场语音技术多么厉害,现在很少有人提手机语音识别的效果。

远场语音技术的三大关键点:第一、信号处理,没有信号处理,就没有现在的远场语音的效果,信号处理用于定位,定位算法才能创造远场语音智能;第二、软硬结合,在远场交互时代,需要与硬度深度结合,将算法、软件在硬件上打磨好,提升用户体验;第三、端到端语音语言一体化,信号处理基于端到端建模,声学模型是匹配好场景的,还有唤醒技术,采用端到端思路,对端到端词汇进行建模,再将唤醒技术和信号处理技术结合,下沉到Duer OS系统层,才能达到很好的唤醒效果。

语音技术软硬一体化解决方案

教会机器听懂人话的过程,就是通过深度神经网络训练声学模型和语言模型的过程。而一些公司宣传的机器识别准确率过高,速记员都达不到这一水平,还有很多相关的工作需要去完成,不能单靠深度神经网络的方法来实现。语音识别准确率涉及多方面原因,例如远场精确识别就是业界难题。

最新一年百度在语音技术上两大进展:一次唤醒多次交互技术,技术特点是信号尾点和语义尾点联合优化模型;第二点,针对声学模型和语义模型做双重的置信度模型,在唤醒一次后可以和机器进行自由交谈,技术的关键点是将干扰信息去除。需要端到端的思路,用信号衰减的思路,配合声纹技术,进行交互。这个技术会在小度系列的硬件产品落地。” 百度语音部门负责人解释说。

百度在远场语音交互技术突破,包括一次唤醒多次交互技术以及 SMLTA 模型,SMLTA 模型在百度输入法正式发布这个技术,特点是语言和语义进行建模训练,这个模型可以跑在手机端,取得和在线识别媲美的效果。

百度历经一年多的打磨和开发,全新推出了百度远场语音开发套件,包括远场语音端到端技术、两款分别主打高性能和高性价比的计算板卡、3种形态的麦克风阵列,形成了环形6+1麦、线形4麦和车载3麦的多形态麦克风阵列套件方案。

“让硬件制造商、ODM、OEM做智能音箱、智能电视、语音机器人、可穿戴设备和车载可以在百度大脑上找到和使用语音开发套件。我们希望提供一条产业链,让上下游合作起来。” 百度语音部门负责人强调说。“这套开发套件的优势,灵活、快速让开发者对接自己在场景中的资源,对接语义理解能力,对接知识库。“

百度远场语音开发套件基于端到端方案,严格按照最佳技术实践指导生产,可解决语音交互产品研发过程中无可用设备选型、选型调试成本大、调试效果不佳等问题。该方案支持回声消除、声源定位、波束形成、噪声抑制等处理算法,一、三、五米识别和唤醒效果优于同类产品,目前已落地150多款产品。

车载三麦克阵列,车上语音识别要求比较高,不仅是主音区,而且是双音区的语音识别,除了主驾驶位,还包括副驾驶位,百度车载三麦克钝角阵列放置在车顶,可以轻松实现主音区和双音区的语音识别,解决方案已经在百度车联网联盟内的被多个车厂采用。百度还在做DSP相关技术,配合麦克风阵列,价格更有竞争力。

主流芯片价格透明,两年原厂开发经验,主板方案非常有竞争力。合作模式:语音端到端产品,开发时间长,需要重新开模和设计,直接贴牌,提供产品原型,在这个基础上做二次开发;线下做开发,把方案放入适用的产品内部。

百度大脑AI硬件生态联盟

发布会现场,百度联合首批合作伙伴成立百度大脑硬件生态联盟,首批联盟伙伴包含芯片厂商赛灵思,摄像头模组厂商奥比中光、睿识、慧谷航天,开发套件厂商天启,终端设备厂商华正联等等。作为联盟发起人和组织者,百度大脑希望与联盟伙伴一起,共同制订端计算与AI硬件标准,共同促进和繁荣AI落地应用。



百度大脑也将对联盟合作伙伴提供深度技术支持、渠道支持、品牌授权、产品折扣和运营资源等权益,全面开启AI技术终端化的大门,赋能合作伙伴的同时为产业带来加速的交流和融合。正如百度AI技术生态部总经理喻友平所言,人工智能若要长期推动各个产业的升级与优化,需要合作伙伴的共同努力,打造适合AI发展的健康环境。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 百度
    +关注

    关注

    9

    文章

    2171

    浏览量

    88920
  • 语音识别
    +关注

    关注

    37

    文章

    1635

    浏览量

    111833
  • 智能音箱
    +关注

    关注

    31

    文章

    1774

    浏览量

    78026
收藏 人收藏

    评论

    相关推荐

    取电套件 零智能开关转单火线供电器 控屏转单火线取电器

    实现零智能开关转单火线安装
    发表于 04-02 01:57

    这个电路Q1和Q3会同时导通吗?

    在这个电路图中,MCU_CTL是MCU发出的数字控制信号,有没有可能在某种条件下,上管Q1和下管Q3同时导通?
    发表于 03-29 16:31

    N9H20 GPIO上电竟然是高电平,有没有办法解决?

    一直很纳闷,GPIO上电竟然是高电平。有没有办法解决,是不是要改动启动程序才能解决问题?
    发表于 01-17 08:27

    LTC3632 Q5的作用是什么?Q2和Q3是开关管吗?

    各位大佬, 萌新一枚,在查LT8612的时候看到了这个原理图,研究了一下,有几个问题想不明白,请教一下各位大佬。 请问一下Q5的作用是什么,Q2和Q3是开关管吗,还有就是LTC3632的Iset的806K的电阻是是干嘛的,是设
    发表于 01-05 06:36

    语音数据集:开启智能语音技术的新篇章

    随着人工智能技术的飞速发展,语音数据集在推动智能语音技术的进步中发挥着越来越重要的作用。语音数据
    的头像 发表于 12-29 11:06 200次阅读

    离线语音识别及控制是怎样的技术

    引言:  随着人工智能的飞速发展,离线语音识别技术成为了一项备受瞩目的创新。离线语音识别技术能够将人的
    发表于 11-24 17:41

    方言离线语音控制场景解决方案

      随着科技的不断发展,离线语音识别技术已经变得越来越成熟。在日常生活,老人或小孩可能会遇到一些困难,如操作复杂的电子设备。为了解决这一问题,离线语音识别模块成为了一个很好的解决方
    发表于 11-17 17:57

    你不知道的FPC,它的发展史竟然是这样的!

    你不知道的FPC,它的发展史竟然是这样的!
    的头像 发表于 11-15 10:48 452次阅读

    语音识别技术智能家居领域的应用与前景

    及未来的发展前景。 二、语音识别技术智能家居领域的应用 1.智能音箱控制:智能家居系统中,通过
    的头像 发表于 10-26 14:27 576次阅读

    程序员节 | 今年程序员们都想要的礼物竟然是……

    原文标题:程序员节 | 今年程序员们都想要的礼物竟然是…… 文章出处:【微信公众号:微软科技】欢迎添加关注!文章转载请注明出处。
    的头像 发表于 10-24 10:35 266次阅读
    程序员节 | 今年程序员们都想要的礼物<b class='flag-5'>竟然是</b>……

    闪耀“中国芯” 华大北斗荣获2023中国芯”优秀技术创新产品奖

    技术创新产品大奖。 自2006以来,“中国芯”优秀产品征集活动至今已连续开展18,旨在对国内集成电路领域产品创新、技术创新和应用创新的
    发表于 09-22 14:46

    《2023中国卫星导航与位置服务产业发展白皮书》发布, 北斗芯片再受关注

    5月18日,中国卫星导航定位协会在京发布《2023中国卫星导航与位置服务产业发展白皮书》。白皮书显示,2022我国卫星导航与位置服务产业总体产值达到5007亿元人民币,较2021
    发表于 09-11 09:35

    如何开发智能家居语音控制方案

    挑战与应用 随着科学技术和人工智能的不断发展,智能生活已经深入生活各个方面,而AI语音控制作为智能化的前驱,其
    发表于 05-31 09:50

    语音识别技术的概念及应用前景

    力来进行识别和语义处理,一个常见的智能语音处理流程如下图所示。 ​ 启英泰伦是行业内首家将人工智能语音处理技术运用到芯片上的公司。2016
    发表于 05-27 09:41

    基于OpenHarmony的智能音响

    搭载OpenHarmony操作系统的小凌派LCD显示屏上显示实时时间和当地实时天气情况。在人工智能音箱交互的过程,主要是使用耳和嘴两个信息通道,即听和说,语音识别的过程要经过三个阶段
    发表于 05-06 15:41