0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2018年Q3中国最火的智能音箱!秘密竟然是远场语音技术

章鹰观察 来源:电子发烧友原创 作者:章鹰 2019-01-19 00:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本站原创,作者:章鹰,电子发烧友执行副主编。

美国研究公司Strategy Analytics近日发布了《2018年第三季度全球智能音箱市场报告》。报告显示,全球智能音箱出货量第三季度达到2270万,同比增长197%,创历史新高。亚马逊在第三季度依然市场占有率最高,占据了32%的份额,谷歌以23%的份额紧追其后。百度的加入改变了全球智能音箱的市场格局,市场占有率猛增至8%,进入全球前四名。

“据IDC统计,2018年第三季度,搭载百度DuerOS的智能音箱在中国市场出货量第一名,小度系列智能硬件在中国市场增速最快,市场份额增至24%。百度在远场语音技术上有很大的突破。我们和Duer OS生态一起发展,上周Duer OS产品的出货量突破2亿。这与百度远场语音技术的突破是密切相关的。“百度语音部门负责人在1月16日深圳举办的百度大脑硬件及平台发布会现场表示。

远场语音技术三大关键点

2017年年初,各家开发厂商针对远场语音技术进行军备竞赛,智能音箱的市场大战,从2017年开始到现在,是从近场语音技术到远场语音技术的过度阶段,厂商会介绍自己的远场语音技术多么厉害,现在很少有人提手机语音识别的效果。

远场语音技术的三大关键点:第一、信号处理,没有信号处理,就没有现在的远场语音的效果,信号处理用于定位,定位算法才能创造远场语音智能;第二、软硬结合,在远场交互时代,需要与硬度深度结合,将算法、软件在硬件上打磨好,提升用户体验;第三、端到端语音语言一体化,信号处理基于端到端建模,声学模型是匹配好场景的,还有唤醒技术,采用端到端思路,对端到端词汇进行建模,再将唤醒技术和信号处理技术结合,下沉到Duer OS系统层,才能达到很好的唤醒效果。

语音技术软硬一体化解决方案

教会机器听懂人话的过程,就是通过深度神经网络训练声学模型和语言模型的过程。而一些公司宣传的机器识别准确率过高,速记员都达不到这一水平,还有很多相关的工作需要去完成,不能单靠深度神经网络的方法来实现。语音识别准确率涉及多方面原因,例如远场精确识别就是业界难题。

“最新一年百度在语音技术上两大进展:一次唤醒多次交互技术,技术特点是信号尾点和语义尾点联合优化模型;第二点,针对声学模型和语义模型做双重的置信度模型,在唤醒一次后可以和机器进行自由交谈,技术的关键点是将干扰信息去除。需要端到端的思路,用信号衰减的思路,配合声纹技术,进行交互。这个技术会在小度系列的硬件产品落地。” 百度语音部门负责人解释说。

百度在远场语音交互技术突破,包括一次唤醒多次交互技术以及 SMLTA 模型,SMLTA 模型在百度输入法正式发布这个技术,特点是语言和语义进行建模训练,这个模型可以跑在手机端,取得和在线识别媲美的效果。

百度历经一年多的打磨和开发,全新推出了百度远场语音开发套件,包括远场语音端到端技术、两款分别主打高性能和高性价比的计算板卡、3种形态的麦克风阵列,形成了环形6+1麦、线形4麦和车载3麦的多形态麦克风阵列套件方案。

“让硬件制造商、ODM、OEM做智能音箱、智能电视、语音机器人、可穿戴设备和车载可以在百度大脑上找到和使用语音开发套件。我们希望提供一条产业链,让上下游合作起来。” 百度语音部门负责人强调说。“这套开发套件的优势,灵活、快速让开发者对接自己在场景中的资源,对接语义理解能力,对接知识库。“

百度远场语音开发套件基于端到端方案,严格按照最佳技术实践指导生产,可解决语音交互产品研发过程中无可用设备选型、选型调试成本大、调试效果不佳等问题。该方案支持回声消除、声源定位、波束形成、噪声抑制等处理算法,一、三、五米识别和唤醒效果优于同类产品,目前已落地150多款产品。

车载三麦克阵列,车上语音识别要求比较高,不仅是主音区,而且是双音区的语音识别,除了主驾驶位,还包括副驾驶位,百度车载三麦克钝角阵列放置在车顶,可以轻松实现主音区和双音区的语音识别,解决方案已经在百度车联网联盟内的被多个车厂采用。百度还在做DSP相关技术,配合麦克风阵列,价格更有竞争力。

主流芯片价格透明,两年原厂开发经验,主板方案非常有竞争力。合作模式:语音端到端产品,开发时间长,需要重新开模和设计,直接贴牌,提供产品原型,在这个基础上做二次开发;线下做开发,把方案放入适用的产品内部。

百度大脑AI硬件生态联盟

发布会现场,百度联合首批合作伙伴成立百度大脑硬件生态联盟,首批联盟伙伴包含芯片厂商赛灵思,摄像头模组厂商奥比中光、睿识、慧谷航天,开发套件厂商天启,终端设备厂商华正联等等。作为联盟发起人和组织者,百度大脑希望与联盟伙伴一起,共同制订端计算与AI硬件标准,共同促进和繁荣AI落地应用。



百度大脑也将对联盟合作伙伴提供深度技术支持、渠道支持、品牌授权、产品折扣和运营资源等权益,全面开启AI技术终端化的大门,赋能合作伙伴的同时为产业带来加速的交流和融合。正如百度AI技术生态部总经理喻友平所言,人工智能若要长期推动各个产业的升级与优化,需要合作伙伴的共同努力,打造适合AI发展的健康环境。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 百度
    +关注

    关注

    9

    文章

    2368

    浏览量

    94250
  • 语音识别
    +关注

    关注

    39

    文章

    1804

    浏览量

    115579
  • 智能音箱
    +关注

    关注

    31

    文章

    1794

    浏览量

    80546
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    全年营收剑指90亿美元!芯国际Q3满产冲刺,净利润大涨43.1%

    11月13日,国内最大的晶圆代工企业芯国际发布Q3业绩报,三季度,芯国际公司整体实现营业收入人民币 171.62 亿元(23.81亿美元),同比增长9.9%;Q3归属上市公司净利润
    的头像 发表于 11-14 10:00 1.2w次阅读
    全年营收剑指90亿美元!<b class='flag-5'>中</b>芯国际<b class='flag-5'>Q3</b>满产冲刺,净利润大涨43.1%

    鲁大师2025PC Q3季报:将阉割进行到底

    Q3季度相对平淡了一些,有亮点但是不多,对于广大的DIY用户来说确实缺乏升级的欲望,今年PC市场或许要到双11促销的时候才能冲上一波,且看各家如何年终斗法。
    的头像 发表于 10-10 13:43 255次阅读
    鲁大师2025<b class='flag-5'>年</b>PC <b class='flag-5'>Q3</b>季报:将阉割进行到底

    智能音箱接口的ESD防护方案

    智能音箱是从传统音箱升级而来的新型产品,它是由传感器、IC芯片、锂电池、外设配件等电子元件组成,除基础的音乐播放功能外,它还集成了查询天气、语音控制、出行玩乐信息检索等网络功能,其中
    的头像 发表于 09-08 16:34 4225次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>音箱</b>接口的ESD防护方案

    力久电机亮相2025中国油气开发技术年会

    此前,7月3日-4日,2025年中国油气技术开发年会暨油气开发新成果及新技术展示会在北京成功举行。本届大会以“高举技术创新旗帜 奋进油气绿色
    的头像 发表于 07-11 16:17 616次阅读

    智睿SSD2351开发板:语音机器人领域的变革力量

    在人工智能快速发展的今天,语音机器人逐渐成为人们生活和工作的得力助手。明智睿SSD2351开发板凭借强大性能与丰富功能,为语音机器人的发
    发表于 05-28 11:36

    智睿SSD2351开发板:智能家居的智能核心

    ,实现设备之间的协同工作,为用户提供更加智能化的生活体验。 丰富的接口使得开发板能够轻松连接各种智能家居设备。通过USB接口可以连接智能摄像头、智能
    发表于 05-07 18:59

    UPS(不间断电源)故障频发?原因竟然是这样

    UPS(不间断电源)故障频发?原因竟然是这样
    的头像 发表于 04-19 13:53 1379次阅读
    UPS(不间断电源)故障频发?原因<b class='flag-5'>竟然是</b>这样

    2024年中国工业机器人市场回顾与总结

    从整体市场来看,2024年中国工业机器人产量为55.6万台,同比增长14.2%;2024年中国工业机器人市场销量为30.2万台,同比下降4.50%。中国作为全球最大工业机器人产销市场的地位持续巩固。
    的头像 发表于 03-04 09:21 4868次阅读
    2024<b class='flag-5'>年中国</b>工业机器人市场回顾与总结

    WT3000A在线AI语音芯片方案在智能蓝牙音箱的应用

    随着物联网(IoT)和人工智能(AI)技术的快速发展,智能家居设备逐渐成为现代家庭的重要组成部分。智能蓝牙音箱作为
    的头像 发表于 02-25 17:10 809次阅读

    OptiFDTD应用:二进制光栅建模及近场和模拟

    入射光束。 检测采样波长的传输光束(对于图案1) 传输功率谱 转换 (1)FDTD主要进行近场模拟,更长距离的模拟要求更多CPU时间和内存使用。 (2)然而,OptiFDTD提供
    发表于 02-20 08:56

    2025中国(华东)智能家居技术创新研讨会

    2025中国(华东)智能家居技术创新研讨会 时间:2025 3月21日 主办单位:Big-Bit商务网 承办单位:《半导体器件应用》杂志
    的头像 发表于 01-22 13:52 936次阅读
    2025<b class='flag-5'>中国</b>(华东)<b class='flag-5'>智能</b>家居<b class='flag-5'>技术</b>创新研讨会

    OptiFDTD案例:二进制光栅建模及近场和模拟

    入射光束。 检测采样波长的传输光束(对于图案1) 传输功率谱 转换 (1)FDTD主要进行近场模拟,更长距离的模拟要求更多CPU时间和内存使用。 (2)然而,OptiFDTD提供
    发表于 01-20 10:26

    「2024中国AIEV产业智驾创新企业」揭榜,文知行光荣上榜

    知行在过去的发展,展现出了非常大的创新能力。202412月20日,知名信息平台亿欧网公布了「2024中国AIEV产业智驾创新企业」的榜单,“全球Robotaxi第一股”的文
    的头像 发表于 01-08 11:37 834次阅读
    「2024<b class='flag-5'>中国</b>AIEV产业智驾创新企业」揭榜,文<b class='flag-5'>远</b>知行光荣上榜

    空调语音控制方案NRK3501语音识别芯片-让智能生活触手可及!

    NRK3501语音识别芯片支持离线语音控制空调,精准识别,降噪,最多支持200条离线指令,5米内识别率92%,让智能家居更便捷舒适。
    的头像 发表于 01-07 11:40 1270次阅读
    空调<b class='flag-5'>语音</b>控制方案NRK3501<b class='flag-5'>语音</b>识别芯片-让<b class='flag-5'>智能</b>生活触手可及!

    离线语音识别技术引领智能语音灯具市场——NRK3502

    智能语音灯具集高科技与人性化设计,内置NRK3502离线语音识别芯片,支持识别与自定义指令,提供便捷
    的头像 发表于 12-30 15:04 1225次阅读
    离线<b class='flag-5'>语音</b>识别<b class='flag-5'>技术</b>引领<b class='flag-5'>智能</b><b class='flag-5'>语音</b>灯具市场——NRK3502