0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于云知声开源全栈语音交互方案概念详解

云知声 来源:djl 作者:云知声 2019-08-08 16:40 次阅读

其实现在外面好多合作伙伴都说我们特别‘独’,不过等你们的东西做出来,大家就不会这么说啦。”云知声联合创始人、芯片负责人李霄寒经常用这句话作为开头来鼓励自己的芯片团队尽快完成 Turnkey 整体音箱方案。因为在 5 月份云知声首款面向物联网AI 芯片—— UniOne 的发布会上,在 UniOne 上实现 Turnkey 音箱方案并将其整体开源,已经作为一个重大举措发布了。

谈起之前和合作伙伴的合作,李霄寒还是比较感慨的,云知声之所以能成为国内唯一实现 IVM (智能硬件模组)在白电领域大规模出货的 AI 公司,其中最关键的一条就是云知声提供了软硬件云+端一体化解决方案,为客户提供了一站式解决方案。但是这种模式,让很多希望和云知声展开合作的技术方案公司感觉云知声不太愿意和大家一起玩,所以有人半开玩笑半认真地说云知声比较“独”。

但是另一方面,李霄寒认为前两年的“独”,恰恰是对合作伙伴的负责。因为面向智能家居实现 AI 落地,牵涉到非常多的环节,比如需要积累可以量产化的结构经验;比如需要通过引擎、硬件平台选型以及系统优化,满足家电厂商整体的功耗要求;再比如适配云知声引擎,并在价格和性能方面达到最佳配置的通用芯片选型。这些都需要经过团队之间日常的紧密的合作,有时候甚至需要针对某些硬件特点做相应的引擎代码级别修改,才能真正实现最佳效果。

“如果仅仅提供一个引擎给自己的合作伙伴,再提供一些 SDK 层面的适配和支持,其实对自己的合作伙伴,包括对自己的团队,都是不负责任的。因为大家资源都是有限而宝贵的,引擎原厂没有足够的硬件、系统和产品经验,是无法高效支撑合作伙伴,最终大家做了很多合作,可能只是一场热闹,而无法做到量产出货。”这是李霄寒的结论。

正是在这种思想的指导下,云知声一面提供着 IVM 的整体解决方案,一面把自己在 IVM 实际落地场景下积累的经验和参数,落实到自有 AI 芯片 UniOne 的设计中,期望通过芯片最大可能地把家居场景下的关键部分进行固化,再将该芯片之上的全栈语音交互进行开源,大大降低技术门槛、缩短上市时间,从而确保合作伙伴与云知声的合作都有收获。

“不过这么做压力很大”,作为资深金庸迷,李霄寒有时候在内部开玩笑,说基于 UniOne 整体开源交互方案出来之前,自己经常想起《倚天屠龙记》里面赵敏说的那两句话“周公恐惧流言日,王莽礼谦下士时”,不过这也更加促进了自己领导的芯片团队加班加点。

碎片化IoT市场 VS基于UniOne的统一战线

兵无常势,水无常形, UniOne 出来后,云知声也进入到自己的“芯时代”,远讲降噪的 2Mic、4Mic 算法的各个参数,离线唤醒达到最佳唤醒率/误唤醒率的阈值,离线识别命令的模型大小和反应速度,都已经调到了最佳状态并且固化在 UniOne 中。在这种情况下,和合作伙伴一起做,就在一个非常稳固并且高起点地基础上了。面向很多潜在地客户,云知声均有一套经过验证过的参数,可以保证最终产品的性能,如果后续云知声算法有升级,也可以通过刷新 UniOne 中的固件来确保效果。

与此同时, UniOne 上目前实现的音箱整体交互方案也将开源。大家可以先感受一下当前的效果。

“ Turnkey 方案的开源,必将大大促进整体智能硬件产品的开发”,谈及这点,李霄寒信心满满。原因主要来源于以下三个方面:

一、 智能硬件的产品经理非常稀缺,尤其是懂语音交互设计的产品经理。语音交互(VUI)与之前屏幕为主要展示的图形界面交互(GUI)差别非常大,前者是扁平结构,一句话直达系统任何一个图形界面,可以做任何一个操作。而后者是树形结构,需要一步步点击。这两种交互各有优势,而VUI 目前市面上人才不多,又由于其扁平结构的特性,在设计的时候,需要从系统整体层面来考虑,而不是简简单单一个 App 层面。如此总总,都大大增加了 VUI 设计难度。

“产品交互设计如果都不好,最终开发的产品效果就可想而知了。”而作为云知声创始团队的李霄寒,在十多年前就在 Motorola 中国研究中心从事人机交互相关的研究工作,从 Motorola 手机上的语音交互到云知声车载到格力空调、斐讯音箱,李霄寒带领云知声团队积累了丰富的 VUI 设计和开发经验,而这些经验凝结而成的整体语音交互方案,将随着 UniOne 一起作为 Turnkey 方案整体开源,这一切将大大降低行业门槛。

二、 语音交互方案开源将大大缩短开发周期。作为一个系统级的功能,语音交互方案将处理音频驱动,处理与系统其他应用的交互,处理各个案件和唤醒事件,而且必须足够健壮稳定,这些都随着云知声开源方案得到解决。合作伙伴可以只做浅层次的定制化改造,比如唤醒词修改;也可以做深层次开发,比如基于云知声架构框架增加自己的对话 Session ;也可以在看懂整体方案情况下,完全重写。

三、 云知声经过考验的实施团队,提及云知声的竞争优势,很多客户都对云知声的服务表示认可,这与云知声有一支经验丰富并且善于和客户配合的实施团队密不可分。而在“芯时代”,这支团队将为愿意采用云知声 UniOne 的合作伙伴提供整体开源方案的技术支持,包括代码培训、工具开发等,尽一切可能降低合作伙伴熟悉整体开源方案的学习曲线陡峭度。

正如在 UniOne 芯片发布会上李霄寒所强调的,IoT 是一个碎片化的市场,面对这个碎片化的市场,如何以一个高效的方式应对,是云知声,也是云知声的合作伙伴需要认真面对并深度思考的。现在云知声给出了自己的回答,通过凝结自己场景落地经验的 UniOne 芯片,将其上的全栈语音交互方案进行开源,结成统一战线。各个合作伙伴可以在开源方案上将精力更多地放在自己熟悉的细分市场定制化方向,更快更好更多的出货。而云知声聚焦在自己性能改进和芯片迭代,更高性能更低成本。

“9月份,大家一起来”,李霄寒非常高兴自己终于可以在9月份的 UniOne Turnkey 方案开源研讨会上甩掉戴在自己和云知声头上两年多的“独”的帽子了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    447

    文章

    48174

    浏览量

    410924
  • 语音交互
    +关注

    关注

    3

    文章

    276

    浏览量

    27841
  • 云知声
    +关注

    关注

    0

    文章

    125

    浏览量

    8281
收藏 人收藏

    评论

    相关推荐

    基于唯创语音芯片的三大烟雾报警器语音方案

    在智能设备与物联网(IoT)技术的飞速发展中,语音播报功能的重要性日益凸显,已成为提升用户体验、实现人机交互的关键一环。本文将深入探讨三种创新性语音播报系统设计方案:传统
    的头像 发表于 04-12 15:08 100次阅读
    基于唯创<b class='flag-5'>语音</b>芯片的三大烟雾报警器<b class='flag-5'>语音</b><b class='flag-5'>方案</b>

    语云全景监测技术:现代安全防护的全面解决方案

    随着信息技术的飞速发展,网络安全问题日益突出,企业和个人对安全防护的需求也越来越迫切。在这个背景下,语云全景监测技术应运而生,为现代安全防护提供了一个全面而高效的解决方案语云全景监测技术
    发表于 02-23 16:40

    思必驰语音算法与芯片的完美结合 人机交互

    TH1520芯片解决方案AISpeech思必驰深圳羲顿科技有限公司TH1520是深聪智能(思必驰旗下的芯片设计企业)根据语音交互市场及算法的需求及发展方向,自主定义开发的“芯片+算法”的人
    的头像 发表于 12-29 11:43 285次阅读
    思必驰<b class='flag-5'>语音</b>算法与芯片的完美结合 人机<b class='flag-5'>交互</b>

    你相信光吗?开源一个能进行虚拟光渲交互志D1s智能家居中控

    本文所介绍产品demo是在立创开源平台的开源作品**《志D1s智能家居中控虚拟光渲交互(86盒)》**,项目选用RISC-V核心的志D1
    发表于 12-14 15:26

    情感语音识别技术在人机交互中的应用与展望

    一、引言 随着人工智能技术的不断发展,人机交互已经渗透到日常生活的方方面面。情感语音识别作为人机交互中的关键技术之一,能够通过分析人类语音中的情感信息实现更加智能化和个性化的人机
    的头像 发表于 11-22 10:40 385次阅读

    方言离线语音控制场景解决方案

    致力于为客户提供一站式的离线语音解决方案。我们的服务涵盖了多个领域,包括家电、医疗器械、安防报警、汽车电子、多媒体、通信、电话录音、工业自动化控制、玩具及互动消费类产品等。通过我们的专业知识和经验,我们能够满足各类产品的语音
    发表于 11-17 17:57

    情感语音识别技术在人机交互中的应用与挑战

     一、引言 随着人工智能技术的不断发展,人机交互已经成为了研究的热点之一。情感语音识别技术作为人机交互中的重要组成部分,能够通过识别人的语音情感,实现更加智能化和个性化的
    的头像 发表于 11-09 15:27 417次阅读

    AISpeech 思必驰 思必驰语音算法与芯片的完美结合 人机交互

    TH1520是深聪智能(思必驰旗下的芯片设计企业)根据语音交互市场及算法的需求及发展方向,自主定义开发的 “芯片+算法” 的人工智能人机语音交互解决
    的头像 发表于 10-18 14:43 1414次阅读
    AISpeech 思必驰 思必驰<b class='flag-5'>语音</b>算法与芯片的完美结合 人机<b class='flag-5'>交互</b>

    一个开源MCU级的命令行交互组件

    一个开源MCU级命令行交互组件~
    的头像 发表于 10-17 16:26 217次阅读
    一个<b class='flag-5'>开源</b>MCU级的命令行<b class='flag-5'>交互</b>组件

    STM32WB产品详解及FUS无线协议升级

    STM32WB产品详解及FUS无线协议升级2.4GHz无线双核STM32WB, 采用SoC单芯片设计,支持多协议射频。
    发表于 09-06 06:35

    智能座舱的语音交互系统技术应用

    从用户发出语音指令到实现与智能设备的交互,其过程并不像其名词描述的那么简单,要实现通过语音来完成人机交互,要解决解决三个关键问题,如何让机器听清用户的
    发表于 07-28 10:17 380次阅读
    智能座舱的<b class='flag-5'>语音</b><b class='flag-5'>交互</b>系统技术应用

    拖地机语音播放芯片,低功耗语音交互方案,WT588F02B-8S语音ic

    在现代科技的快速发展中,语音交互已成为众多智能设备的重要功能之一。为了满足市场需求,我们推出了一款创新的拖地机语音播放芯片——WT588F02B-8S,该芯片不仅具备低功耗的特性,而且提供了卓越的
    的头像 发表于 07-11 09:13 338次阅读
    拖地机<b class='flag-5'>语音</b>播放芯片,低功耗<b class='flag-5'>语音</b><b class='flag-5'>交互</b><b class='flag-5'>方案</b>,WT588F02B-8S<b class='flag-5'>语音</b>ic

    语音识别唤醒词-开启智能化的语音交互时代

    语音识别唤醒词是指在语音交互系统中使用的特定词语或短语,用于唤醒系统并启动语音识别功能。这项技术的出现为智能化的语音
    的头像 发表于 07-09 00:53 1070次阅读

    Dexter独立语音助手开源分享

    电子发烧友网站提供《Dexter独立语音助手开源分享.zip》资料免费下载
    发表于 06-25 11:08 0次下载
    Dexter独立<b class='flag-5'>语音</b>助手<b class='flag-5'>开源</b>分享

    如何开发智能家居语音控制方案

    技术支持, 并适配海量语音终端应用方案,为客户定制化产品开发提供全方位的技术支持。 方案应用广泛,性价比更高 启英泰伦第三代智能语音芯片支持作为独立主控,与MCU通过串口实现
    发表于 05-31 09:50