0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

思必驰,被业内称为可与科大讯飞二分天下的语音巨头

思必驰 来源:djl 作者:思必驰 2019-08-06 17:16 次阅读

汤兵城,思必驰商务拓展总监,是《电器》记者在过去三年中,采访这家公司的第四人。可以说,从思必驰坚持To B并转型至专注智能硬件领域以来,在资本市场每一次获得青睐,与阿里智能、庆科、绿联等生态伙伴的每一场合作,笔者几乎没有缺席。这期间,思必驰经历了移动互联的风口、语音交互技术的升级以及团队人员的完善,从2014年至今,面向智能车载、智能家居和智能机器人三大垂直领域,为其提供自然语言交互解决方案的思必驰,被业内成为可与科大讯飞二分天下的语音巨头。

图1 思必驰商务拓展总监汤兵城

2017年3月10日,在中国家电及消费电子博览会期间,思必驰商务拓展总监汤兵城做客《电器》杂志专访间,从2016年云栖大会YunOS@Home专场谈起,详解伴随三大板块提升,思必驰是如何引领人性化智能语音交互技术。

独家AIOS,奠定优势基础

谈起公司在三大垂直领域的发展,可以用强劲二字来形容。据汤兵城介绍,在车载后装市场,思必驰与阿里旗下的高德地图合作已久,Yun OS全线产品所搭载的语音系统都是思必驰提供。在Android系统方面,与IME、瑞联、天之眼等都保持密切合作。在车载后装市场奠定基础的同时,思必驰加速前装市场,如今与奇点汽车、小鹏汽车等互联网造车企业已经进入后期调整。在家居方面,与阿里、腾讯、小米、联想、海尔、美的等建立合作关系,推出的产品包括电视、音箱、OTT盒子等。在智能机器人方面,与大华乐橙、360等中高端品牌合作密切。擅长唱歌跳舞的小萝卜机器人、智能程度颇高的大华乐橙小乐机器人、360小巴迪机器人等都已经推向市场。

图2 庆科VBS6100AI芯片模组

专注细分领域是成功的关键,但技术积累必不可少。能够在这三大领域保持自然语言交互解决方案商的领先地位,与思必驰在2015年推出的对话操作系统AISpeech Operating System(简称:AIOS)密不可分。据汤兵城介绍,源于英文缩写的AIOS相当于思必驰的独家系统,它可运行于主流操作系统(Linux, Android,QNX)之上,封装核心的语音相关技术和对话交互逻辑,同时对上层应用制定了一层领域抽象接口,支持快速集成和自定义开发。他说,思必驰把语音相关技术整合成AIOS 人机对话操作系统,作为安卓系统之上的一层标准接口,提供给硬件合作伙伴,能够极大减少开发及维护成本。针对不同场景,AIOS又分成了AIOS for Car,AIOS for Home,AIOS for Robot等版本,而这些版本成为日后思必驰发力三大板块的基础。

创新模式,成就语音交互独角兽

虽然AIOS成为很多语音创业公司效仿的重点,但对系统的重视程度难以和思必驰相提并论。据汤兵城介绍,公司会根据不同的系统量身打造AIOS,强调语音识别、语音合成、语义理解、声纹识别、对话管理、音频分析等技术的定制化处理,并且对接了丰富的第三方内容资源,比如酷我音乐、虾米音乐、大众点评以及股票天气、故事读物、笑话大全等。这一整套下来,正是汤兵城眼中人工智能语音交互的重要组成部分。

图3 小米生态链诸葛小明床头灯

作为人工智能重要的组成部分,汤兵城强调,思必驰从头至尾都会把更多的精力聚焦在语音交互的体验上。汤兵城进一步解释说,公司做语音识别起家,相比其他人工智能公司更加专注,思必驰的联合创始人俞凯是剑桥的语音博士,现在是上海交大教授,所以公司在自然语言处理技术等方面也更专业。此外,同科大讯飞一样,思必驰具有全套语音技术产权,并成功实现了“产学研”结合,雄厚的技术积累也是的思必驰在系统上迭代升级非常快。相比其他语音创业公司,思必驰更专注在智能硬件在具体场景的语音交互。据悉,思必驰和上海交通大学建立了智能人机交互联合实验室,并达了完善的独家知识产权协议。另外,B2B2C的商业模式与其他公司也有不同。

图4 车萝卜HUD

据了解,AIOS已经成为中国智能车载后装市场中占有率最大的语音解决方案,占有率达到60%左右。采用这款系统的车载产品包括了著名的捷渡“远界”智能后视镜、祖师汇云龙智能后视镜、天之眼智能后视镜、车萝卜HUD等,是当之无愧的独角兽。

环形“6+1”远场麦克风阵列,提高交互体验

提高用户体验,是汤兵城在采访中提到最多的几个字,他举例说,家居环境下的噪音有混响、回声、背景噪音、人声干扰等多种类型,此外远距离交互也是语音交互领域要解决的一个难点。在噪声干扰或者距离稍微远的环境下,即使是优质的语音软件方案也不能得到好的交互效果。针对这个问题,在AIOS软件方案之外,思必驰研发了一个软硬一体化的解决方案,那就是环形“6+1”远场麦克风阵列,属于数字信号处理范畴,6个麦克风呈环形均匀分部拾音,中间1个麦克风辅助拾音。阵列获取声音信息之后,利用拾音波束成形,采用独特算法,抑制波束之外的噪声,并融合语音信号信息,从含噪声的语音信号中提取出纯净语音,增强说话人语音。从而可以确定信号来波方向,达到抗噪目的的同时,还增强了人的声音。

图5 乐橙小乐育儿机器人

据了解,用“环形6+1远场麦克风阵列”对声音信息进行处理之后,智能设备可以做到5米远场交互(准确率达到92%)、360°全角度环形拾音、声源定位精确度控制在±10°以内。“该阵列为国内首款同类产品,大大增强了降噪处理和远场识别,再结合丰富的后端第三方资源,提高了交互体验。”汤兵城表示,“目前,思必驰的“环形6+1远场麦克风阵列”主要针对的是智能机器人和智能音箱等设备,未来会在更多家电产品上应用。”

迭代升级,满足更多客户需求

用户通过各类硬件、家电的使用调用思必驰的云端,每天都会产生海量数据。凭借这些,首先可以进一步优化、训练声学模型,使得声音识别率无限逼近于百分之百。其次,通过数据分析,可以挖掘一些新的商业模式。当然这些需要过程,眼前对思必驰而言重要的做到专注与聚焦,以及提升用户的体验。

图6 联想智能音箱

没有时间考虑行业竞争与抄袭,思必驰正忙于拓展新领域。在本次AWE上,思必驰展示了联想在CES发布的智能音箱,其海外版搭载亚马逊Alexa平台,国内版则采用了思必驰自然语言交互方案,能够实现流畅的语音交互,涵盖音乐播放、新闻、有声读物、查询天气、语音叫车、订外卖等服务,是用户的贴心助理。

此外,小米互联网音箱、与庆科联手打造的VBS6100AI语音模组,搭载了思必驰ASR、TTS等语音技术的方案,具备语音交互功能,高度集成了多方技术优势。还有声必可语控背景音乐系统、乐橙TC5S人工智能摄像机、乐橙小乐育儿机器人、诸葛小明床头灯以及美的洗衣机,海尔馨厨冰箱等产品。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能家居
    +关注

    关注

    1912

    文章

    9150

    浏览量

    179355
  • 人工智能
    +关注

    关注

    1776

    文章

    43845

    浏览量

    230600
  • 智能车载
    +关注

    关注

    0

    文章

    44

    浏览量

    9028
收藏 人收藏

    评论

    相关推荐

    科大发布星火语音大模型

    科大行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年01月31日 09:17:28

    科技创新与智能助力:揭秘科大讯飞智能键盘D1的独特魅力

    科技创新与智能助力:揭秘科大讯飞智能键盘D1的独特魅力引言:AI键盘赋予普通键盘智能化的能力,为移动办公和语音翻译等场景提供了更便捷高效的解决方案。在这篇文章中,我们将揭秘科大讯飞智能键盘D1的独特
    的头像 发表于 01-03 11:02 240次阅读
    科技创新与智能助力:揭秘<b class='flag-5'>科大</b>讯飞智能键盘D1的独特魅力

    科大讯飞AI智能键盘D1:语音打字AI智能PPT、AI写作提高办公效率

    键矮轴机械键盘的特点,同时集成了智能截图、语音翻译、语音打字和智能办公助手等多项功能     科大讯飞旗下星火认知大模型AI智能键盘D1,凭借其独特的产品特点与功能,成为办公市场的明星产品。 一、搭载讯飞星火认知大模型,开启
    的头像 发表于 01-02 14:56 672次阅读
    <b class='flag-5'>科大</b>讯飞AI智能键盘D1:<b class='flag-5'>语音</b>打字AI智能PPT、AI写作提高办公效率

    科大讯飞语音控制模块怎么用

    科大讯飞语音控制模块是一种人机交互技术,它利用语音识别和语音合成技术,使用户可以通过语音指令来控制设备或应用程序。本文将详细介绍
    的头像 发表于 12-25 13:58 606次阅读

    离线语音识别及控制是怎样的技术?

    可以在没有网络连接的情况进行使用,适用于一些特殊场景,如旅行、户外等无法连接网络的环境。  6. 开发周期短:在客户的产品已经完善的情况,可以快速接入离线语音识别。使用深圳雷龙发展有限公司的推出的LSYT201B模组,最快一
    发表于 11-24 17:41

    卡尔SC系列的读写需要什么设备?

    请问下卡尔SC120529VLL6 读写能用什么设备读写?求助芯片的针脚定义图?
    发表于 11-07 07:00

    业内最高灵敏度--MW601

    无刷电机,包括电脑风扇,洗衣机等 ⚫ 矩阵MW601高灵敏度档位产品,灵敏度业内最高 更薄的电机,更高的效率 尺寸图: 矩阵拥有完整InSb霍尔元件晶圆及封装产线,满足应用客户对于性能及外形需求 经典封装
    发表于 10-11 17:08

    卡尔K60芯片通讯口正常,开通IO口就复位的原因?

    卡尔K60芯片通讯口正常,开通IO口就复位,有哪位大神能指点迷津啊
    发表于 10-08 08:07

    一文带你了解:微带功器有哪些特点?

    器是微波电路设计中常见的一种无源元器件,又被称为功率分配器,顾名义就是将输入功率按照一定比例分配成N路功率输出的一种微波元器件。如图所示,P0端进入的信号分为两路信号从P1和P2端输出
    发表于 08-31 15:39

    【米尔-芯D9开发板- 国产平台试用】-- 01 -- 开箱上电

    ,那么接下来说一关于芯芯片的一些介绍吧。 D9其实是一个系列的代称,这个系列有多款芯片自称,单核、四核、八核,配套的还有R5的实时协处理器的实时核,适合做实时任务的处理,芯采用的多核异构的框架对于
    发表于 08-16 17:45

    基于FOC无刷电机的按摩器方案以及PCBA介绍【其利天下技术开发有限公司】

    。对于用在颈部按摩的按摩器,由于靠近耳边,一方面要求按摩力度柔和,另一方面也要求噪声低,因此现基于FOC控制的按摩仪方案去解决这个问题。 其利天下技术开发方案公司设计的基于FOC的无刷电机的按摩器方案
    发表于 07-12 09:29

    如何开发智能家居语音控制方案

    语音AI平台,支持5钟产生固件资源,支持3完成功能对接,3完成PCB设计和验证,从而极大降低客户开发门槛,促进智能语音产品快速落地;另
    发表于 05-31 09:50

    语音识别技术的概念及应用前景

    力来进行识别和语义处理,一个常见的智能语音处理流程如下图所示。 ​ 启英泰伦是行业内首家将人工智能语音处理技术运用到芯片上的公司。2016年推出行业首款人工智能语音芯片,通过芯片上的终
    发表于 05-27 09:41

    科大讯飞发布星火认知大模型

    讯飞星火,5月6日如约而至。 “1999年,中文语音市场全部被国际巨头控制,中国人被掐住了咽喉;我们创办科大讯飞,提出要让中国语音技术做到全世界最好,要在多语种技术上做到全世界第一。”
    的头像 发表于 05-08 09:36 2051次阅读
    <b class='flag-5'>科大</b>讯飞发布星火认知大模型