0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

物联网时代,语音交互将会是智能硬件产品的入口

JsPm_robot_1hjq 来源:YXQ 2019-06-25 15:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

特别是智能音箱,最近两年来发展迅猛,几乎所有主流企业都是入局者,如华为音箱、小米音箱、腾讯音箱等等,因大企业的入局,让国内智能音箱领域竞争更加残酷。

或许北京声智科技有限公司(以下简称:声智)会是一匹黑马,因为市面上大多数智能音箱,如小米、华为、腾讯等出品的智能音箱几乎都是采用声智的远程语音交互方案。

声智战略合伙人/副总裁李智勇说:“声智的强项在于远场语音交互能力,这也是华为、小米等与我们合作的原因,凡是和远场语音交互相关的部分,我们都是做的比较好的。”

对国内机器人企业而言,声智专业的远场语音交互技术或许可以提升机器人语音交互能力,特别是在复杂的商业场景里,语音交互可以得到更好的优化。

1号机器人网记者:声智有丰富的应用案例基础,你们的核心技术是体现在哪些方面?

李智勇:为了实现智能音箱的一次交互,核心技术有5点:

第一点是远场语音唤醒;第二点是麦克风阵列;第三点是远场语音识别;第四点是我们经常讲的自然语言处理;第五点是语音合成和TTS。这五个流程是每次交互都会用到,另外就是辅助的一些技术点。

比如经常说的声纹识别,你要区分每个讲话的人是谁?通话时通话的质量高不高?等等还要根据不同使用场景来进行优化不同的技术和算法

凡是和远场语音交互相关的部分,我们都是做的比较好的,现在市面上的主流智能音箱产品都是用我们的方案,如华为音箱、小米音箱、腾讯音箱等等。

另外,我们把各种复杂的技术整合在一套系统里,自主研发了远场智能交互系统SoundAI Azero,这样对产品方而言,就更加省事。产品方只需要注重产品其它部分的开发,如灯、按键等,然后搭载我们的SoundAI Azero系统就可以出产品了。对产品企业而言,与我们合作,可以大大节省产品开发的周期。

1号机器人网记者:要想得到完美的语音识别产品,需要经过多长的时间训练?一般语音识别的训练过程是怎样?

李智勇:语音识别训练与通常进行深度学习训练是一样的,首先有相应的数据进行标注,然后调一些参数进行训练,接下来看效果再进一步调优。

核心驱动点有两个,一个不是训练本身的时间,关键是数据,到底有多少数据?标注精不精准?另一个是训练本身,越往后发展,语音识别不能说只做一套识别就能适用所有。真正能做到的是,在特定领域,数据影响权重,变得比模型权重更大一些。

1号机器人网记者:可否介绍一下你们的麦克风阵列芯片?你们花了多久的时间进行研发?这片芯片都集成了哪些技术?

李智勇:这不是大家经常说的芯片,我们研发这款芯片是AI声学芯片,主要目的是让市面上已有的产品可接入麦克风阵列。

如市面上已有的电视机,很多不支持麦克风阵列,现在有了这片芯片后,可以很容易支持麦克风阵列。

随着物联网时代的到来,市面上很多IOT设备都会需要智能交互产品,而我们的芯片就是支撑已有产品很容易接入我们的远场语音交互系统SoundAI Azero。

1号机器人网记者:看官网介绍,你们的案例客户有百度、腾讯、阿里、小米、华为等等,你们为他们提供的是怎样的解决方案?它们的产品相互之间会存在差异吗?

李智勇:这些主流的产品,很多都是远场语音交互的设备,而我们的技术核心就体现在远场语音交互上,如远场语音唤醒、远场语音识别等。

不同客户,它的产品侧重点和特色不同,比如说华为音箱,它把通话的功能也加进来了,这是原来智能音箱所不具备的。还如腾讯王者荣耀机器人,从ID到整个产品的思路和通常的智能音箱也不同,所以它们产品相互之间还是存在差异的。

1号机器人网记者:现在市面上的儿童机器人种类繁多,针对儿童机器人,你们可以提供怎样的解决方案?

李智勇:儿童机器人也是分两部分:一部分是产品本身,如唤醒、降噪、麦克风阵列等,语音交互能力跟智能音箱是相通的。我们在智能音箱领域的经验可以移植到儿童机器人领域;另一部分是相比智能音箱,儿童机器人搭载的内容是不一样的。

我们在儿童机器人领域也有内容服务资源,我们与第三方企业合作,把内容服务接入到我们Sound Azero系统中来,现在在儿童机器人领域,我们可以提供一套比较完整的方案。

假设儿童机器人厂商,用我们的远场智能交互系统SoundAI Azero,他只需要选择一个唤醒词,再做一些基础的集成工作就可以了。比如针对具体的场景做一些技能的调整,再把你自己特别想输出的内容,接到系统里就可以了。我们可以提供部分儿童内容,但是更多技能端的扩展内容,儿童机器人企业也可以自己去寻找。

1号机器人网记者:目前已有不少大型商用机器人已经落地到政务系统,如深圳出入境就有一台机器人在服务,但是从现场体验来看,语音交互不是很理想,在商业噪杂的环境下,你们可以提供怎样的解决方案?

李智勇:目前语音交互有两个一大一小的瓶颈,大的瓶颈也是NLP当前的技术瓶颈,目前语音识别没办法达到100%的准确率;另外一个小的瓶颈就是在复杂环境下的远场降噪处理。

因为每家公司擅长的地方不一样,而远场语音交互是我们擅长的,虽然,我们还没有与商业机器人合作过,但是从我们的角度去看,语音交互是可以优化的。

因为在商场里,我们能解决智能音箱交互问题,如果是商业机器人,就需要机器人企业与我们联动配合优化,当然,经过一定周期的优化过程,我们可以提升商业机器人在复杂环境中的语音交互能力,甚至提升一个量级。

1号机器人网记者:就语音技术来讲,目前中国与西方国家是否存在技术差距?如果相互对比,西方技术的优势体现在哪里?国内的企业技术优势又体现在哪里?

李智勇:从技术上讲,目前中西方语音交互整体技术并没有太大的差距,大家基本处于同一个水平线。当然,类似亚马逊等公司在语音识别领域精耕很长时间,所以体验感会略好一些。

产品体验感并不是技术好了,体验就好了,它涉及很多的因素,如产品结构设计、响应速度、内容多少等等,这个是需要时间打磨的,国内很多语音企业都是2017年才出产品,发展也就两年时间。

其实中西方语音企业是可以互补的,比如中文领域,国内语音企业普遍做的比西方企业好,因为中国有大量语料、大量的数据,这是西方所不能比拟的。但是西方企业在英文领域精耕的很好,这是目前国内语音企业薄弱的地方。

1号机器人网记者:最后一个问题,从市场拓展的角度去讲,目前你们的业务重心是放在哪几个领域?你们是如何看待机器人这个市场?

李智勇:目前AIoT场景是很热门,而且跑的也很快,各种品类都在崛起,如:电视、机顶盒、儿童机器人和故事机、汽车车联网前装后装、白色家电等等,对我们来说,当前首先是智能音箱,属于成长最快的领域。

另外,从智能音箱延伸到其它产品,对我们来讲,场景迁移的成本并没有想象中的大,如延伸汽车领域、电视领域等等,我们目标是覆盖主流的通用产品领域,然后通过不同的技能来实现不同场景下不同的产品应用去解决客户的疑难杂症。

对于机器人,从技术视角和商业视角去讲:技术视角,机器人是众多技术的融合结晶,人工智能技术越成熟,机器人最终落地也会更完美;从商业视角来讲,现阶段机器人需要往更多垂直领域去精耕,因为通用机器人属于未来的产品,目前暂不适合。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2950

    文章

    48147

    浏览量

    418746
  • 语音交互
    +关注

    关注

    3

    文章

    359

    浏览量

    29221

原文标题:声智:物联网时代 语音交互将成IOT设备入口

文章出处:【微信号:robot-1hjqr,微信公众号:1号机器人网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    低功耗智能门锁语音芯片控制方案

    随着智能家居的普及,智能门锁已成为家庭安防的重要入口。作为一种成熟稳定的产品智能锁对内部核心元器件的选型有着严格要求,尤其是
    的头像 发表于 04-24 16:54 709次阅读

    Edge AI 语音交互与MCP外设控制实践 | 技术集结

    小智AI是一款集成大语言模型(LLM)的端侧智能交互框架,能够实现从语音唤醒、云端对话到通过MCP协议(ModelContextProtocol)实时控制外设的完整闭环。为
    的头像 发表于 03-16 11:58 5414次阅读
    Edge AI <b class='flag-5'>语音</b><b class='flag-5'>交互</b>与MCP外设控制实践 | 技术集结

    新品 | Echo Pyramid,智能语音交互底座

    系列主控单元实现音频数据处理、无线通信、业务逻辑控制以及物联网连接,适用于远场语音识别、语音助手、语音控制等多种智能
    的头像 发表于 03-06 16:51 2610次阅读
    新品 | Echo Pyramid,<b class='flag-5'>智能</b><b class='flag-5'>语音</b><b class='flag-5'>交互</b>底座

    构建语音入口:模组化音频系统选型关键要素

    等维度,系统阐述模组选型的核心考量点。 在联网开发中,为产品赋予“听觉”与“语音”能力,是实现智能交互
    的头像 发表于 02-09 15:06 237次阅读
    构建<b class='flag-5'>语音</b><b class='flag-5'>入口</b>:模组化音频系统选型关键要素

    WT588F02KD-32N语音芯片:智能电饭煲的语音交互革新方案

    一、智能电饭煲的语音交互时代1.1电饭煲产品智能化转型随着
    的头像 发表于 11-20 09:19 905次阅读
    WT588F02KD-32N<b class='flag-5'>语音</b>芯片:<b class='flag-5'>智能</b>电饭煲的<b class='flag-5'>语音</b><b class='flag-5'>交互</b>革新方案

    学习联网可以做什么工作?

    嵌入式软件和硬件,支持联网设备的功能实现。   数据分析师:负责从联网设备和传感器中获取和分析数据,并提供数据支持和决策。   
    发表于 10-11 16:40

    新品 | Atom EchoS3R,可编程的联网语音交互控制器

    AtomEchoS3R是一款可编程的联网语音交互控制器,专为智能语音控制与人机
    的头像 发表于 09-19 18:36 1024次阅读
    新品 | Atom EchoS3R,可编程的<b class='flag-5'>物</b><b class='flag-5'>联网</b><b class='flag-5'>语音</b><b class='flag-5'>交互</b>控制器

    “芯”声代,智未来—VS680本地语音交互系统 #语音交互 #芯片

    语音交互
    深蕾半导体
    发布于 :2025年09月17日 10:59:30

    七牛云发布灵矽 AI:600ms超低延迟,重塑智能硬件语音交互新范式

    8 月 15 日,七牛云正式发布灵矽 AI —为新一代智能硬件而生的语音交互新范式,让智能硬件
    的头像 发表于 08-15 15:33 989次阅读
    七牛云发布灵矽 AI:600ms超低延迟,重塑<b class='flag-5'>智能</b><b class='flag-5'>硬件</b><b class='flag-5'>语音</b><b class='flag-5'>交互</b>新范式

    联网时代的核心枢纽

    智能网关:联网时代的核心枢纽 随着联网技术的快速发展,
    的头像 发表于 07-23 14:06 615次阅读

    联网设备也能‘开口说话’?Aircall实时通话功能让智能交互触手可及

    成为能‘听懂’需求、‘说出’答案的智能伙伴。” 在万互联的时代语音通话是最自然的交互方式。   Air8000工业引擎Aircall功能
    的头像 发表于 07-07 09:26 913次阅读
    <b class='flag-5'>物</b><b class='flag-5'>联网</b>设备也能‘开口说话’?Aircall实时通话功能让<b class='flag-5'>智能</b><b class='flag-5'>交互</b>触手可及

    从‘指令接收器’到‘语音伙伴’:Aircall让联网设备实时通话能力落地!

    Aircall的创新成果重新定义联网设备角色。实时通话功能使设备不再仅是被动执行任务的工具,而是成为能主动沟通、灵活应答的‘语音伙伴’。这一转变让智能家居、智慧城市等场景的
    的头像 发表于 07-06 16:12 652次阅读
    从‘指令接收器’到‘<b class='flag-5'>语音</b>伙伴’:Aircall让<b class='flag-5'>物</b><b class='flag-5'>联网</b>设备实时通话能力落地!

    联网的应用范围有哪些?

    联网,简单来说,就是“万相连的互联网”。它以互联网为基石,将用户端延伸至物品与物品之间,实现信息的交换与通信。打个比方,你的
    发表于 06-16 16:01

    联网未来发展趋势如何?

    近年来,联网行业以其惊人的增长速度和无限的潜力成为了全球科技界的焦点。它正在改变我们的生活方式、商业模式和社会运转方式。那么,联网行业的未来发展趋势
    发表于 06-09 15:25

    芯资讯|广州唯创电子WTV系列语音芯片:以技术创新赋能智能语音交互

    在万互联的智能化时代语音交互技术已成为人机交互的重要桥梁。广州唯创电子深耕语音芯片领域多年,
    的头像 发表于 05-21 08:45 845次阅读
    芯资讯|广州唯创电子WTV系列<b class='flag-5'>语音</b>芯片:以技术创新赋能<b class='flag-5'>智能</b><b class='flag-5'>语音</b><b class='flag-5'>交互</b>