0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音控制不是魔术,而是设计

efwedfd 来源:efwedfd 作者:efwedfd 2022-07-14 16:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

由于硬件和软件的进化突破,语音用户界面或各种尺寸和价格点的支持 VUI 的产品现在都可以推向市场。与直到今天定义语音控制体验的“对着麦克风说话并等待”模型不同,新系统现在可以以最终用户谨慎甚至不可见的方式嵌入到产品中,并具有即时响应时间,而不是“ t 体验云延迟。

在评估智能扬声器和云的语音控制替代方案时,产品开发人员面临着新的机遇和挑战。开发人员必须考虑尺寸和位置,因为高度微型化的设备被嵌入到家具和电器中。将语音应用程序与边缘机器学习相结合对于让产品随着时间的推移变得更加智能是必要的。同时,设备也越来越依赖电池供电,需要开发人员进行工程设计以实现最佳能源管理。最后,开发人员必须考虑用户对功能的期望。对于消费者来说,精心设计的语音控制感觉无处不在,能够听到角落和穿墙的声音。所有这些以及更多内容汇集了在构建支持 VUI 的产品时必须考虑的几个设计元素。

语音控制 2.0 更自由的方面之一是可以自由地说出语音命令,而无需附近的智能扬声器。集成在智能家居设备中的语音可以使整个家庭成为一个可听区域,在识别唤醒词或其他可定义的声音时随时可用。专门的硬件和软件用于产生准确的远场音频捕获。

设计技巧

为了在远场环境中有效地捕捉声音,一些设计技术开始发挥作用,包括:端口方向:声学端口是可以在没有物理障碍的情况下接受音频信号的地方。端口的位置(顶部或底部)由单个设备的外形尺寸决定。为了简化设计,声学端口通常位于麦克风附近,如下所示。但是,端口孔应与扬声器和其他声学噪声源(例如电机放大器)足够远,以最大限度地减少麦克风输入处的不需要的信号。

pYYBAGLOlHGAf4-SAADGbhu2oQE285.png

pYYBAGLOlHGAf4-SAADGbhu2oQE285.png

图 1. 顶部和底部加载声学端口配置的横截面(来源:Knowles)

麦克风阵列和波束成形:使用多个麦克风称为“阵列”。在任何给定时刻,麦克风阵列都会同时听到来自各个方向的声音。除了口头命令外,他们还会听到家中的其他声音和动作。通过一种称为波束成形的技术,可以对麦克风阵列进行编程,以选择性地捕获来自一个方向的声音,同时拒绝来自其他方向的声音。波束成形算法的最终结果是选择性地调谐出来自所需方向的信号以外的信号。波束成形是数字信号处理链中的第一步。

数字信号处理 (DSP) 算法:DSP 是任何语音控制系统的基石。这就是想要的音频信息的意义——捕捉它、聚焦它、净化它、放大它——这样音素就可以发出文字、命令和噪音,而不会破坏这个过程。DSP 几乎用于语音交互的所有阶段,从音频捕获和语音增强到语音处理。

poYBAGLOlHeABH1RAAD6ke5lWrg712.png

poYBAGLOlHeABH1RAAD6ke5lWrg712.png

图 2. 远场语音拾取(来源:Jerry Lu)

以便利为设计理念

除了针对功能进行设计之外,支持 VUI 的设备还需要针对便利性和可用性进行设计。唤醒词的两个主要设计考虑围绕能源管理和处理能力。由于 VUI 必须始终处于“侦听”模式以等待唤醒词,因此电池供电的 VUI 和 VCD 必须设计用于极低的能量消耗以及立即唤醒。此外,设备在过滤掉不需要的声音的同时区分想要的语音命令的能力需要不可忽视的处理能力,这需要准确性和即时性。包含强大音频边缘处理器的产品现在可以提供计算能力和低功耗、低延迟操作,从而实现即时用户体验。

即使在今天的早期阶段,语音控制的爆炸式增长也充分证明了智能家居中语音控制的市场机会。智能家居的支柱任务,包括安全、能源管理、娱乐和高级安全,都通过语音控制变得更简单、更容易访问。语音最终可以作为整个智能家居的统一控制器,从房子的任何房间发出命令……如果它们的设计考虑到用户并利用语音控制技术的重大进步。

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 设计方法
    +关注

    关注

    0

    文章

    12

    浏览量

    9240
  • 语音控制
    +关注

    关注

    5

    文章

    516

    浏览量

    29743
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    告别手忙脚乱!蜀瑞创新语音一键顺控,一句话搞定开关柜

    语音一键顺控,不是简单加个语音功能,而是可视化 + 语音 + 五防 + 自动顺控的一体化升级 —— 让开关柜 “听得懂、做得准、看得见”,把
    的头像 发表于 04-24 09:16 250次阅读
    告别手忙脚乱!蜀瑞创新<b class='flag-5'>语音</b>一键顺控,一句话搞定开关柜

    485AI语音识别模块:多路语音控制,实现安防设备语音联动

    防消防、能源设施、老旧设备改造等。 一、工业自动化(核心场景) - 智慧工厂/产线:语音控制流水线启停、机械臂、传送带调速、机床操作、设备参数查询 - 智慧仓储:语音控制AGV小车、货
    的头像 发表于 04-22 15:17 71次阅读

    技术资讯 I 不是在选电源芯片,而是在选整个系统架构

    Q学校里学的电源拓扑,真的是工程中最常用的吗?在真实产品里,电源设计从来不是一道理论题,而是一个系统级决策问题。你在Digi‑Key上看到的,不是几十种芯片参数,而是不同电源架构,对系
    的头像 发表于 04-17 18:21 366次阅读
    技术资讯 I <b class='flag-5'>不是</b>在选电源芯片,<b class='flag-5'>而是</b>在选整个系统架构

    A-59U 矿场 / 矿井 / 井下专用语音对讲方案

    A-59U 不是普通消费级语音模块,而是真正为矿山极端环境打造的工业级核心。它解决了井下最痛的噪音大、回声重、易啸叫、拾音近、不耐造、难升级六大问题
    的头像 发表于 04-13 11:18 122次阅读
    A-59U 矿场 / 矿井 / 井下专用<b class='flag-5'>语音</b>对讲方案

    三防漆和 PCB 板 “疏离、起皮、脱层”,90% 不是漆本身差,而是界面张力 / 表面能不匹配。

    三防漆和 PCB 板 “疏离、起皮、脱层”,90% 不是漆本身差,而是界面张力 / 表面能不匹配。该如何自测如何解决?
    的头像 发表于 03-02 11:59 258次阅读
    三防漆和 PCB 板 “疏离、起皮、脱层”,90% <b class='flag-5'>不是</b>漆本身差,<b class='flag-5'>而是</b>界面张力 / 表面能不匹配。

    在工业现场,接口多不是缺点,而是一种生存能力

    一阵子,你就会知道: 不是工程师喜欢复杂,而是工业现场必须复杂。 而这些看似杂乱的接口,背后都有非常现实、非常刚性的理由。 1、为什么接口多?因为工业现场比你想象得“野”得多 在消费电子领域,我们可以用一个 USB-C 解决大多数连接问
    的头像 发表于 01-05 16:07 292次阅读
    在工业现场,接口多<b class='flag-5'>不是</b>缺点,<b class='flag-5'>而是</b>一种生存能力

    智能语音识别控制器是什么?图形中文编程,多路设备控制

    智能语音识别控制器是一种融合语音识别技术、物联网通信技术与设备控制模块的智能终端设备,核心功能是将人类自然语言指令转化为设备可执行的电信号,实现对各类终端设备的
    的头像 发表于 12-03 16:35 836次阅读

    楼宇自控系统语音控制集成,操作更便捷智能

    在智慧建筑升级浪潮中,楼宇自控系统的交互方式不断革新,语音控制集成作为新型操作模式,打破了传统按键、触屏的操作局限,让楼宇管理更高效、更人性化。这种 “动口不动手” 的控制方式,不仅简化了操作流程
    的头像 发表于 11-27 10:30 458次阅读

    开源不是削弱竞争力,而是新护城河的开始

    。 越来越多的企业在开源的浪潮中找到了机会,也有人提出疑问: 既然代码都开源了,护城河还从哪里来?开源软件还有壁垒可言吗? 事实上,开源并不是没有护城河,它只是 把护城河从“技术代码”转移到了“综合能力” 。 一、开源不是免费的午餐,
    的头像 发表于 11-06 14:26 577次阅读

    增加语音控制功能关注这几颗芯片轻松搞定

    增加语音控制功能关注这几颗芯片轻松搞定 目前感觉几乎所有的头部或者非头部的产品都在争先恐后的上语音控制功能,产品单价高的上离在线AI对话功能,产品单价低的上离线
    的头像 发表于 08-19 16:46 1115次阅读

    网络语音控制器 智能自控语音播报

    网络语音控制器(NetworkVoiceController)是一种通过有线/无线网络接收指令,实现远程语音播报、对讲或声光告警的智能设备。其应用场景极为广泛,几乎覆盖所有需要“远程声音交互”或
    的头像 发表于 08-13 15:21 1016次阅读

    茶吧机语音控制方案设计2025新版

    一、方案概述 在智能家居技术飞速发展的当下,茶吧机的智能化升级成为必然趋势。语音控制作为一种便捷、自然的交互方式,正逐渐成为茶吧机智能化的关键方向。本方案聚焦于利用 WT2606B 芯片,精心构建
    的头像 发表于 07-22 17:02 1344次阅读
    茶吧机<b class='flag-5'>语音</b><b class='flag-5'>控制</b>方案设计2025新版

    AI语音控制模块能做些什么

    在智能化浪潮中,AI 语音控制模块成为众多设备实现便捷交互的关键组件。WT3000A 作为一款功能卓越的 AI 语音控制模块,在智能家居、工业物联网等领域展现出强大的应用能力。 丰富语
    的头像 发表于 06-18 11:48 1141次阅读
    AI<b class='flag-5'>语音</b><b class='flag-5'>控制</b>模块能做些什么

    语音控制模块工作原理

    语音控制芯片或者说模块的应用前景越来越广泛,无论是设计方案还是厂家生产的产品在越来越多越来越频繁的使用语音控制芯片。当然行业内更多的是称呼为语音
    的头像 发表于 06-17 11:49 1674次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>控制</b>模块工作原理

    你失去工作不是因为AI,而是因为使用AI的人

    当算法能精准预测消费者需求时,当AI生成的文案比人类更懂传播心理学时,当自动化系统开始取代基础决策岗位时,真正的危机已悄然降临—— 不是AI在抢夺你的工作,而是那些比你更早掌握AI、更懂得如何驾驭
    的头像 发表于 05-13 12:05 984次阅读
    你失去工作<b class='flag-5'>不是</b>因为AI,<b class='flag-5'>而是</b>因为使用AI的人