0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音控制不是魔术,而是设计

efwedfd 来源:efwedfd 作者:efwedfd 2022-07-14 16:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

由于硬件和软件的进化突破,语音用户界面或各种尺寸和价格点的支持 VUI 的产品现在都可以推向市场。与直到今天定义语音控制体验的“对着麦克风说话并等待”模型不同,新系统现在可以以最终用户谨慎甚至不可见的方式嵌入到产品中,并具有即时响应时间,而不是“ t 体验云延迟。

在评估智能扬声器和云的语音控制替代方案时,产品开发人员面临着新的机遇和挑战。开发人员必须考虑尺寸和位置,因为高度微型化的设备被嵌入到家具和电器中。将语音应用程序与边缘机器学习相结合对于让产品随着时间的推移变得更加智能是必要的。同时,设备也越来越依赖电池供电,需要开发人员进行工程设计以实现最佳能源管理。最后,开发人员必须考虑用户对功能的期望。对于消费者来说,精心设计的语音控制感觉无处不在,能够听到角落和穿墙的声音。所有这些以及更多内容汇集了在构建支持 VUI 的产品时必须考虑的几个设计元素。

语音控制 2.0 更自由的方面之一是可以自由地说出语音命令,而无需附近的智能扬声器。集成在智能家居设备中的语音可以使整个家庭成为一个可听区域,在识别唤醒词或其他可定义的声音时随时可用。专门的硬件和软件用于产生准确的远场音频捕获。

设计技巧

为了在远场环境中有效地捕捉声音,一些设计技术开始发挥作用,包括:端口方向:声学端口是可以在没有物理障碍的情况下接受音频信号的地方。端口的位置(顶部或底部)由单个设备的外形尺寸决定。为了简化设计,声学端口通常位于麦克风附近,如下所示。但是,端口孔应与扬声器和其他声学噪声源(例如电机放大器)足够远,以最大限度地减少麦克风输入处的不需要的信号。

pYYBAGLOlHGAf4-SAADGbhu2oQE285.png

pYYBAGLOlHGAf4-SAADGbhu2oQE285.png

图 1. 顶部和底部加载声学端口配置的横截面(来源:Knowles)

麦克风阵列和波束成形:使用多个麦克风称为“阵列”。在任何给定时刻,麦克风阵列都会同时听到来自各个方向的声音。除了口头命令外,他们还会听到家中的其他声音和动作。通过一种称为波束成形的技术,可以对麦克风阵列进行编程,以选择性地捕获来自一个方向的声音,同时拒绝来自其他方向的声音。波束成形算法的最终结果是选择性地调谐出来自所需方向的信号以外的信号。波束成形是数字信号处理链中的第一步。

数字信号处理 (DSP) 算法:DSP 是任何语音控制系统的基石。这就是想要的音频信息的意义——捕捉它、聚焦它、净化它、放大它——这样音素就可以发出文字、命令和噪音,而不会破坏这个过程。DSP 几乎用于语音交互的所有阶段,从音频捕获和语音增强到语音处理。

poYBAGLOlHeABH1RAAD6ke5lWrg712.png

poYBAGLOlHeABH1RAAD6ke5lWrg712.png

图 2. 远场语音拾取(来源:Jerry Lu)

以便利为设计理念

除了针对功能进行设计之外,支持 VUI 的设备还需要针对便利性和可用性进行设计。唤醒词的两个主要设计考虑围绕能源管理和处理能力。由于 VUI 必须始终处于“侦听”模式以等待唤醒词,因此电池供电的 VUI 和 VCD 必须设计用于极低的能量消耗以及立即唤醒。此外,设备在过滤掉不需要的声音的同时区分想要的语音命令的能力需要不可忽视的处理能力,这需要准确性和即时性。包含强大音频边缘处理器的产品现在可以提供计算能力和低功耗、低延迟操作,从而实现即时用户体验。

即使在今天的早期阶段,语音控制的爆炸式增长也充分证明了智能家居中语音控制的市场机会。智能家居的支柱任务,包括安全、能源管理、娱乐和高级安全,都通过语音控制变得更简单、更容易访问。语音最终可以作为整个智能家居的统一控制器,从房子的任何房间发出命令……如果它们的设计考虑到用户并利用语音控制技术的重大进步。

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 设计方法
    +关注

    关注

    0

    文章

    12

    浏览量

    9214
  • 语音控制
    +关注

    关注

    5

    文章

    510

    浏览量

    29556
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    楼宇自控系统语音控制集成,操作更便捷智能

    在智慧建筑升级浪潮中,楼宇自控系统的交互方式不断革新,语音控制集成作为新型操作模式,打破了传统按键、触屏的操作局限,让楼宇管理更高效、更人性化。这种 “动口不动手” 的控制方式,不仅简化了操作流程
    的头像 发表于 11-27 10:30 167次阅读

    开源不是削弱竞争力,而是新护城河的开始

    。 越来越多的企业在开源的浪潮中找到了机会,也有人提出疑问: 既然代码都开源了,护城河还从哪里来?开源软件还有壁垒可言吗? 事实上,开源并不是没有护城河,它只是 把护城河从“技术代码”转移到了“综合能力” 。 一、开源不是免费的午餐,
    的头像 发表于 11-06 14:26 125次阅读

    增加语音控制功能关注这几颗芯片轻松搞定

    增加语音控制功能关注这几颗芯片轻松搞定 目前感觉几乎所有的头部或者非头部的产品都在争先恐后的上语音控制功能,产品单价高的上离在线AI对话功能,产品单价低的上离线
    的头像 发表于 08-19 16:46 625次阅读

    网络语音控制器 智能自控语音播报

    网络语音控制器(NetworkVoiceController)是一种通过有线/无线网络接收指令,实现远程语音播报、对讲或声光告警的智能设备。其应用场景极为广泛,几乎覆盖所有需要“远程声音交互”或
    的头像 发表于 08-13 15:21 616次阅读

    茶吧机语音控制方案设计2025新版

    一、方案概述 在智能家居技术飞速发展的当下,茶吧机的智能化升级成为必然趋势。语音控制作为一种便捷、自然的交互方式,正逐渐成为茶吧机智能化的关键方向。本方案聚焦于利用 WT2606B 芯片,精心构建
    的头像 发表于 07-22 17:02 553次阅读
    茶吧机<b class='flag-5'>语音</b><b class='flag-5'>控制</b>方案设计2025新版

    语音控制模块工作原理

    语音控制芯片或者说模块的应用前景越来越广泛,无论是设计方案还是厂家生产的产品在越来越多越来越频繁的使用语音控制芯片。当然行业内更多的是称呼为语音
    的头像 发表于 06-17 11:49 988次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>控制</b>模块工作原理

    你失去工作不是因为AI,而是因为使用AI的人

    当算法能精准预测消费者需求时,当AI生成的文案比人类更懂传播心理学时,当自动化系统开始取代基础决策岗位时,真正的危机已悄然降临—— 不是AI在抢夺你的工作,而是那些比你更早掌握AI、更懂得如何驾驭
    的头像 发表于 05-13 12:05 612次阅读
    你失去工作<b class='flag-5'>不是</b>因为AI,<b class='flag-5'>而是</b>因为使用AI的人

    为什么dlp4710evm投射出来的条纹不是显示的导入的图片,而是每幅图片都会产生渐变?

    我使用 internal patterns的方式投射图片,我的投影仪参数如下图所示, 为什么投射出来的条纹不是显示的导入的图片,而是每幅图片都会产生渐变。
    发表于 02-26 06:35

    TTS语音播报控制器能做什么?

    TTS(Text-to-Speech)语音播报控制器,作为一种能够将文本信息转换为语音输出的技术设备,在现代社会的各个领域中展现出了广泛的应用前景。TTS技术的出现,丰富人机交互的方式,提高信息传播
    的头像 发表于 02-20 18:18 1101次阅读

    网络语音控制器的原理与应用

    随着科技的飞速发展,网络语音控制器作为一种新兴的技术产品,已经在各个领域展现出了其巨大的应用潜力和价值。网络语音控制器是一种人机系统中以语言驱动的
    的头像 发表于 02-20 18:16 814次阅读

    网络语音控制器是什么设备

    网络语音控制器,作为一种能够通过语音识别技术接收并执行用户语音指令的智能设备,结合计算机、人工智能、物联网、网络通信、语音处理等技术,使用户
    的头像 发表于 02-19 17:42 813次阅读

    在DLP2021-Q1参考设计中,DMD与投影镜头不是平行的而是成一定的夹角,这样的目的是什么?

    在DLP2021-Q1参考设计中,non-telecentric design 非远心设计方案里,DMD与投影镜头不是平行的而是成一定的夹角,这样的目的是什么,不会引起畸变吗?
    发表于 02-19 08:03

    在做导联脱落检测时,ADS1294的输出不是77,而是63,为什么?

    我的ECG是用ADS1294作为AFE,ECG为三导联,CH1:LARA,CH2:LL RA, CH3:LLLA, 在做导联脱落检测时,ADS1294的输出不是77,而是63,为什么?
    发表于 02-13 08:13

    空调语音控制方案NRK3501语音识别芯片-让智能生活触手可及!

    NRK3501语音识别芯片支持离线语音控制空调,精准识别,远场降噪,最多支持200条离线指令,5米内识别率92%,让智能家居更便捷舒适。
    的头像 发表于 01-07 11:40 1250次阅读
    空调<b class='flag-5'>语音</b><b class='flag-5'>控制</b>方案NRK3501<b class='flag-5'>语音</b>识别芯片-让智能生活触手可及!

    ADS7841发送控制字节0x97的时候,ADOUT引脚不是一直保持低电平,而是会发送0x07呢?

    为什么我在用ADS7841,发送控制字节0x97的时候,ADOUT引脚不是一直保持低电平,而是会发送0x07呢?
    发表于 12-30 06:54