0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超低功耗VAD的语音命令系统的设计方案

电子设计 来源:embedded 作者:Raj Senguttuvan 2021-04-01 17:09 次阅读

语音助手和集成已在投放市场的大多数产品,设备和技术中实现。话虽这么说,这些有用的语音助手始终会监听激活/唤醒单词(例如“ okay Google”或“ Alexa”),这通常会消耗大量电量,这已不是什么秘密。在当今技术日新月异的世界中,必须考虑其对能源消耗的影响。

本文提供了使用语音活动检测(VAD)的低功耗,始终在线语音命令系统的设计注意事项。在选择创建易于使用,节能的语音用户界面(VUI)所需的组件时,它探讨了取舍和注意事项。

VAD功能可在聆听唤醒词之前检测环境中的人声,这意味着当没人在家时,您的语音助手将不会浪费不必要的能量。据估计,全球使用的数字语音助手有42亿,到2024年,这个数字有望翻一番。将该技术应用于语音助手软件和其他依赖语音集成的产品,将大大降低其能耗。使用语音助手的人。

有几种用于实现VUI系统的硬件体系结构。通常,典型的语音用户界面实现由麦克风组成,麦克风可以是单个麦克风,也可以是与音频处理器相连的麦克风阵列,用于捕获和处理语音。

可以在边缘音频边缘处理器,具有内置音频边缘处理器的智能麦克风或标准应用处理器(AP)上处理输入的音频流。边缘音频处理器针对音频信号的低功耗和低延迟处理进行了优化。除了提供对输入音频的专门处理之外,边缘音频处理器还可以用于后处理音频输出信号。如果VUI系统是云连接的,则音频边缘处理器还可以通过具有无线连接性的主单芯片系统(SoC)与云VUI接口进行通信。本文介绍了VUI系统的两种不同实现,以及它们各自的权衡。

超低功耗VAD(语音活动检测)

图1所示的体系结构使用模拟信号路径支持超低功耗VUI,该路径包括模拟麦克风和模拟比较器以提供唤醒触发。当检测到声音活动时,模拟信号链会产生一个中断,以唤醒音频处理器以进行语音捕获。该设备还可以包括“一键通”功能,从而用户按下按钮即可唤醒音频处理器。

o4YBAGBljDOAdAMKAAG61VQPUpo615.png

图1.超低功耗,始终在线的VUI硬件信号链,无需进行前滚动缓冲即可进行远程控制。

模拟唤醒麦克风必须始终在聆听环境,因此该麦克风以及比较器必须消耗很少的功率。Knowles IA8201是高效音频处理器的一个示例,在最简单的唤醒触发模式下其功耗小于1mW,并且具有1MB的存储器用于高级音频处理。尽管图1中所示的方法为设备(例如,遥控器和可穿戴设备)中始终在线的VUI提供了一种简单的低功耗AAD(声学活动检测)方法,但它具有局限性。这种实现方式会唤醒音频处理器的任何声音信号,并且在嘈杂的情况下会导致总体系统功耗过高。还,与云连接的语音用户界面系统要求在捕获唤醒字之前的一段时间内获取音频数据,以提高唤醒字检测的准确性。这通常称为预滚动,是支持Alexa的设备和其他智能扬声器设备的必备条件。

o4YBAGBljEGASHKJAAFt-j68w1c971.png

图2.支持诸如智能扬声器之类的设备的前置滚动缓冲的架构。

图2显示了一种支持针对智能扬声器等设备的前置滚动缓冲的体系结构。这些设备通常具有更大的电池,并且/或者一次充电可能不需要多个月的电池寿命。VUI系统始终处于打开状态,可以收听环境并在循环缓冲区中记录预滚动。预卷的长度通常约为500毫秒的音频数据,用于校准环境噪声水平。

有几种不同的方法可以设计永远在线的前端体系结构。音频处理器的选择取决于所用麦克风的数量,以及它们是模拟还是数字。

上面显示的体系结构使用Knowles IA611进行语音活动检测,使用SPH0655LM4H-1 Cornell II数字麦克风进行波束成形,并使用Knowles IA8201进行音频处理。Knowles IA611是一款智能麦克风,可为系统设计人员带来好处,如以下部分所述。

麦克风选择

对于图1所示的体系结构,当检测到声音活动时,将单个模拟麦克风和比较器用作触发输入,以唤醒音频处理器。唤醒麦克风应为低功率模拟麦克风,其信噪比(SNR)最好高于62 dB。Knowles SiSonic MEMS麦克风产品组合为唤醒麦克风提供了多种选择。例如,SPV1840LR5H-B Kaskade模拟麦克风是一个不错的选择,当打开时仅消耗45µA。包括麦克风,放大器和比较器在内的始终在线的模拟路径消耗的电流小于67µA。市场上有一些压电麦克风,它们的始终接通功率很低(10µA),但是它们通常具有低SNR,这会影响系统性能。

对于图2所示的具有预卷缓冲功能的体系结构,具有嵌入式音频处理器和足够内存以在2秒的循环缓冲区中连续捕获语音数据的麦克风(例如Knowles IA611)是始终在线语音活动的可行选择。检测。它还带有移植语音触发器和命令的生态系统,例如亚马逊的Alexa。当检测到关键字时,预滚动缓冲区和发出的语音音频都会发送到云自动语音识别(ASR)引擎。IA611的始终开启的语音唤醒功率为0.39 mA(电池1.8V,效率为90%),使其成为电池供电设备(如蓝牙扬声器)中语音用户界面的理想选择。该设备还接受来自数字麦克风的PDM输入,

虽然这种始终接通的功率对于预卷式应用是可以接受的,但对于图1所示的非预卷式架构,也值得考虑。如前所述,模拟唤醒麦克风将触发任何传入声音并打开扬声器。音频处理器。在嘈杂的环境中(例如在电视开机时),这可能会成问题,因为那里会有许多虚假的唤醒,导致功率的大量浪费。如果使用语音活动检测而不是低功率模拟唤醒麦克风,则系统仅在检测到关键字时才打开。从逻辑上看,为什么在嘈杂的环境中使用语音活动检测麦克风可能比简单的模拟唤醒麦克风更有效。

图3显示了模拟数据,该数据比较了使用IA611上的VAD的典型电视遥控器与竞争性的压电低功率AAD麦克风和音频处理器在不同声活动开启时间下的电池寿命天数。当电视或其他家用电器打开时,或在其他情况下,如鼓鼓声等时,可能会出现声音活动。如图3所示,在大约3小时处有一个交叉点,因此使用模拟AAD的功率优势竞争对手的麦克风上的IA611上的语音活动检测消失了。

在声音活动开启时间为五个小时的情况下,语音活动检测解决方案比基于竞争的基于AAD的解决方案多了八天的电池寿命。为了充分发挥这一优势,根据尼尔森(Nielsen)在2017年发布的一项研究,美国成年人每天看电视的时间将近八小时。随着对联网设备(例如智能电视,游戏机和其他多媒体设备)的需求不断增加,在典型的美国家庭中,声音活动的小时数也可能会继续增加。使用基于智能VAD的唤醒将帮助系统设计人员开发更节能的VUI系统。

pIYBAGBljLKAfkMvAAEbsbCqEQg611.png

图3. VAD与AAD的远程控制电池寿命。

结论

智能家居,酒店,数字工作场所,语音支付,智能能源管理,边缘语音和医疗保健,一直到改变厂房的工业物联网应用,语音都为新技术增加了灵活性,效率,可持续性和采用接受性。

用于语音用户界面设计的各种硬件体系结构以及麦克风部分,根据最终设备的应用程序和设计人员的喜好,各自满足的需求略有不同。例如,支持Alexa的设备和智能扬声器需要具有预卷缓冲功能的体系结构。

电子工程师和设计师必须仔细评估终端设备将如何利用语音,他们希望访问的功能,并据此确定正确的架构和麦克风组件,这一点很重要。

Raj Senguttuvan 在面向消费者和工业应用的新技术开发,早期业务开发以及为Analog Devices和Texas Instruments等公司提供的项目管理方面拥有超过15年的经验。在担任Knowles战略营销总监期间,他指导系统级开发,推动风险投资和合作伙伴关系以及IoT和消费者技术(包括音频处理器,算法,麦克风,传感器接收器)的营销策略。Raj拥有康奈尔大学(Cornell University)的MBA学位和佐治亚理工学院(Georgia Institute of Technology)的电气工程博士学位。

编辑“hfy”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 麦克风
    +关注

    关注

    14

    文章

    594

    浏览量

    54172
  • 模拟信号
    +关注

    关注

    8

    文章

    953

    浏览量

    51789
  • 智能家居
    +关注

    关注

    1911

    文章

    9127

    浏览量

    179125
  • 语音系统
    +关注

    关注

    1

    文章

    27

    浏览量

    12918
  • 智能扬声器
    +关注

    关注

    0

    文章

    30

    浏览量

    6242
收藏 人收藏

    评论

    相关推荐

    超低功耗16位MSP430 TM电源管理解决方案MCU

    电子发烧友网站提供《超低功耗16位MSP430 TM电源管理解决方案MCU.pdf》资料免费下载
    发表于 11-16 11:25 0次下载
    <b class='flag-5'>超低功耗</b>16位MSP430 TM电源管理解决<b class='flag-5'>方案</b>MCU

    27 MHz超低功耗无线鼠标参考设计

    电子发烧友网站提供《27 MHz超低功耗无线鼠标参考设计.pdf》资料免费下载
    发表于 11-13 14:59 2次下载
    27 MHz<b class='flag-5'>超低功耗</b>无线鼠标参考设计

    基于ARM的低功耗语音增强系统设计

    电子发烧友网站提供《基于ARM的低功耗语音增强系统设计.pdf》资料免费下载
    发表于 10-23 09:49 0次下载
    基于ARM的<b class='flag-5'>低功耗</b><b class='flag-5'>语音</b>增强<b class='flag-5'>系统</b>设计

    一种超低功耗便携式高斯计的设计方案

    。虽然部分高斯计可以用外接电源供电,但是在实际的现场应用中非常不便。于电池对环境的污染非常大,尤其在国内垃圾分类回收还刚刚起步的情况下,废弃的干电池对环境的危害很大。根据这一市场需求,文中设计了一款超低功耗的便携式高斯计,采用3节7号干电池供电,电池寿命达到了l ooO h.
    发表于 10-10 06:52

    中微BAT32G135单片机的超低功耗血氧仪/指夹式血氧仪方案

    主控芯片BAT32G135GE32FP采用Cortex M0+ 超低功耗内核,主频高达64MHz,内置12位高精度ADC,8位DAC,具备I/O矩阵功能等
    的头像 发表于 09-11 17:04 365次阅读
    中微BAT32G135单片机的<b class='flag-5'>超低功耗</b>血氧仪/指夹式血氧仪<b class='flag-5'>方案</b>

    AR智能眼镜PCB|AR眼镜电路板低功耗发热小的生产设计方案

    AR智能眼镜PCB|AR眼镜电路板低功耗发热小的生产设计方案。该电路板基于联发科MTK6765八核硬件平台,具有低功耗和低发热的优势。操作系统采用Android 9.0,并集成了光波导
    的头像 发表于 08-28 19:13 1225次阅读
    AR智能眼镜PCB|AR眼镜电路板<b class='flag-5'>低功耗</b>发热小的生产<b class='flag-5'>设计方案</b>

    恩智浦超低功耗i.MX 8ULP Sensor Hub参考案例

    大家介绍一款基于i.MX 8ULP超低功耗微处理器的Sensor Hub参考案例。该方案利用i.MX 8ULP评估板的板载传感器,实现温度,气压,加速度等数据的采集,并显示在屏幕上。在完成数据采集、处理、显示后,系统可以进入待机
    的头像 发表于 08-18 08:05 388次阅读

    以CS32L010为例浅谈超低功耗MCU的应用

    随着物联网技术的不断发展,超低功耗MCU已经成为了物联网方案中主要的芯片处理技术。超低功耗MCU具有众多的优点,其中一大所用就是能够大大提高物联网设备的续航能力,保证设备在长时间内不掉电不断电。那么
    的头像 发表于 08-09 14:41 733次阅读

    超低功耗MCU的选型技巧与设计思路

    循序渐进式的功耗优化已经不再是超低功耗mcu的游戏规则,而是“突飞猛进”模式,与功耗相关的很多指标都不断刷新记录。我们在选择合适的超低功耗mcu时要掌握必要的技巧,在应用时还需要一些设
    的头像 发表于 08-04 14:46 1327次阅读

    低功耗系统在降低功耗的同时保持精度所涉及的时序因素和解决方案

    本文将介绍低功耗系统在降低功耗的同时保持精度所涉及的时序因素和解决方案,以满足测量和监控应用的要求。
    的头像 发表于 07-11 16:16 392次阅读
    <b class='flag-5'>低功耗</b><b class='flag-5'>系统</b>在降<b class='flag-5'>低功耗</b>的同时保持精度所涉及的时序因素和解决<b class='flag-5'>方案</b>

    超低功耗蓝牙芯片

    PHY6222 超低功耗蓝牙芯片 是一款低功耗蓝牙芯片,主要应用在数据传输的产品领域。例如,车载蓝牙、手环、医疗、蓝牙锁、蓝牙自拍杆、蓝牙健身器材等等。处理器为32位的ARM Cortex M0
    发表于 06-27 17:30

    儿童牙刷语音方案低功耗语音芯片NV040C,支持UART指令

    随着人们对生活品质的追求越来越高,家庭中的日常用品也开始注重便携性、功能性与智能化。牙刷作为家庭必备的清洁用品,同样也在走向智能化的方向。为此,市场上出现了一些支持语音指令的儿童牙刷语音方案,其中
    的头像 发表于 06-27 16:52 236次阅读

    加湿助眠仪语音方案低功耗语音芯片NV040C-SOP8

    的基本设计思路是,通过语音交互的方式,让用户可以轻松控制加湿助眠仪的工作状态,可以实现助眠仪的音乐播放、人机交互以及语音提示等多种功能。首先,低功耗是九芯电子NV040C
    的头像 发表于 06-26 16:34 316次阅读
    加湿助眠仪<b class='flag-5'>语音</b><b class='flag-5'>方案</b>,<b class='flag-5'>低功耗</b><b class='flag-5'>语音</b>芯片NV040C-SOP8

    超低功耗MCU在物联网方案中的应用

    随着物联网技术的不断发展,超低功耗MCU已经成为了物联网方案中主要的芯片处理技术。超低功耗MCU具有众多的优点,其中一大所用就是能够大大提高物联网设备的续航能力,保证设备在长时间内不掉电不断电。那么
    发表于 06-13 18:18

    超低功耗设计概述

    介绍Cortex-M0、Cortex-M0+超低功耗
    的头像 发表于 06-02 09:36 40.9w次阅读