0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新的数字麦克风允许完全强大的麦克风阵列

符筹荣 来源:请叫我保尔 作者:请叫我保尔 2022-07-28 08:02 次阅读

Vesper 麦克风的单层耐用结构使其免受空气中的颗粒和污染物引起的漂移和降解。

随着智能设备大战愈演愈烈,许多传感器公司的目标是为声控设备构建最好的麦克风阵列。随着此类设备的激增席卷消费市场,此类设备的需求量很大。先进的传感器公司被证明是该领域的创新者,他们引入了新技术来延长电池寿命、提高远场音频质量并抵御环境污染物。

先进的传感器公司Vesper就是这样的实体之一。其最新、最先进的麦克风VM3000是一款脉冲密度调制 (PDM) 输出麦克风,具有内置模数转换器ADC),可转换 MEMS 传感器捕获的输入模拟信号进入数字领域。与需要外部 ADC 的模拟麦克风同类产品相比,数字麦克风可节省材料清单 (BOM) 和设计尺寸,以及更高的射频RF) 和电磁干扰 (EMI) 噪声抗扰度。

数字麦克风还可以在多种模式下运行,其中编解码器或应用处理器可以使用时钟频率定义麦克风的状态。例如,VM3000 提供四种此类功耗模式:睡眠 (《1 µA)、待机 (145 µA)、低功耗 (400 µA) 和正常 (700 µA),具体取决于操作的时钟频率。图1为麦克风的状态图:

图 1. VM3000 数字 MEMS 麦克风的状态图。

麦克风上的左/右 (L/R) 选择引脚还允许在一对 VM3000 之间复用数据线,以形成立体声麦克风配置(单声道和立体声配置的典型时序图和应用电路可从数据表)。

独特的差异化

虽然 PDM 输出和多模式操作是当今市场上许多数字 MEMS 麦克风的典型特征,但与电容式同类产品相比,Vesper 的 VM3000 为嵌入式语音接口提供了独特的差异化。

让我们从 VM3000 麦克风的稳健性开始。VM3000 采用与 Vesper 的其他模拟麦克风相同的压电 MEMS 结构,使用单层压电晶体,对灰尘、水、湿气和其他环境颗粒具有鲁棒性。

在具有双板设计的电容式 MEMS 麦克风中,进入 MEMS 传感器的任何外来颗粒都可能被困在板之间,因此随着时间的推移会降低灵敏度和频率响应。随着阵列中各个麦克风的性能漂移,波束形成算法将这种差异视为方向性线索,使波束远离预期方向。覆盖声学端口的网格或薄膜会使 SNR 降低 2-3 dB,也增加了设计的成本和复杂性。

相比之下,Vesper 麦克风的单层耐用结构使其不受这些漂移的影响,并提供稳定的阵列而无需网格。图 2 显示了两种不同类型的 MEMS 麦克风在独立测试设施中暴露于灰尘之前和之后的频率响应比较。

图 2. 根据 JDEC 标准,电容式(左)和 Vesper(右)麦克风在灰尘暴露前后的频率响应测量。

有人可能会问,“既然电容式 MEMS 麦克风已经存在多年,为什么现在这很重要?” 答案在于在智能扬声器、安全摄像头、耳机、智能手机等语音激活设备中越来越多地采用麦克风阵列。现在强大的压电麦克风的模拟和数字版本都可用,开发人员可以放心,长期其阵列的长期稳定性,无论其芯片组上可用的接口如何。对于需要多个带有保护网或膜的麦克风的阵列,VM3000 是一个福音,因为具有 IP57 等级的 Vesper 产品不需要网/膜,从而实现更简单的设计和不变的性能,以及节省 BOM 。

与其他压电麦克风一样,VM3000 不需要电荷泵来产生偏置电压。因此,与电容式麦克风相关的 10 ms 启动和模式切换延迟相比,VM3000 可以在 200 µs 内从睡眠中唤醒,并在 100 µs 内切换不同的电源模式。

这种 50 倍的启动时间优势使语音激活系统能够以足够快的速度唤醒以捕获完整的唤醒词。相比之下,电容式麦克风的缓慢启动限制了整个系统的唤醒时间,从而影响了唤醒词检测性能。

对于启动时间的直观解释,请考虑图 3 所示的语音激活系统的简化框图。在此设计中,VM3000 与 Vesper 的零功率监听 (ZPL) 麦克风 VM1010 结合使用。

图 3. Vesper 的 ZPL 麦克风与 VM3000 数字麦克风相结合的简化语音激活系统。

VM1010 是一款模拟麦克风,仅当有任何声音活动超过预定义的声压级时才会从超低功耗睡眠模式中唤醒。此唤醒由处理器使用两个 GPIO 控制引脚控制:Dout 和 Mode。综上所述,当环境中有声音活动时,VM1010 从睡眠模式切换到正常模式,并在 Dout 上输出高电平。然后,Dout 信号驱动 DSP/编解码器上的时钟,进而设置 VM3000 上的 CLK 以将麦克风从睡眠中唤醒。

上述系统也进行了修改,以测量 VM3000 和具有可比声学规格的电容式麦克风的启动时间。图 4a 和 4b 显示了 VM1010 上 Mode/Dout 引脚的状态转换,以及每种情况下数字麦克风上的 CLK 和 PDM 数据引脚。当 VM1010 听到唤醒字时,Dout 从低变高,处理器在 8 µs 内设置模式引脚。PDM 时钟信号从 16 µs 开始(如图 4a 所示)以将数字麦克风从睡眠模式切换出来,并且 PDM 数据在 200 µs 内可在 DATA 引脚上使用,如图 4b 所示。

图 4a。使用 VM1010 和数字麦克风进行模式转换(为粒度单独显示)

图 4b。在示波器上测量的 VM1010 + VM3000 时序。(来源:维斯珀)

相比之下,图 5 显示电容式麦克风上的 PDM 数据仅在 CLK 变为高电平后 10 ms 可用。因此,DSP/编解码器必须等待这段时间才能接收 PDM 数据并执行额外的唤醒字处理。

图 5. VM1010 和电容式 MEMS 数字麦克风时序。(来源:维斯珀)

从实现的角度来看,这意味着 DSP 必须将电容式麦克风保持在低功耗模式之一,而不是切换回待机模式(典型电流为 50 µA),因为它无法以足够快的速度唤醒以服务于唤醒词检测请求。 相比之下,Vesper 的系统可以在电流略低于 1 µA 的情况下长时间保持睡眠模式,同时根据需要在不到 100 µs 的时间内切换到高性能模式。

这种启动时间优势如何转化为唤醒词检测性能?为了进一步研究,Vesper 测量了唤醒词检测性能,以评估启动时间对错误拒绝率 (FRR) 的影响。

FRR 被测量为所有 50 种不同的唤醒词话语中错过的唤醒词的数量。在这些测试中,测量是在办公室类型的房间内进行的,环境安静,环境本底噪声为 30 dBA。头和躯干嘴模拟器 (HATS) 用于播放从 75 dB 到 98 dBSPL 的不同语音级别的话语。每个话语之间使用 30 秒的间隔,以确保整个系统(包括 VM1010 和 VM3000)在唤醒后切换到睡眠模式。图 6 显示了 FRR 性能与 VM3000 和电容式麦克风的比较。

图 6. 使用 Vesper(蓝色)和电容(红色)麦克风进行唤醒词检测。

在较高的声压级下,由于麦克风输入端的声级较高,两个麦克风的 FRR 性能相似。随着 SPL 水平的降低,唤醒缓慢的系统会受到惩罚,因为唤醒词中的第一个音节丢失了。结果表明,与 Vesper 的 ZeroPower Listening 技术结合使用时,VM3000 与电容式麦克风相比,关键字准确度提高了 2 倍。

总结

虽然数字麦克风为设计人员在编解码器周围布线和布线方面提供了更好的灵活性已被广泛接受,但 Vesper 独特的价值主张还提供了额外的设计灵活性和在启动时间方面的前所未有的优势。Vesper 数字麦克风产品组合的发展将是朝着强大而准确的语音激活设备的扩散迈出的一大步,即使在恶劣的环境条件下也可以运行。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18288

    浏览量

    222175
  • 解码器
    +关注

    关注

    9

    文章

    1073

    浏览量

    40159
  • adc
    adc
    +关注

    关注

    95

    文章

    5652

    浏览量

    539489
收藏 人收藏

    评论

    相关推荐

    怎么连接麦克风

    连接麦克风的时候把正负极接反了,会不会把麦克风给烧坏掉,急急急;该怎么检测,请指教。
    发表于 08-01 09:16

    ICS‐41350 数字麦克风

    麦克风阵列(Microphone Array)技术能够实现远场拾音,人声定位、回音消除和打断等效果,麦克风阵列方案非常适合使用在视频会议摄像头定位、安防摄像头定位、机器人定位等场合,以
    发表于 02-11 12:01

    麦克风阵列音频信号进行数字化设计

    阵列捕获;这种情况下,阵列包括四个模拟驻极体电容麦克风。尽管在图2中未显示,但典型的驻极体电容麦克风在偏置时接近电流源。模数转换器(ADC)对来自
    发表于 06-25 10:10

    为什么需要麦克风阵列

    消费级麦克风阵列的兴起得益于语音交互的市场火热,主要解决远距离语音识别的问题,以保证真实场景下的语音识别率。这涉及了语音交互用户场景的变化,当用户从手机切换到类似Echo智能音箱或者机器人的时候
    发表于 07-28 14:25

    科普麦克风阵列原理

    1 麦克风阵列麦克风阵列,是一组位于空间不同位置的全向麦克风按一定的形状规则布置形成的阵列,是对
    发表于 07-28 14:28

    麦克风阵列介绍

    1 麦克风阵列麦克风阵列,是一组位于空间不同位置的全向麦克风按一定的形状规则布置形成的阵列,是对
    发表于 08-08 18:43

    麦克风阵列 仅有两个麦克风,会不会不够用?

    麦克风阵列麦克风只有2个,带来的直接优势是成本低很多。同时,它小巧的构型决定它的应用也更为灵活。双麦克风阵列,顾名思义在录音系统上只使用
    发表于 08-08 18:44

    全球量产麦克风阵列的阵型技术盘点

    处理效果,实际上这三种技术是无法完全分割的,特别是麦克风阵列和唤醒技术更是浑然一体。所以国内厂商开发的Amazon Alexa产品,若选用Sensory等提供的唤醒词,总是会比Echo差不少,有意思的是,Alexa与Echo两个
    发表于 08-08 18:55

    汽车 麦克风阵列技术进行详述

    概述 我们之前介绍过语音识别技术(ASR),随着ASR的逐步成熟,麦克风阵列也逐步得到重用。尤其在汽车里,空间有限,便于声音的近场定位,而麦克风的布线可以很方便和很规则,便于实现成阵列
    发表于 08-10 14:30

    了解麦克风灵敏度

    ,模拟麦克风完全可以拥有 20 dBV 的灵敏度,其中用于基准电平输入信号的输出信号为 10 V。只要放大器、转换器和其他电路能支持所需的信号电平,完全可以实现这一水平的灵敏度。数字
    发表于 10-22 16:57

    麦克风技术规格解析

    的灵敏度通常用 dBV 来规定,即相对于 1.0 V rms 的 dB 数。数字麦克风的灵敏度通常用dBFS 来规定,即相对于满量程数字输出 (FS) 的 dB 数。对于数字
    发表于 11-01 11:26

    MEMS与ECM:比较麦克风技术

    前置放大器的输出提供给用户。但是,如果需要数字输出信号,则模数转换器(ADC)与音频前置放大器结合在同一个芯片上。脉冲密度调制(PDM)是用于MEMS麦克风中的数字编码的传统格式,并且允许
    发表于 02-23 14:05

    麦克风灵敏度探讨

    作者: Jerad Lewis灵敏度, 即模拟输出电压或数字输出值与输入压力之比,对任何麦克风来说都是一项关键指标。在输入已知的情况下,从声域单元到电域单元的映射决定麦克风输出信号的幅度。 本文将
    发表于 07-23 07:51

    驻极体麦克风电路

    三pin的驻极体麦克风和两pin的驻极体麦克风可以共用电路吗,就如下图,是2pin的麦克风假差分电路,那如果是三pin的麦克风,应用于这个电路中,引脚该怎么接呢
    发表于 04-14 11:21

    请问NUC505是否支持数字麦克风?

    是,NUC505内部音讯编译码器( Audio CODEC )有支持数字麦克风功能,但只能同时支持一组麦克风,左右声道数据相同。通过PA2 (Digital MIC clock in)及PA3
    发表于 06-20 08:15