0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

波束成形技术下麦克风数量与几何布局对方向性拾音效果的影响

CLASS HD功放电路设计 来源:CLASS HD功放电路设计 作者:CLASS HD功放电路设 2025-07-28 18:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

波束成形是一种核心信号处理技术,通过麦克风阵列实现空间滤波,从而显著提升音频系统的方向性拾音能力。

该技术通过对阵列中各麦克风信号进行巧妙组合,使来自特定方向的信号产生建设性干涉,而来自其他方向的干扰信号则产生破坏性干涉,以此实现对目标声源的增强和对噪声及干扰的抑制。

我们深入探讨了麦克风数量(N)和阵列几何布局对波束成形方向性拾音效果的关键影响。

研究表明,增加麦克风数量通常能提升阵列增益、指向性指数和空间分辨率,并增强干扰抑制能力。

然而,这种性能提升并非线性无限,而是存在边际效益递减的现象,伴随着成本、计算复杂度和物理尺寸的显著增加。

在几何布局方面,线性、圆形、平面和球形阵列各具特点,对波束宽度、旁瓣电平、零点形成以及对声场复杂度的适应性产生不同影响。

1. 波束成形在方向性音频拾取中的应用

1.1. 声学波束成形的基本原理

波束成形是一种信号处理技术,与麦克风阵列配合使用,以提供空间滤波能力。其核心目的是根据信号的空间位置,通过建设性组合提取所需信号,并通过破坏性组合抑制干扰信号。

麦克风阵列对传播波进行空间采样,然后由信号处理器对这些样本进行操作,以产生波束成形器输出信号 。

这种空间滤波是通过以特定方式组合阵列中的元素来实现的,使得来自特定角度的信号经历建设性干涉,而来自其他角度的信号则经历破坏性干涉。

最常见的实现方式是延迟-求和(Delay-and-Sum, DS)波束成形器,它通过延迟麦克风信号然后将其求和,以实现来自所需方向的信号的相干组合。这种处理可以在时域或频域进行。

在时域波束成形中,对每个麦克风信号应用有限脉冲响应(FIR)滤波器,然后将滤波器输出组合以形成波束成形器输出。在频域波束成形中,麦克风信号使用短时傅里叶变换(STFT)分离成窄带频率分量,并单独处理每个频率分量的数据。

波束成形技术大致可分为数据无关(确定性)和数据相关(自适应)两类。数据无关波束成形器之所以如此命名,是因为它们的滤波器不依赖于麦克风信号,而是选择用于近似所需响应。例如,可以设计滤波器以在特定方向上接收任何信号,或在特定频率和方向上抑制干扰。

自适应波束成形器则根据所需信号和干扰信号的统计特性进行设计,以优化某些功能,使其在某种意义上达到最佳状态,例如最大信噪比(MSNR)、最小均方误差(MMSE)或最小方差无失真响应(MVDR)。

波束成形的理论基础建立在声波传播原理之上。声波通常以球形波的形式从声源传播,但当距离声源足够远时,可以将其近似为平面波,这简化了数学分析。

麦克风阵列通过在不同空间位置放置多个麦克风来对声场进行空间采样。

从本质上讲,单个微机电系统(MEMS)麦克风通常表现出全向拾音响应,即它们对来自任何方向的声音都具有相同的敏感度。然而,通过波束成形技术将多个麦克风配置成阵列,可以形成定向响应或波束模式 。这种从全向敏感度到空间选择性的转变,是麦克风阵列在音频捕获能力上的根本性飞跃。这种能力不仅仅是信号的简单放大,它允许系统主动地从复杂声场中“提取”所需信号并“抑制”干扰信号。因此,波束成形成为一项关键的使能技术,它重新定义了音频捕获系统的能力,使其能够执行单麦克风无法完成的复杂任务,例如在嘈杂环境中进行语音分离 1或精确的到达方向(DoA)估计。

1.2. 方向性拾取在现代音频应用中的重要性

方向性音频拾取在现代音频应用中至关重要,尤其是在复杂声学环境中有效分离或提取语音和其他所需信号方面。这些环境通常充满噪声、竞争声源和混响。

通过将接收辐射模式聚焦于所需信号的方向,波束成形显著提高了语音质量和可懂度 。

语音识别系统、电话会议、音频监控和助听器等广泛应用中,方向性拾取是提高性能的关键。例如,在电话会议系统中,波束成形可以改善音频质量并减少回声和背景噪声。在助听器中,它有助于提高语音清晰度并降低背景噪声 。对在智能扬声器、智能手机机器人等小型设备以及其他高保真音频采集场景中实现高级空间滤波能力的需求,凸显了波束成形技术的重要性 。

智能音频设备日益融入各种且通常不受控制的声学环境,例如家庭中的背景噪声、会议室中的多位发言人或户外环境。在这种背景下,波束成形已从一种专业的信号处理技术演变为实现有效人机交互和通信的基本要求。在这些复杂的声学环境中,单个全向麦克风在从干扰和混响中隔离所需信号方面存在固有限制 12。波束成形通过“将接收辐射模式聚焦于所需信号的方向,从而减少干扰并提高捕获声音的质量”,隐含地提供了必要的“质量增强” 12。这使其不仅是一个可选功能,而且是一项关键的使能技术,确保了现代以音频为中心的系统的功能性、性能以及最终的用户体验,使其能够在干扰中可靠地“听到”和处理相关声音。

2. 麦克风阵列方向性的关键性能指标(KPI

2.1. 指向性与阵列增益

指向性描述了麦克风或阵列的输出电平在声源在消声空间中改变位置时如何变化。它代表了与全向接收/传输相比的改进。

指向性指数(DI)-

以dB表示,量化了这种指向性。它是麦克风在参考轴方向上接收到的平面声波产生的输出与在相同频率或频带和声压下扩散声场产生的输出之比。较高的DI表示声能更集中。标准麦克风的典型DI范围在0 dB(全向)到6 dB(超心形)之间。

阵列增益(AG)-

是阵列实现的信噪比(SNR)改善的度量。阵列增益的实现是由于所需信号从N个阵列元素中相干相加,而无关噪声则从这些相同的元素中非相干相加。如果噪声被认为是无关的,则阵列增益小于或等于N(阵列元素的数量);对于均匀加权阵列,阵列增益等于N。

指向性和阵列增益虽然是不同的指标,但它们是内在关联的性能度量,共同定义了阵列隔离所需信号的能力。高指向性塑造了拾音模式,而高阵列增益量化了在存在噪声时信噪比的改善。指向性定义了阵列的空间选择性——它如何比其他方向更“倾听”一个方向。它描述了阵列敏感度模式的形状。

阵列增益则量化了这种空间选择性在信号质量方面的益处,特别是信噪比的改善。它衡量了改善的

幅度。

指向性所实现的空间滤波(所需信号的建设性干涉,其他信号的破坏性干涉)正是信号能够相干求和、噪声能够非相干求和的原因,这也是实现阵列增益的机制。如果没有明确定义的指向性模式,相干求和将无法有效定位,信噪比的改善也将微乎其微。因此,指向性是实现空间滤波的手段,而阵列增益是有效指向性的一个关键结果,这使得它们成为评估空间滤波性能的互补指标。

2.2. 空间分辨率与波束宽度

空间分辨率定义为阵列能够区分的两个声源在空间中的最小距离。高空间分辨率表示声源识别和定位的准确性高。

波束宽度(BW)-

是衡量空间分辨率的关键参数,特指主瓣宽度。它通常定义为阵列响应图中主瓣峰值以下3dB处的宽度 。

对于传统的延迟-求和(DS)波束成形器,波束宽度与频率成反比。这意味着主瓣在低频时更宽,在高频时更窄,这会降低波束成形器处理噪声和干扰的有效性,尤其是在低频时。

基本波束成形器(如延迟-求和)中波束宽度的频率依赖性对宽带音频应用提出了根本性挑战,需要更先进的技术才能在人耳听觉范围内实现一致的性能。DS波束成形器的波束宽度与频率成反比。这意味着阵列聚焦于某个方向的能力会随着声音频率的变化而显著改变。在低频时,波束较宽,空间选择性较低;在高频时,波束较窄。

语音和其他音频信号是宽带的,覆盖广泛的频率范围(大约20 Hz到20 kHz)。具有频率依赖性波束宽度的波束成形器在整个音频频谱上的性能将不一致。这“降低了其处理噪声和干扰的有效性,尤其是在低频时” ,因为主瓣最宽,因此选择性最低。

这种基本波束成形器的固有局限性给实际音频系统带来了关键的设计挑战。为了在整个可听范围内提供一致、高质量的方向性拾音,设计人员不得不超越简单的DS方法。这推动了差分波束成形器或谐波嵌套子阵列等更复杂解决方案的开发,这些解决方案旨在实现频率不变的波束模式或宽带性能,凸显了跨频率的一致空间滤波是关键的性能差异化因素。

2.3. 干扰抑制、旁瓣电平与零点形成

干扰抑制是波束成形的主要目标之一,通过组合麦克风输出,对离轴分量产生破坏性干涉,从而抑制干扰信号(噪声、竞争声源、混响)。自适应波束成形技术通过动态调整阵列模式,特别有效地提高了对来自其他方向的非期望信号的抑制能力。

旁瓣电平(SLL)-

是阵列指向性模式中的次级、低幅度波束,与主瓣不同 。高旁瓣电平是不希望出现的,因为它们会捕获非期望的噪声、声学回声和混响,从而降低波束成形器的信噪比(SNR)。空间欠采样可能导致“栅瓣”的形成,这本质上是偏离所需方向的不期望波束。为了抑制旁瓣,通常采用振幅加权、遗传算法或特定的非均匀元素间距等技术。

零点形成是指波束成形器可以优化为在特定干扰源方向上具有零响应或最小响应,从而在其拾音模式中有效地创建一个“零点”。

零点深度(ND)-

量化了零点方向的信号衰减量(以dB为单位),表示阵列抑制来自该角度信号的有效性。理想情况下,ND接近-∞ dB(完美抵消),但在实践中,由于阵列设计、阶数和量化比特分辨率等因素,观察到的是有限值。

零点转向波束成形器专门设计用于策略性地放置这些零点,以“忽略来自特定方向的噪声或干扰,同时监听其他方向的事件”。

旁瓣抑制和零点转向之间复杂的相互作用,反映了从简单信号增强到主动环境塑造的转变,其中阵列的空间滤波器被精确地塑造成既能广泛地最小化非期望拾音,又能专门消除强干扰。这种高级控制对于在复杂真实声学场景中的稳健性能至关重要。

波束成形的基本目标是增强所需信号并抑制干扰。然而,存在两个主要挑战:首先,非期望信号可能被旁瓣拾取,从而降低信噪比;其次,在许多情况下,存在需要精确消除的离散、强干扰源(例如,会议中的其他发言人,特定机器噪声)。

为了应对这些挑战,采用了两种解决方案:旁瓣抑制技术(如振幅加权或非均匀间距)被应用于广泛降低阵列对来自主波束外部方向的信号的敏感度,从而改善整体噪声抑制。

对于特定已知干扰方向,则主动在阵列模式中创建零点,这为来自这些精确角度的信号提供了极高的衰减。这种双重方法表明对阵列空间滤波能力的高度成熟控制。它不仅仅是关于被动地在某个方向上“听得更好”,而是主动地塑造阵列感知的声学空间。

通过抑制旁瓣,阵列最大限度地减少了漫射噪声和一般离轴声音的影响。通过转向深零点,它能够精确地“屏蔽”自身免受特定强干扰源的影响。这种主动空间管理对于在动态和高度干扰的环境中实现稳健和高保真音频捕获至关重要 9,展示了对声学场景分析和操作的复杂理解。

2.4. 信噪比与信号加干扰加噪声比(SNR/SINR)

信噪比(SNR)-

是衡量所需信号电平与背景噪声电平之间关系的度量 。它定义为信号功率与噪声功率之比,通常以分贝(dB)表示。较高的SNR表示信号更清晰,更容易检测或解释 。

信号加干扰加噪声比(SINR)-

是一个更全面的指标,定义为感兴趣的特定信号功率除以所有其他干扰信号的干扰功率与背景噪声功率之和。如果干扰功率为零,SINR降至SNR;如果噪声为零,则降至信号加干扰比(SIR)。SINR在无线通信和麦克风阵列中特别相关,因为在这些应用中,除了背景噪声之外,还存在离散的干扰源。

波束成形的首要目标是优化这些比率,通过增强所需信号分量并有效抑制噪声和干扰分量来提高SNR/SINR 。

从主要使用信噪比(SNR)到使用信号加干扰加噪声比(SINR)作为关键指标的转变,反映了现实世界声学环境日益增长的复杂性和真实性,其中离散干扰源通常与漫射背景噪声一样重要,甚至更具挑战性。历史上,信噪比(SNR)是主要指标,主要关注所需信号与一般背景噪声的关系。然而,现代声学环境不仅仅是“嘈杂”的;它们通常包含多个“竞争声源” 或明显的“干扰信号” 。例如,会议中的多个发言人,或工业环境中的特定机器声音。SINR的引入和广泛采用明确地将这些离散干扰信号与背景噪声一起计入分母。

这种指标的转变意味着对麦克风阵列所面临的声学挑战有了更细致和真实的理解。它暗示仅仅减少漫射噪声通常是不够的;系统还必须善于识别、分离和抑制

特定的非期望声源。这推动了波束成形算法设计向更复杂的空间滤波和声源分离技术发展,这些技术能够区分所需信号、相干干扰和非相干噪声,反映了在高度复杂声学场景中对稳健性能日益增长的需求。

3. 麦克风数量对方向性拾取性能的影响

3.1. 麦克风数量增加的普遍性能趋势

增加麦克风数量(N)通常会提升波束成形性能。更多的麦克风能够更有效地衰减来自离轴方向(侧面和后方)的声音,从而提高阵列的整体指向性和干扰抑制能力。例如,一个3麦克风宽边阵列可以实现6 dB的侧面衰减,而2麦克风阵列则为3 dB。更高阶的差分阵列使用更多麦克风,也能实现对后方和侧面声音的更强抑制。

此外,增加麦克风数量可以通过利用多个传感器的冗余来改善白噪声增益(WNG)。这有助于避免白噪声放大问题,该问题在低频时尤为关键 。

麦克风数量的增加不仅仅是简单的累加;它解锁了更复杂的信号处理能力,例如利用信号冗余和实现更高阶差分波束成形,这在麦克风数量较少时是不可行的。最初,更多的麦克风直接导致离轴声音的更大衰减 。这是一种直接的、线性提升,体现在空间滤波能力上。然而,更深层次的影响在于,麦克风数量的增加提供了“冗余”。这种冗余不仅仅是更多数据,更是对声场进行更多空间多样化采样。

这种增加的空间信息使得应用更复杂和强大的算法成为可能。例如,它允许设计更高阶的差分波束成形器 ,这些波束成形器本质上提供更优异的抑制能力。它还促进了鲁棒波束成形器的开发,这些波束成形器能够通过有效利用这种冗余来减轻白噪声放大问题 。因此,麦克风的数量不仅决定了潜在的性能,还决定了可以有效部署的波束成形算法的类别。

3.2. 关键性能指标的量化分析

阵列增益/信噪比(SNR):对于噪声不相关的阵列,阵列增益理论上小于或等于N(元素数量);对于均匀加权阵列,它可以等于N 。

一个常见的经验法则是,麦克风数量每增加一倍,整体信噪比可提高约3 dB。这是因为麦克风信号相干叠加(每次翻倍导致振幅增加6 dB),而无关噪声非相干叠加(导致噪声基底增加3 dB)。

指向性指数(DI):要实现指向性指数3 dB的增加,通常需要将麦克风数量和相关的信号处理硬件翻倍。

干扰抑制(零点深度):虽然零点深度并非仅由N决定,但信号处理的保真度(可以通过更多麦克风和更好的量化来增强)会影响零点深度。例如,增加量化比特数已被证明可以增加零点深度,表明干扰抑制能力得到改善。

空间分辨率:实现更高的空间分辨率通常需要更多的麦克风,并且通常需要将它们放置得更远以增加阵列孔径。比较研究表明,麦克风数量较多的阵列,例如64麦克风圆形阵列,与优化后的螺旋形和矩形阵列相比,可以表现出略好的空间分辨率 。一项实际评估表明,在声音方向估计性能方面,8麦克风配置比4麦克风配置提供了5到9 dB的显著优势,具体增益取决于工作信噪比。

3.3. 性能饱和与边际效益递减

尽管麦克风数量的增加带来了明显的益处,但性能增益会呈现边际效益递减的现象。具体而言,对于延迟-求和波束成形,传感器数量每增加一倍,信噪比最多增加3 dB,但这仅限于传入的干扰信号完全不相关的情况。

在DS波束成形中,“需要大量传感器来提高信噪比”被认为是一个主要缺点,因为它会导致系统复杂性显著增加,并需要更多额外设备。在实际产品设计中,麦克风数量通常受物理和计算限制,这使得在实现最佳空间指向性的同时,保持在设计约束内变得具有挑战性。这表明,超过某个点后,边际性能改进无法证明不断增加的成本和复杂性是合理的。

麦克风数量增加所带来的“边际效益递减”现象,代表了一个关键的经济和工程转折点,即边际性能增益不再能证明成本和复杂性的指数级增长是合理的。

这种固有的权衡推动了算法效率和混合物理/虚拟阵列设计方面的创新,以在实际资源限制下最大限度地提高性能。更多的麦克风直接带来更好的信噪比和指向性指数。然而,实现这些增益伴随着硬件成本、系统复杂性和物理尺寸的显著增加。例如,指向性指数增加3 dB需要两倍的麦克风和硬件,而大量传感器会导致更高的复杂性和成本。每增加一倍传感器,信噪比最多增加3 dB,这突出表明性能增益(以dB计)与物理资源的指数级增长之间存在线性关系。

这意味着增加麦克风数量的投资回报率随着阵列规模的扩大而显著下降。这种根本性的经济和工程现实意味着简单地增加麦克风数量并非性能优化的可持续或最佳策略。

这种压力迫使研究人员和设计人员探索更智能、更资源高效的解决方案。这包括开发高度优化的算法,以从有限数量的物理麦克风中提取最大性能,或开创“虚拟麦克风”等概念,通过计算增强阵列而无需增加物理元素。这种权衡是计算声学领域创新的主要驱动力,推动了在受限资源下所能实现的技术边界。

4. 麦克风阵列几何布局对方向性拾取的影响

4.1. 线性阵列:特点、优势与局限性

特点:线性麦克风阵列由麦克风沿直线排列组成。它们的空间位置向量可以简化为一维表示(例如,[xm, 0, 0])。

优势:线性阵列相对简单,易于设计和实现。早期的波束成形系统由于硬件限制,常采用延迟-求和(DS)波束成形与线性阵列结合,以实现方向性。

局限性:线性阵列的一个显著限制是它们无法在完整的360度范围内区分信号,通常只能区分ϴ ϵ [0, π]范围内的声源。这导致了“前后问题”,即阵列前方的声源无法与正后方的声源区分开来 。

此外,线性阵列的DS波束成形器波束宽度与频率成反比,使得主瓣在低频时更宽,在高频时更窄,这降低了其处理噪声和干扰的有效性,尤其是在低频时。

线性阵列的“前后问题”从根本上限制了它们在需要360度空间感知应用中的效用,这推动了对更复杂、多维几何布局的需求,尽管这会增加设计和处理的挑战。线性阵列在设计和实现上相对简单。然而,尽管有这种简单性,一个关键的缺陷是其固有的“前后问题” 。这意味着它无法区分来自阵列前方和后方的声音,这对于需要全面空间感知的应用(如智能助手或会议系统)而言是致命的缺陷。

这种根本性的限制导致了对能够提供360度覆盖和更好空间分辨率的阵列的需求。因此,设计人员被迫转向更复杂的几何形状,如圆形或球形阵列,即使这些阵列在硬件实现、校准和算法处理方面带来了更大的挑战。这种对更复杂几何形状的追求,直接源于线性阵列在实际应用中无法满足全方位空间感知需求的基本限制。

4.2. 圆形阵列:特点、优势与局限性

特点:圆形麦克风阵列由麦克风以圆形模式排列组成 。这种布局允许阵列在ϴ ϵ [0, 2π]范围内进行转向,从而解决了线性阵列的“前后问题”。

优势:圆形阵列提供比线性阵列更好的方向分辨率,并且可以用于检测来自多个方向的信号。它们能够实现跨不同方位角的一致性能。圆形阵列在声源定位任务中表现良好,尤其是在低频时,具有良好的阵列指向性和半功率波束宽度(HPBW)值。它们还被广泛用于需要360度覆盖的应用。

局限性:尽管有优势,但圆形阵列在某些频率下可能出现性能退化,例如在与贝塞尔函数零点对应的频率处,这会导致指向性因子(DI)和白噪声增益(WNG)出现固有的深零点问题。为了克服这些问题,研究人员提出了各种解决方案,如在阵列周围安装障板或使用同心圆形麦克风阵列(CCMAs)。然而,障板可能会干扰原始声场,而CCMAs则需要更多的麦克风,增加了系统的复杂性和成本。

圆形阵列的“深零点问题”揭示了波束成形设计中物理声学与数学模型之间的复杂相互作用,迫使工程师在理想性能和实际可实现性之间进行权衡,并推动了虚拟麦克风等创新解决方案的出现。

圆形阵列因其360度覆盖能力而备受青睐 。然而,其性能在某些频率下会严重下降,表现为指向性因子和白噪声增益的“深零点” 。这种现象源于阵列拓扑与声波传播的数学特性(特别是贝塞尔函数的零点)之间的固有耦合

这意味着,即使在理论上完美的条件下,阵列在某些频率下也无法有效工作。为了解决这个问题,传统方法包括使用物理障板或增加麦克风数量形成同心阵列 。然而,这些方法各自带来了新的问题:障板会干扰声场,而增加麦克风则会显著提高成本和复杂性 。这种困境促使了更具创新性的解决方案的出现,例如结合物理麦克风和虚拟麦克风的阵列 。这种方法通过声学信息神经网络AINN)估计虚拟麦克风处的声压,从而在不增加物理硬件负担的情况下克服了深零点问题并抑制了空间混叠效应。这表明,在追求理想性能时,物理限制和成本约束是强大的驱动力,它们促使技术发展超越纯粹的硬件堆叠,转向更智能的信号处理和混合系统设计。

4.3. 平面阵列:特点、优势与局限性

特点:平面阵列是线性阵列的扩展,麦克风以二维模式排列在一个平面上(例如,x轴上有M个麦克风,y轴上有N个麦克风)。

优势:平面阵列比线性阵列提供更好的方向分辨率,并且可以用于检测来自多个方向的信号 。它们在控制和塑造阵列模式方面提供了额外的变量,能够提供更对称的模式和更低的旁瓣。此外,平面阵列可以用于将天线的主波束扫描到空间中的任何点 。

局限性:尽管有优势,平面阵列仍然存在“上下混淆”的问题,即无法区分来自上方和下方的声源 。此外,阵列中存在故障元素会导致不对称性,从而增加旁瓣电平,严重扭曲辐射模式,浪费能量并可能导致不必要的干扰 。为了避免空间混叠,平面阵列中元素之间的间距通常必须小于波长的一半(dx < λ/2 和 dy < λ/2)。

平面阵列在提供二维空间选择性方面有所改进,但其固有的“上下混淆”问题以及对元件故障的高度敏感性,凸显了在实际应用中实现完全三维声场感知和系统鲁棒性所面临的持续挑战。平面阵列在空间分辨率和模式控制方面优于线性阵列。然而,它们仍然存在“上下混淆”的根本性限制 。

这意味着阵列无法区分来自其上方和下方的声音,这在需要完整三维声场感知的应用中(例如,沉浸式音频捕获或复杂机器人导航)是一个严重的缺点。此外,平面阵列对故障元件高度敏感 。即使单个麦克风故障也可能导致辐射模式的严重扭曲和旁瓣电平的增加,从而降低性能和可靠性。这些限制表明,尽管平面阵列在二维空间滤波方面取得了进展,但在处理三维声场和确保系统在非理想条件下的鲁棒性方面,仍存在根本性的挑战。这促使人们寻求更先进的几何结构和故障容错算法,以满足日益复杂的实际应用需求。

4.4. 球形阵列:特点、优势与局限性

特点:球形麦克风阵列由麦克风排列在一个球体表面组成 13。它们利用球谐函数框架进行处理和分析。优势:球形阵列提供最高的方向分辨率,并且可以用于检测来自任何方向的信号 。它们能够实现比其他标准阵列几何形状更灵活的三维波束模式合成 。球形阵列可以提供完整的全向噪声图,适用于车内和室内环境,并且可以在自由场和混响环境中工作,因为它们不假设声学环境的性质 。它们特别适用于三维声源接收、声场分析、声源定位和噪声抑制应用。

局限性:球形阵列的性能受限于有限数量麦克风引入的空间混叠误差,这在高频时会施加限制。此外,麦克风定位不准确和测量噪声也会在所有频率下引入误差,尽管这些误差通常在高频时更大。为了降低旁瓣电平,可能需要非均匀的仰角元素间距,这会增加阵列设计的复杂性。

球形阵列在提供全面三维声场感知方面具有无与伦比的优势,但其复杂性和对高频空间混叠的敏感性,凸显了在追求终极空间保真度时,工程实现和物理限制所带来的挑战。球形阵列提供最高的方向分辨率和最灵活的三维波束模式合成能力。它们能够捕获完整的全向噪声图,适用于各种复杂的声学环境,包括混响环境,因为它们不依赖于声场性质的假设 。这使得它们成为三维声源接收、声场分析和噪声抑制的理想选择 。

然而,这种卓越的性能伴随着固有的挑战。球形阵列的性能受到有限麦克风数量引入的“空间混叠误差”的限制,这在高频时尤为明显 。此外,麦克风定位的不准确性和测量噪声也会在所有频率下引入误差,尽管这些误差通常在高频时更为显著 。为了优化旁瓣电平,可能需要采用非均匀的元素间距,这进一步增加了阵列设计的复杂性。这些因素表明,尽管球形阵列在理论上提供了最全面的空间感知能力,但其在实际部署中面临的复杂性、对高频混叠的敏感性以及对精确校准的需求,使其成为一个需要高度专业知识和先进技术才能充分利用的解决方案。

4.5. 特定几何布局对波束宽度、旁瓣电平与零点形成的影响

不同的几何布局对波束宽度、旁瓣电平(SLL)和零点形成产生显著影响:

波束宽度:

线性阵列:对于均匀加权的连续线性阵列,波束成形器响应是sinc函数,零点出现在规则的分数间距处 。波束宽度与频率成反比。

圆形阵列:与线性阵列类似,但可以转向ϴ ϵ [0, 2π],消除了前后问题 12。然而,在某些频率下,由于贝塞尔函数的零点,可能出现白噪声增益的严重退化,即“深零点问题” 。

平面阵列:作为线性阵列的扩展,其总响应是x和y方向上单个线性阵列响应的乘积,对于均匀间隔和均匀加权的平面阵列,阵列因子是两个sinc函数的乘积 。

球形阵列:能够实现更灵活的三维波束模式合成 。

旁瓣电平(SLL):

线性/平面阵列:可以通过振幅加权、遗传算法优化或稀疏收发孔径来抑制旁瓣,但这可能以降低指向性或锥度效率为代价。

圆形阵列:可以通过修改特定元素的权重和径向距离来降低旁瓣电平 。同心圆形阵列也可以用于降低旁瓣 。

球形阵列:非均匀仰角元素间距可以显著降低旁瓣电平,与均匀间隔阵列相比,可降低20dB以上。

空间欠采样:当来自不同位置的多个声源产生相同的阵列响应向量时,会发生空间欠采样,导致指向性模式中出现“栅瓣”(不期望的波束)。这些旁瓣会捕获非期望的噪声和混响,降低信噪比 。

旁瓣抑制技术:

麦克风放置:将麦克风密集分布在阵列中心附近可以获得较低的SLL,而将麦克风密集放置在阵列边缘则会降低主瓣宽度(MLW),但会增加SLL。多臂螺旋阵列被认为能在SLL和MLW之间提供最佳权衡 。

差分波束成形器:能够以相对较宽的波束峰值获得尖锐的零点,这对于需要抵消或衰减干扰源的应用非常有用 。

零点深度:量化了零点方向的信号衰减量 。零点深度受阵列类型、阶数和量化比特分辨率等因素影响 。增加量化比特数可以增加零点深度 。当零点接近声源方向时,零点深度会降低,表明干扰抑制能力下降 。

圆形阵列:零点约束方法已扩展到圆形阵列,以处理其对称特性 。

4.6. 阵列间距与孔径对性能的影响

麦克风之间的间距和阵列的整体孔径是影响波束成形性能的关键设计参数。

间距:

宽边阵列:麦克风间距越近,混叠频率越高,但低频衰减会降低。

端射阵列:麦克风间距决定了所需方向响应中的第一个零点。麦克风间距越近,该零点频率越高(因此带宽越宽) 。例如,在48 kHz采样率下,21毫米的间距可实现心形模式,其半波长为8.2 kHz,对应零点频率 。当麦克风间距小于21毫米时,后方零点会显著减弱,响应变为亚心形模式。

空间混叠:为了避免空间混叠,麦克风之间的距离应小于半波长 。空间欠采样会导致栅瓣,降低信噪比 。

双麦克风解决方案:麦克风之间的距离应在4到6.5厘米之间,并水平对齐。

孔径:

阵列孔径:指阵列的物理尺寸,是决定麦克风阵列复杂性的核心因素之一 。更大的孔径通常意味着更高的空间分辨率和更宽的应用范围 。

虚拟孔径:通过在吸音圆柱体表面安装麦克风阵列,可以增大圆形阵列的“虚拟孔径”,从而实现更好的波束成形性能 。

紧凑型阵列:差分波束成形器因其能够提供高方向性增益和紧凑麦克风阵列的频率不变波束模式而广泛应用于实际系统。

阵列间距和孔径对波束成形性能的影响,特别是对空间混叠和频率响应的影响,揭示了物理设计约束如何直接决定阵列的理论上限和实际应用范围。麦克风间距是阵列性能的关键决定因素。例如,在宽边阵列中,减小间距可以提高混叠频率,但会降低低频衰减 。在端射阵列中,间距决定了零点频率和带宽 。最重要的是,为了避免空间混叠,麦克风间距必须小于半波长 。如果间距过大,会导致“栅瓣”的出现,这些不期望的波束会捕获噪声和混响,从而降低信噪比。这表明,物理间距的限制直接影响了阵列在不同频率下保持其空间选择性(即避免混叠)的能力。阵列的整体孔径,即其物理尺寸,也至关重要。更大的孔径通常与更高的空间分辨率相关联 ,因为它可以提供更丰富的空间采样信息。然而,物理尺寸的增加也带来了实际的限制,例如在紧凑型设备中的集成挑战 。因此,设计人员必须在实现理想的声学性能(通过优化间距和孔径)与满足实际物理尺寸和成本约束之间进行权衡。这种权衡促使了例如差分波束成形器等技术的开发,这些技术旨在在紧凑的阵列中实现高方向性增益和频率不变的波束模式,从而在有限的物理空间内最大化性能。

5. 实际考虑与设计权衡

5.1. 计算复杂性与实时处理

波束成形,尤其是自适应波束成形,可能具有很高的计算强度。处理麦克风阵列数据所需的复杂信号处理算法,包括滤波、放大和数字化,以及波束成形算法本身,都需要强大的计算能力。

实时操作:对于需要实时处理的应用(如电话会议、语音助手),计算复杂性是一个主要挑战。比较和计算信号之间的时间延迟需要大量的操作,如果使用大量麦克风,这会非常耗时 。

硬件加速:现场可编程门阵列(FPGA)因其并行处理能力和低延迟而在需要高速实时处理的应用中表现出色 。它们能够同时执行多个操作,显著提高性能 。

算法优化:优化算法对于提高处理速度和准确性以及降低资源消耗至关重要 。现代方法还利用数据驱动方法,如基于深度学习的算法,通过理解这些挑战来增强语音质量。

计算复杂性和实时处理能力之间的权衡,是波束成形系统设计中的一个核心挑战,直接影响了其在实际应用中的可行性和响应速度。波束成形算法,尤其是那些涉及动态调整阵列模式的自适应方法,本质上是计算密集型的 。在需要实时响应的应用场景中(例如,智能扬声器、视频会议系统),这种计算需求变得尤为突出 。处理来自多个麦克风的大量音频数据,并实时执行复杂的滤波、放大和波束成形操作,需要强大的处理能力。如果处理速度不够快,系统将无法及时响应环境变化,导致用户体验下降或功能失效。这种对实时性的需求,迫使工程师在算法的复杂性和计算效率之间进行权衡。例如,虽然更复杂的算法可能提供更好的性能,但它们可能无法在现有硬件上以实时速度运行。因此,需要采用硬件加速(如FPGA) 和算法优化(如数据驱动方法和深度学习)来弥合这一差距,以确保系统在满足性能目标的同时,也能满足实时操作的严格时间限制。

5.2. 成本与物理限制

麦克风阵列的设计和部署还受到成本和物理限制的显著影响。

麦克风数量与成本:增加麦克风数量会显著增加系统的复杂性和成本 。例如,同心圆形麦克风阵列(CCMAs)需要更多麦克风,因此更复杂且昂贵 。为了将指向性指数提高3 dB,通常需要将麦克风数量和信号处理硬件翻倍,这带来了巨大的额外开销 。

物理尺寸与集成:阵列的物理尺寸可能与工业设计限制相冲突 。例如,更高阶的端射波束成形器虽然能提供更好的抑制,但需要更长的物理距离来构建 。紧凑性和便携性是许多应用中的重要考虑因素,如智能手机和可穿戴设备。

虚拟麦克风:为了克服物理限制和成本,研究人员提出了虚拟麦克风阵列等创新方法。例如,一种结合物理麦克风和虚拟麦克风的圆形阵列,可以在不增加物理麦克风数量的情况下解决深零点问题并抑制空间混叠效应,从而降低复杂性和成本。

组件一致性:为了实现最佳性能,阵列中所有麦克风在灵敏度、动态范围、频率响应和信噪比等方面应表现出高度一致性 。这增加了组件选择和制造的复杂性。

成本和物理限制是波束成形阵列设计中不可避免的约束,它们迫使设计者在理想性能和实际可行性之间进行精细的平衡,并推动了对创新解决方案的需求。麦克风阵列的性能通常随着麦克风数量的增加而提高,但这直接导致了成本和复杂性的指数级增长 。例如,为了获得看似微小的3 dB指向性指数提升,就需要将麦克风数量和相关硬件翻倍,这迅速推高了总成本。此外,阵列的物理尺寸也受到严格限制,尤其是在智能设备等紧凑型应用中 。较大的阵列可能在声学上表现更好,但它们可能无法集成到目标产品中,或者会影响产品的外观和可用性 。这种双重压力——性能需求与成本/尺寸限制——促使了对创新解决方案的探索。例如,虚拟麦克风阵列的概念 2旨在通过计算方法而非增加物理硬件来提升性能,从而在不牺牲紧凑性和成本效益的情况下实现更优异的声学性能。这表明,在工程设计中,物理和经济约束并非仅仅是障碍,它们是推动技术创新、寻找更智能、更高效解决方案的关键驱动力。

5.3. 校准与同步挑战

麦克风阵列的精确校准和同步对于实现最佳波束成形性能至关重要。

空间校准:确定每个传感器节点在公共世界坐标系中的精确位置是大型麦克风阵列的主要实际挑战之一 。麦克风的准确位置对于任何空间音频处理任务都是必不可少的 。

空间校准:确定每个传感器节点在公共世界坐标系中的精确位置是大型麦克风阵列的主要实际挑战之一 。麦克风的准确位置对于任何空间音频处理任务都是必不可少的 。

频率响应校准:麦克风频率响应的一致性是许多麦克风阵列实现的基本前提 。麦克风之间的响应差异是信号相关的,并随录音环境而变化,这使得在没有适当设备的情况下难以校准频率响应 。

时间同步:高时间分辨率需要精确的同步和高带宽数据采集 。声波到达不同位置的时间不同,因为它们以有限的速度传播 。精确的时间延迟计算对于确定声源位置至关重要 。

自校准与即插即用部署:为了应对这些挑战,研究人员正在开发自校准系统,例如通过光学跟踪 。这些系统能够快速、即插即用地部署大型麦克风阵列,大大降低了设置复杂性,并消除了对繁琐布线或手动校准的需求 。

校准和同步的复杂性是麦克风阵列从理论模型到实际部署的关键瓶颈,这促使了对自校准和鲁棒算法的持续研究,以弥合理想条件与现实世界挑战之间的差距。麦克风阵列的性能高度依赖于其元件的精确空间校准和时间同步 。在理论模型中,麦克风位置和信号到达时间通常被假定为完美已知。然而,在现实世界中,精确确定每个麦克风在三维空间中的位置是一个复杂的挑战 ,而麦克风之间信号的精确时间对齐也同样困难,因为声波以有限速度传播,且可能受到环境因素(如温度、湿度)的影响 。这些不确定性直接影响波束成形算法的准确性和效果,可能导致波束指向不准、零点失效或旁瓣增加。此外,麦克风自身的频率响应差异也会影响整体性能,且这种差异可能随环境和信号而变化。这些挑战不仅增加了阵列的部署难度和成本,也限制了其在非受控环境中的鲁棒性。因此,对自校准技术 和能够容忍一定程度误差的鲁棒算法的持续研究,对于推动麦克风阵列在更广泛应用中的普及至关重要。

结论与建议

麦克风阵列的波束成形技术是实现方向性音频拾取的基石,其性能在很大程度上取决于麦克风的数量和几何布局。

关于麦克风数量:

增加麦克风数量通常能提升阵列增益、指向性指数、空间分辨率和干扰抑制能力。更多的麦克风提供了更丰富的空间采样信息,从而能够实现更精确的波束模式控制和更强的噪声抑制。然而,这种性能提升并非线性无限,而是存在显著的边际效益递减。麦克风数量的增加会带来成本、计算复杂度和物理尺寸的指数级增长,这在实际产品设计中构成重要限制。因此,在选择麦克风数量时,必须在期望的声学性能与实际的预算、集成和处理能力之间找到最佳平衡点。

关于几何布局:

不同的几何布局(线性、圆形、平面、球形)对波束成形性能有独特的影响。

线性阵列:结构简单,但存在“前后问题”和频率依赖性波束宽度,限制了其在全方位感知应用中的效用。

圆形阵列:解决了“前后问题”,提供360度覆盖,但在特定频率下可能出现“深零点问题”,需要额外的复杂性(如障板或同心设计)来克服。

平面阵列:在二维空间上提供更好的分辨率和模式控制,但仍有“上下混淆”问题,且对元件故障敏感。

球形阵列:提供最全面的三维空间感知和最灵活的波束模式合成,但其复杂性、对高频空间混叠的敏感性以及对精确校准的需求也最高。

综合性结论:

麦克风阵列的设计是一个多目标优化问题,需要综合考虑应用场景、性能需求、成本预算、物理尺寸限制以及计算资源。没有一种“一刀切”的最佳配置。性能的提升往往伴随着复杂性和成本的增加。例如,从简单的线性阵列到复杂的球形阵列,其空间感知能力和性能上限显著提高,但设计、实现和校准的难度也呈指数级增长。

建议:

明确应用需求:在设计麦克风阵列之前,应首先明确应用场景对方向性拾取、空间分辨率、干扰抑制和实时性的具体要求。例如,对于语音助手,需要高信噪比和360度覆盖;对于特定方向的监听,可能更侧重于高指向性和零点形成。

平衡麦克风数量与成本/复杂性:认识到麦克风数量增加的边际效益递减。在满足核心性能指标的前提下,优先考虑通过优化算法和巧妙的几何布局来提升性能,而非盲目增加麦克风数量。

选择合适的几何布局:根据所需的空间覆盖范围和声场复杂度选择最合适的阵列几何结构。

对于二维或特定方向的拾取,线性或平面阵列可能足够;对于全方位或三维声场分析,圆形或球形阵列是更优选择。

投资于算法与校准:即使麦克风数量有限,先进的波束成形算法(如自适应波束成形、差分波束成形)也能显著提升性能。同时,确保精确的阵列校准和时间同步是实现理论性能的关键,应考虑采用自校准技术以简化部署和提高鲁棒性。

探索混合与虚拟阵列:对于同时追求高性能、紧凑性和成本效益的应用,可以探索结合物理麦克风和虚拟麦克风的混合阵列设计,以在不增加物理硬件负担的情况下扩展阵列孔径和提升性能。

通过对麦克风数量和几何布局的深入理解及其对波束成形性能的复杂影响,工程师和研究人员可以做出更明智的设计决策,从而开发出在各种声学环境中表现卓越的音频系统。

审核编辑 黄宇


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 麦克风
    +关注

    关注

    16

    文章

    687

    浏览量

    57293
  • 波束成形
    +关注

    关注

    1

    文章

    32

    浏览量

    14036
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    深入剖析ITF技术的CP0402高方向性LGA耦合器

    深入剖析ITF技术的CP0402高方向性LGA耦合器 在高频无线系统的设计中,耦合器的性能往往起着至关重要的作用。今天,我们就来详细了解一基于ITF(Integrated Thin
    的头像 发表于 11-26 15:11 360次阅读

    波束成形技术:从原理到实践,如何精准控制无线信号方向

    在频谱资源日益紧张的今天,波束成形技术通过将射频能量聚焦成定向波束,成为提升无线通信容量与效率的关键。本文深入解析波束成形原理,并介绍德思特巴特勒矩阵如何以高稳定性、便携易用的方案,助
    的头像 发表于 11-21 10:18 291次阅读
    <b class='flag-5'>波束成形</b><b class='flag-5'>技术</b>:从原理到实践,如何精准控制无线信号<b class='flag-5'>方向</b>?

    蓝牙耳机降噪核心技术解析:MEMS硅麦克风如何重塑听觉体验?

    深入剖析蓝牙耳机中MEMS硅麦克风技术优势,从微型化设计到射频抗干扰能力,解读索尼、Jabra等品牌如何通过多麦克风阵列实现精准降噪。结合瑞声科技70dB高信噪比芯片案例,揭示国产MEMS突破对行业的影响,文末揭秘华芯邦研发
    的头像 发表于 11-06 16:04 301次阅读
    蓝牙耳机降噪核心<b class='flag-5'>技术</b>解析:MEMS硅<b class='flag-5'>麦克风</b>如何重塑听觉体验?

    共达电声麦克风产品上架立创商城

    麦克风作为电子设备声音采集的关键部件,品质直接影响音频效果。近日, Gettop(共达)品牌 ECM 麦克风、MEMS 传感器麦克风,正式在立创商城(WWW.SZLCSC.COM)上架
    的头像 发表于 08-29 13:51 826次阅读

    MEMS麦克风设计注意事项和应用指南

    MEMS麦克风以其极致的小巧、卓越的性能、强大的稳定性和极具竞争力的成本,席卷了从消费电子到工业物联网的各个角落。无论是打造清晰通话的TWS耳机,赋予智能设备“听”的能力,还是在嘈杂环境中精准音,MEMS麦克风都扮演着至关重要
    的头像 发表于 08-29 13:48 7513次阅读
    MEMS<b class='flag-5'>麦克风</b>设计注意事项和应用指南

    请问NUC505 支持数字麦克风吗?

    NUC505 支持数字麦克风吗?
    发表于 08-28 07:03

    麦克风CE认证要求

    一、麦克风属于CE强制认证产品麦克风作为电子音频设备,出口欧盟必须完成CE认证,并加贴CE标志。CE认证是强制性的,用于确保产品符合欧盟关于安全、电磁兼容和环保的法规。二、适用的CE指令有
    的头像 发表于 07-28 17:25 573次阅读
    <b class='flag-5'>麦克风</b>CE认证要求

    A-59P 多功能语音处理模组:性能卓越,便捷易用​

    能清晰听到室内人员的声音,不会受到回音的困扰,实现高效、清晰的沟通。​ 3. 精准波束音,灵活定向收音​ A-59P 在双数字麦克风模式,支持双
    发表于 07-26 10:53

    芯知识|语音识别芯片麦克风配置指南:单麦与双麦方案的技术选择

    在智能语音产品的开发过程中,麦克风阵列的选型直接决定了用户体验的优劣。广州唯创电子提供的单麦克风与双麦克风解决方案,为不同场景的语音交互需求提供了灵活选择。本文将深入解析两种方案的性
    的头像 发表于 03-27 09:20 1436次阅读
    芯知识|语音识别芯片<b class='flag-5'>麦克风</b>配置指南:单麦与双麦方案的<b class='flag-5'>技术</b>选择

    制作一个优雅的麦克风放大器

    /building-a-decent-microphone-amplifier 我们的目标是建立高保真麦克风电路,能够忠实地取大自然的声音、现场音乐表演或房间里的对话。这项任务比表面看起来更棘手,因为就像视力一样,我们不知道自己听力的动态范围有多大。一个人
    的头像 发表于 02-06 17:28 1267次阅读
    制作一个优雅的<b class='flag-5'>麦克风</b>放大器

    开源项目!制作一个优雅的麦克风放大器

    “ 如何用麦克风捕捉远距离的声音信号,同时保持设计的简洁 。 ” 我们的目标是建立高保真麦克风电路,能够忠实地取大自然的声音、现场音乐表演或房间里的对话。这项任务比表面看起来更棘手,因为就像视力
    发表于 01-13 10:56

    AN-1140: 麦克风阵列波束成形

    电子发烧友网站提供《AN-1140: 麦克风阵列波束成形.pdf》资料免费下载
    发表于 01-05 09:32 0次下载
    AN-1140: <b class='flag-5'>麦克风</b>阵列<b class='flag-5'>波束成形</b>

    四、麦克风阵列主要技术参数之精准解读

    麦克风阵列宛如一个精密的声学仪器,其性能由多个关键技术参数决定,下面就对这些主要技术参数进行精准解读,揭开麦克风阵列高效运作的神秘面纱。(一)灵敏度与动态范围:声音信号的“感知标尺”在
    的头像 发表于 12-31 00:00 1816次阅读
    四、<b class='flag-5'>麦克风</b>阵列主要<b class='flag-5'>技术</b>参数之精准解读

    三、麦克风阵列类型及分类之细致梳理

    麦克风阵列,作为声学领域的关键技术,拥有多种类型,每种类型都以独特的排列方式和卓越的性能,在不同的应用场景中发挥着重要作用,下面将为您细致梳理其类型与分类,展现麦克风阵列的奇妙世界。
    的头像 发表于 12-29 00:00 1560次阅读
    三、<b class='flag-5'>麦克风</b>阵列类型及分类之细致梳理

    一、麦克风阵列之基础概念探幽

    麦克风阵列技术,犹如一位隐匿于幕后的神奇工匠,悄无声息却又深刻地渗透进了我们生活的每一处缝隙。无论是日常沟通所用的通信系统,还是专业音频录制领域,亦或是精准的声源定位任务,麦克风阵列都似一颗璀璨
    的头像 发表于 12-21 14:43 1435次阅读
    一、<b class='flag-5'>麦克风</b>阵列之基础概念探幽