0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一文带你全面熟悉智能语音之麦克风阵列技术的原理

电子设计 来源:互联网 作者:佚名 2017-12-13 14:06 次阅读

麦克风阵列(Microphone Array),从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。

早在20世纪70、80年代,麦克风阵列已经被应用于语音信号处理的研究中,进入90年代以来,基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点。而到了“声控时代”,这项技术的重要性显得尤为突出。

麦克风阵列能干什么?

任何一项技术的发生发展都伴随着问题的提出及解决,麦克风阵列也是如此。那么它主要应用在哪些场景下呢?又有着怎样的功能!

◆【噪声环境怎么破?】—— 语音增强(Speech Enhancement)

语音增强是指当语音信号被各种各样的噪声(包括语音)干扰甚至淹没后,从含噪声的语音信号中提取出纯净语音的过程。所以DingDong在嘈杂环境下,也能准确识别语音指令。

通过麦克风阵列波束形成进行语音增强示意图

从20世纪60年代开始,Boll等研究者先后提出了针对使用一个麦克风的语音增强技术,称为单通道语音增强。因为它使用的麦克风个数最少,并且充分考虑到了语音谱和噪声谱的特性,使得这些方法在某些场景下也具有较好的噪声抑制效果,并因其方法简单、易于实现的特点广泛应用于现有语音通信系统与消费电子系统中。

但是,在复杂的声学环境下,噪声总是来自于四面八方,且其与语音信号在时间和频谱上常常是相互交叠的,再加上回波和混响的影响,利用单麦克风捕捉相对纯净的语音是非常困难的。而麦克风阵列融合了语音信号的空时信息,可以同时提取声源并抑制噪声。

目前科大讯飞已经实现了基于线性阵列、平面阵列以及空间立体阵列的波束形成和降噪技术,效果均达到业界一流水平。

2013年科大讯飞车载降噪产品和国际竞争对手效果对比

◆【说话人老是变幻位置怎么破?】——声源定位(Source Localization)

现实中,声源的位置是不断变化的,这对于麦克风收音来说,是个障碍。麦克风阵列则可以进行声源定位,声源定位技术是指使用麦克风阵列来计算目标说话人的角度和距离,从而实现对目标说话人的跟踪以及后续的语音定向拾取,是人机交互、音视频会议等领域非常重要的前处理技术。所以麦克风阵列技术不限制说话人的运动,不需要移动位置以改变其接收方向,具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点,因而成为智能语音处理系统中捕捉说话人语音的重要手段。

混响产生原因示意图

◆【室内回声太大怎么破?】——去混响(Dereverberation)

一般我们听音乐时,希望有混响的效果,这是听觉上的一种享受。合适的混响会使得声音圆润动听、富有感染力。混响(Reverberation)现象指的是声波在室内传播时,要被墙壁、天花板、地板等障碍物形成反射声,并和直达声形成叠加,这种现象称为混响。

但是,混响现象对于识别就没有什么好处了。由于混响则会使得不同步的语音相互叠加,带来了音素的交叠掩蔽效应(Phoneme Overlap Effect),从而严重影响语音识别效果。

影响语音识别的部分一般是晚期混响部分,所以去混响的主要工作重点是放在如何去除晚期混响上面,多年来,去混响技术抑制是业界研究的热点和难点。利用麦克风阵列去混响的主要方法有以下几种:

1、基于盲语音增强的方法(Blind signal enhancement approach),即将混响信号作为普通的加性噪声信号,在这个上面应用语音增强算法。

2、基于波束形成的方法(Beamforming based approach),通过将多麦克风对收集的信号进行加权相加,在目标信号的方向形成一个拾音波束,同时衰减来自其他方向的反射声。

3、基于逆滤波的方法(An inverse filtering approach),通过麦克风阵列估计房间的房间冲击响应(Room Impulse Response, RIR),设计重构滤波器来补偿来消除混响。

现在科大讯飞实现的基于麦克风阵列的去混响技术能很好的对房间的混响情况进行自适应的估计,从而很好的进行纯净信号的还原,显著的提升了语音听感和识别效果,在测试对比中,多种混响时间下识别效果接近手机近讲水平。

混响语音信号频谱

经过去混响后的语音信号频谱

◆【说话人太多怎么破?】——声源信号提取(分离)

家里人说话太多,DingDong听谁的呢。这个时候就需要DingDong聪明的辨别出哪个声音才是指令。而麦克风阵列可以实现声源信号提取,声源信号的提取就是从多个声音信号中提取出目标信号,声源信号分离技术则是将需要将多个混合声音全部提取出来。

通过麦克风阵列波束形成做语音提取和分离

利用麦克风阵列做信号的提取和分离主要有以下几种方式:

1、基于波束形成的方法,即通过向不同方向的声源分别形成拾音波束,并且抑制其他方向的声音,来进行语音提取或分离:

2、基于传统的盲源信号分离(Blind Source Separation)的方法进行,主要包括主成分分析(Principal Component Analysis,PCA)和基于独立成分分析(Independent Component Analysis,ICA)的方法。

进击的麦克风阵列

麦克风阵列技术虽然已经可以达到相当的技术水平,但是总体上还是存在一些问题的,比如当麦克风和信号源距离太远时(比如10m、20m距离),录制信号的信噪比会很低,算法处理难度很大;对于便携设备来说,受设备尺寸以及功耗的限制,麦克风的个数不能太多,阵列尺寸也不能太大。而分布式麦克风阵列技术则是解决当前问题的一个可能途径。所谓分布式阵列就是将子阵元或子阵列布局到更大的范围内,相互之间通过有线或者无线的方式进行数据的交换和共享,并在此基础上进行广义上的声源定位、波束形成等技术实现信号处理。

相对于目前集中式的麦克风阵列,分布式阵列的优势也是非常明显的。首先分布式麦克风阵列(尤其无线传输)的尺寸的限制就不存在了;另外,阵列的节点可以覆盖很大的面积——总会有一个阵列的节点距离声源很近,录音信噪比大幅度提升,算法处理难度也会降低,总体的信号处理的效果也会有非常显著的提升,因此分布式阵列有可能是未来智能家居和会议系统中的主流方案。

在万物互联的今天,麦克风阵列技术已经深刻的走进了我们的日常生活。在智能车载、智能家居、机器人、可穿戴设备等应用热潮正兴起的时代,语音交互由于其便捷性,成了人机交互入口的第一选择,麦克风阵列自然也成为其中非常重要的前端技术。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 麦克风阵列
    +关注

    关注

    4

    文章

    19

    浏览量

    13955
收藏 人收藏

    评论

    相关推荐

    ICS‐41350 数字麦克风

    、机器人、智能音箱等语音识别场合。深圳市木瓜电子科技有限公司提供成熟的多路麦克风阵列方案和麦克风阵列
    发表于 02-11 12:01

    基于Amazon AVS 智能音箱麦克风阵列立体声开发方案

    适用于Amazon AVS的VocalFusion™立体声开发套件具有紧凑的四麦克风线性阵列,使开发人员和OEM能够为消费电子产品和物联网产品添加远场语音捕获。线性设计经过优化,可集成到智能
    发表于 07-12 10:25

    为什么需要麦克风阵列

    了某语音识别引擎在单麦克风和四麦克风环形阵列的识别率对比。另外也要提醒,语音识别率并非只有个W
    发表于 07-28 14:25

    科普麦克风阵列原理

    1 麦克风阵列麦克风阵列,是组位于空间不同位置的全向麦克风
    发表于 07-28 14:28

    麦克风阵列介绍

    模型和远场模型的划分没有绝对的标准,般认为声源离麦克风阵列中心参考点的距离远大于信号波长时为远场;反之,则为近场。设均匀线性阵列相邻阵元之间的距离(又称
    发表于 08-08 18:43

    麦克风阵列 仅有两个麦克风,会不会不够用?

    优势。优点3由于双麦克风阵列是基于DSP进行降噪处理的,所以它还有个非常重要的优势,就是超低的功耗。讯飞双麦模组运行功耗
    发表于 08-08 18:44

    全球量产麦克风阵列的阵型技术盘点

    知名产品的麦克风阵型也多种多样,即便相同的阵型,其阵元间距也会不同,为何会产生这个现象?1、麦克风阵列技术首先从麦克风
    发表于 08-08 18:55

    如何正确选择麦克风阵列阵型和技术

    远场语音交互产品确实比较复杂,仅仅选用麦克风阵列就有如此多的问题。那么应当如何选择合适的麦克风阵列技术
    发表于 08-08 18:56

    汽车 麦克风阵列技术进行详述

    的就是车辆运行过程中噪音比较大,当然其噪音还不算很复杂,加入CNN神经网络、深度学习等技术会有很好的除噪效果。 下面就麦克风阵列技术进行详述。定义
    发表于 08-10 14:30

    麦克风技术规格解析

    作者 :Jerad Lewls简介在 ADI 公司的众多产品中,MEMS 麦克风 IC 的独特之处在于其输入为声压波。因此,这些器件的数据手册中包括的某些技术规格可能不为大家所熟悉,或者虽然
    发表于 11-01 11:26

    MEMS与ECM:比较麦克风技术

    产生的不受欢迎的噪声水平。半导体构造技术与音频前置放大器的加入进步使得制造具有紧密匹配,温度稳定性能特性的MEMS麦克风成为可能,使其非常适合于多麦克风
    发表于 02-23 14:05

    如何利用MEMS麦克风阵列定位并识别音频或语音信源?

    如何利用MEMS麦克风阵列定位并识别音频或语音信源?
    发表于 06-01 07:02

    如何去实现种基于麦克风阵列的声源定位装置系统设计

    基于麦克风阵列的声源定位装置的组成及功能有哪些?如何去实现种基于麦克风阵列的声源定位装置系统设计?
    发表于 11-11 06:49

    ESP32-Korvo AI语音麦克风阵列开发板有何性能呢

    ESP32-Korvo是什么?ESP32-Korvo AI语音麦克风阵列开发板有何性能呢?
    发表于 12-23 06:24

    麦克风阵列语音增强技术及其应用

    本文简要叙述了应用麦克风阵列进行语音增强的原理及方法。且由于麦克风阵列在实际语音处理时具有良好的
    发表于 09-08 10:20 48次下载