0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音UI的基本原则

星星科技指导员 来源:嵌入式计算设计 作者:Paul Beckmann 2022-10-25 16:17 次阅读

Amazon Echo和Google Home中的语音用户界面(语音UI)功能吸引了消费者的注意。语音识别系统的效率很大程度上取决于麦克风阵列和算法集合,这些算法允许阵列聚焦于用户的语音并拒绝不需要的噪声。下面解释这些算法的基本功能。

触发/唤醒词

语音 UI 系统使用分配的触发词(如“Alexa”或“确定谷歌”)来激活语音 UI 设备。设备必须使用自己的算法立即进行识别,因为使用互联网资源会产生太多的延迟。

触发词必须产生一个独特的波形,该波形可以使算法与正常语音区分开来,否则成功识别的百分比可能低得令人无法接受。通常,使用三到五个音节的触发词是最好的。

小触发词算法占用较少的内存和处理,但犯更多的错误,而大的算法需要更多的资源,但犯的错误更少。模型也是可调的 - 它们可以更严格(更少的误报,但更难触发)或更宽松(更多的误报,但更容易触发)。大多数产品设计师选择更严格的调整,因为客户对错误触发没有同情心。

图 1 比较了不同调谐点的三触发模型的性能。在测试条件下,每小时实现少于两个错误触发器是一个合理的目标。小模型只能通过图形最左侧的两个最严格的调谐来实现这一点。中型和大型型号在更宽的工作范围内实现了这一目标。

pYYBAGNXm7eAXMiVAAFTjAUgeAU218.png

图 1. 每小时使用小型、中型和大型算法模型测试误报,左侧调整更严格,右侧调整更宽松。

到达目的地(到达方向)

一旦触发词被识别出来,下一步就是确定用户语音的到达方向(DOA)。一旦确定了方向,DOA算法就会告诉波束成形算法它应该聚焦在哪个方向。

DOA算法的核心功能是检查来自阵列中不同麦克风的信号的相位关系,并使用此信息来确定哪个麦克风首先接收声音。但是,由于来自墙壁,地板,天花板和房间内其他物体的反射,用户的声音也将从其他方向传来。为此,DOA算法包括优先逻辑,它将更响亮的初始到达与更安静的反射分开。

DOA 算法的操作通过自动调整环境噪声水平得到增强。该算法测量房间内的平均噪声水平,并且仅当输入信号至少比环境噪声水平高出一定数量的分贝时,才会重新计算用户嘴巴的位置。

回声消除器

为了更好地关注用户的声音,语音 UI 设备必须从其麦克风拾取的声音中减去自己的扬声器产生的声音。这似乎很简单,就像将节目材料的相位反转版本混合到来自麦克风的信号中一样简单。然而,该过程不足以处理扬声器对波形的改变、数字信号处理(DSP)均衡、麦克风和声学反射。

AEC算法中的第一步是将麦克风的输出与原始(前DSP)输入信号进行比较,并计算校正曲线,以从语音命令的波形中减去扬声器的直接声音。

第二步是减去声学回声。该算法必须在一定的误差范围内“寻找”与节目材料匹配的声音(以补偿由声学引起的波形变化),以及对应于预期混响时间的已定义时间窗口内的声音。由于每个麦克风接收的回声集略有不同,并且来自扬声器的直接声音也不同,因此要实现最佳性能,需要对每个麦克风进行单独的 AEC 处理。

AEC 查找反射的时间段称为“回波尾部长度”。回声尾部长度越长,可以消除的反射越多,算法的性能就越好。然而,较长的尾巴需要更多的内存和更多的处理。图2显示了回声消除器在逐渐增加混响的房间中的表现。对更长的回声尾部的需求是显而易见的。

poYBAGNXm8KACjm8AAFJhHlrwKk343.png

图 2. 回声消除器在四个房间中表现,混响时间增加。较大的房间受益于使用长回声尾部的算法。

波束成形

波束成形允许麦克风阵列聚焦于来自特定方向的声音。它提高了信噪比(SNR),因为它有助于隔离用户的声音,同时抑制来自其他方向的声音。

例如,如果用户位于麦克风阵列的一侧,而空调位于另一侧,则来自空调的声音首先到达用户对面的麦克风,然后在几分之一秒后到达离用户最近的麦克风。波束成形算法使用这些时差来消除空调声音,同时保留用户的声音。

具有两个麦克风的阵列取消声音的能力有限,但具有三个或更多麦克风的阵列可以消除来自更多方向的声音。麦克风越少,性能就越会随着视角(用户的声音与语音 UI 产品前轴之间的角度)的变化而变化。

虽然麦克风阵列系统使用定向拾音模式来滤除噪声,但某些噪声可以通过识别将噪声与所需信号分离的特性,然后消除噪声的算法进行衰减。降噪算法可以帮助触发单词识别,并在所有其他算法完成其工作后提高语音UI性能。

语音命令是瞬时事件。可以检测到始终存在或重复的任何声音,并将其从来自麦克风阵列的信号中删除。示例包括汽车中的道路噪声,以及家庭中的洗碗机和HVAC系统噪声。高于或低于人声频谱的声音也可以从信号中滤除。

手机中使用的常见降噪算法倾向于突出显示对人类理解最关键的频谱,而不是对电子系统隔离和理解语音命令最关键的频谱。大多数此类算法实际上会降低语音 UI 性能。简单地说,人类听的东西与语音UI系统不同。

图3显示了在有和没有降噪的情况下触发字检测的功效。降噪算法将整体语音识别提高了2 dB -考虑到用户的声音通常仅比周围噪声大几dB,这是一个很大的差异。

pYYBAGNXm86AEU3SAAFj-NKmSMQ786.png

图 3. 降噪算法对触发字检测的影响。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • dsp
    dsp
    +关注

    关注

    544

    文章

    7687

    浏览量

    344465
  • 触发器
    +关注

    关注

    14

    文章

    1694

    浏览量

    60429
收藏 人收藏

    评论

    相关推荐

    电路仿真所遵循的基本原则是什么

    电路仿真是一种基于电子计算机进行模拟的技术,用于分析和预测电路的行为和性能。它可以帮助设计师优化电路的功能、减少成本和提高可靠性。为了保证仿真结果的准确性和可靠性,电路仿真需要遵循一些基本原则。本文
    的头像 发表于 04-21 10:20 469次阅读

    鸿蒙原生应用元服务-访问控制(权限)开发概念和使用基本原则

    )。TokenID是每个应用的身份标识,ATM通过应用的TokenID来管理应用的权限。 权限使用的基本原则 在进行权限的申请和使用时,需要满足以下基本原则: 应用申请的权限,都必须有明确、合理
    发表于 04-18 15:39

    选择IGBT的基本原则是什么

    选择IGBT的基本原则涉及以下几个方面: 电压等级:选择合适的IGBT要考虑其能够承受的电压等级。通常情况下,IGBT的额定电压等级应大于实际电路中的最高电压。 电流容量:根据电路的负载电流,选择
    的头像 发表于 03-12 15:29 394次阅读

    pcb设计的基本原则分享 PCB设计16个原则一定要知道

    PCB设计的这16个原则你一定要知道
    的头像 发表于 03-12 11:19 750次阅读

    plc梯形图编程的基本原则

    PLC(可编程逻辑控制器)是现代自动化控制领域中广泛应用的一种控制装置。PLC的梯形图编程是PLC控制中最常用的编程方式之一。本文将详细介绍PLC梯形图编程的基本原则,包括其定义、基本概念、编程要点
    的头像 发表于 01-22 10:51 629次阅读

    群脉冲预防方案的基本原则

    群脉冲预防方案的基本原则?|深圳比创达电子
    的头像 发表于 01-15 14:03 246次阅读
    群脉冲预防方案的<b class='flag-5'>基本原则</b>?

    群脉冲预防方案的基本原则?|深圳比创达电子a

    永久性的硬件损坏,甚至完整的电力网络瘫痪。 二、群脉冲预防方案的基本原则1、预测与评估:通过监测可能的群脉冲来源和模拟群脉冲对不同系统的影响,评估潜在的风险和脆弱性;2、屏蔽与保护:采取物理和技术措施
    发表于 01-15 10:42

    控制静电放电的三个基本原则

    控制静电放电的三个基本原则  控制静电放电是一项关键的工程问题,尤其是在现代工业中。静电放电不仅可能损坏电子设备和电子元件,还可能引发火灾和爆炸等安全问题。为了有效地控制静电放电,我们需要遵循三个
    的头像 发表于 01-03 11:00 701次阅读

    pcb布局的基本原则

    pcb布局的基本原则  PCB布局(Printed Circuit Board Layout)是电路板的设计过程,它的目的是将电子元器件和连接线路按照要求布置在电路板上,并确保电路板的正常运行
    的头像 发表于 12-07 17:27 825次阅读

    汽车电源设计的六个基本原则

    电子发烧友网站提供《汽车电源设计的六个基本原则.doc》资料免费下载
    发表于 11-13 14:44 0次下载
    汽车电源设计的六个<b class='flag-5'>基本原则</b>

    手机故障维修基本原则及方法

    电子发烧友网站提供《手机故障维修基本原则及方法.ppt》资料免费下载
    发表于 10-24 14:22 1次下载
    手机故障维修<b class='flag-5'>基本原则</b>及方法

    逆变电源调速或节能的基本原则解释,启动的时间长短有关

    选择逆变电源调速或节能时,应遵循以上10条原则,作为决定方案的前提。选择逆变电源调速或节能的基本原则1)电力逆变器省电是有一定条件的。在不影响使用的情况下,适当改变工作参数后,可以节省不合理运行参数
    的头像 发表于 10-20 11:22 605次阅读
    逆变电源调速或节能的<b class='flag-5'>基本原则</b>解释,启动的时间长短有关

    原理图设计基本原则

    原理图设计是产品设计的理论基础,设计一份规范的原理图对设计PCB、跟机、做客户资料具有指导性意义,是做好一款产品的基础。原理图设计基本要求: 规范、清晰、准确、易读。
    的头像 发表于 09-21 14:08 1143次阅读
    原理图设计<b class='flag-5'>基本原则</b>

    PLC控制系统设计的基本原则

    一、PLC控制系统设计的基本原则 1、充分发挥PLC的功能,最大限度地满足被控制对象的控制要求。 2、在满足控制要求的前提下,力求使控制系统简单、经济、实用和维修方便。 3、保证控制系统安全、可靠
    的头像 发表于 09-15 14:55 988次阅读

    复杂电路简化的基本原则和经典例题

    初中物理电学中的复杂电路可以通过如下原则进行简化。
    发表于 06-13 14:33 1089次阅读
    复杂电路简化的<b class='flag-5'>基本原则</b>和经典例题