0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于语音识别技术用于录音应用

星星科技指导员 来源:嵌入式计算设计 作者:OpenSystems Media 2022-06-09 09:50 次阅读

在一个痴迷于互联网隐私的世界里,令人惊讶的是,我们很少谈论像 Amazon Echo 这样的始终在听的设备。毕竟,一家想要了解你生活中的私密细节以便向你推销更多东西的公司会在你的厨房里永久打开一个麦克风。

如果您拥有 Echo 并且不知道此功能,请打开您的 Alexa 应用程序,选择“设置”菜单,然后选择“历史记录”。听一听。所有这些录音都是为 Echo 准备的吗?

我想隐私是现代消费主义中便利的代价。事情将变得更加方便。

杂音、鸡尾酒会、便利和圣诞节

XMOS 是一家从布里斯托大学分离出来的无晶圆半导体公司,专注于语音和音乐处理 IC。在这些 IC 中,基于 32 位 xCORE MCU 架构的设备在语音识别市场上取得了显着的成功,提供了 16 个可编程内核(分为 8 个内核的两个区块,每个内核共享一个地址空间),DSP 功能集成在相同的芯片

XMOS 将 xCORE 架构加入到用于亚马逊 Alexa 语音服务 (AVS) 的 VocalFusion 4-Mic 开发套件中。该套件围绕英飞凌的 VocalFusion XVF3000 集成远场语音处理器和四个高信噪比 (SNR) MEMS 麦克风而设计。XMOS 声称该套件是市场上第一个远场线性麦克风阵列解决方案。

在范围之外,在解决“鸡尾酒会”问题或平台需要将单个扬声器的声音与嘈杂环境隔离的情况时,远场语音处理变得非常有趣。在 5 m 或更远的距离处,VocalFusion 4-Mic 开发套件使用声学回声消除 (AEC)、自适应波束形成、动态去混响和自动增益控制 (AGC) 的组合来隔离和提取声音信号主讲者。除此之外,事情开始变得令人毛骨悚然。

今年早些时候,XMOS 收购了马萨诸塞州波士顿的 Setem Technologies, Inc.,该公司开发了用于盲源信号分离的大规模傅立叶变换。这些盲源分离算法在数学上从一组信号中分解源信号的元素,然后单独或作为组重构它们(图 1)。在语音识别中,这可以应用于单个说话者,甚至是对话。

poYBAGKhUguADw9uAACPBFyn28M881.png

图 1.现在隶属于 XMOS 的 Setem Technologies 开发了盲源分离算法,可用于隔离嘈杂环境中的一个或多个扬声器。

现在,在理论上(或许在实践中),盲源分离可用于隔离房间内多个说话者的语音频率,从而为每个说话者建立生物识别身份。正如你可以想象的那样,这种技术的应用可能会很广泛,不仅仅是亚马逊想知道你的每个家庭成员想要什么圣诞节。例如,监视立即浮现在脑海中。

这让我们回到了 VocalFusion 4-Mic Dev Kit 的线性麦克风阵列。虽然 Amazon Echo 和 Google Home 等许多平台使用圆形阵列的全向麦克风来提供 360 度的房间覆盖,但线性阵列设计用于 180 度的弧度。这很有趣,因为语音识别领域的领导者设想了一个未来,今天基于塔的虚拟助手将退居电视、冰箱、沙发、墙壁等日常物品中——你可以说出来。

这个未来被设计为超级方便,通过音节提供服务。但小心点。你可能不知道谁或什么在听。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18271

    浏览量

    222119
  • dsp
    dsp
    +关注

    关注

    544

    文章

    7682

    浏览量

    344346
  • 扬声器
    +关注

    关注

    29

    文章

    1214

    浏览量

    60180
收藏 人收藏

    评论

    相关推荐

    离线语音识别及控制是怎样的技术

    引言:  随着人工智能的飞速发展,离线语音识别技术成为了一项备受瞩目的创新。离线语音识别技术能够
    发表于 11-24 17:41

    离线语音识别和控制的工作原理及应用

    神经网络(RNN)和卷积神经网络(CNN)是最常用的两种技术。RNN 适用于处理时间序列数据,如语音信号,而 CNN 则适用于处理具有网格结构的数据,如图像。通过深度学习
    发表于 11-07 18:01

    语音芯片怎么录音 以及如何选择合适的录音芯片

    语音芯片怎么录音 以及如何选择合适的录音芯片 语音芯片,其中就有一个品类,称之为录音芯片 其实他们是合并在一个芯片里面的,也就是说,
    的头像 发表于 10-30 15:02 444次阅读
    <b class='flag-5'>语音</b>芯片怎么<b class='flag-5'>录音</b> 以及如何选择合适的<b class='flag-5'>录音</b>芯片

    语音识别技术在医疗健康领域的应用与挑战

    语音病历:通过语音识别技术,医生可以快速、准确地获取患者的病历信息,提高诊断效率和准确性。2.智能问诊:语音
    的头像 发表于 10-25 13:46 344次阅读

    语音识别技术在医疗领域的应用与前景

    可以用于自动转换医疗病历,将医生或患者的语音信息转换成文字信息,以便于医疗信息的存储、检索和分析。这种技术可以帮助医生更快速地获取患者的信息,提高诊断效率。 2.智能问诊:语音
    的头像 发表于 10-19 16:30 1020次阅读

    语音识别技术:现状、挑战与未来发展

    一、引言 语音识别技术是一种将人类语音转化为计算机可读文本的技术,它在许多领域都有广泛的应用,如智能助手、智能家居、医疗诊断等。本文将探讨
    的头像 发表于 10-12 16:57 1204次阅读

    深度学习在语音识别中的应用及挑战

    一、引言 随着深度学习技术的快速发展,其在语音识别领域的应用也日益广泛。深度学习技术可以有效地提高语音
    的头像 发表于 10-10 18:14 493次阅读

    语音识别技术的应用及优化

    :智能助手能够理解用户的声音指令,并执行相应的操作,如播放音乐、发送信息、查询天气等。语音识别技术是智能助手的必备技术。 2.智能家居:语音
    的头像 发表于 10-10 17:26 999次阅读

    语音识别技术的挑战与机遇

    一、引言 语音识别技术是一种将人类语言转化为计算机可理解数据的技术。随着科技的不断发展,语音识别
    的头像 发表于 10-10 17:10 580次阅读

    语音识别技术的进步与挑战

    一、引言 在当今数字化时代,语音识别技术已经成为人机交互的重要方式之一。本文将探讨语音识别技术
    的头像 发表于 09-22 18:29 451次阅读

    语音识别技术的挑战与机遇

    一、引言 随着科技的快速发展,语音识别技术成为了人机交互的重要方式。然而,尽管语音识别技术在某些
    的头像 发表于 09-20 16:17 321次阅读

    语音识别技术:原理、应用与未来

    一、引言 语音识别技术是一种让计算机理解和解析人类语音的方法。这种技术已经存在多年,但随着硬件性能的提升和深度学习算法的发展,
    的头像 发表于 09-19 18:30 1182次阅读

    语音识别唤醒词的技术与应用

    词是语音识别技术中的重要组成部分,它的作用是检测语音输入并判断是否包含唤醒词,如果包含则执行相应的指令或响应。 语音
    的头像 发表于 06-24 04:02 888次阅读

    情感语音识别技术及其应用

    情感语音识别是一种利用人工智能技术识别语音中的情感信息,并将其转换为情感标签的技术。该
    的头像 发表于 06-24 03:24 750次阅读

    语音识别技术的概念及应用前景

    解决的问题,就是使得设备可以用听觉感知周围的世界,用声音和人做最自然的交互,让操控和生活更为便捷。 智能语音的基础在于通过神经网络技术,提升语音识别
    发表于 05-27 09:41