0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于语音识别技术用于录音应用

星星科技指导员 来源:嵌入式计算设计 作者:OpenSystems Media 2022-06-09 09:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在一个痴迷于互联网隐私的世界里,令人惊讶的是,我们很少谈论像 Amazon Echo 这样的始终在听的设备。毕竟,一家想要了解你生活中的私密细节以便向你推销更多东西的公司会在你的厨房里永久打开一个麦克风。

如果您拥有 Echo 并且不知道此功能,请打开您的 Alexa 应用程序,选择“设置”菜单,然后选择“历史记录”。听一听。所有这些录音都是为 Echo 准备的吗?

我想隐私是现代消费主义中便利的代价。事情将变得更加方便。

杂音、鸡尾酒会、便利和圣诞节

XMOS 是一家从布里斯托大学分离出来的无晶圆半导体公司,专注于语音和音乐处理 IC。在这些 IC 中,基于 32 位 xCORE MCU 架构的设备在语音识别市场上取得了显着的成功,提供了 16 个可编程内核(分为 8 个内核的两个区块,每个内核共享一个地址空间),DSP 功能集成在相同的芯片。

XMOS 将 xCORE 架构加入到用于亚马逊 Alexa 语音服务 (AVS) 的 VocalFusion 4-Mic 开发套件中。该套件围绕英飞凌的 VocalFusion XVF3000 集成远场语音处理器和四个高信噪比 (SNR) MEMS 麦克风而设计。XMOS 声称该套件是市场上第一个远场线性麦克风阵列解决方案。

在范围之外,在解决“鸡尾酒会”问题或平台需要将单个扬声器的声音与嘈杂环境隔离的情况时,远场语音处理变得非常有趣。在 5 m 或更远的距离处,VocalFusion 4-Mic 开发套件使用声学回声消除 (AEC)、自适应波束形成、动态去混响和自动增益控制 (AGC) 的组合来隔离和提取声音信号主讲者。除此之外,事情开始变得令人毛骨悚然。

今年早些时候,XMOS 收购了马萨诸塞州波士顿的 Setem Technologies, Inc.,该公司开发了用于盲源信号分离的大规模傅立叶变换。这些盲源分离算法在数学上从一组信号中分解源信号的元素,然后单独或作为组重构它们(图 1)。在语音识别中,这可以应用于单个说话者,甚至是对话。

poYBAGKhUguADw9uAACPBFyn28M881.png

图 1.现在隶属于 XMOS 的 Setem Technologies 开发了盲源分离算法,可用于隔离嘈杂环境中的一个或多个扬声器。

现在,在理论上(或许在实践中),盲源分离可用于隔离房间内多个说话者的语音频率,从而为每个说话者建立生物识别身份。正如你可以想象的那样,这种技术的应用可能会很广泛,不仅仅是亚马逊想知道你的每个家庭成员想要什么圣诞节。例如,监视立即浮现在脑海中。

这让我们回到了 VocalFusion 4-Mic Dev Kit 的线性麦克风阵列。虽然 Amazon Echo 和 Google Home 等许多平台使用圆形阵列的全向麦克风来提供 360 度的房间覆盖,但线性阵列设计用于 180 度的弧度。这很有趣,因为语音识别领域的领导者设想了一个未来,今天基于塔的虚拟助手将退居电视、冰箱、沙发、墙壁等日常物品中——你可以说出来。

这个未来被设计为超级方便,通过音节提供服务。但小心点。你可能不知道谁或什么在听。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20378

    浏览量

    255616
  • dsp
    dsp
    +关注

    关注

    561

    文章

    8289

    浏览量

    369044
  • 扬声器
    +关注

    关注

    29

    文章

    1356

    浏览量

    66345
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    离线语音识别芯片与在线语音识别芯片,到底该怎么选?—广州唯创电子WTK6900HA/HC语音识别芯片深度解析

    语音识别技术已经渗透到我们生活的方方面面:一句“打开空调”,客厅便开始降温;一声“播放音乐”,厨房音箱便悠扬响起。然而,在开发智能语音产品的关键节点上,很多工程师和产品经理都会面临一个
    的头像 发表于 05-13 09:24 172次阅读
    离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片与在线<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片,到底该怎么选?—广州唯创电子WTK6900HA/HC<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片深度解析

    MP3录音上传芯片是什么?如何实现实时语音采集与UART数据输出?

    语音交互、智能硬件和物联网设备快速发展的背景下,MP3录音芯片正在成为语音采集方案的核心组件。那么问题来了:有没有一种方案,可以实现“录音+MP3编码+实时上传”一步到位?答案就是
    的头像 发表于 04-30 09:32 640次阅读
    MP3<b class='flag-5'>录音</b>上传芯片是什么?如何实现实时<b class='flag-5'>语音</b>采集与UART数据输出?

    语音识别ic芯片分类工作原理,语音识别芯片分类

    设备执行相应动作。例如,在智能娃娃产品中,当用户说出“眨眨眼”,芯片识别指令后便会控制电机让娃娃完成眨眼动作。除了语音识别功能,现代语音识别
    的头像 发表于 04-24 15:14 258次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>ic芯片分类工作原理,<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片分类

    语音识别芯片介绍,语音识别芯片工作原理解析

    在智能交互不断深入的今天,语音识别芯片正成为众多设备实现语音控制与AI对话的关键部件。语音芯片广义上涵盖语音播放、
    的头像 发表于 04-01 16:26 327次阅读

    语音识别IC分类,语音识别芯片的工作原理

    语音识别芯片,也叫语音识别集成电路,是一种集声音存储、播放、录音语音
    的头像 发表于 01-14 15:22 510次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>IC分类,<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片的工作原理

    芯知识|可录音语音芯片如何实现声音的储存与重放?

    是可录音语音芯片IC。这种录放音IC如何完成从声音采集到储存再到播放的完整过程?它又在哪些创新场景中发挥着不可替代的作用?本文将深入解析其技术内核与应用价值。一、核心
    的头像 发表于 01-08 09:44 384次阅读
    芯知识|可<b class='flag-5'>录音</b><b class='flag-5'>语音</b>芯片如何实现声音的储存与重放?

    语音识别芯片有哪些(语音识别芯片AT680系列)

    在人工智能技术飞速发展的今天,语音识别芯片作为人机交互的重要桥梁,正逐渐成为各类智能设备不可或缺的核心部件。与传统的语音芯片不同,语音
    的头像 发表于 11-14 17:11 1634次阅读

    什么是离线语音识别芯片(离线语音识别芯片有哪些优点)

    离线语音识别芯片,是一种集成了语音信号采集、前端处理和本地识别功能的专用集成电路,无须联网也可以进行语音控制。它内设先进的数字信号处理模块及
    的头像 发表于 10-31 15:27 765次阅读

    如何选择合适的语音识别芯片型号

    语音识别芯片(又称语音识别IC)是现代智能设备的核心组件,与传统语音芯片相比,其最大特点是能够主动识别
    的头像 发表于 10-30 16:32 817次阅读

    广州唯创电子录音语音芯片IC:工作原理与应用场景全解析

    让智能设备拥有“记忆之声”,录放自如的语音技术解决方案录音播放语音芯片作为现代电子设备的核心组件,通过高度集成的技术实现了声音的采集、存储和
    的头像 发表于 09-24 09:39 1097次阅读
    广州唯创电子<b class='flag-5'>录音</b><b class='flag-5'>语音</b>芯片IC:工作原理与应用场景全解析

    语音识别系统的技术核心:从声音到文字的智能转换

          语音识别技术,也称为自动语音识别(ASR),其核心目标是将人类语音信号转换为对应的文
    的头像 发表于 09-05 14:04 1074次阅读

    唯创录音芯片五大技术方案,重塑智能录音市场新格局:自动识别环境噪音、智能调节录音参数、实现多路并

    2025,智能录音市场正从基础功能满足转向音质体验升级。企业正面临哪些技术选型难点?唯创知音一文为您解读录音芯片行业技术演进之路!三大诉求录音
    的头像 发表于 08-16 12:03 1354次阅读
    唯创<b class='flag-5'>录音</b>芯片五大<b class='flag-5'>技术</b>方案,重塑智能<b class='flag-5'>录音</b>市场新格局:自动<b class='flag-5'>识别</b>环境噪音、智能调节<b class='flag-5'>录音</b>参数、实现多路并

    瑞芯微RK3576语音识别算法

    1.语音识别简介语音识别技术,也被称为自动语音识别
    的头像 发表于 08-15 15:13 2548次阅读
    瑞芯微RK3576<b class='flag-5'>语音</b><b class='flag-5'>识别</b>算法

    语音识别---大家怎么看呢?

    语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,
    发表于 08-09 10:54

    语音识别芯片选型有哪些技术参数要注意

    语音识别芯片的使用场景越来越多涉及的范围也越来越广!那么语音芯片的选型就很重要了,选型不对直接影响产品的使用体验,下面小编从不同的维度来给大家介绍语音
    的头像 发表于 06-23 17:31 1140次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片选型有哪些<b class='flag-5'>技术</b>参数要注意