0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何使用音频来估计与讲话用户之间的距离,并识别周围的声音

倩倩 来源:百度粉丝网 作者:百度粉丝网 2021-01-22 16:32 次阅读

最新研究表明,苹果公司正在研究HomePod或其他设备如何使用音频来估计与讲话用户之间的距离,并识别周围的声音。

Apple的HomePod已经非常擅长于听到您的声音,即使它正在大声播放音乐。苹果公司有两项单独的新专利申请表明,苹果公司希望将其改进,并将设备的聆听能力提高到一个新水平。

其中之一,“基于学习的距离估计”,不仅涉及使用音频来识别用户,而且要弄清楚他们在哪里。

专利申请说:“通常希望设备使用[其]紧凑型麦克风阵列来估算从设备到用户的距离。” “例如,该设备可以基于用户到该设备的估计距离来调整播放音量或来自智能辅助设备的响应。”

继续说:“因此,如果用户离设备非常近,则不会大量播放音乐或语音。” 或者,如果用户离得很远,则可以将媒体播放或来自智能助手设备的响应调整为更大的音量。”

同样的想法也意味着将其引入苹果公司目前令人印象深刻但有些瑕疵的系统,在该系统中,所有设备都会尝试确定您对“嘿,Siri”说的是什么。

苹果公司说:“在有多个设备的应用程序中,这些设备可以在彼此之间进行协调或仲裁,以根据从每个设备到用户的距离来决定应回答一个或多个设备的查询。”

苹果公司提出了简单和更复杂的解决方案,它们都可以同时使用。更简单的方法是让设备先执行HomePod的工作并首先绘制其环境图。

然后,它实际上具有“在声学环境中的测量点或模拟点的网格”。在这种情况下,可以将声音与此“网格”进行比较,以大致了解说话者所在的位置。

但是,Apple认为这本身并不足够好,并且还说它与Siri最少一起使用。那是因为一个人说话时可能会动弹,而且他们要求快速回应-此提议不适合。

备选地,然后,“如果至少两个麦克风阵列可用”,则“可以使用三角测量方法来估计语音源的距离”。

但是,这里的关键部分是至少需要两个带麦克风的设备。因此,Apple提供了另一个涉及更多的解决方案,其中涉及“基于学习的系统,如深度神经网络(DNN)”,并且不需要多个设备。

专利申请说:“深度学习系统可以根据紧凑型麦克风阵列接收到的语音信号来估计每个时间帧的语音源距离。”

这个DNN系统可以做的是确定什么是语音,什么是背景噪声。然后,它可以计算“有关直接信号传播的信息”以及“混响效果和噪声”。

该申请归功于三位发明者,包括Mehrez Souden和Joshua D. Atkins。他们先前的相关工作包括已获专利的如何使用比普通麦克风少的声音来录制完整空间声音的专利。

这特别涉及Apple AR中的音频,该最新专利申请涉及真实环境中的物理设备。但是,如果只是为了避免用太大声的HomePod mini炸毁别人的耳朵而感到很麻烦,那还有很多事情要做。

该专利申请说:“例如,助听器之类的辅助和增强型助听器可以根据语音源的距离来增强音频信号。”

这也是第二个新公开的专利申请重点关注的内容。

识别重要的声音

“基于观察到的声音识别声源的系统和方法”,是关于让一些设备识别其他声音并为我们做出反应。

“许多家用电器,例如微波炉,洗衣机,洗碗机和门铃,会发出声音来提醒用户该器具的状况已经改变,”该专利申请开始。

它继续说:“但是,由于各种原因,用户可能无法听到家用电器发出的声音警报。” “例如,用户可能有听力障碍,用户可能在外面或在另一个房间里,或者设备可能发出被家庭声学场景遮挡的声音。”

也不必是您的煮蛋计时器关闭。该专利同样涉及“公共场所(政府大楼),半公共场所(办公室大厅)和私人场所(住宅或办公大楼)”中的声音。

它说:“(这些)也有声学场景,可以包含带有信息的声音。” “例如,铃,铃或蜂鸣器可能指示门已经打开或关闭,或者警报器可能发出警报声或其他声音,警告附近的人有危险(例如,烟,火或一氧化碳)。”

总体而言,该专利申请主要详述了可以“训练”设备以识别“常见声音”的方法。然后,它将继续侦听其中的任何一个,并且当听到一个声音时,可以发出“响应于确定声音存在于声学场景中的选定输出”。

换句话说,如果是您的煮蛋计时器关闭,则该设备可能会使您的Apple Watch在手腕上轻按。或者,如果是防盗警报,则该设备可以通知当局。

苹果公司表示:“声音中包含大量的上下文信息。” “识别常见的声音可以使电子设备响应于观察到的环境(例如,根据观察到的声音确定)来适应其行为或提供服务,从而增加它们对用户的相关性和价值,同时需要更少的用户帮助或输入。”

第二项专利申请归功于包括丹尼尔·克林格(Daniel C. Klinger)在内的四位发明家。他先前的工作包括一项专利申请,该专利用于通过HomePod或其他设备进行安全的电话呼叫。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    27

    文章

    2588

    浏览量

    79864
  • 苹果公司
    +关注

    关注

    2

    文章

    389

    浏览量

    22331
  • 深度学习
    +关注

    关注

    73

    文章

    5200

    浏览量

    119803
收藏 人收藏

    评论

    相关推荐

    苹果获家庭声音定位和识别专利,HomePod可监听婴儿哭闹并向用户

    据美国商标与专利管理局最近公布信息,苹果成功取得一项关于音频的专利,透过监测室内响动,为用户提供另一间房内事件详情。该专利名为《家庭声音定位及辨识》
    的头像 发表于 02-28 11:41 132次阅读

    立体声音频放大器电路图分享

    立体声音频放大器是一种专门设计用于处理立体声音频信号的放大器。它通常具有两个独立的放大通道,分别用于处理左声道和右声道的音频信号。立体声音频放大器的主要目的是增强
    的头像 发表于 02-06 14:45 1350次阅读
    立体<b class='flag-5'>声音频</b>放大器电路图分享

    labview声音采集与处理

    ,LabVIEW提供了丰富的声音采集工具。用户可以通过声卡或其他外部设备将声音信号输入电脑。LabVIEW支持多种声音输入接口,包括麦克风、音频
    的头像 发表于 01-04 10:48 456次阅读

    KT6368A蓝牙芯片的距离天线周围的匹配元器件LC,能增加距离

    KT6368A蓝牙芯片的距离,以及天线周围的元器件,电感和电容,添加上去是否可以增加距离
    的头像 发表于 11-12 09:36 258次阅读
    KT6368A蓝牙芯片的<b class='flag-5'>距离</b>天线<b class='flag-5'>周围</b>的匹配元器件LC,能增加<b class='flag-5'>距离</b>吗

    音频传输系统:数字时代的声音使者

      音频传输系统是一种技术,用于将声音信号从一个地方传输到另一个地方。这可以是通过电线、光纤、或者无线通信等方式进行传输。音频传输系统旨在以数字或模拟形式传递声音,以便人们可以在不同位
    的头像 发表于 10-17 18:10 359次阅读

    如何用Java播放声音

    声音API播放一个音频文件。 播放声音的Java APIs 一般来说, javax.sound 包中的Java Sound APIs提供了两种播放音频的方法。在这两种方法
    的头像 发表于 10-09 10:56 1497次阅读

    声音音频编码器记录到MP3格式存储到缩微SD卡中

    CMSIS V3.00.001.001 硬件: NuMaker-M467HJ V1.0 此示例代码使用音频编码记录声音。 在将声音数据编码为 MP3 格式后, 编码后的数据将被写入
    发表于 08-29 07:54

    语音识别唤醒词:让智能设备主动“听”你的声音

    语音识别唤醒词是指在语音助理和智能设备中使用的特定词语或短语,用于唤醒设备并启动语音交互。随着智能科技的飞速发展,语音识别唤醒词成为了现代智能设备的一项关键技术。它让设备能够主动“听”用户
    的头像 发表于 08-07 20:21 1077次阅读

    小白悬赏声音收集传输云端返回播放的方案

    通过音箱收集声音传输到云端 计算后的音频返回音箱播放的方案和厂家 赏金2000,15198767002求助
    发表于 08-03 22:20

    从原始音频数据中检测火花声音

    电子发烧友网站提供《从原始音频数据中检测火花声音.zip》资料免费下载
    发表于 07-03 11:45 1次下载
    从原始<b class='flag-5'>音频</b>数据中检测火花<b class='flag-5'>声音</b>

    Amiga立体声音频数字转换器开源

    电子发烧友网站提供《Amiga立体声音频数字转换器开源.zip》资料免费下载
    发表于 06-12 10:52 0次下载
    Amiga立体<b class='flag-5'>声音频</b>数字转换器开源

    IMX8QM无法从扩展音频板获得任何音频的原因?怎么解决?

    、通知和系统声音从 CPU 板上的音频插孔播放。音乐等其他声音从扩展音频板播放。 音频插孔按预期正常工作。 问题是我们无法从扩展
    发表于 06-09 06:35

    沉浸式音频的未来:计算机视觉辅助下的声音重现

    消费类娱乐对沉浸式体验的要求越来越高,用户希望获得身临其境的体验并消费内容,声音则是临场感的重要组成部分。在未来,我们将更了解人类大脑处理和定位声音的方式,由此开发出创新的声音重现技术
    的头像 发表于 06-08 14:23 754次阅读
    沉浸式<b class='flag-5'>音频</b>的未来:计算机视觉辅助下的<b class='flag-5'>声音</b>重现

    如何使用ESP8266的实时立体声音频流?

    嗨,我一直在考虑使用 Arduino Due 或 Teensy3.2 板设置*实时*无线(读取 Wifi)立体声音频流,这样即使在厨房里我也能听到我的电视播放的内容(我不会 使用使用现成的蓝牙模块
    发表于 05-22 06:24

    如何在音频运算放大电路中用电容调节声音的音质呢?

    比如,我有一个运算放大电路,该电路中有两级运放,在运放的反馈电阻上接一个电容调整声音的频率特性,或则在运放的输入端和输出端来加入电容调节音质的好坏,很不明白加的电容值是根据什么
    发表于 04-06 17:30