0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

专利显示苹果正在研究如何利用音频来估计设备与说话用户的距离

璟琰乀 来源:cnBeta.COM 作者:cnBeta.COM 2021-01-22 11:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

新专利显示,苹果正在研究HomePod或其他设备如何利用音频来估计与说话用户的距离,还可以识别周围的声音。苹果的HomePod已经很好地听到了你的声音,即使是在大声播放音乐的时候。现在新专利申请显示,苹果希望改进这一点,并将设备的听觉能力,提升到一个新的水平。

一项是名为 “基于学习的距离估计”的专利,涉及到使用音频不仅仅是为了识别用户,而是为了弄清用户的位置。苹果在专利当中表示,设备使用紧凑麦克风阵列估计设备到用户的距离,例如,设备可以根据用户与设备的估计距离来调整播放音量或智能辅助设备的响应。因此,如果用户离设备非常近,音乐或语音将不会以高音量播放,另外,如果用户离得很远,媒体播放或智能助理设备的响应可能会被调整到更大的音量。

这个想法也是为了改进苹果目前令人印象深刻但又有些缺陷的系统,即多个苹果设备都会尝试确定你对哪个设备说了 “嘿,Siri”。对此,苹果在专利当中表示,在有多个设备的应用场景中,设备之间可以相互协调或仲裁,根据每个设备到用户的距离来决定哪一个或多个设备应该回复查询。

在专利当中,苹果提出了简单和更复杂的解决方案,这些方案都可以协同使用。比较简单的是让设备像HomePod一样,先绘制出环境图。然后,它有效地拥有一个声学环境中的测量或模拟点的网格。在这种情况下,就可以将声音与这个 “网格 ”进行对比,从而大致判断出说话的人所在的位置。

如果这不够好,苹果还有另一个解决方案,它涉及 “基于学习的系统,如深度神经网络(DNN),而且不需要多个设备互相协调帮助。苹果在专利当中表示,深度学习系统可以根据紧凑的麦克风阵列接收到的语音信号,估计语音源在每个时间段的距离。这个DNN系统可以做的是确定什么是语音,什么是背景噪声。然后,它可以计算出 关于直接信号传播的信息,还可以计算出混响效应和噪声。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    31

    文章

    3228

    浏览量

    86339
  • 苹果
    +关注

    关注

    61

    文章

    24613

    浏览量

    208764
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    VirtualLab Fusion:基于微软专利的蝴蝶型出瞳扩展光导

    **摘要 ** 在为增强和混合现实(AR&MR)应用设计光导设备的过程中,像提供的视场(FOV)这样的参数是主要的关注点。为了提高可达到的最大视场的极限,已经研究了各种方法,例如在耦
    发表于 04-28 08:11

    IDT VLX1000 PanelPort LinkXtend:长距离显示信号传输的理想解决方案

    IDT VLX1000 PanelPort LinkXtend:长距离显示信号传输的理想解决方案 在电子设备的设计中,长距离传输显示信号一直
    的头像 发表于 04-13 18:05 377次阅读

    UWB宠物电子围栏系统解决方案 | 远距离宠物测距技术

    项圈设备组成。遥控器通过UWB技术对宠物设备进行精确定位与距离监测。用户可在遥控器上设定宠物项圈与遥控器之间的安全距离,作为电子围栏的边界;
    发表于 03-23 15:15

    苹果Vision Pro的“隐形功臣”:揭秘顶级AR设备中导热凝胶的精密应用

    2025年,苹果公司第二代VisionPro正式上市,凭借其在显示精度、空间计算与交互体验上的全面升级,再次定义了高端增强现实(AugmentedReality,AR)设备的技术标杆。然而,在这
    的头像 发表于 01-27 11:17 933次阅读
    <b class='flag-5'>苹果</b>Vision Pro的“隐形功臣”:揭秘顶级AR<b class='flag-5'>设备</b>中导热凝胶的精密应用

    光纤20公里,网线250米,HT1001EK长距离传输无忧

    主机NVR、电脑、DVD等信号源 HDMI OUT 1个HDMI信号输出口 连接高清电视机、拼接屏、投影机等显示设备,实现信号环出 A-IN 3.5mm音频输入口 接入外部模拟音频
    发表于 01-05 19:09

    双目视觉是如何实现深度估计的?

    [首发于智驾最前沿微信公众号]自动驾驶的纯视觉方案中,单目摄像头因无法直接感知深度,在环境理解上存在根本局限,双目视觉技术在此需求下应运而生。它通过模拟人眼,利用双摄像头的视差推算距离,将二维图像
    的头像 发表于 12-31 09:45 684次阅读
    双目视觉是如何实现深度<b class='flag-5'>估计</b>的?

    如何用FPGA控制ADV7513实现HDMI画面显示音频播放

    HDMI接口显示使用DMT时序+TMDS编码实现。当用FPGA控制HDMI的数据传输时,通常可以采用纯RTL实现TMDS算法或者使用专门的HDMI芯片(如ADV7513)这两种方案完成。本文主要是介绍如何用FPGA控制ADV
    的头像 发表于 12-02 11:05 7054次阅读
    如何用FPGA控制ADV7513实现HDMI画面<b class='flag-5'>显示</b>和<b class='flag-5'>音频</b>播放

    轻量化AI+AR显示设备的新变局拉开帷幕

    在智能穿戴设备行业的激烈竞争中,每一次产品的推出与战略的调整都如同投入湖面的巨石,激起层层涟漪。苹果公司,这位科技领域的巨头,其一举一动都备受全球瞩目。近期,苹果公司在AI+AR显示
    的头像 发表于 08-19 11:19 1252次阅读

    不止三折!华为新专利暗示四折屏设备已在路上?

    上周,华为正式公布一项名为“显示方法、电子设备及可读存储介质”的专利,针对三折叠及以上设备的交互逻辑提出革新方案,引发科技圈热议。该专利通过
    的头像 发表于 07-22 13:25 929次阅读

    XR空间音频革命:苹果、三星推出新技术,ASAF成Vision Pro最佳搭档

    Audio)格式:Apple Spatial Audio Format(ASAF,苹果空间音频格式),可以用来打造真正沉浸式的音频体验。   ASAF 通过确保使用声学提示渲染
    的头像 发表于 07-20 00:11 3302次阅读

    大模型推理显存和计算量估计方法研究

    过程中需要占用大量显存,导致推理速度变慢,甚至无法进行。 计算量过大:大模型的计算量较大,导致推理速度慢,难以满足实时性要求。 为了解决这些问题,本文将针对大模型推理显存和计算量的估计方法进行研究。 二
    发表于 07-03 19:43

    苹果发布的主动散热专利,或将开启移动电影摄影的未来

    在重新定义移动影像的征程中,苹果或许刚刚暗示了一种革命性组合:一个影院级图像传感器,以及一套强大的新型主动散热系统。YMCinema率先披露了苹果具备20挡动态范围的图像传感器专利,拼图的各个碎片
    的头像 发表于 06-27 07:20 1113次阅读
    <b class='flag-5'>苹果</b>发布的主动散热<b class='flag-5'>专利</b>,或将开启移动电影摄影的未来

    神经网络RAS在异步电机转速估计中的仿真研究

    众多方法中,由于其结构简单,稳定性好广泛受到人们的重视,且已被用于产品开发。但是MRAS仍存在在低速区速度估计精度下降和对电动机参数变化非常敏感的问题。本文利用神经网络的特点,使估计更为简单、快速
    发表于 06-16 21:54

    紫光展锐T8300 5G SoC为用户开创主流音频新体验

    数字化时代,从语音通话到智能交互,从聆听音乐到创作Vlog,声音已成为隐形的基础措施。日益发展的音频技术正在重构用户感知世界的方式,重塑用户的听觉体验。
    的头像 发表于 06-13 10:07 1099次阅读

    轮边驱动电机专利技术发展

    摘要:利用轮边电机直接驱动电动汽车采用轮边电机,避免了机械传动系统中的能量损失,使电能得到了最大的利用。电动汽车采用轮边直驱式可立即产生旋转动力,减少了加速时间,并且对每个车轮实施单独控制非常方便
    发表于 06-10 13:15