0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌将利用机器学习技术来改善Duo的通话质量

独爱72H 来源:cnBeta 作者:cnBeta 2020-04-07 21:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(文章来源:cnBeta)
外媒报道称,为保障 Duo 通话服务在不稳定连接状态下的音频质量,谷歌推出了一项名叫 WaveNetEQ 的音质改善方案。 据悉,其基于谷歌 DeepMind 部门的相关技术,旨在利用人工加入的噪音来抑制音频的抖动。这种噪音听起来就像人类在说话,但其实是通过机器学习技术产生的。

如果你曾经拨打过网络电话,那肯定多多少少地经历过因连接不稳定而导致的音频抖动。当通话期间的部分音频数据包在通信过程中丢失、延迟过高、或顺序错误时,就有可能发生这样的情况。谷歌表示,99% 的 Duo 通话都会出现数据包丢失,其中 20% 的丢失率超过 3%、另有 10% 的丢失率超过 8% 。

每款通信应用都有采取某种方式来处理丢包问题,但谷歌表示,传统的丢包掩饰(PLC)过程,或导致高达 60ms 的空缺。

相比之下,基于 DeepMind 神经网络技术的 WaveNetEQ 解决方案,已经在 48 种不同语言的 100 多个扬声器数据上展开了训练。为增加说服力,谷歌还放出了一些 WaveNetEQ 与常见的 PLC 技术的比较音频。当然,新技术能够转换多少音频,还是有一定的局限的。谷歌表示,WaveNetEQ 旨在替换较短的音频间隔,而不是真人通话期间漏掉的整个单次。因此在 120ms 之后,这套系统会淡出并产生静音。

通过评估,谷歌确保了 WaveNetEQ 不会引入任何新运算的重音,此外所有处理都能够在用户的设备端进行,毕竟 Google Duo 默认就开启了端到端加密。一旦网络连接变得顺畅,真人的音频会立即恢复,WaveNetEQ 将无缝地淡出介入。目前该技术已在 Pixel 4 智能机上进行测试,后续该公司还将向更多设备推广。
(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6271

    浏览量

    112197
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137425
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    机器学习中的数据质量双保障:从“验证”到“标记”

    机器学习的世界里,有句老话尤为贴切:“garbagein,garbageout”(输入垃圾,输出垃圾)。无论模型架构多先进、算法多精妙,数据的质量始终是决定模型性能的核心。本文聚焦数据处理中两个
    的头像 发表于 04-24 15:48 174次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>中的数据<b class='flag-5'>质量</b>双保障:从“验证”到“标记”

    语音通话中的回声消除与噪声抑制:F-18模块的设计启示与实践反思

    在智能家居、可视门铃、网络对讲等产品中,通话质量往往是用户最关心、也最容易出问题的一环。回音刺耳、背景嘈杂、声音断断续续……这些痛点不仅影响体验,也让不少开发团队头疼不已。 最近,我们拿到
    的头像 发表于 04-24 09:55 200次阅读

    谷歌评论卡,碰一碰即可完成谷歌评论 #谷歌评论卡 #NFC标签 #nfc卡

    谷歌
    深圳市融智兴科技有限公司
    发布于 :2026年01月15日 17:02:00

    机器视觉的核心技术和应用场景

    机器视觉正通过让机器“看见”并解读视觉数据为行业带来变革,进而提升自动化水平、质量控制效率与运营效能。本文深入探讨
    的头像 发表于 12-29 16:32 1134次阅读

    【Milk-V Duo S 开发板免费体验】开箱和系统体验

    、TensorFlow(Lite)等主流深度学习框架都可以轻松移植到该平台。 首先要到官网下载固件,Milk-V Duo S 开发板支持ARM和RISC-V两类固件,因为主打是RV,所以选择了RISC-V
    发表于 08-12 22:04

    【Milk-V Duo S 开发板免费体验】基于Duo S 使用 TDL SDK(V2版本)

    各种深度学习技术应用于自己的产品和服务中。无论开发者是否是深度学习领域的专家,有了TDL SDK作为助手,都能轻松构建智能应用。 目前 TDL SDK 包含 移动侦测,人脸检测,人
    发表于 08-10 22:35

    【Milk-V Duo S 开发板免费体验】基于Duo S 使用 TDL SDK(V1版本)

    各种深度学习技术应用于自己的产品和服务中。无论开发者是否是深度学习领域的专家,有了TDL SDK作为助手,都能轻松构建智能应用。 目前 TDL SDK 包含 移动侦测,人脸检测,人
    发表于 08-10 22:09

    即时通话软件音频传输质量测试方案介绍

    本套测试方案的核心目的是通过POLQA(Perceptual Objective Listening Quality Assessment)主观音质评价测试反映即时通话软件在使用过程中的音频
    的头像 发表于 08-10 15:21 3843次阅读
    即时<b class='flag-5'>通话</b>软件音频传输<b class='flag-5'>质量</b>测试方案介绍

    【Milk-V Duo S 开发板免费体验】Milk-V DuoS性能测试

    ://github.com/eembc/coremark.git。 (二)环境设置 因为之前刷的Milk-V Duo S 开发板固件是ARM版,本来想下载个A53兼容的gcc编译,后来想想demo直接配置了开发环境
    发表于 08-09 23:32

    【Milk-V Duo S 开发板免费体验】测试舵机

    。使用wiringX,开发者可以使用相同的代码控制不同平台上的 GPIO 引脚,简化了跨平台开发的工作,使得开发嵌入式应用程序更加方便和灵活。 选择pwm1,先找到针脚。 然后到Milk-V Duo S 开发板
    发表于 08-09 22:46

    【Milk-V Duo S 开发板免费体验】Duo S(SG2000)初步使用

    。 Milk-V Dou USB转TTL串口 RX (pin 8) 白色线 TX (pin 10) 绿色线 **GND (pin 6) ** 黑色线 给开发板上点后,Duo 上的蓝色 LED 灯闪烁
    发表于 07-10 00:27

    【Milk-V Duo S 开发板免费体验】镜像烧录与开箱上电

    LED 闪烁。 这里烧录使用的工具是Rufus。 开机 使用适配器(5V)或电脑 USB,用 Type-C 线连接 DuoDuo 上的蓝色 LED 灯闪烁。 使用 ssh 通过 USB-NCM
    发表于 06-30 19:19

    【Milk-V Duo S 开发板免费体验】开箱、介绍、系统更新

    ; 下载镜像烧录工具 Rufus ; 加载镜像及 SD 设备,点击开始执行镜像烧录 烧录完成后, SD 卡插入开发板卡槽; Type-C 数据线连接 Duo S 为其供电,系统开机,蓝色
    发表于 06-28 09:18

    【Milk-V Duo S 开发板免费体验】Milk-V Duo S开箱、固件烧写和系统体验

    套件。 Caffe、Pytorch、ONNX、MXNet、TensorFlow(Lite)等主流深度学习框架都可以轻松移植到该平台。 Milk-V Duo S 是 Duo 的升级型号,升级了 SG2000
    发表于 06-27 23:21

    谷歌地图GPS定位

    谷歌地图GPS定位:精准导航背后的技术解析 谷歌地图作为全球最受欢迎的地图服务之一,其精准的GPS定位功能为用户提供了极大便利。本文深入探讨谷歌
    的头像 发表于 05-29 16:54 1794次阅读