0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌将利用机器学习技术来改善Duo的通话质量

独爱72H 来源:cnBeta 作者:cnBeta 2020-04-07 21:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(文章来源:cnBeta)
外媒报道称,为保障 Duo 通话服务在不稳定连接状态下的音频质量,谷歌推出了一项名叫 WaveNetEQ 的音质改善方案。 据悉,其基于谷歌 DeepMind 部门的相关技术,旨在利用人工加入的噪音来抑制音频的抖动。这种噪音听起来就像人类在说话,但其实是通过机器学习技术产生的。

如果你曾经拨打过网络电话,那肯定多多少少地经历过因连接不稳定而导致的音频抖动。当通话期间的部分音频数据包在通信过程中丢失、延迟过高、或顺序错误时,就有可能发生这样的情况。谷歌表示,99% 的 Duo 通话都会出现数据包丢失,其中 20% 的丢失率超过 3%、另有 10% 的丢失率超过 8% 。

每款通信应用都有采取某种方式来处理丢包问题,但谷歌表示,传统的丢包掩饰(PLC)过程,或导致高达 60ms 的空缺。

相比之下,基于 DeepMind 神经网络技术的 WaveNetEQ 解决方案,已经在 48 种不同语言的 100 多个扬声器数据上展开了训练。为增加说服力,谷歌还放出了一些 WaveNetEQ 与常见的 PLC 技术的比较音频。当然,新技术能够转换多少音频,还是有一定的局限的。谷歌表示,WaveNetEQ 旨在替换较短的音频间隔,而不是真人通话期间漏掉的整个单次。因此在 120ms 之后,这套系统会淡出并产生静音。

通过评估,谷歌确保了 WaveNetEQ 不会引入任何新运算的重音,此外所有处理都能够在用户的设备端进行,毕竟 Google Duo 默认就开启了端到端加密。一旦网络连接变得顺畅,真人的音频会立即恢复,WaveNetEQ 将无缝地淡出介入。目前该技术已在 Pixel 4 智能机上进行测试,后续该公司还将向更多设备推广。
(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110263
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【Milk-V Duo S 开发板免费体验】开箱和系统体验

    、TensorFlow(Lite)等主流深度学习框架都可以轻松移植到该平台。 首先要到官网下载固件,Milk-V Duo S 开发板支持ARM和RISC-V两类固件,因为主打是RV,所以选择了RISC-V
    发表于 08-12 22:04

    【Milk-V Duo S 开发板免费体验】基于Duo S 使用 TDL SDK(V2版本)

    各种深度学习技术应用于自己的产品和服务中。无论开发者是否是深度学习领域的专家,有了TDL SDK作为助手,都能轻松构建智能应用。 目前 TDL SDK 包含 移动侦测,人脸检测,人
    发表于 08-10 22:35

    【Milk-V Duo S 开发板免费体验】基于Duo S 使用 TDL SDK(V1版本)

    各种深度学习技术应用于自己的产品和服务中。无论开发者是否是深度学习领域的专家,有了TDL SDK作为助手,都能轻松构建智能应用。 目前 TDL SDK 包含 移动侦测,人脸检测,人
    发表于 08-10 22:09

    即时通话软件音频传输质量测试方案介绍

    本套测试方案的核心目的是通过POLQA(Perceptual Objective Listening Quality Assessment)主观音质评价测试反映即时通话软件在使用过程中的音频
    的头像 发表于 08-10 15:21 3412次阅读
    即时<b class='flag-5'>通话</b>软件音频传输<b class='flag-5'>质量</b>测试方案介绍

    【Milk-V Duo S 开发板免费体验】Milk-V DuoS性能测试

    ://github.com/eembc/coremark.git。 (二)环境设置 因为之前刷的Milk-V Duo S 开发板固件是ARM版,本来想下载个A53兼容的gcc编译,后来想想demo直接配置了开发环境
    发表于 08-09 23:32

    【Milk-V Duo S 开发板免费体验】测试舵机

    。使用wiringX,开发者可以使用相同的代码控制不同平台上的 GPIO 引脚,简化了跨平台开发的工作,使得开发嵌入式应用程序更加方便和灵活。 选择pwm1,先找到针脚。 然后到Milk-V Duo S 开发板
    发表于 08-09 22:46

    【Milk-V Duo S 开发板免费体验】Duo S(SG2000)初步使用

    。 Milk-V Dou USB转TTL串口 RX (pin 8) 白色线 TX (pin 10) 绿色线 **GND (pin 6) ** 黑色线 给开发板上点后,Duo 上的蓝色 LED 灯闪烁
    发表于 07-10 00:27

    【Milk-V Duo S 开发板免费体验】镜像烧录与开箱上电

    LED 闪烁。 这里烧录使用的工具是Rufus。 开机 使用适配器(5V)或电脑 USB,用 Type-C 线连接 DuoDuo 上的蓝色 LED 灯闪烁。 使用 ssh 通过 USB-NCM
    发表于 06-30 19:19

    【Milk-V Duo S 开发板免费体验】开箱、介绍、系统更新

    ; 下载镜像烧录工具 Rufus ; 加载镜像及 SD 设备,点击开始执行镜像烧录 烧录完成后, SD 卡插入开发板卡槽; Type-C 数据线连接 Duo S 为其供电,系统开机,蓝色
    发表于 06-28 09:18

    【Milk-V Duo S 开发板免费体验】Milk-V Duo S开箱、固件烧写和系统体验

    套件。 Caffe、Pytorch、ONNX、MXNet、TensorFlow(Lite)等主流深度学习框架都可以轻松移植到该平台。 Milk-V Duo S 是 Duo 的升级型号,升级了 SG2000
    发表于 06-27 23:21

    谷歌地图GPS定位

    谷歌地图GPS定位:精准导航背后的技术解析 谷歌地图作为全球最受欢迎的地图服务之一,其精准的GPS定位功能为用户提供了极大便利。本文深入探讨谷歌
    的头像 发表于 05-29 16:54 924次阅读

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编探讨机器学习模型市场
    的头像 发表于 02-13 09:39 624次阅读

    嵌入式机器学习的应用特性与软件开发环境

    作者:DigiKey Editor 在许多嵌入式系统中,必须采用嵌入式机器学习(Embedded Machine Learning)技术,这是指
    的头像 发表于 01-25 17:05 1211次阅读
    嵌入式<b class='flag-5'>机器</b><b class='flag-5'>学习</b>的应用特性与软件开发环境

    借助谷歌Gemini和Imagen模型生成高质量图像

    在快速发展的生成式 AI 领域,结合不同模型的优势可以带来显著的成果。通过利用谷歌的 Gemini 模型制作详细且富有创意的提示,然后使用 Imagen 3 模型根据这些提示生成高质量
    的头像 发表于 01-03 10:38 1340次阅读
    借助<b class='flag-5'>谷歌</b>Gemini和Imagen模型生成高<b class='flag-5'>质量</b>图像

    利用Arm Kleidi技术实现PyTorch优化

    PyTorch 是一个广泛应用的开源机器学习 (ML) 库。近年来,Arm 与合作伙伴通力协作,持续改进 PyTorch 的推理性能。本文详细介绍如何利用 Arm Kleidi
    的头像 发表于 12-23 09:19 1620次阅读
    <b class='flag-5'>利用</b>Arm Kleidi<b class='flag-5'>技术</b>实现PyTorch优化