0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google最新推出的音频编解码器Lyra

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2021-03-11 16:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Google最新推出的音频编解码器Lyra,不仅实现了以每秒3kb网络宽带提供听起来自然清晰的语音聊天,还可以在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。

2月25日,Google AI blog发布了一篇文章详细的介绍了最新推出的Lyra——一种用于语音压缩的新型超低比特率编解码器。该编解码器使Google Duo,以及未来的其他应用程序能够以每秒3kb的网络宽带提供听起来很自然清晰的语音聊天。

众所周知,人们对实时音视频的需求不断增加。特别是去年由于受到疫情的影响,许多人不得不隔离在家,只能与亲朋好友通过视频通话的方式保持联系。例如,仅去年一年Google Duo和Meet就承载了超过1万亿分钟的视频。而这些情况无疑是给全球的互联网基础设施带来了巨大的挑战。除此之外,虽然有些人可以使用一致的高质量,高速网络,但这种连接并不普遍。比如在网络通信并不发达的农村地区。然而,尽管在连接良好的地区,人们有时也会遇到质量差、带宽低的问题。那么如何在有限的带宽下实现高质量的音频输出就成为了目前最重要的议题。

Lyra音频编解码器

6e8f3e5c-7e1a-11eb-8b86-12bb97331649.png

因此,Google推出了一种高质量、低比特率的新型音频编解码器——Lyra。尽管用户在网速很慢的情况下,也能进行语音聊天。Lyra编解码器的基本结构体系非常简单,如上图所示。而Lyra与其他音频编解码器的不同之处在于:它利用机器学习模型,开发了一种新的模型,能够使用最少的数据来重建语音。这种模型不仅能够区分信号,还能生成全新的信号。与之相比,传统的参数编解码器只从语音中提取关键参数,然后用于在接收端重建信号。虽然实现低比特率,但得到的音频通常听起来很机械,不自然。而Lyra利用这些新的自然声生成模型,即能够保持参数编解码器的低比特率,同时又能实现高质量的音频输出。这与目前大多流媒体平台中使用的波形编解码器几乎不相上下。更重要的是,Lyra的效率足够高,可以在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。

与现有编解码器对比

Lyra目前被设计运行在3kbps情况下,听力测试表明,Lyra的表现优于任何其他编解码器。并且优于在相同8kbps情况下的Opus,从而实现了超过60%的带宽减少。Lyra可以在带宽条件不适合高比特率和现有的低比特率编解码器不能提供足够质量的情况下使用,这是它的一大优势,也是解决现在低音频质量的方案。

以下是Lyra与现有编解码器的对比:

在安静的环境下:

Original原始音频

Opus@6kbps

Lyra@3kbps

Speex@3kbps

在嘈杂的环境下:

Original原始音频

Opus@6kbps

Lyra@3kbps

Speex@3kbps

上方是Google提供的Lyra与Opus、Speex分别以6kbps和3kbps,对同一音频的压缩质量对比。能够明显感受到即使Lyra在3kbps情况下,自然语音音频的清晰程度也远优于Opus在6kbps下的情况。

适用情况

Google已经利用开源音频库对Lyra使用超过70种语言的扬声器进行了数千小时的音频培训,然后与专家和来自广泛的听众一起验证音频质量。Lyra在一个广泛的数据集中训练,包括大量不同语言的使用者,以确保编解码器能够应对各种情况。另外,Lyra还可以在云环境中使用,以方便使用各种网络和设备的用户能够无缝对接聊天。不仅如此,Google还将Lyra与新的视频压缩技术(例如AV1)配对后,即使用户通过56kbps拨号调制调节器连接到Internet,也可以进行视频聊天。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1814

    浏览量

    60632
  • 音频编解码器

    关注

    4

    文章

    224

    浏览量

    56813
  • 应用程序
    +关注

    关注

    38

    文章

    3346

    浏览量

    60419

原文标题:在3kbps的带宽下还能清晰地语音聊天?

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MAX9860:16位单声道音频语音编解码器的卓越之选

    推出的MAX9860 16位单声道音频语音编解码器,看看它能为我们带来哪些惊喜。 文件下载: MAX9860.pdf 一、产品概述 MAX9860是一款低功耗、语音频段的单声道
    的头像 发表于 04-22 15:45 48次阅读

    深入剖析AD1938:高性能音频编解码器的技术奥秘

    深入剖析AD1938:高性能音频编解码器的技术奥秘 在音频处理领域,高性能的编解码器是实现优质音频体验的关键。AD1938作为一款出色的单芯
    的头像 发表于 04-18 14:50 114次阅读

    高性能音频编解码器AD1937:特性、规格与应用解析

    高性能音频编解码器AD1937:特性、规格与应用解析 在音频处理领域,一款高性能的编解码器对于实现优质音频效果至关重要。AD1937作为一款
    的头像 发表于 04-18 14:50 96次阅读

    WM8915:超低功耗音频集线器编解码器的卓越之选

    WM8915:超低功耗音频集线器编解码器的卓越之选 在当今的移动音频领域,对于高质量语音和音乐播放的需求日益增长,而超低功耗的音频编解码器
    的头像 发表于 03-27 18:05 1045次阅读

    德州仪器PCM3002和PCM3003立体声音频编解码器深度解析

    德州仪器PCM3002和PCM3003立体声音频编解码器深度解析 在音频处理领域,编解码器(CODEC)是实现模拟信号与数字信号相互转换的关键组件。德州仪器(TI)
    的头像 发表于 03-16 15:50 301次阅读

    详解TI的PCM2901/2903立体声音频编解码器

    立体声音频编解码器,这两款产品在USB音频应用中展现了卓越的性能和广泛的适用性。 文件下载: pcm2901.pdf 产品概述 PCM2901和PCM2903是TI推出的单芯片USB立
    的头像 发表于 02-04 10:30 448次阅读

    深入解析LM4546B AC '97多通道音频编解码器

    (Texas Instruments)推出的高性能音频编解码器——LM4546B。 文件下载: lm4546b.pdf 产品概述 LM4546B是一款专为PC系统设计的音频
    的头像 发表于 02-03 10:50 355次阅读

    深入剖析LM4549B:高性能音频编解码器的技术指南

    深入剖析LM4549B:高性能音频编解码器的技术指南 在当今的音频处理领域,高性能的音频编解码器对于实现出色的
    的头像 发表于 02-03 10:50 368次阅读

    TLV320AIC34音频编解码器:低功耗设计与高性能音频处理的完美结合

    TLV320AIC34音频编解码器:低功耗设计与高性能音频处理的完美结合 在当今的便携式音频和通信设备领域,低功耗、高性能的音频
    的头像 发表于 02-02 16:30 382次阅读

    探索PCM3168A音频编解码器:高性能音频处理的理想之选

    探索PCM3168A音频编解码器:高性能音频处理的理想之选 在音频处理领域,一款出色的编解码器对于实现高质量
    的头像 发表于 02-02 14:35 520次阅读

    解析PCM5310音频编解码器:多功能设计与性能优势

    解析PCM5310音频编解码器:多功能设计与性能优势 在当今数字化音频技术飞速发展的时代,音频编解码器作为核心组件,对于实现高质量
    的头像 发表于 02-02 11:45 454次阅读

    TLV320AIC3206:超低功耗立体声音频编解码器的卓越之选

    TLV320AIC3206:超低功耗立体声音频编解码器的卓越之选 在当今的音频处理领域,低功耗、高性能的音频编解码器是众多便携式设备和
    的头像 发表于 01-30 16:00 751次阅读

    探索MAX9860:16位单声道音频语音编解码器的卓越性能与应用

    探索MAX9860:16位单声道音频语音编解码器的卓越性能与应用 在当今的音频设备领域,低功耗、高性能的音频编解码器需求日益增长。Maxim
    的头像 发表于 01-28 16:10 294次阅读

    德州仪器PCM2904/PCM2906立体声音频编解码器:特性、应用与设计指南

    概述 PCM2904和PCM2906是德州仪器推出的单芯片USB立体声音频编解码器,集成了符合USB全速协议的控制。两
    的头像 发表于 12-23 15:05 753次阅读

    基于E203 RISC-V的音频信号处理系统 -CODEC(音频编解码器)配置

    CODEC介绍 本设计采用的音频编解码器是WM8731,该编解码器可以通过I2C进行寄存配置,可以调节主从模式、数据位数可设置为16bit、24bit、32bit。可以设置的传输模
    发表于 10-28 06:29