0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google最新推出的音频编解码器Lyra

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2021-03-11 16:37 次阅读

Google最新推出的音频编解码器Lyra,不仅实现了以每秒3kb网络宽带提供听起来自然清晰的语音聊天,还可以在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。

2月25日,Google AI blog发布了一篇文章详细的介绍了最新推出的Lyra——一种用于语音压缩的新型超低比特率编解码器。该编解码器使Google Duo,以及未来的其他应用程序能够以每秒3kb的网络宽带提供听起来很自然清晰的语音聊天。

众所周知,人们对实时音视频的需求不断增加。特别是去年由于受到疫情的影响,许多人不得不隔离在家,只能与亲朋好友通过视频通话的方式保持联系。例如,仅去年一年Google Duo和Meet就承载了超过1万亿分钟的视频。而这些情况无疑是给全球的互联网基础设施带来了巨大的挑战。除此之外,虽然有些人可以使用一致的高质量,高速网络,但这种连接并不普遍。比如在网络通信并不发达的农村地区。然而,尽管在连接良好的地区,人们有时也会遇到质量差、带宽低的问题。那么如何在有限的带宽下实现高质量的音频输出就成为了目前最重要的议题。

Lyra音频编解码器

6e8f3e5c-7e1a-11eb-8b86-12bb97331649.png

因此,Google推出了一种高质量、低比特率的新型音频编解码器——Lyra。尽管用户在网速很慢的情况下,也能进行语音聊天。Lyra编解码器的基本结构体系非常简单,如上图所示。而Lyra与其他音频编解码器的不同之处在于:它利用机器学习模型,开发了一种新的模型,能够使用最少的数据来重建语音。这种模型不仅能够区分信号,还能生成全新的信号。与之相比,传统的参数编解码器只从语音中提取关键参数,然后用于在接收端重建信号。虽然实现低比特率,但得到的音频通常听起来很机械,不自然。而Lyra利用这些新的自然声生成模型,即能够保持参数编解码器的低比特率,同时又能实现高质量的音频输出。这与目前大多流媒体平台中使用的波形编解码器几乎不相上下。更重要的是,Lyra的效率足够高,可以在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。

与现有编解码器对比

Lyra目前被设计运行在3kbps情况下,听力测试表明,Lyra的表现优于任何其他编解码器。并且优于在相同8kbps情况下的Opus,从而实现了超过60%的带宽减少。Lyra可以在带宽条件不适合高比特率和现有的低比特率编解码器不能提供足够质量的情况下使用,这是它的一大优势,也是解决现在低音频质量的方案。

以下是Lyra与现有编解码器的对比:

在安静的环境下:

Original原始音频

Opus@6kbps

Lyra@3kbps

Speex@3kbps

在嘈杂的环境下:

Original原始音频

Opus@6kbps

Lyra@3kbps

Speex@3kbps

上方是Google提供的Lyra与Opus、Speex分别以6kbps和3kbps,对同一音频的压缩质量对比。能够明显感受到即使Lyra在3kbps情况下,自然语音音频的清晰程度也远优于Opus在6kbps下的情况。

适用情况

Google已经利用开源音频库对Lyra使用超过70种语言的扬声器进行了数千小时的音频培训,然后与专家和来自广泛的听众一起验证音频质量。Lyra在一个广泛的数据集中训练,包括大量不同语言的使用者,以确保编解码器能够应对各种情况。另外,Lyra还可以在云环境中使用,以方便使用各种网络和设备的用户能够无缝对接聊天。不仅如此,Google还将Lyra与新的视频压缩技术(例如AV1)配对后,即使用户通过56kbps拨号调制调节器连接到Internet,也可以进行视频聊天。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1710

    浏览量

    56782
  • 音频编解码器

    关注

    4

    文章

    118

    浏览量

    55692
  • 应用程序
    +关注

    关注

    37

    文章

    3126

    浏览量

    56315

原文标题:在3kbps的带宽下还能清晰地语音聊天?

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    集成电源管理和音频编解码器TPS65950数据表

    电子发烧友网站提供《集成电源管理和音频编解码器TPS65950数据表.pdf》资料免费下载
    发表于 03-06 11:15 0次下载
    集成电源管理和<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>TPS65950数据表

    TPS65920和TPS65930集成电源管理/音频编解码器数据表

    电子发烧友网站提供《TPS65920和TPS65930集成电源管理/音频编解码器数据表.pdf》资料免费下载
    发表于 03-06 10:55 0次下载
    TPS65920和TPS65930集成电源管理/<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>数据表

    使用具备SigmaDSP内核的编解码器是否必须载入SigmaDSP程序才能使用?

    目前预计使用ADAU1761连接两个MEMS数字麦克风, ADAU1761与ADAU1361相比, ADAU1761多了SigmaDSP内核. 使用具备SigmaDSP内核的编解码器是否必须
    发表于 11-30 07:31

    密勒调制副载波编解码器的FPGA实现

    电子发烧友网站提供《密勒调制副载波编解码器的FPGA实现.pdf》资料免费下载
    发表于 10-26 11:10 0次下载
    密勒调制副载波<b class='flag-5'>编解码器</b>的FPGA实现

    基于VHDL语言的HDB3码编解码器设计

    电子发烧友网站提供《基于VHDL语言的HDB3码编解码器设计.doc》资料免费下载
    发表于 10-13 09:22 0次下载
    基于VHDL语言的HDB3码<b class='flag-5'>编解码器</b>设计

    如何在嵌入式系统中使用音频编解码器更轻松地优化音频性能?

    作者:Jacob Beningo 许多设计人员在其基于微控制器的嵌入式系统设计中加入了音频编解码器,以提供高保真音频。但在这样做之前,他们必须弄清楚如何对其应用进行音频
    的头像 发表于 10-03 14:34 602次阅读
    如何在嵌入式系统中使用<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>更轻松地优化<b class='flag-5'>音频</b>性能?

    使用STM32L1xx微控制器与外部I2S音频编解码器播放音频文件

    电子发烧友网站提供《使用STM32L1xx微控制器与外部I2S音频编解码器播放音频文件.pdf》资料免费下载
    发表于 09-21 11:30 2次下载
    使用STM32L1xx微控制器与外部I2S<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>播放<b class='flag-5'>音频</b>文件

    ES8336低功耗音频编解码器规格书

    ES8336低功耗音频编解码器规格书
    发表于 06-13 18:13 3次下载

    如何获得ESP8266上的opus编解码器

    我想要 ESP8266 上的 opus 编解码器(尤其是解码器),因为 128 kbps 应该足够用便宜的 I2S DAC 来传输音频。我认为这非常重要,因为 opus 可以让人们从互联网上获取
    发表于 06-12 06:54

    imx8mp - wm8962编解码器音频的问题求解

    我的音频编解码器 - WM8962 有问题。 我在自己的平台上工作,以 imx8mp-devkit 为模型。 图表: 将设备添加到设备树: reg_audio_pwr: 调节
    发表于 06-09 07:50

    如何将多个AK5554编解码器与i.MX8MN SAI线集成?

    我目前正在从事一个项目,涉及在 i.MX8MN 平台上将两个 AK5554 编解码器与同一条 SA5I 线路集成。我的目标是以这样一种方式配置系统,使其有效地充当八个音频通道,所有通道都连接到正确
    发表于 05-18 06:15

    phycore iMX8Mplus如何将WM8960音频编解码器与其集成?

    我们正在开发 phycore i MX 8M plus,我们正在尝试将WM8960 音频编解码器与其集成。 我们已经添加了我们的 dts 文件,我们也能够生成 dtb 文件,但是生成的 dtb 文件
    发表于 05-17 08:06

    TLV320AIC3100音频编解码器启动问题求解

    嗨,团队,我们正在研究 IXM8MM 定制板。我们使用带有 imx8mm 和 Android 11 代码库的 tlv320aic3100 音频编解码器。面临一些与MCLK相关的问题。当我尝试播放音频
    发表于 05-17 08:03

    wm8960音频编解码器的dtsi文件如何设置?

    \"; 模型=“wm8960-音频”; cpu-dai = <&sai2>; 音频编解码器= <&编解码器>
    发表于 04-23 08:12

    视频编码包括什么?视频编解码器是如何工作的?

    视频编码包括什么,视频编解码器是如何工作的?我们将在下面深入挖掘,并涵盖我们的流媒体最佳视频编解码器列表。
    的头像 发表于 04-21 10:42 1497次阅读