0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google最新推出的音频编解码器Lyra

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2021-03-11 16:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Google最新推出的音频编解码器Lyra,不仅实现了以每秒3kb网络宽带提供听起来自然清晰的语音聊天,还可以在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。

2月25日,Google AI blog发布了一篇文章详细的介绍了最新推出的Lyra——一种用于语音压缩的新型超低比特率编解码器。该编解码器使Google Duo,以及未来的其他应用程序能够以每秒3kb的网络宽带提供听起来很自然清晰的语音聊天。

众所周知,人们对实时音视频的需求不断增加。特别是去年由于受到疫情的影响,许多人不得不隔离在家,只能与亲朋好友通过视频通话的方式保持联系。例如,仅去年一年Google Duo和Meet就承载了超过1万亿分钟的视频。而这些情况无疑是给全球的互联网基础设施带来了巨大的挑战。除此之外,虽然有些人可以使用一致的高质量,高速网络,但这种连接并不普遍。比如在网络通信并不发达的农村地区。然而,尽管在连接良好的地区,人们有时也会遇到质量差、带宽低的问题。那么如何在有限的带宽下实现高质量的音频输出就成为了目前最重要的议题。

Lyra音频编解码器

6e8f3e5c-7e1a-11eb-8b86-12bb97331649.png

因此,Google推出了一种高质量、低比特率的新型音频编解码器——Lyra。尽管用户在网速很慢的情况下,也能进行语音聊天。Lyra编解码器的基本结构体系非常简单,如上图所示。而Lyra与其他音频编解码器的不同之处在于:它利用机器学习模型,开发了一种新的模型,能够使用最少的数据来重建语音。这种模型不仅能够区分信号,还能生成全新的信号。与之相比,传统的参数编解码器只从语音中提取关键参数,然后用于在接收端重建信号。虽然实现低比特率,但得到的音频通常听起来很机械,不自然。而Lyra利用这些新的自然声生成模型,即能够保持参数编解码器的低比特率,同时又能实现高质量的音频输出。这与目前大多流媒体平台中使用的波形编解码器几乎不相上下。更重要的是,Lyra的效率足够高,可以在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。

与现有编解码器对比

Lyra目前被设计运行在3kbps情况下,听力测试表明,Lyra的表现优于任何其他编解码器。并且优于在相同8kbps情况下的Opus,从而实现了超过60%的带宽减少。Lyra可以在带宽条件不适合高比特率和现有的低比特率编解码器不能提供足够质量的情况下使用,这是它的一大优势,也是解决现在低音频质量的方案。

以下是Lyra与现有编解码器的对比:

在安静的环境下:

Original原始音频

Opus@6kbps

Lyra@3kbps

Speex@3kbps

在嘈杂的环境下:

Original原始音频

Opus@6kbps

Lyra@3kbps

Speex@3kbps

上方是Google提供的Lyra与Opus、Speex分别以6kbps和3kbps,对同一音频的压缩质量对比。能够明显感受到即使Lyra在3kbps情况下,自然语音音频的清晰程度也远优于Opus在6kbps下的情况。

适用情况

Google已经利用开源音频库对Lyra使用超过70种语言的扬声器进行了数千小时的音频培训,然后与专家和来自广泛的听众一起验证音频质量。Lyra在一个广泛的数据集中训练,包括大量不同语言的使用者,以确保编解码器能够应对各种情况。另外,Lyra还可以在云环境中使用,以方便使用各种网络和设备的用户能够无缝对接聊天。不仅如此,Google还将Lyra与新的视频压缩技术(例如AV1)配对后,即使用户通过56kbps拨号调制调节器连接到Internet,也可以进行视频聊天。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1801

    浏览量

    60283
  • 音频编解码器

    关注

    4

    文章

    155

    浏览量

    56665
  • 应用程序
    +关注

    关注

    38

    文章

    3342

    浏览量

    59977

原文标题:在3kbps的带宽下还能清晰地语音聊天?

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于E203 RISC-V的音频信号处理系统 -CODEC(音频编解码器)配置

    CODEC介绍 本设计采用的音频编解码器是WM8731,该编解码器可以通过I2C进行寄存配置,可以调节主从模式、数据位数可设置为16bit、24bit、32bit。可以设置的传输模
    发表于 10-28 06:29

    集成了32位RISC处理和SPDIF音频接口的音频编解码

    音频编解码器的工作原理主要涉及将音频信号转换为数字格式并进行压缩处理,以实现高效存储和传输。
    的头像 发表于 10-11 09:52 522次阅读
    集成了32位RISC处理<b class='flag-5'>器</b>和SPDIF<b class='flag-5'>音频</b>接口的<b class='flag-5'>音频</b><b class='flag-5'>编解码</b>

    新唐科技推出低延迟音频编解码器NAU88L21C

    Audio CODEC (Audio Coder-Decoder) 是音频编解码器”,主要功能是进行音频信号的编码(压缩)和解码(解压)。在音频
    的头像 发表于 09-30 09:25 5684次阅读
    新唐科技<b class='flag-5'>推出</b>低延迟<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>NAU88L21C

    增强T-BOX设计,新唐编解码器的重要作用

    。 T-BOX音频架构: T-BOX 音频架构的主要特点包括: 独立电源管理系统 双麦克风音频处理 编解码器、D类音频放大器和车载信
    发表于 09-05 06:26

    如何使用 M487 微控制和外部音频编解码器NAU88L25将 AMR 格式的声音录制到 MicroSD 卡中?

    使用 M487 微控制和外部音频编解码器NAU88L25将 AMR 格式的声音录制到 MicroSD 卡中
    发表于 08-20 06:28

    一款低功耗、高质量的24位立体声编解码器-CJC8972

    24位立体声编解码器通过数字信号处理实现高精度音频编码与解码,核心在于对立体声信号的数字化处理及还原。
    的头像 发表于 08-07 09:22 1046次阅读
    一款低功耗、高质量的24位立体声<b class='flag-5'>编解码器</b>-CJC8972

    Texas Instruments TAC5x42接口编解码器数据手册

    Texas Instruments TAC5x42接口编解码器包括低功耗立体声音频模数转换 (ADC) 和音频数模转换器 (DAC),集成了丰富的功能。这些支持时分复用 (TDM)、
    的头像 发表于 07-14 14:43 587次阅读
    Texas Instruments TAC5x42接口<b class='flag-5'>编解码器</b>数据手册

    Texas Instruments TAC5311-Q1汽车单声道音频编解码器数据手册

    Texas Instruments TAC5311-Q1汽车单声道音频编解码器是一款低功耗单声道编解码器,具有10V~RMS ~差分输入、104dB ADC和2V~RMS~ 差分输出、114dB
    的头像 发表于 07-09 15:35 705次阅读
    Texas Instruments TAC5311-Q1汽车单声道<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>数据手册

    CYW20721内置的所有编解码器类型有哪些?

    您能告诉我们 CYW20721 内置的所有编解码器类型吗? LDAC、LC3(LE 音频)、AAC、SBC 等。
    发表于 06-27 08:03

    AI玩具爆发,音频编解码器如何满足语音交互需求

    电子发烧友网综合报道,在AI玩具已经开始逐渐爆发的当下,人机交互已经成为标配功能,而最重要的便是语音控制。而语音控制的第一步,便需要让AI玩具听懂你在说什么这就需要用到音频编解码器。   音频
    的头像 发表于 06-20 01:07 6941次阅读

    TWL6040 用于便携式应用的 8 通道高质量低功耗音频编解码器数据手册

    TWL6040 设备是具有高集成度的音频编码/解码器编解码器),可为便携式应用程序提供模拟音频编解码
    的头像 发表于 04-27 17:52 777次阅读
    TWL6040 用于便携式应用的 8 通道高质量低功耗<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>数据手册

    TWL6041 用于便携式应用的 8 通道高质量低功耗音频编解码器数据手册

    TWL6041 是一种具有高集成度的音频编解码器,为便携式应用程序提供模拟音频编解码器功能,如 所示。该设备包含多个音频模拟输入和输出,以及
    的头像 发表于 04-27 14:55 813次阅读
    TWL6041 用于便携式应用的 8 通道高质量低功耗<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>数据手册

    EE-212:将AD74111单声道音频编解码器评估板连接到ADSP-21161N SHARC® EZ-KIT Lite板

    电子发烧友网站提供《EE-212:将AD74111单声道音频编解码器评估板连接到ADSP-21161N SHARC® EZ-KIT Lite板.pdf》资料免费下载
    发表于 01-08 14:27 0次下载
    EE-212:将AD74111单声道<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>评估板连接到ADSP-21161N SHARC® EZ-KIT Lite板

    国芯思辰| 单声道音频编解码器SC2601应用于录音笔,替换ES8311

    国芯思辰| 单声道音频编解码器SC2601应用于录音笔,替换ES8311
    的头像 发表于 01-07 10:33 1139次阅读
    国芯思辰| 单声道<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>SC2601应用于录音笔,替换ES8311

    TLV320AIC28音频编解码器评估模块

    电子发烧友网站提供《TLV320AIC28音频编解码器评估模块.pdf》资料免费下载
    发表于 12-20 16:02 0次下载
    TLV320AIC28<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>评估模块