0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅析Lyra音频编解码器Android开源版本

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2021-04-08 16:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最新消息:Google于今日发布了Lyra音频编解码器Android开源版本。

据悉,开源发布的Lyra代码是用C++编写的,以提高速度、效率和互操作性,使用了带有Abseil的Bazel构建框架和GoogleTest框架进行全面的单元测试。

前不久,Google推出的Lyra音频编解码器——是一种用于语音压缩的新型超低比特率编解码器。其在于能给在每秒3kb的网络宽带为用户提供自然清晰的语音聊天,还可在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。(有关Lyra的详细介绍请浏览:在3kbps的带宽下还能清晰地语音聊天?)

对此,我们查阅了Google的官方Lyra推送文章,浏览了文中所载的相同视频分别在原版、Opus@6kbps和Lyra@3kbps带宽下的音频质量对比(如下所示)。通过浏览对比,可以明确感知到Lyra在3kbps带宽情况下,虽然比特率降低为Opus的一半,但其音频的输出质量却优于Opus。我们着实被Lyra的音频输出质量所惊艳。

因此我们联系到了负责Lyra音频编解码器研发工作的产品经理Jamieson Brettle以及主管工程师Jan Skoglund进行了一次邮件采访。虽然仅是一次简短的采访,但是从字里行间中可以看出谷歌团队对Lyra音频编解码器的音频生成质量充满了信心。

以下内容由LiveVideoStack与Jamieson和Jan的采访整理而成。

Q 、Lyra是如何做到在比特率低到3kbps的情况下,依然能输出高质量的语音?

首先,Lyra的目的并不是传输语音信号本身,而是提取少量的关键特征,使得模型可以利用这些特征来合成语音。这些特征可以被高度压缩,但不会失去产生高质量语音的能力。

Lyra是用于产生语音信号的,当输入信号中存在语音时,该模型可以很好地进行语音再生。

Q 、Lyra为什么以3kbps为节点?

其实,我们的目标是在传输语音时尽可能地少用数据,并且即使在最恶劣的网络条件下也能进行实时通信。我们也都知道虽然Opus能以6kbps这么低的速率满足在2G网络上进行通信,但是其音频质量却下降了。

而我们对Lyra进行了调整,使其能够在一半的数据(3kbps)下工作,同时在这个非常低的比特率下可以提供比Opus更高的音频质量,并且能够运行在我们的目标设备上。

Q 、Lyra目前的应用范围与具体的应用场景有哪些?

目前,我们专注于确保即使在最糟糕的网络状况下Lyra也能让用户进行高质量的端对端语音通话。

Q 、Lyra的下一步计划是什么?

Lyra的下一步计划是为Android开发一个开源的编解码器,并且我们将开始关注更多的操作系统和硬件目标。我们相信,我们所做的研究作为下一代音频编解码器的基石,可以应用于比实时语音更多的用例。

由此可以看出,Lyra的目标是帮助那些所处网络状态恶劣,2G网络或有线拨号连接的用户提供高质量的语音通话,以满足用户对语音通话的最基本需求。除此之外,据悉Google团队还提出Lyra与AV1相结合,将比VP9的编码效率提高了约40%,并且用户可以通过56kbps的拨号调制解调器连接到互联网实现视频聊天。

但是有媒体也对此提出了质疑:AV1与Lyra的组合对于使用2G网络的手机用户来说是行不通的,因为这类手机无法支持AV1所需的处理。

对此,Google Lyra项目的相关负责人也有回应:Lyra并不要求用户使用的一定是5G智能手机,只是需要有一定计算能力的智能手机。在很多发展中国家市场,我们注意到,这几年即使是中低端手机的计算力也在快速提升。

另外,负责人还提到:在很多欧美市场即使是服务商无限制的数据计划,用户通常每个月只有1GB或2GB的高速数据,之后的网络速度一般会降到64kbps-128kbps, Lyra和AV1对这些用户也会有非常有价值。

对此,仅个人认为:有争议也好,有质疑也罢。对于一个新产品来说都需要经历时间与实践的打磨和积累,用户的使用反馈,才能不断提升。所以不要急,现在Lyra开源只是刚刚开始,我们还会持续关注。
编辑:lyn

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Android
    +关注

    关注

    12

    文章

    3988

    浏览量

    133162
  • Google
    +关注

    关注

    5

    文章

    1801

    浏览量

    60283
  • 音频编解码器

    关注

    4

    文章

    155

    浏览量

    56665

原文标题:Google Lyra Android版开源 支持3kbps语音聊天

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于E203 RISC-V的音频信号处理系统 -CODEC(音频编解码器)配置

    CODEC介绍 本设计采用的音频编解码器是WM8731,该编解码器可以通过I2C进行寄存配置,可以调节主从模式、数据位数可设置为16bit、24bit、32bit。可以设置的传输模
    发表于 10-28 06:29

    集成了32位RISC处理和SPDIF音频接口的音频编解码

    音频编解码器的工作原理主要涉及将音频信号转换为数字格式并进行压缩处理,以实现高效存储和传输。
    的头像 发表于 10-11 09:52 520次阅读
    集成了32位RISC处理<b class='flag-5'>器</b>和SPDIF<b class='flag-5'>音频</b>接口的<b class='flag-5'>音频</b><b class='flag-5'>编解码</b>

    新唐科技推出低延迟音频编解码器NAU88L21C

    Audio CODEC (Audio Coder-Decoder) 是音频编解码器”,主要功能是进行音频信号的编码(压缩)和解码(解压)。在音频
    的头像 发表于 09-30 09:25 5682次阅读
    新唐科技推出低延迟<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>NAU88L21C

    增强T-BOX设计,新唐编解码器的重要作用

    。 T-BOX音频架构: T-BOX 音频架构的主要特点包括: 独立电源管理系统 双麦克风音频处理 编解码器、D类音频放大器和车载信
    发表于 09-05 06:26

    如何使用 M487 微控制和外部音频编解码器NAU88L25将 AMR 格式的声音录制到 MicroSD 卡中?

    使用 M487 微控制和外部音频编解码器NAU88L25将 AMR 格式的声音录制到 MicroSD 卡中
    发表于 08-20 06:28

    一款低功耗、高质量的24位立体声编解码器-CJC8972

    24位立体声编解码器通过数字信号处理实现高精度音频编码与解码,核心在于对立体声信号的数字化处理及还原。
    的头像 发表于 08-07 09:22 1046次阅读
    一款低功耗、高质量的24位立体声<b class='flag-5'>编解码器</b>-CJC8972

    Texas Instruments TAC5x42接口编解码器数据手册

    Texas Instruments TAC5x42接口编解码器包括低功耗立体声音频模数转换 (ADC) 和音频数模转换器 (DAC),集成了丰富的功能。这些支持时分复用 (TDM)、
    的头像 发表于 07-14 14:43 586次阅读
    Texas Instruments TAC5x42接口<b class='flag-5'>编解码器</b>数据手册

    Texas Instruments TAC5311-Q1汽车单声道音频编解码器数据手册

    Texas Instruments TAC5311-Q1汽车单声道音频编解码器是一款低功耗单声道编解码器,具有10V~RMS ~差分输入、104dB ADC和2V~RMS~ 差分输出、114dB
    的头像 发表于 07-09 15:35 704次阅读
    Texas Instruments TAC5311-Q1汽车单声道<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>数据手册

    CYW20721内置的所有编解码器类型有哪些?

    您能告诉我们 CYW20721 内置的所有编解码器类型吗? LDAC、LC3(LE 音频)、AAC、SBC 等。
    发表于 06-27 08:03

    AI玩具爆发,音频编解码器如何满足语音交互需求

    电子发烧友网综合报道,在AI玩具已经开始逐渐爆发的当下,人机交互已经成为标配功能,而最重要的便是语音控制。而语音控制的第一步,便需要让AI玩具听懂你在说什么这就需要用到音频编解码器。   音频
    的头像 发表于 06-20 01:07 6941次阅读

    TWL6040 用于便携式应用的 8 通道高质量低功耗音频编解码器数据手册

    TWL6040 设备是具有高集成度的音频编码/解码器编解码器),可为便携式应用程序提供模拟音频编解码
    的头像 发表于 04-27 17:52 776次阅读
    TWL6040 用于便携式应用的 8 通道高质量低功耗<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>数据手册

    TWL6041 用于便携式应用的 8 通道高质量低功耗音频编解码器数据手册

    TWL6041 是一种具有高集成度的音频编解码器,为便携式应用程序提供模拟音频编解码器功能,如 所示。该设备包含多个音频模拟输入和输出,以及
    的头像 发表于 04-27 14:55 813次阅读
    TWL6041 用于便携式应用的 8 通道高质量低功耗<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>数据手册

    EE-212:将AD74111单声道音频编解码器评估板连接到ADSP-21161N SHARC® EZ-KIT Lite板

    电子发烧友网站提供《EE-212:将AD74111单声道音频编解码器评估板连接到ADSP-21161N SHARC® EZ-KIT Lite板.pdf》资料免费下载
    发表于 01-08 14:27 0次下载
    EE-212:将AD74111单声道<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>评估板连接到ADSP-21161N SHARC® EZ-KIT Lite板

    国芯思辰| 单声道音频编解码器SC2601应用于录音笔,替换ES8311

    国芯思辰| 单声道音频编解码器SC2601应用于录音笔,替换ES8311
    的头像 发表于 01-07 10:33 1139次阅读
    国芯思辰| 单声道<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>SC2601应用于录音笔,替换ES8311

    TLV320AIC28音频编解码器评估模块

    电子发烧友网站提供《TLV320AIC28音频编解码器评估模块.pdf》资料免费下载
    发表于 12-20 16:02 0次下载
    TLV320AIC28<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>评估模块