0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从Satin到Lyra为什么微软、谷歌都盯向音频编解码器?

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2021-05-24 15:36 次阅读

回顾今年的2月份,可以说是音频编解码器最为热闹的一个月。先是微软宣布推出最新款由AI支持的音频编解码器——Satin。仅一周后,谷歌推出了用于语音压缩的新型超低比特率音频编解码器——Lyra,并且Android版本已开源。在此,也非常感谢来自国内音频领域的知名业内人士对本文发表评论及审校。

不难发现,硅谷大佬们对音频编解码器的深度研发进度已提上日程,对未来可应用的场景让人们充满期待。值得注意的是这两款音频编解码器都是基于AI的语音编码,但它们又有各自不同的特点。

Satin:用于实时通信的AI音频编解码器 作为一款由人工智能驱动的音频编解码器,Satin可以在网速6kbps时提供超宽频段的语音,17kbps时提供全频段的立体声音乐,网速越高,质量越高。

Satin旨在高丢包率下也提供良好的音频质量。此外,在冗余算法的改进下,可以应对突发丢包情况,提供更好的保护。以下是经过改进的弹性算法和Satin编解码器的最终效果: SILK@6kbps,突发数据包丢失(附加6kbps的冗余) Satin@6kbps,突发数据包丢失,改进的冗余算法(附加6kbps的冗余)

相对于Silk推出的超宽带语音,12kHz的频率,以24kHz的采样率(在人类声音超过12kHz的频率时,能量会迅速下降);Satin重新定义了超宽带,以覆盖16kHz的频率,采样率在32kHz,以提供更高的清晰度和稳定性,而其高效的压缩功能则可以实现6 kbps的超宽带语音。

4f0e8eb2-bc62-11eb-bf61-12bb97331649.png

/ t /一词在“ suit”一词中的频率分量。除了4 kHz的窄带截止甚至8 kHz的宽带截止以外,还有大量的能量。将能量保留在较高的频谱分量中会导致声音听起来更加自然。 以下分别为在6kbps下,Silk窄带和Satin超宽带的音频示例(建议使用耳机试听): 为了保证在6kbps超宽带下的语音质量,Satin使用对语音产生、建模和心理声学的深度理解来提取和编码信号的稀疏表达。

为了进一步降低所需的比特率,Satin只在较低的频带中编码和传输某些参数。在解码器上,Satin使用深层神经网络从接收到的低频带参数以及通过导线发送的最少量辅助信息中估计高频带参数。 虽然这种方法解决了在超低比特率下对使用超宽带语音的最大挑战,但也带来了计算复杂度的新挑战。对此,微软将重心放在对算法优化和循环向量化等技术上,使计算复杂度降低40%,并保障能够在所有用户的设备上运行。

4f31376e-bc62-11eb-bf61-12bb97331649.png

除此之外,微软还关注到了关于Satin的丢包数据恢复能力。对此,Satin对每个数据包进行独立编码,因此丢失一个数据包的效果不会影响后续数据包的质量。编解码器还被设计为有助于在内部参数域中隐藏高质量的丢包。这些功能可帮助Satin无缝处理随机丢失,一次丢失一个或两个数据包。

目前,Satin已被用于所有Teams和Skype两方通话,并将很快用于Teams会议。目前,它以6-36 kbps的比特率范围在宽带语音模式下运行,并且在不久的将来将扩展为以48 kHz的最大采样率支持全频带立体声音乐。

Lyra:一款用于语音压缩的新型超低比特率编解码器 Lyra是由谷歌团队研发并已开源了Android版本。它所拥有的能力在于能在3kbps网络带宽下为用户提供自然清晰的语音聊天,以及仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。(有关Lyra的详细介绍请浏览:在3kbps的带宽下还能清晰地语音聊天?)

对比Satin & Lyra:虽然这两个音频编解码器都能够在低比特率下进行操作,并通过AI提供动力,但它们有很大的不同。Lyra仅专注于窄带,而Satin则致力于超宽带。 另外,国内音频领域的知名业内人士指出:“在AI Codec领域中,有两种方式。一种是 end to end 也就是全AI,所以Lyra属于全AI结构

。而另一种是hybird结构,就是只有部分模块才使用AI,因此Satin是hybird结构。那么之所以现在才使用AI与音频编解码器结合,是因为在相同码率下,使用AI能够大幅提升音频质量。”

相关链接: https://mp.weixin.qq.com/s/Y1wceNAuMO7X8Vq3NiJ_GQ https://techcommunity.microsoft.com/t5/microsoft-teams-blog/satin-microsoft-s-latest-ai-powered-audio-codec-for-real-time/ba-p/2141382 https://bloggeek.me/lyra-satin-webrtc-voice-codecs/

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 宽带
    +关注

    关注

    4

    文章

    970

    浏览量

    59592
  • 数据
    +关注

    关注

    8

    文章

    6511

    浏览量

    87600
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264045
  • 音频编解码器

    关注

    4

    文章

    118

    浏览量

    55698

原文标题:从Satin到Lyra 为何微软、谷歌都盯向音频编解码器?

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    集成电源管理和音频编解码器TPS65950数据表

    电子发烧友网站提供《集成电源管理和音频编解码器TPS65950数据表.pdf》资料免费下载
    发表于 03-06 11:15 0次下载
    集成电源管理和<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>TPS65950数据表

    TPS65920和TPS65930集成电源管理/音频编解码器数据表

    电子发烧友网站提供《TPS65920和TPS65930集成电源管理/音频编解码器数据表.pdf》资料免费下载
    发表于 03-06 10:55 0次下载
    TPS65920和TPS65930集成电源管理/<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>数据表

    视频编解码器-晶振应用选型方案简介

    随着科技的日新月异,视频编解码技术也将迎来新的发展机遇,5G网络的普及将进一步提升视频传输速度和质量,为视频编解码器的发展提供更广阔的空间。
    的头像 发表于 12-09 10:55 466次阅读
    视频<b class='flag-5'>编解码器</b>-晶振应用选型方案简介

    使用具备SigmaDSP内核的编解码器是否必须载入SigmaDSP程序才能使用?

    目前预计使用ADAU1761连接两个MEMS数字麦克风, ADAU1761与ADAU1361相比, ADAU1761多了SigmaDSP内核. 使用具备SigmaDSP内核的编解码器是否必须
    发表于 11-30 07:31

    密勒调制副载波编解码器的FPGA实现

    电子发烧友网站提供《密勒调制副载波编解码器的FPGA实现.pdf》资料免费下载
    发表于 10-26 11:10 0次下载
    密勒调制副载波<b class='flag-5'>编解码器</b>的FPGA实现

    基于VHDL语言的HDB3码编解码器设计

    电子发烧友网站提供《基于VHDL语言的HDB3码编解码器设计.doc》资料免费下载
    发表于 10-13 09:22 0次下载
    基于VHDL语言的HDB3码<b class='flag-5'>编解码器</b>设计

    如何在嵌入式系统中使用音频编解码器更轻松地优化音频性能?

    作者:Jacob Beningo 许多设计人员在其基于微控制器的嵌入式系统设计中加入了音频编解码器,以提供高保真音频。但在这样做之前,他们必须弄清楚如何对其应用进行音频
    的头像 发表于 10-03 14:34 615次阅读
    如何在嵌入式系统中使用<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>更轻松地优化<b class='flag-5'>音频</b>性能?

    使用STM32L1xx微控制器与外部I2S音频编解码器播放音频文件

    电子发烧友网站提供《使用STM32L1xx微控制器与外部I2S音频编解码器播放音频文件.pdf》资料免费下载
    发表于 09-21 11:30 2次下载
    使用STM32L1xx微控制器与外部I2S<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>播放<b class='flag-5'>音频</b>文件

    ES8336低功耗音频编解码器规格书

    ES8336低功耗音频编解码器规格书
    发表于 06-13 18:13 3次下载

    ES8388音频编解码器规格书

    ES8388是一种高性能、低功率和低成本音频编解码器。它由2路ADC、2路DAC、3路DAC组成,耳机麦克风放大器放大器、数字音效,以及模拟混频和增益功能。该设备使用高级多位Δ-∑调制技术在数字和模拟多位delta-sigma调制器使该设备对时钟抖动的低灵敏度和低带外噪声
    发表于 06-13 18:11 7次下载

    如何获得ESP8266上的opus编解码器

    我想要 ESP8266 上的 opus 编解码器(尤其是解码器),因为 128 kbps 应该足够用便宜的 I2S DAC 来传输音频。我认为这非常重要,因为 opus 可以让人们
    发表于 06-12 06:54

    imx8mp - wm8962编解码器音频的问题求解

    我的音频编解码器 - WM8962 有问题。 我在自己的平台上工作,以 imx8mp-devkit 为模型。 图表: 将设备添加到设备树: reg_audio_pwr: 调节
    发表于 06-09 07:50

    如何将多个AK5554编解码器与i.MX8MN SAI线集成?

    我目前正在从事一个项目,涉及在 i.MX8MN 平台上将两个 AK5554 编解码器与同一条 SA5I 线路集成。我的目标是以这样一种方式配置系统,使其有效地充当八个音频通道,所有通道连接到正确
    发表于 05-18 06:15

    phycore iMX8Mplus如何将WM8960音频编解码器与其集成?

    我们正在开发 phycore i MX 8M plus,我们正在尝试将WM8960 音频编解码器与其集成。 我们已经添加了我们的 dts 文件,我们也能够生成 dtb 文件,但是生成的 dtb 文件
    发表于 05-17 08:06

    TLV320AIC3100音频编解码器启动问题求解

    嗨,团队,我们正在研究 IXM8MM 定制板。我们使用带有 imx8mm 和 Android 11 代码库的 tlv320aic3100 音频编解码器。面临一些与MCLK相关的问题。当我尝试播放音频
    发表于 05-17 08:03