0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

比MP3小10倍,Meta公开全新音频压缩技术

OSC开源社区 来源:OSC开源社区 作者:OSC开源社区 2022-11-07 11:39 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Meta 近日在一篇题为 “High Fidelity Neural Audio Compression”(高保真神经音频压缩)的论文中公布了一项名为 "EnCodec" 的开源音频压缩技术,该技术由 AI 驱动,可以在音频质量没有损失的前提下,将音频压缩到比 MP3 格式还要小 10 倍的程度。

bc8c974c-5dd1-11ed-a3b6-dac502259ad0.jpg

Meta 将这项技术的实现方法分成了一个由三部分组成的系统,经过训练后的 AI 可以将音频压缩到所需的目标大小,其实现过程如下:

首先,编码器将未压缩的数据转换为较低帧率的 "latent space" 表示(representation);

然后,量化器将这个表示压缩到目标大小,同时跟踪最重要的信息,这些信息以后将被用于重建原始信号(这个压缩信号将通过网络发送或保存在磁盘上);

最后,解码器使用单个 CPU 上的神经网络将压缩的数据实时地转变回音频;

至于应用,Meta 表示这种由人工智能驱动的 "超压缩音频" 可以在恶劣的网络条件下获得更快、更优质的通话效果。作为一家 “梭哈” 元宇宙的公司,这项技术还可以提供更加丰富的元宇宙体验(视频会议、影音流媒体、VR 游戏等),而不需要提高带宽。 除了语音通话,这项技术同样可以应用于音乐领域,未来我们有望可以获得高品质、小体积的音频文件。 目前这项技术仍处于研究阶段,源代码和一些音频样本都已公开在 GitHub 上:https://github.com/facebookresearch/encodec

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49785

    浏览量

    261934
  • Meta
    +关注

    关注

    0

    文章

    316

    浏览量

    12361

原文标题:比MP3小10倍,Meta公开全新音频压缩技术

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MP3010M - EV 10变焦模组

    在无人机航拍技术快速发展的当下,一款合适的摄像机模组对提升航拍效果十分关键。MP3010M - EV 10变焦摄像机模组,凭借自身特性,在无人机航拍领域展现出独特价值。
    的头像 发表于 11-14 10:52 495次阅读

    广州唯创电子WT2003H MP3语音芯片方案:强大、灵活且易于集成的高性能音频解决方案

    配置和简便的集成方式,为各行业提供了一套完善的高品质声音播报芯片解决方案。强大音频处理能力,满足多元应用场景WT2003H语音芯片支持MP3和WAV两种主流音频格式
    的头像 发表于 10-27 08:33 189次阅读
    广州唯创电子WT2003H <b class='flag-5'>MP3</b>语音芯片方案:强大、灵活且易于集成的高性能<b class='flag-5'>音频</b>解决方案

    多封装长录音:WT2003H系列MP3录音芯片满足全场景音频需求

    系列MP3录音芯片在8K采样率下支持最长达70秒的连续录音,这一时长指标在同类产品中表现优异。通过优化的存储架构和高效的压缩算法,芯片在保证语音清晰度的同时,实现了
    的头像 发表于 10-16 09:12 589次阅读
    多封装长录音:WT2003H系列<b class='flag-5'>MP3</b>录音芯片满足全场景<b class='flag-5'>音频</b>需求

    广州唯创WT2003H录音芯片-高精度ADC/DAC+64mA驱动MP3音频芯片

    一、产品概述:WT2003H系列MP3录音芯片的技术优势1.1芯片定位与市场价值广州唯创电子作为国内领先的语音IC厂家,推出的WT2003H系列MP3音频芯片集高精度信号处理和强大驱动
    的头像 发表于 10-16 09:03 259次阅读
    广州唯创WT2003H录音芯片-高精度ADC/DAC+64mA驱动<b class='flag-5'>MP3</b><b class='flag-5'>音频</b>芯片

    广州唯创电子WT2003Hx高品质MP3语音芯片:重塑智能设备音频体验

    32位处理器与工业级品质的完美结合,为智能设备注入卓越音频性能在智能化浪潮席卷各行各业的今天,音频体验已成为衡量智能设备品质的重要标准。广州唯创电子推出的高品质MP3音频解码语音芯片W
    的头像 发表于 09-29 09:27 390次阅读
    广州唯创电子WT2003Hx高品质<b class='flag-5'>MP3</b>语音芯片:重塑智能设备<b class='flag-5'>音频</b>体验

    Waytronic广州唯创电子 MP3语音芯片:现代智能设备的音频解决方案

    高品质音频与低功耗设计的完美结合,为智能设备注入声音灵魂在智能化浪潮席卷全球的今天,语音交互已成为人机互动的重要方式。MP3语音芯片作为高度集成的音频处理解决方案,正以其出色的性能和创新技术
    的头像 发表于 09-23 08:41 362次阅读
    Waytronic广州唯创电子 <b class='flag-5'>MP3</b>语音芯片:现代智能设备的<b class='flag-5'>音频</b>解决方案

    广州唯创电子WT2605C音频蓝牙MP3语音芯片:楼宇对讲门铃的智能“声”力军

    在智慧社区与智能家居深度融合的浪潮中,楼宇对讲门铃已从单纯的通话工具,进化为社区安防与智慧生活的关键入口。广州唯创电子推出的WT2605C-L011音频蓝牙MP3语音芯片,凭借其强大的多模通信与智能
    的头像 发表于 08-05 08:45 2691次阅读
    广州唯创电子WT2605C<b class='flag-5'>音频</b>蓝牙<b class='flag-5'>MP3</b>语音芯片:楼宇对讲门铃的智能“声”力军

    新品|Unit AudioPlayer,支持 MP3/WAV 播放的音频播放单元

    UnitAudioPlayer是一款自带MP3解码功能的音频播放单元,内置高性能音频解码芯片N9301,自带microSD卡座。该产品采用UART通信接口,用户可通过配置指令实现音频
    的头像 发表于 06-20 15:59 734次阅读
    新品|Unit AudioPlayer,支持 <b class='flag-5'>MP3</b>/WAV 播放的<b class='flag-5'>音频</b>播放单元

    请问k230如何读取sd卡并播放其中的mp3音频,他有库支持吗?

    k230如何读取sd卡并播放其中的mp3音频,他有库支持吗?
    发表于 06-04 06:24

    芯资讯|广州唯创电子语音芯片U盘MP3播放IC技术解析与应用指南

    ,在语音芯片领域积累了深厚的技术实力。唯创电子的核心创新之一是其支持U盘直读的MP3语音芯片系列,这些芯片解决了传统语音芯片需要专用工具更新语音内容的痛点,为用户提
    的头像 发表于 05-30 09:17 559次阅读
    芯资讯|广州唯创电子语音芯片U盘<b class='flag-5'>MP3</b>播放IC<b class='flag-5'>技术</b>解析与应用指南

    芯资讯|广州唯创电子MP3语音芯片IC的音频解码方式解析

    格式支持、技术特性及应用场景三方面,解析其解码方案的设计逻辑与优势。一、音频解码格式的支持MP3播放类芯片的主流解码能力唯创电子的MP3语音芯片(如WT2003H系列)
    的头像 发表于 05-28 08:48 586次阅读
    芯资讯|广州唯创电子<b class='flag-5'>MP3</b>语音芯片IC的<b class='flag-5'>音频</b>解码方式解析

    KT142C语音芯片支持的语音文件格式什么?Mp3还是wav呢?

    真没有必要 2、如果客户强烈需要,我们也是可以添加的。但是KT142C内置的宝贵可用空间就变少了 3、因为同等音质、同等时长的mp3文件,wav文件体积小很多很多。 所以优先压缩
    的头像 发表于 02-17 11:07 821次阅读
    KT142C语音芯片支持的语音文件格式什么?<b class='flag-5'>Mp3</b>还是wav呢?

    学习机MP3语音芯片方案:WMV硬解码芯片,N9301-316

    在当今数字化时代,学习机已不再仅仅是静态的物品。随着技术的快速发展和不断探索创新方法,人们将音乐与互动学习相融合,为儿童创造出更加富有创意和学习机产品。其中,九芯电子N9301系列MP3解码芯片
    的头像 发表于 02-07 18:31 818次阅读
    学习机<b class='flag-5'>MP3</b>语音芯片方案:WMV硬解码芯片,N9301-316

    KT148A语音芯片一个mp3语音,有办法分成一段一段的吗

    第一步:生成语音素材:到这一步,就实现了语音素材的生成,下载下来就是一整个mp3文件 详见KT148A资料包里面的文档说明 第二步:将需要的语音素材剪裁 使用的是Adobe
    的头像 发表于 01-22 16:11 886次阅读
    KT148A语音芯片一个<b class='flag-5'>mp3</b>语音,有办法分成一段一段的吗

    将基于PC的MP3播放器软件移植到ADSP-21262 SHARC处理器上

    电子发烧友网站提供《将基于PC的MP3播放器软件移植到ADSP-21262 SHARC处理器上.pdf》资料免费下载
    发表于 01-03 14:54 0次下载
    将基于PC的<b class='flag-5'>MP3</b>播放器软件移植到ADSP-21262 SHARC处理器上