0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种用于音乐源分离的新型深度学习系统

倩倩 来源:互联网分析沙龙 2020-03-22 15:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Facebook Research最近发布了Demucs,这是一种用于音乐源分离的新型深度学习系统。根据人类对分离后声音总体质量的评估,Demucs的性能优于先前报道的结果。

音乐源分离是经过大量研究的一种应用,称为盲源分离。该过程包括在不借助元信息的情况下从一组混合信号中分离出一组源信号。对于音乐,各个组成部分可能包括人声或其他乐器轨道。当空中交通管制员开始在单个扬声器上听到多个飞行员的混合声音时出现问题时,源分离领域首先受到了广泛关注。这导致英国科学家科林·切里(Colin Cherry)在1953年将这种效应称为“鸡尾酒会问题”。

在源分离领域的现有研究的推动下,研究科学家于2000年代初开始使用AI分离音乐中的声音。如今,短时傅立叶变换产生的频谱图(STFT)是最新音乐源分离的核心。这些系统在每个帧和每个源的幅度谱上产生一个掩码,并且通过在掩码频谱图上运行逆STFT的同时重新使用输入混合相位,来生成输出音频

建立在频谱图分析基础上的系统在诸如中音钢琴或连奏小提琴之类的乐器的源分离方面表现出色,因为它们可以产生一致的频率和振铃。但是,这些系统很难隔离敲击声音,因为敲击乐器所产生的残留噪声会产生更宽的频率范围,并且当与多个乐器的重叠相结合时,信息就会丢失,并且掩盖操作将使信息不再可逆。

Demucs是一种深度学习模型,可直接对原始输入波形进行操作并为每个源生成一个波形。U-net体系结构使用卷积编码器和解码器,该解码器和解码器基于跨步卷积较大的步幅。波形模型的工作方式与常见的计算机视觉模型相似,因为它们都使用神经网络在推断更高级别的模式之前先检测基本模式。

基于频谱图的模型优于Wave-U-Net,后者是Demucs之前最先进的基于波形的模型。Demucs建立在Wave-U-Net体系结构的基础上,具有可调整的超参数和较长的短期内存,允许网络处理整个数据序列,而不是单个数据点。

这些改进帮助系统解决了一个声音超过另一个声音的问题,因为解码器足够聪明,可以填充柔和的音符。

人类在MusDB数据集上评估Demucs,并将其与其他最新的源分离系统的结果进行比较。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 傅立叶变换
    +关注

    关注

    3

    文章

    105

    浏览量

    33145
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123912
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    网荷储:构建新型电力系统的核心引擎

    在“双碳”目标引领与能源结构转型的关键节点,新型电力系统正从概念走向实践,其核心特征表现为“清洁低碳、安全高效、柔性互动”。而网荷储体化系统
    的头像 发表于 11-17 16:11 986次阅读
    <b class='flag-5'>源</b>网荷储:构建<b class='flag-5'>新型</b>电力<b class='flag-5'>系统</b>的核心引擎

    的MCU最小封装是哪一种?有QFN的封装嘛?

    的MCU最小封装是哪一种?有QFN的封装嘛?
    发表于 11-14 07:57

    自动驾驶中Transformer大模型会取代深度学习吗?

    [首发于智驾最前沿微信公众号]近年来,随着ChatGPT、Claude、文心言等大语言模型在生成文本、对话交互等领域的惊艳表现,“Transformer架构是否正在取代传统深度学习”这
    的头像 发表于 08-13 09:15 3922次阅读
    自动驾驶中Transformer大模型会取代<b class='flag-5'>深度</b><b class='flag-5'>学习</b>吗?

    一种用于动态环境的实时RGB-D SLAM系统

    了UP-SLAM,这是一种用于动态环境的实时RGB-D SLAM系统。实验结果表明,UP-SLAM在定位精度方面(高出59.8%)和渲染质量方面(峰值信噪比高出4.57分贝)均优于最先进的方法,同时保持实时性能,并在动态环境中
    的头像 发表于 07-04 15:14 983次阅读
    <b class='flag-5'>一种</b>适<b class='flag-5'>用于</b>动态环境的实时RGB-D SLAM<b class='flag-5'>系统</b>

    宽调速范围低转矩脉动的一种新型内置式永磁同步电机的设计与分析

    摘要:宽调速范围与低转矩脉动直是设计电动汽车用内置式永础同步电机时所追求的重要目标。设计了一种转子结构为胃的新型内置式永础同步电机,并进行了绕组结构优化与性能分析。利用有限元分析法,将所设计的电机
    发表于 06-06 14:13

    音乐盒芯片方案——N9305音乐芯片

    音乐盒芯片方案开发音乐盒,作为一种融合艺术与机械智慧的精巧物件,散发着独特魅力。它以灵动的音符为载体,承载着人们的情感、回忆与祝福。从孩童手中开启梦幻世界的木质八音盒,到恋人间传递爱意的精致
    的头像 发表于 06-05 15:29 634次阅读
    <b class='flag-5'>音乐</b>盒芯片方案——N9305<b class='flag-5'>音乐</b>芯片

    一种新型宽带鞭状套筒天线

    电子发烧友网站提供《一种新型宽带鞭状套筒天线.pdf》资料免费下载
    发表于 05-28 14:05 0次下载

    一种新型激光雷达惯性视觉里程计系统介绍

    针对具有挑战性的光照条件和恶劣环境,本文提出了LIR-LIVO,这是一种轻量级且稳健的激光雷达-惯性-视觉里程计系统。通过采用诸如利用深度与激光雷达点云关联实现特征的均匀深度分布等先进
    的头像 发表于 04-28 11:18 804次阅读
    <b class='flag-5'>一种</b><b class='flag-5'>新型</b>激光雷达惯性视觉里程计<b class='flag-5'>系统</b>介绍

    一种新型直流电机控制器

    以前控制直流电机多由单片机完成。该方式缺点是接口繁琐、速度慢,且不易在高温、高压等恶劣环境下工作[1]。采用一种新型直流电机控制器——DSP 控制器解决了单片机控制的缺点,其具备很多优点,该控制器
    发表于 03-25 15:25

    BP神经网络与深度学习的关系

    ),是一种多层前馈神经网络,它通过反向传播算法进行训练。BP神经网络由输入层、个或多个隐藏层和输出层组成,通过逐层递减的方式调整网络权重,目的是最小化网络的输出误差。 二、深度学习
    的头像 发表于 02-12 15:15 1348次阅读

    一种新型半导体光放大器设计(1)

    我们介绍了一种具有高增益(> 40 dB)和高饱和功率(> 21 dBm)的半导体光学放大器(SOA)芯片,其驱动电流适中(1.3 A)。本文提出了用于优化新型双段SOA概念
    的头像 发表于 02-10 14:12 907次阅读
    <b class='flag-5'>一种</b><b class='flag-5'>新型</b>半导体光放大器设计(1)

    一种新型的非晶态NbP半金属薄膜

    来自斯坦福大学和韩国Ajou大学的科学家们在《Science》杂志上发表了项开创性的研究成果。他们发现了一种新型的非晶态NbP半金属薄膜,其电阻率随着薄膜厚度的减小而显著降低,这
    的头像 发表于 02-07 10:08 1143次阅读
    <b class='flag-5'>一种</b><b class='flag-5'>新型</b>的非晶态NbP半金属薄膜

    新型电力革命:网荷储联动引领未来--安科瑞张田田

    、概述 在探索新型电力系统的道路上,网荷储联动成为了一种必然选择。这种新型电力
    的头像 发表于 01-06 14:17 812次阅读
    <b class='flag-5'>新型</b>电力革命:<b class='flag-5'>源</b>网荷储联动引领未来--安科瑞张田田

    文读懂网荷储体化、虚拟电厂、微电网三业务之间的关系

    的,接下来我们从以下几个方面来剖析下三类业务之间的关系。 、定义 1. 网荷储体化        网荷储体化是
    的头像 发表于 12-20 11:24 2456次阅读
    <b class='flag-5'>一</b>文读懂<b class='flag-5'>源</b>网荷储<b class='flag-5'>一</b>体化、虚拟电厂、微电网三<b class='flag-5'>种</b>业务之间的关系

    一种新型高效率的服务器电源系统

    一种新型高效率的服务器电源系统
    发表于 12-19 16:45 1次下载