搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

让音乐更柔和 MIT用AI过滤音源

一般利用均衡器可以将音乐中的低音部分调出来，但是麻省理工学院的计算机科学和人工智能实验室(Computer Science and Artificial Intelligence Lab，CSAIL)的研究人员发现了更好的解决方案。他们所研发的新系统 PixelPlayer，能够利用人工智能来区分和过滤声音，让音乐听起来更洪亮或更柔和。

将指定视频录入经过充分训练的 PixelPlayer，系统随机能够过滤伴奏，同时识别音源，接着计算图像中每个像素的音量，然后通过“空间定位”确定产生相似音波的片段。

今年9月，德国慕尼黑即将举行欧洲计算机视觉会议(European Conference on Computer Vision)，会议中要发表的一篇新论文则详细论述了“像素的声音(The Sound of Pixels)”。麻省理工学院计算机科学和人工智能实验室的博士生，同时也是这篇论文的合著者 Zhao Hang 同学表示，“最好的情况就是，我们能识别出哪种乐器发出怎样的声音。”

PixelPlayer 的核心是一种基于乐器组合多模态训练的神经网络，数据集采用了 Youtube 上 714 条未经修剪且未经标记的视频。其中，总时长为 60 小时的 500 条视频用于训练，剩余的则用于验证和测试。在训练过程中，研究人员分别根据原声吉他、大提琴、单簧管、长笛和其他乐器向系统馈入了算法。

这只是 PixelPlayer 多重机器学习框架的一个部分。经过训练后的视频分析算法将从剪辑帧中提取出视觉特征，这就是系统的第二个神经网络，即音频分析网络。音频分析网络将声音拆分为片段，并从中提取特征。最后，音频合成网络将把上述两个网络输出的特定像素和声波关联起来。

PixelPlayer 进行完全自监督的学习，人们无需对数据注释，而且系统目前已经能识别 20 种乐器。Zhao Hang 说，较大的数据集增强了系统的识别量，但识别乐器子类的能力却不佳。系统也可以识别音乐元素，例如小提琴的谐波频率。

研究人员认为 PixelPlayer 可以进行声音剪辑，或者帮助机器人理解动物、车辆和其他物体所制造的环境声音。他们写到，“我们希望我们的工作能够开辟新的研究途径，从视觉和听觉信号角度实现声源分离”。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4570

浏览量
98709
AI

AI

+关注

关注
87

文章
26409

浏览量
264011
MIT

MIT

+关注

关注
3

文章
253

浏览量
23247

原文标题：MIT实现用AI过滤音源让音乐更悦耳

文章出处：【微信号：worldofai，微信公众号：worldofai】欢迎添加关注！文章转载请注明出处。

评论

相关推荐

全球AI音乐会，第一次听见中国声音

全球AI音乐盛宴中，中国首个音乐AIGC SOTA 的独特旋律

的头像

发表于 04-19 11:01 •138次阅读

全球<b class='flag-5'>AI</b><b class='flag-5'>音乐</b>会，第一次听见中国声音

一键消原音智能AI芯片PTN1118芯片简介

PTN1118植入帕特纳微AI（SVS），实现将任意音源中人声部分消除，并在极大程度上保留伴奏，配合PTN 卡拉OK系列芯片，使传统音频设备更富娱乐性。支持模拟与数字输入输出，数字接口支持从模式人声消除深浅度可调（比如，保留

发表于 04-12 17:40

明星音乐人联手呼吁慎用AI取代艺术家

据官方披露，随着AI技术在音乐圈内不断扩张，音乐从业者的工作可能面临严峻挑战。因此，众星联合撰写了一份公开信，坚决反对这种可能威胁他们生的运用AI技术进行取代。

的头像

发表于 04-03 14:49 •284次阅读

FPGA让末日计算器PC1500焕发数码新春

FPGA如何让PC1500古董计算器实现vgm音乐格式播放以及国产全能语音芯片和国产全能音源芯片控制和编程。

发表于 12-01 13:46

3 数字麦阵列六向音源定位追踪 AR1105

音源

深圳德宇科技有限公司

发布于 :2023年10月20日 15:05:50

高通和腾讯音乐合作，首创QQ音乐“骁龙臻品音质”

今日，高通技术公司和腾讯音乐娱乐集团（TME）宣布展开合作并推出业界首创的“骁龙臻品音质”，利用骁龙移动平台强大的AI计算性能，在终端侧高效运行QQ音乐臻品音质AI模型算法，为用户带来

的头像

发表于 09-27 10:10 •676次阅读

高通和腾讯<b class='flag-5'>音乐</b>合作，首创QQ<b class='flag-5'>音乐</b>“骁龙臻品音质”

用51单片机DIY音乐频谱显示

该资源是手把手教你用51单片机DIY音乐频谱显示

发表于 09-27 07:42

Nvidia AI剑走偏锋；MIT水泥破局出奇

亲爱的朋友，欢迎收看河套IT WALK总第90期。 Nvidia的最新AI图像生成器Perfusion正在改变我们对图像生成的认知，而MIT的电化水泥技术为未来城市的能源解决方案提供了新的希望

的头像

发表于 08-02 19:50 •280次阅读

Nvidia <b class='flag-5'>AI</b>剑走偏锋；<b class='flag-5'>MIT</b>水泥破局出奇

N9300音乐芯片在婴儿安抚器中的功能与优势

。婴儿安抚器音乐芯片选型选择婴儿安抚器音乐芯片时，开发者需要考虑选择音质清晰、柔和、舒缓的芯片，以确保安抚音乐对婴儿的效果最佳，避免选择过于刺耳或嘈杂的

的头像

发表于 07-08 10:02 •354次阅读

N9300<b class='flag-5'>音乐</b>芯片在婴儿安抚器中的功能与优势

创造宝宝舒适睡眠环境：N9300音乐芯片在婴儿安抚器中的功能与优势

受新手妈妈的喜爱。婴儿安抚器音乐芯片选型选择婴儿安抚器音乐芯片时，开发者需要考虑选择音质清晰、柔和、舒缓的芯片，以确保安抚音乐对婴儿的效果最佳，避免选择过于刺耳或嘈杂的

的头像

发表于 07-07 17:25 •282次阅读

创造宝宝舒适睡眠环境：N9300<b class='flag-5'>音乐</b>芯片在婴儿安抚器中的功能与优势

MIT的射频讲义

大家好，这里是射频学堂。今天分享一份MIT的射频讲义：Receivers, Antennas,and Signals，来自于MIT David H. Staelin 教授。 MIT讲义

的头像

发表于 06-29 09:49 •365次阅读

<b class='flag-5'>MIT</b>的射频讲义

是否可以通过SoftAP模式将数据从MIT app发送到ESP8266？

顾名思义，是否可以通过SoftAP模式将数据从MIT app发送到ESP8266？我的想法是让用户使用 MIT 应用程序输入数据（在本例中为警报系统的日期和时间），然后该应用程序会将输入数据（日期

发表于 06-02 08:50

中国大模型为什么更关注产业？#AI技术 #大模型 #AI产业

ai技术

脑极体

发布于 :2023年05月30日 12:08:54

MIT app inventor是不是需要路由器或者WIFI网络才能加入？

我真的很难找到一种方法将我的手机连接到 wemos d1 mini 并读取传输的信息。我已经尝试过 Remotexy，这种方法有一些限制，我想知道是否有更简单的方法来做到这一点？ MIT app inventor好像需要路由器或者WIFI网络才能加入？

发表于 05-25 13:46

音乐分离AI模型研发成功，浪潮信息以AI算力服务助力

该音乐院校与浪潮信息密切合作，通过AI算力服务解决算力挑战。浪潮信息以高性能、高质量的AI算力服务协助用户进行音乐分离AI模型的研究开发，很

的头像

发表于 04-25 11:04 •1113次阅读

<b class='flag-5'>音乐</b>分离<b class='flag-5'>AI</b>模型研发成功，浪潮信息以<b class='flag-5'>AI</b>算力服务助力