0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个可以预测活页乐谱中和目标录音匹配度最高的的位置的AI系统

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2020-12-07 11:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

音乐AI技术正在快速发展。

在预印平台Arxiv.org上发布的一项研究中,约翰内斯·开普勒大学林茨计算感知研究所和奥地利人工智能研究所的研究人员介绍了一个可以预测活页乐谱中和目标录音匹配度最高的的位置的AI系统。表面上,其对齐精度高于当前基于图像的最新乐谱追踪器。

乐谱追踪技术是很多应用程序的基础。这些应用包括自动伴奏、翻页以及将现场表演与可视化图像同步等等。现有的系统要么依赖于固定长短的小片段乐谱图像,要么需要光学音乐识别技术所提取出的计算机可读的乐谱。但是这些研究人员的AI系统可以以独特的方式观察整页乐谱,从而从头到尾地追踪任意长度的音乐表演。

这个研究团队将乐谱追踪当作一种图像分割任务。根据特定时间的某个音乐表演,他们的系统针对当前正在播放的音乐相对应的乐谱预测分段蒙版(即小片段)。研究人员说,仅仅利用固定大小音频输入的乐谱追踪器无法在超过特定环境的情况下区分重复的音符,然而他们提出的AI系统在处理较长时间的乐谱时都不会有问题。

在实验过程中,研究人员们从多模型乐谱数据集(MSMD)中获取了一些复音钢琴样本,其中包括巴赫、莫扎特、贝多芬等多个作曲家的作品。在手动识别并且纠正一些对齐上的错误后,他们通过353对乐谱和MIDI音频信息训练了AI系统。

该AI系统的另一位作者说,除了最高的门槛以外(没搞懂highest threshold是啥),他们的系统拥有比基准线更高的性能,并能在时间差方面得出更精确的结果(即对于更严格的容错率,百分比更高)。它偶尔也会产生一些错误,研究人员将其归因于系统可能会在图像纸上 “大幅跳跃”。但是他们断言,种种试验结果都表明这个AI系统在大多数情况下都是“非常精确的”。

“未来的工作会需要对扫描图像或照片进行测试,以评估该AI系统在视觉领域的泛化能力。”研究人员写道,“成就功能更强大的系统的下一步是显式或隐式地结合某种机制来处理乐谱和演奏中重复的音符。尽管我们也怀疑其性能会很大程度上取决于迄今为止音频的隐式编码。举例来说,循环网络中能够存储多大的听觉环境将成为很重要的一个因素,但我们相信,我们所提出的方法能够从合适的(经受过训练的)的数据中很自然地获得这种功能。”

音乐AI技术正在快速发展。OpenAI最近发布了一款叫做Jukebox的机器学习框架,它可以生成包括基本歌曲在内的音乐作为各种音乐类型和音乐风格的原始音频。在2018年末,Google Brain的“Project Magenta”项目致力于“探索机器学习在创作过程中的作用”,提出了一个叫做“Musical Transformer”的模型。该模型能够生成可识别的重复性歌曲。不仅如此,去年三月,谷歌发布了一种算法“Google Doodle”,让用户能够创造向巴赫致敬的旋律。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    31

    文章

    3134

    浏览量

    84915
  • 数据集
    +关注

    关注

    4

    文章

    1230

    浏览量

    26038
  • ai技术
    +关注

    关注

    1

    文章

    1313

    浏览量

    25594

原文标题:研究人员的AI技术能够实时匹配活页乐谱与MIDI音频

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    目标追踪的简易实现:模板匹配

    )*(720-50+1)= 826001 次。每次运算都会计算出 SAD 值,而我们只要找到这个最小的 SAD 值对应的模板所在位置,就可以认为找到了帧图像
    发表于 10-28 07:21

    提高条件分支指令预测正确率的方法

    “Gshare方法”。 BTB: 分支目标缓冲器(Branch Target Buffer,BTB)是用于存储分支指令地址和目标地址的高速缓存,其常见于超标量处理器中,主要用于提
    发表于 10-22 08:22

    AI赋能6G与卫星通信:开启智能天网新时代

    学习,AI可以智能识别和纠正信号错误。在2024年欧洲卫星通信展上,展示的AI信号处理系统使卫星通信的误码率从0.01%降至0.0001%,相当于每1000万比特数据中,错误比特数从1
    发表于 10-11 16:01

    使用studio,最高版本的系统是4.0.3,用到LVGL,但是可选的版本是9.1的,不匹配怎么解决?

    使用studio搭建的系统,选的是4.0.3版本,需要用到LVGL,但是版本没的选,只有9.1最高的版本,系统匹配怎么办?
    发表于 09-29 09:56

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    流体芯片 ⑤AI计算平台 ⑥基于AI的自主决策系统 ⑦基于AI的自主学习系统 2、面临的挑战 ①需要造就
    发表于 09-17 11:45

    多种录音笔录音芯片方案推荐

    产品成本。唯创知音作为音频芯片领域的知名厂商,推出了系列性能卓越的录音芯片,为录音笔的设计提供了多样化且优质的解决方案。 二、多种录音芯片推荐 (
    的头像 发表于 08-06 16:48 835次阅读

    基于LockAI视觉识别模块:C++多模板匹配

    多模板匹配种在图像中同时寻找多个模板的技术。通过对每个模板逐进行匹配,找到与输入图像最相似的区域,并标记出匹配
    发表于 05-14 15:00

    基于LockAI视觉识别模块:C++多模板匹配

    多模板匹配种在图像中同时寻找多个模板的技术。通过对每个模板逐进行匹配,找到与输入图像最相似的区域,并标记出匹配
    的头像 发表于 05-14 14:37 1331次阅读
    基于LockAI视觉识别模块:C++多模板<b class='flag-5'>匹配</b>

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    生态系统系统性革新,更需要高效、强力的开发者解决方案。为此,联发科带来了站式可视化智能开发工具——天玑开发工具集,包含AI应用全流程开发工具Neuron Studio,并带来全新升
    发表于 04-13 19:52

    无人机低延时目标跟踪识别智算系统

    ,实现末端自主AI精准目标识别、目标追踪,同时兼具时敏性高、成本低、功耗低等特色,具备满足装备复杂环境要求下,软硬件自主可控的能力。本产品包含AI智能硬件、
    发表于 03-06 15:48

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    功能模块,如AI引擎、可变精度DSP。 • 灵活性:FPGA可以系统运行中重新编程,实现功能的动态重构。 • 低功耗:与ASIC相比,FPGA在功耗方面具有优势,尤其是在处理低延迟任务时。 二
    发表于 03-03 11:21

    AI Agent 应用与项目实战》阅读心得2——客服机器人、AutoGen框架 、生成式代理

    及时处理。 第5章的斯坦福AI小镇项目对生成式代理技术做出了开创性的探索。该项目的核心是将LLM与计算交互代理相结合,构建了具有记忆、反思、规划能力的智能体系统。在技术实现层面,记
    发表于 02-25 21:59

    电位对中和反应的影响

    电位对中和反应具有显著的影响,主要体现在以下几个方面: 、驱动电子转移 在酸碱中和反应中,电子的转移是由电位差驱动的。电位是反映电化学
    的头像 发表于 12-28 14:10 1061次阅读

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    的是百的Picodet模型,它是种基于深度卷积网络(DNN)的轻量级目标检测模型,具有非常高的检测精度,可以在低算力设备进行实时的端到端推理检测。 2.1 Picodet模型介绍
    发表于 12-19 14:33

    2025年1000亿!Arm立了目标

    立下的目标:到2025年底,全球将有超过1,000亿台具备AI能力的Arm设备。这个1000亿目标
    的头像 发表于 12-17 16:43 1365次阅读
    2025年1000亿!Arm立了<b class='flag-5'>一</b><b class='flag-5'>个</b>小<b class='flag-5'>目标</b>!