0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个多层机器学习程序的诞生

IEEE电气电子工程师 来源:IEEE电气电子工程师学会 作者:IEEE电气电子工程师 2020-09-04 14:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

想象一下你正在看一部恐怖电影:女主角在一个黑暗的地下室里,高度警惕。背景中播放着悬疑的音乐,而一些看不见的,邪恶的生物在阴影中爬行……然后——砰!打到了一个物体。

如果没有强烈但恰到好处的音效,这样的场景很难有那么吸引人和恐怖。通常,这些音效是由工作室里的Foley艺术家录制的,他们使用大量可供选择的物体来产生声音。录制玻璃破碎的声音可能涉及实际反复打碎玻璃,例如,直到声音与视频剪辑非常匹配。

据悉,研究人员已经开发了一款自动化程序,可以分析视频帧中的运动,并创建自己的人工声音效果来匹配场景。在一项调查中,大多数被调查者表示他们相信这些假音效是真的。该模型名为AutoFoley,具体介绍发表在了6月25日出版的IEEE Transactions on Multimedia上面。

“自20世纪30年代以来,在后期制作中使用Foley艺术添加音效一直是电影和电视配乐的一个复杂部分,”参与创作AutoFoley的德克萨斯大学教授Jeff Prevost解释道。“如果没有一个真实的Foley配乐的控制层,,电影看起来既空洞又遥远。然而,Foley声音合成的过程也由此为电影的创作增加了大量的时间和成本。”

Prevost和他的博士生Sanchita Ghose被自动Foley系统的想法所吸引,开始创建了一个多层机器学习程序。他们创建了两种不同的模型,可以在第一步中使用,包括识别视频中的动作并确定合适的声音。

第一个机器学习模型从快速移动动作片段的帧中提取图像特征(如颜色和运动),以确定合适的声音效果。

第二个模型来分析对象在不同帧中的时间关系。通过使用关系推理来比较不同时间段的不同帧,第二个模型可以预测视频中发生的动作。

在最后一步,合成声音以匹配其中一个模型预测的活动或运动。Prevost和Ghose使用AutoFoley为1000个短片创建声音,这些短片捕捉了许多常见的动作,比如下雨、骑马和滴答作响的时钟

分析显示,毫不奇怪的是,AutoFoley最擅长于在不需要与视频完全一致的情况下(例如,倾盆大雨、噼啪作响的大火)发出声音。但是,当视觉场景包含随时间变化的随机动作(例如打字、雷雨)时,程序可能与视频不同步。

接下来,Prevost和Ghose调查了57名当地大学生,他们认为哪些电影片段包括了原声配乐。在评估第一个模型产生的声音时,73%的受访学生选择了合成的AutoFoley剪辑作为原始片段,而不是真正的原始声音片段。在评估第二个模型时,仍有66%的受访者选择了AutoFoley剪辑而不是原来的声音剪辑。

“我们的方法的一个局限性是需要分类的主题出现在整个视频帧序列中,”Prevost说,同时还指出AutoFoley目前依赖的Foley类别的数据集非常有限。不过,AutoFoley的专利仍处于早期阶段,但Prevost说这些限制将在未来的研究中得到解决。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136233

原文标题:又被AI骗了?人工智能欺骗人类相信合成的声音效果是真实的

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶中常提的“强化学习”是啥?

    [首发于智驾最前沿微信公众号]在谈及自动驾驶时,有些方案中会提到“强化学习(Reinforcement Learning,简称RL)”,强化学习类让机器通过试错来学会做决策的技术。
    的头像 发表于 10-23 09:00 326次阅读
    自动驾驶中常提的“强化<b class='flag-5'>学习</b>”是<b class='flag-5'>个</b>啥?

    如何解决开发机器学习程序时Keil项目只能在调试模式下运行,但无法正常执行的问题?

    如何解决开发机器学习程序时Keil项目只能在调试模式下运行,但无法正常执行的问题
    发表于 08-28 07:28

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 2632次阅读

    利用PLC调用ABB机器程序号教程

    PP TO MAIN 程序是用来使机器人里的程序回到 MAIN 主程序的。
    的头像 发表于 07-04 15:34 5212次阅读
    利用PLC调用ABB<b class='flag-5'>机器</b>人<b class='flag-5'>程序</b>号教程

    开源项目!教你如何制作开源教育机械臂

    前言 我们的计划始于2016年,当时有简单的问题:我们如何让机器人和编程对每个人都可用? 是学习电子和编程的最佳工具之,但使用带有有线
    发表于 03-10 11:22

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编将探讨机器学习模型市场的未来发展。
    的头像 发表于 02-13 09:39 619次阅读

    BP神经网络与深度学习的关系

    ),是多层前馈神经网络,它通过反向传播算法进行训练。BP神经网络由输入层、或多个隐藏层和输出层组成,通过逐层递减的方式调整网络权重,目的是最小化网络的输出误差。 二、深度
    的头像 发表于 02-12 15:15 1340次阅读

    嵌入式机器学习的应用特性与软件开发环境

    作者:DigiKey Editor 在许多嵌入式系统中,必须采用嵌入式机器学习(Embedded Machine Learning)技术,这是指将机器学习模型部署在资源受限的设备(如微
    的头像 发表于 01-25 17:05 1210次阅读
    嵌入式<b class='flag-5'>机器</b><b class='flag-5'>学习</b>的应用特性与软件开发环境

    华为云 Flexus X 实例部署安装 Jupyter Notebook,学习 AI,机器学习算法

    前言 由于本人最近在学习机器算法,AI 算法的知识,需要搭建学习环境,所以就在最近购买的
    的头像 发表于 01-02 13:43 860次阅读
    华为云 Flexus X 实例部署安装 Jupyter Notebook,<b class='flag-5'>学习</b> AI,<b class='flag-5'>机器</b><b class='flag-5'>学习</b>算法

    传统机器学习方法和应用指导

    用于开发生物学数据的机器学习方法。尽管深度学习般指神经网络算法)是强大的工具,目前也非常
    的头像 发表于 12-30 09:16 1981次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    【「具身智能机器人系统」阅读体验】1.全书概览与第学习

    非常感谢电子发烧友提供的这次书籍测评活动!最近,我一直在学习大模型和人工智能的相关知识,深刻体会到机器人技术是极具潜力的未来方向,甚至可以说是推动时代变革的重要力量。能参与这次活动
    发表于 12-27 14:50

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 699次阅读

    zeta在机器学习中的应用 zeta的优缺点分析

    在探讨ZETA在机器学习中的应用以及ZETA的优缺点时,需要明确的是,ZETA词在不同领域可能有不同的含义和应用。以下是根据不同领域的ZETA进行的分析: 、ZETA在
    的头像 发表于 12-20 09:11 1626次阅读

    cmp在机器学习中的作用 如何使用cmp进行数据对比

    机器学习领域,"cmp"这个术语可能并不是常见的术语,它可能是指"比较"(comparison)的缩写。 比较在机器
    的头像 发表于 12-17 09:35 1323次阅读

    构建云原生机器学习平台流程

    构建云原生机器学习平台是复杂而系统的过程,涉及数据收集、处理、特征提取、模型训练、评估、部署和监控等多个环节。
    的头像 发表于 12-14 10:34 676次阅读