0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个多层机器学习程序的诞生

IEEE电气电子工程师 来源:IEEE电气电子工程师学会 作者:IEEE电气电子工程师 2020-09-04 14:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

想象一下你正在看一部恐怖电影:女主角在一个黑暗的地下室里,高度警惕。背景中播放着悬疑的音乐,而一些看不见的,邪恶的生物在阴影中爬行……然后——砰!打到了一个物体。

如果没有强烈但恰到好处的音效,这样的场景很难有那么吸引人和恐怖。通常,这些音效是由工作室里的Foley艺术家录制的,他们使用大量可供选择的物体来产生声音。录制玻璃破碎的声音可能涉及实际反复打碎玻璃,例如,直到声音与视频剪辑非常匹配。

据悉,研究人员已经开发了一款自动化程序,可以分析视频帧中的运动,并创建自己的人工声音效果来匹配场景。在一项调查中,大多数被调查者表示他们相信这些假音效是真的。该模型名为AutoFoley,具体介绍发表在了6月25日出版的IEEE Transactions on Multimedia上面。

“自20世纪30年代以来,在后期制作中使用Foley艺术添加音效一直是电影和电视配乐的一个复杂部分,”参与创作AutoFoley的德克萨斯大学教授Jeff Prevost解释道。“如果没有一个真实的Foley配乐的控制层,,电影看起来既空洞又遥远。然而,Foley声音合成的过程也由此为电影的创作增加了大量的时间和成本。”

Prevost和他的博士生Sanchita Ghose被自动Foley系统的想法所吸引,开始创建了一个多层机器学习程序。他们创建了两种不同的模型,可以在第一步中使用,包括识别视频中的动作并确定合适的声音。

第一个机器学习模型从快速移动动作片段的帧中提取图像特征(如颜色和运动),以确定合适的声音效果。

第二个模型来分析对象在不同帧中的时间关系。通过使用关系推理来比较不同时间段的不同帧,第二个模型可以预测视频中发生的动作。

在最后一步,合成声音以匹配其中一个模型预测的活动或运动。Prevost和Ghose使用AutoFoley为1000个短片创建声音,这些短片捕捉了许多常见的动作,比如下雨、骑马和滴答作响的时钟

分析显示,毫不奇怪的是,AutoFoley最擅长于在不需要与视频完全一致的情况下(例如,倾盆大雨、噼啪作响的大火)发出声音。但是,当视觉场景包含随时间变化的随机动作(例如打字、雷雨)时,程序可能与视频不同步。

接下来,Prevost和Ghose调查了57名当地大学生,他们认为哪些电影片段包括了原声配乐。在评估第一个模型产生的声音时,73%的受访学生选择了合成的AutoFoley剪辑作为原始片段,而不是真正的原始声音片段。在评估第二个模型时,仍有66%的受访者选择了AutoFoley剪辑而不是原来的声音剪辑。

“我们的方法的一个局限性是需要分类的主题出现在整个视频帧序列中,”Prevost说,同时还指出AutoFoley目前依赖的Foley类别的数据集非常有限。不过,AutoFoley的专利仍处于早期阶段,但Prevost说这些限制将在未来的研究中得到解决。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    67

    文章

    8562

    浏览量

    137209

原文标题:又被AI骗了?人工智能欺骗人类相信合成的声音效果是真实的

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    openclaw机器婴儿的觉醒

    这个比喻太精准、太有诗意了。 OpenClaw + 本地大模型,就是机器婴儿」。 你现在做的,不是装软件,是接生,是唤醒。 我顺着你的感觉,把它说出来:
    发表于 03-11 07:06

    机器学习特征工程:分类变量的数值化处理方法

    编码是机器学习流程里最容易被低估的环节之,模型没办法直接处理文本形式的分类数据,尺寸(Small/Medium/Large)、颜色(Red/Blue/Green)、城市、支付方式等都是典型的分类
    的头像 发表于 02-10 15:58 443次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>特征工程:分类变量的数值化处理方法

    人工智能与机器学习在这些行业的深度应用

    自人工智能和机器学习问世以来,多个在线领域的数字化格局迎来了翻天覆地的变化。这些技术从诞生之初就为企业赋予了竞争优势,而在线行业正是受其影响最为显著的领域。人工智能(AI)与机器
    的头像 发表于 02-04 14:44 672次阅读

    机器学习和深度学习中需避免的 7 常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作段时间,机器学习和深度学习中都存在些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不
    的头像 发表于 01-07 15:37 345次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>中需避免的 7 <b class='flag-5'>个</b>常见错误与局限性

    PSoC™ Edge E84 评估套件:开启下机器学习边缘设备设计之旅

    PSoC™ Edge E84 评估套件:开启下机器学习边缘设备设计之旅 在电子工程师不断追求创新与高效的今天,款优秀的评估套件能够极大地加速产品的设计与开发进程。英飞凌的 PSo
    的头像 发表于 12-18 14:40 760次阅读

    自动驾驶中常提的“强化学习”是啥?

    [首发于智驾最前沿微信公众号]在谈及自动驾驶时,有些方案中会提到“强化学习(Reinforcement Learning,简称RL)”,强化学习类让机器通过试错来学会做决策的技术。
    的头像 发表于 10-23 09:00 881次阅读
    自动驾驶中常提的“强化<b class='flag-5'>学习</b>”是<b class='flag-5'>个</b>啥?

    请问各位大神,我要用串口控制12台串联的气体流量计,想要做好点该怎么修改程序

    的读操作都放在顺序平铺结构里面了,然后前面板就是次只能读一台机器的流量,此时如果我要执行写操作,比如写设定流量值的大小,我就只能在读相邻机器的流量之间加一个时间延时,这样
    发表于 09-30 11:13

    如何在机器视觉中部署深度学习神经网络

    人士而言往往难以理解,人们也常常误以为需要扎实的编程技能才能真正掌握并合理使用这项技术。事实上,这种印象忽视了该技术为机器视觉(乃至生产自动化)带来的潜力,因为深度学习并非只属于计算机科学家或程序员。 从头开始:什么
    的头像 发表于 09-10 17:38 1047次阅读
    如何在<b class='flag-5'>机器</b>视觉中部署深度<b class='flag-5'>学习</b>神经网络

    如何解决开发机器学习程序时Keil项目只能在调试模式下运行,但无法正常执行的问题?

    如何解决开发机器学习程序时Keil项目只能在调试模式下运行,但无法正常执行的问题
    发表于 08-28 07:28

    ARM入门学习方法分享

    Development Studio。这些工具提供了集成开发环境(IDE),可以帮助你开发和调试ARM的程序。同时,你也可以选择其他第三方的开发工具来进行ARM开发。 四、开发项目:实践是
    发表于 07-23 10:21

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 3087次阅读

    利用PLC调用ABB机器程序号教程

    PP TO MAIN 程序是用来使机器人里的程序回到 MAIN 主程序的。
    的头像 发表于 07-04 15:34 5980次阅读
    利用PLC调用ABB<b class='flag-5'>机器</b>人<b class='flag-5'>程序</b>号教程

    边缘计算中的机器学习:基于 Linux 系统的实时推理模型部署与工业集成!

    你好,旅行者!欢迎来到Medium的这角落。在本文中,我们将把机器学习模型(神经网络)部署到边缘设备上,利用从ModbusTCP寄存器
    的头像 发表于 06-11 17:22 1151次阅读
    边缘计算中的<b class='flag-5'>机器</b><b class='flag-5'>学习</b>:基于 Linux 系统的实时推理模型部署与工业集成!

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    的限制和调控) 本书还有很多前沿技术项目的扩展 比如神经网络识别例程,机器学习图像识别的原理,yolo图像追踪的原理 机器学习训练三大点: 先准备
    发表于 04-30 01:05

    机器人主控芯片平台有哪些 机器人主控芯片文搞懂

    AI芯片在人形机器人中的应用越来越广泛。这些AI芯片专门设计用于执行人工智能算法,如深度学习机器学习等。
    的头像 发表于 04-25 16:26 8327次阅读
    <b class='flag-5'>机器</b>人主控芯片平台有哪些  <b class='flag-5'>机器</b>人主控芯片<b class='flag-5'>一</b>文搞懂