0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook的研究人员提出了一个能从真实视频中抽取可控制主角的模型Vid2Game

nlfO_thejiangme 来源:lq 2019-04-26 09:58 次阅读

相信大家还记得曾经游戏中的主人公,可以随着按键旋转跳跃,通过三维/二维模型或者实现录制好的视频来响应不同指令的动作。而最近来自Facebook的研究人员提出了一个能从真实视频中抽取可控制主角的模型Vid2Game,这意味你可以将视频中喜欢的主人公变成可以在游戏中控制的主角。

让我们先来看看效果,从真实视频中抽取的主角被放置到了新背景中,随着按键的控制左右移动挥拍击球。

黑衣服的运动员被妥妥地安排到了不同的背景中,随着键盘的指令移动。这是怎么做到的呢?为了实现对主体的控制和生成需要解决一下几个问题:首先需要将主体从环境中分离出来以便在新的任意的背景中生成;由于渲染阴影、反射、运动效果等、这种分离不是二值化的;用户给出的控制信号任意的x,y位移、如何编码并将控制量馈入主体生成中;最后需要处理生成序列过程中积累误差的影响。

那么文章中具体是如何做到的呢?

下面让我们一起来看看背后的原理。Vid2Game包含了两个神经网络和三个主要步骤的工作流程,首先利用第一个神经网络将当前位姿和控制信号映射到下一时刻的新位姿;随后利用新位姿和给定的背景输出希望的帧,包括背景和主体以及主体的mask;最后将生成的主体以背景融合生成最终输出。这种通用的方法可以被广泛用于多种不同运动场景中。给定视频中的主角可以根据用户的控制,生成在目标背景中运动的视频。两个序列形式工作的模型分别是Pose2Pose和Pose2Frame。

Pose2Pose网络基于用户的控制序列信号以自回归的方式操作给定的位姿,实现在特定的域内基于2D控制信号引导人体位姿生成。

通过输入t-1时刻的位姿和对应物体、在用户控制序列的操作下生成t时刻的主角位姿和对应物体。上图中我们可以看到输入的运动员位姿图和对应的球拍、同时输入的还有控制量。我们还可以看到中间的n-2个条件残差模块是基于质心位移量进行处理的。在训练时,质心唯一来自于训练序列的编码、而推理时则来自于用户输入。

随后将生成的位姿及给定的背景输入Pose2Frame将生成高分辨率的真实视频序列。同样以运动员作为例子,将运动员位姿和网球拍的序列输入,模型将生成一个RGB图像和mask图像.RGB图像考虑了运动员在环境中需要包括了阴影、反射等渲染,而mask辅助融合运动员与给定背景。通过mask与生成的rgb相乘得到运动员部分的RGB图像、再通过背景抠出mask区域随后融合运动与与给定背景,即得到运动员在新环境中生成的受用户控制的帧。

对于判别器部分、模型主要关注多尺度情况下二进制阈值主体。其中o为基准图像f为生成图像,在放入多尺度判别器前需要进行均值pooling减采样,。放入VGG分类器中的图像则保持了原始分辨率用于给出感知损失。Pose2Pose和Pose2Frame的生成器和判别器都使用了pix2pixHD架构来作为基础网络,并进行了一系列改进。同时利用了基于DensePose的方法来对位姿进行表示,同时使用了语义分割的方法来对运动员手持物体进行抽取。

通过这样的方法,就可以在希望的场景中合成你可控制的主角了。这对于未来个性化游戏、虚拟显示等具有十分重要的意义。从各种视频中抽取主角、并可以通过键盘在游戏中控制真的很棒!

让我们来跳一支舞吧:

控制你的主角四处漫游:

到任何想去的地方打球:

与龙来一场战斗吧:

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4572

    浏览量

    98748
  • 图像
    +关注

    关注

    2

    文章

    1063

    浏览量

    40041
  • Facebook
    +关注

    关注

    3

    文章

    1428

    浏览量

    54033

原文标题:Facebook提出Vid2Game模型,帮助你来控制视频里的主人公动起来~

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    自动识别事件类别的中文事件抽取技术研究

    【作者】:许红磊;陈锦秀;周昌乐;林如琦;杨肖方;【来源】:《心智与计算》2010年01期【摘要】:本文提出种新的中文事件抽取自动识别事件类别的
    发表于 04-24 09:55

    美国普渡大学和哈佛大学的研究人员出了项新发明 新...

    据物理学家组织网报道,美国普渡大学和哈佛大学的研究人员出了项极为应景的新发明:种外形如同颗圣诞树
    发表于 02-03 20:30

    LabVIEW进行癌症预测模型研究

    效果。 LabVIEW在此研究的应用展示了其在处理复杂医学数据和开发高效预测模型方面的独特优势,特别是在癌症早期诊断和治疗策略的研究。通
    发表于 12-13 19:04

    基于XML的WEB信息抽取模型设计

    对现有的信息抽取技术和XML 技术加以研究,在此基础上提出了适合XML 的通用的web 信息抽取模型,它能够把Web 上的数据
    发表于 12-22 13:56 17次下载

    研究人员提出了一种柔性可拉伸扩展的多功能集成传感器阵列

    研究人员提出了一种柔性可拉伸扩展的多功能集成传感器阵列,成功将电子皮肤的探测能力扩展到7种,实现温度、湿度、紫外光、磁、应变、压力和接近等多种外界刺激的实时同步监测。
    的头像 发表于 01-24 15:15 6920次阅读
    <b class='flag-5'>研究人员</b><b class='flag-5'>提出了</b>一种柔性可拉伸扩展的多功能集成传感器阵列

    Facebook提出了一种在虚拟现实环境中表征真实世界对象的解决方案

    )”的专利中指出,VR用户有时渴望与真实世界对象交互,但由于传统头显的设计,其无法或难以确定真实世界对象的位置。为了解决这个问题,Facebook提出了一种在虚拟现实环境中表征
    发表于 01-28 09:47 838次阅读
    <b class='flag-5'>Facebook</b><b class='flag-5'>提出了</b>一种在虚拟现实环境中表征<b class='flag-5'>真实</b>世界对象的解决方案

    研究人员提出了一系列新的点云处理模块

    为了探索这些问题的解决办法、来自伦敦大学学院的研究人员提出了一系列新的点云处理模块,从效率、信息共享和点云卷积操作等方面进行了研究,得到了更宽、更深、更快效率更高的点云处理网络,让更深的点云深度学习
    的头像 发表于 08-02 14:44 2759次阅读
    <b class='flag-5'>研究人员</b>们<b class='flag-5'>提出了</b>一系列新的点云处理模块

    JD和OPPO的研究人员提出了一种姿势引导的时尚图像生成模型

    研究人员的主要目的在于训练一个生成模型,将模特在当前姿势上的图像迁移到其他的目标姿势上去,实现对于衣着等商品的全面展示。
    的头像 发表于 08-02 14:50 2367次阅读

    Facebook研究人员提出了Mesh R-CNN模型

    这一研究的目标是通过单张图像输入,对图像中的物体进行检测、获取不同物体的类别、掩膜和对应的三维网格,并对真实世界中的复杂模型进行有效处理。在2D深度网络的基础上,研究人员改进并
    的头像 发表于 08-02 15:51 3606次阅读
    <b class='flag-5'>Facebook</b>的<b class='flag-5'>研究人员</b><b class='flag-5'>提出了</b>Mesh R-CNN<b class='flag-5'>模型</b>

    研究人员出了一种新的基于深度学习的策略

    苏黎世联邦理工学院的研究人员最近推出了一种新的基于深度学习的策略,该策略可以在不需要大量真实数据的情况下在机器人中实现触觉传感。在arXiv上预先发表的一篇论文中概述了他们的方法,该方法需要完全在模拟数据上训练深度神经网络。
    的头像 发表于 03-26 15:47 2416次阅读

    研究人员开发出了一种称为LB-WayPtNav-DH的机器人导航新框架

    加州大学伯克利分校的研究人员最近开发了一种新的框架,该框架可以增强办公室,房屋或博物馆等室内环境中人类的机器人导航能力。他们的模型在arXiv上预先发表的一篇论文中提出,并在称为HumANav的
    发表于 04-09 11:18 872次阅读

    研究人员提出了一个名为CommPlan的框架

    使用CommPlan,开发人员首先使用数据,领域专业知识和学习算法指定五个模块-任务模型,通信功能,通信成本模型人员响应模型
    的头像 发表于 04-09 14:30 1990次阅读

    Facebook研究人员发布友谊数据

    Facebook在一篇博文中表示,卡耐基梅隆大学的研究人员“不会与Facebook分享个人调查反馈,Facebook也不会与研究人员分享关于
    的头像 发表于 04-22 10:58 3161次阅读

    华裔女博士提出Facebook提出用于超参数调整的自我监督学习框架

    【导读】Facebook研究人员近日提出了一种用于超参数调整的自我监督学习框架。
    的头像 发表于 04-26 09:45 1540次阅读
    华裔女博士<b class='flag-5'>提出</b>:<b class='flag-5'>Facebook</b><b class='flag-5'>提出</b>用于超参数调整的自我监督学习框架

    研究人员制造出一种可以挖洞的软体机器人

    的软体机器人。 研究人员提出了新的在颗粒介质中挖掘的动力学理解,结合关键结果设计出一款带有尖端延伸喷气装置的管状机器人,控制地下的相互作用力来实现快速、可控的三维挖掘。 该论文题目为《
    的头像 发表于 06-26 16:28 2013次阅读