0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook AI研究团队描述了一个能够从现实世界视频中提取可控角色的系统

电子工程师 来源:lq 2019-04-29 17:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI 在未来几年可能颠覆整个游戏产业制作流程。

传统游戏制作往往需要经过原画设定、3D 场景搭建、特效设计、3D 角色构建等多个环节完成,而在未来,这些工作都有望交给 AI 来做。

近日,Facebook AI 研究团队描述了一个能够从现实世界视频中提取可控角色的系统。利用该系统,可以从日常视频中随意创建虚拟人物及各种姿势动作。

三位 AI 研究人员创建的这种新方法(Vid2Game: Controllable Characters Extracted from Real-World Videos),可以将一个视频中的真人转换成一个 3D游戏角色,并且可以将此角色及其相关动作转换到新背景上。研究人员称,生成的角色可以和不同的背景互动。

据介绍,这套AI 系统主要依赖于两个神经网络。一个是由 Pose2Pose(P2P)网络基于控制信号的输入流(例如来自操纵杆或游戏手柄的控制信号)以自动回归方式操纵给定姿势。另一个是 Pose2Frame(P2F),在随后给定背景图像的情况下生成高分辨率视频帧。它们通过“学习”视频中的人物身体形状、运动风格及其他特征,以此来建立游戏角色。系统最终生成的视频具有高度的个性化和逼真性,可大大提升玩家的游戏体验。

“我们的模型可以从视频中提取一个角色,并能控制它的动作。”该论文的共同作者在文章中解释道,“模型能有效地捕捉到人的动态和外观,生成角色的图像序列,生成的视频可以具有任意背景”。研究人员称该系统具有足够强的鲁棒性,可在动态背景下任意定位提取人物特征。

首先,需要将包含一个或多个人物特征的视频输入到针对特定域(例如,跳舞)训练的 Pose2Pose 网络,将其运动状态和自身隔离,用于确定哪些背景区域可以被合成图像所替换。随后 Pose2Frame 网络运用这些组合的运动姿势数据,区分场景中与角色相关的变化,如阴影、反射以及角色的独立特征。最后与预先设计好的背景混合输出。

在实验部分,研究人员采集了三段视频,每段视频长度为五到八分钟,视频的主角分别是一个户外网球运动员,一个在室内舞剑的人,和一个正在走路的人。之后与一个用三分钟跳舞视频训练的神经网络相比,该实验结果对人物动态元素的捕捉更为成功。(排除角色服装和镜头角度的变化)。

该技术投入使用后,人们将有机会成为游戏中人物的化身,自定义游戏角色,并赋予角色独有的动作形态。这项基于 AI 技术的角色生成系统可能会催生更多不同类型的游戏,逼真且个性化可能是未来游戏行业发展的一个方向。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4842

    浏览量

    108160
  • 3D游戏
    +关注

    关注

    0

    文章

    10

    浏览量

    10254
  • Facebook
    +关注

    关注

    3

    文章

    1432

    浏览量

    59349

原文标题:Facebook AI通过“学习”视频,自动生成游戏角色

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI大模型微调企业项目实战课

    自主可控大模型:企业微调实战课,筑牢未来 AI 底座 在人工智能席卷全球商业版图的今天,企业对大模型(LLM)的态度已经“新奇观望”转变为“全面拥抱”。然而,随着应用层面的不断深入,
    发表于 04-16 18:48

    ISL59885:高清与标清视频的自动调整同步分离器

    ISL59885:高清与标清视频的自动调整同步分离器 在视频处理领域,同步分离器是关键的组件,它能够
    的头像 发表于 03-26 16:15 141次阅读

    AI辅助编程设计之道:Spec到Code工程实践

    大语言模型正在重塑软件开发的日常。Copilot到各种编程助手,AI生成代码的能力已经渗透到许多开发者的工作流中。但在实际应用中,现象值得注意:不少
    发表于 03-16 13:33

    AI智能体管理系统:当企业拥有支会思考、会协作的数字团队

    清晨七点,某跨国制造企业的数字控制中心悄然启动。这不是传统意义上的IT系统上线,而是支由87AI智能体组成的数字团队开始
    的头像 发表于 12-23 13:48 321次阅读

    传音TEX AI团队斩获ICCV 2025大型视频目标分割挑战赛双料亚军

    目标分割两赛道中均荣获全球第二名,击败众多国内外强队,充分展示团队在复杂视频理解与多模态视频目标分割领域的深厚积累与
    的头像 发表于 10-31 09:42 722次阅读
    传音TEX <b class='flag-5'>AI</b><b class='flag-5'>团队</b>斩获ICCV 2025大型<b class='flag-5'>视频</b>目标分割挑战赛双料亚军

    AI赋能6G与卫星通信:开启智能天网新时代

    质量),能够提前数月甚至数年预测潜在故障。 在2024年,国际通信卫星公司(Intelsat)部署的AI预测系统成功预测某颗卫星的电源模块故障,提前3
    发表于 10-11 16:01

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    解决人类智能无法解决的复杂问题。实现AGI的AI相关研究机构和企业的主要目标。 、生成式AI点燃AGI之火 CHatGPT就是已经取得成功的生成式
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    和关联性 AI驱动科学:研究和模拟人类思维和认识过程。 本章节作者为我们讲解了第五范式,介绍科学发现的般方法和流程等。、科学发现的5
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:AI硬件到AI湿件

    ,又分为真菌计算和基于DNA的计算。 图4 基本的真菌计算机结构 在用化学和生物方法实现AI功能的过程中,要经历5阶段,见图5所示。 图5 以化学和生物方法实现AI功能各阶段 期待
    发表于 09-06 19:12

    声智科技声学模型赋予AI感知物理世界

    在科技浪潮的尖端,新时代正悄然开启。NVIDIA创始人黄仁勋曾预言,未来通用人工智能(AGI)将不再局限于虚拟世界,而是能够与物理世界
    的头像 发表于 09-02 17:46 1596次阅读

    NVIDIA助力枢途科技突破视频提取具身数据技术鸿沟

    技术,加速互联网视频提取具身智能模型训练数据,实现
    的头像 发表于 08-30 16:11 1975次阅读

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    技术落地到了小小的边缘设备MaixCAM-Pro上。它不仅展示深度学习在图像取证领域的强大能力,更体现边缘AI
    发表于 08-21 13:59

    【书籍评测活动NO.64】AI芯片,过去走向未来:《AI芯片:科技探索与AGI愿景》

    问题请咨询工作人员(微信:elecfans_666)。 AI芯片,过去走向未来 四年前,市面上仅有的AI芯片全书在世界范围内掀起
    发表于 07-28 13:54

    Gartner报告看Atlassian在生成式AI领域的创新路径与实践价值

    Atlassian入选Gartner 2025生成式AI技术"新兴领导者"!其核心AI产品Rovo依托Teamwork Graph,支持团队知识库
    的头像 发表于 06-05 15:59 1269次阅读
    <b class='flag-5'>从</b>Gartner报告看Atlassian在生成式<b class='flag-5'>AI</b>领域的创新路径与实践价值

    套Linux系统,撑起整个芯片设计平台?CFA团队教你如何搭好EDA智算平台的技术底座

    时间,则可以选择 Ubuntu。 软件包管理:RPM到YUM,让EDA工具“键上岗” 在对Linux系统的使用和操作过程中,需要经常安装、卸载和升级各种应用软件。 要让
    发表于 05-07 14:44