0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个端到端的深度学习系统,可以将足球比赛的YouTube视频转换为运动的3D全息图

DPVg_AI_era 来源:未知 作者:李倩 2018-07-03 10:30 次阅读

你有没有想过让C罗、梅西或者内马尔在你家桌子上踢一场比赛会是什么样子?华盛顿大学、Facebook和Google的研究人员开发了第一个端到端的深度学习系统,可以将足球比赛的YouTube视频转换为运动的3D全息图,使用AR设备就可以观看到3D全息投影的足球比赛。这项研究将在 CVPR 2018 会议上首次亮相。

世界杯来了!央视名嘴白岩松调侃“俄罗斯世界杯,中国除了足球队没去,其他的都去了”,这届世界杯,中国球迷购买球票的数量在所有国家中排名第9,可见球迷对世界杯的热情。那么,除了准备好小龙虾在电视机前观看世界杯比赛,你有没有想过让C罗、梅西或者内马尔在你家桌子上踢一场比赛会是什么样子?

华盛顿大学、Facebook和Google的研究人员开发了第一个端到端的深度学习系统,该系统可以将足球比赛的YouTube视频转换为运动的3D全息图。

用CNN重建一场足球比赛

“对一场足球比赛进行单目重建有很多挑战。我们必须估计相对于场地的摄像机姿态,检测并跟踪每个球员,重新构建他们的身体形状和姿势,并对联合重建进行渲染,”研究人员在他们的研究论文中写道。

图1:以足球比赛的YouTube视频为输入,系统输出比赛的动态3D重建,可以使用增强现实设备在桌面上以交互式的方式观看。

这种方法的关键是卷积神经网络(CNN),研究人员通过训练CNN来估计每个球员与拍摄比赛的摄像机之间的距离。该网络分析了从足球视频游戏《FIFA》中提取的12000张2D球员图像,以及从游戏引擎提取的相应3D数据,以了解两者之间的相关性。

这样,网络就能从没见过的2D图像中预估球员的深度图(depth maps)。当被展示没见过的视频时,系统能准确地预测每个球员的深度图,并将其与颜色素材结合,以3D的方式重建每个球员。

图2:重建方法的概览

以YouTube视频的帧作为输入,我们使用field lines来恢复摄像机参数。然后,提取边界框、姿势和轨迹(跨多个帧)来分割球员。通过在视频游戏数据上训练好的深度网络,我们在游戏环境中重建了每个球员的深度图,这样就可以在3D查看器或AR设备上呈现出来。

然后,球员们被放在一个虚拟的足球场上。其结果令人惊叹,并且可以通过3D查看器或AR设备从任何角度观看比赛。

图3:训练数据:从《FIFA》游戏中提取图像和对应的深度,这里展示了几个可视化为深度图和网格的例子。

该团队使用NVIDIA GeForce GTX 1080 GPU和NVIDIA TITAN Xp GPU,以及cuDNN加速的PyTorch深度学习框架,在从世界杯比赛视频中提取的数小时的3D球员数据上对卷积神经网络进行训练。

基于这些比赛视频数据,神经网络能够重构球场上的每个球员的深度图,这些图可以在3D查看器或AR设备上呈现。

“事实证明,在玩EA的《FIFA》游戏并截取游戏引擎和GPU间的调用时,可以从视频游戏中提取深度图。具体来说,我们使用RenderDoc来截取游戏引擎和GPU之间的调用。”研究团队表示:“FIFA与大多数游戏类似,在游戏过程中使用延迟渲染。通过访问GPU调用,可以捕获每帧的深度和颜色缓冲区。一旦特定的帧被捕获了深度和颜色,就可以提取出球员。”

图4:合成数据集的结果以及与当前最优技术和ground truth的比较,可视化为depth maps和3D网格。我们的方法更准确,实现了更好的网格重构。

为了验证这个系统,研究团队用YouTube上找到的10个高分辨率的职业足球比赛视频测试他们的方法。值得注意的是,该系统只在合成视频素材上进行训练。但是,在真实的场景中,系统也有非常好的结果。

来自YouTube视频的实际图像的结果

从Youtube框架开始(顶行),我们网络重建的深度图可以添加到虚拟3D球场环境中,这里显示为仅网格和纹理渲染(第2-4行)。

研究人员用微软的HoloLensAR眼镜进行测试。HoloLens可以将3D重建叠加到真实的桌面上。最终的产品虽然不完美,它无法重建球,不能实时地工作,并且只允许从视频录制的球场侧面观看。但是,这项技术可能比当前3D重建运动的最先进方法更具可扩展性,因为当前的方法需要在每一个角度布置相机。研究人员称,这种方法也适用于预定义的其他事件,例如音乐会或剧场。

桌面实际的场景

用HoloLens看到的场景

研究人员承认他们的系统并不完美。他们的下一个项目将专注于训练系统以更好地检测球,并开发可从任何角度观察的系统。

这项研究将于6月18日至22日在犹他州盐湖城举行的年度计算机视觉和模式识别(CVPR)会议上首次亮相。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4572

    浏览量

    98714
  • 深度学习
    +关注

    关注

    73

    文章

    5236

    浏览量

    119895
  • 全息图
    +关注

    关注

    0

    文章

    7

    浏览量

    2476

原文标题:来看一场 AI 重建的 3D 全息世界杯比赛!

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    3d全息声音技术解析

    ,然后可以感觉飘远的距离感。 随着3D技术在表演领域的广泛应用,音乐的创作必将因此受到影响,带来作曲方式上的改变。除了构思旋律之外,艺术家需要在前期创作中就考虑空间关系。
    发表于 04-16 10:39

    labview全息图

    怎么用labview生成修正离轴全息图,有没有大神
    发表于 04-30 18:28

    3D全息投影打造梦幻婚礼宴会

    `3D全息投影打造梦幻婚礼宴会! 进入下半年,结婚摆宴席的人多起来了,各种节庆派对也陆续登场。“80后”、“90后”的年轻人已经越来越热衷于在婚礼宴会上使用高科技舞美技术,打造梦幻般的场景,过把“明星瘾”。时下最新的
    发表于 09-09 15:33

    革命性创新测量技术——数字全息术带来实时3D形貌

    调焦扫描不同平面的图像,通过计算机分析和模拟,就能显示细胞样品的立体结构。数字全息技术由于其非扫描成像方式实现3D形貌显微,可以做到超高速实时3D显微。这
    发表于 11-07 10:30

    AI黑科技 | 不用去俄罗斯,在家里餐桌上就能看世界杯实况

    、Facebook跟谷歌的研究员们,研发了可以深度学习的人工智能,他们获取了足球比赛中每个球员各1万2千张的2
    发表于 06-29 08:46

    如何混合模式参数转换为ADS中的单参数?

    大家好,您好。有人可以建议我如何轻松地混合模式参数转换为ADS中的单参数?我有混合模式4
    发表于 03-22 08:53

    3d全息风扇灯条|3D全息风扇方案|3d全息风扇PCBA

    我公司专业从事3D全息风扇研发生产,主要生产供应3D全息风扇PCBA,也可出售整机,其他配件可免费提供供应商信息或者代购,欢迎咨询 刘先生:*** 微信同号
    发表于 08-02 09:50

    基于深度学习3D图像处理的精密加工件外观缺陷检测系统

    点四:丰富的2D/3D图像软硬件接口,配合被测金属五金加工件的形状、轮廓精度拥有丰富的成像硬件、运动机构以及执行机构的选择。 基于深度学习
    发表于 03-08 13:59

    Q学习角色值法在机器人足球比赛中的应用

    提出了基于Q学习的角色值方法,避免了在比赛中由于机器人之间的频繁角色转换而造成的系统效率损失及系统不稳定。该方法完善了多智能体
    发表于 12-16 23:53 9次下载

    基于全维视觉的足球比赛机器人目标定位

    本文给出了robocup 中型组足球比赛机器人在全维视觉情况下,对足球比赛中目标定位的一种方法。文中推导了一种针对全向摄像机镜面投影的变换关系,该方法简单有效,为全维
    发表于 08-14 09:37 21次下载

    基于全维视觉的足球比赛机器人目标定位

    本文给出了robocup 中型组足球比赛机器人在全维视觉情况下,对足球比赛中目标定位的一种方法。文中推导了一种针对全向摄像机镜面投影的变换关系,该方法简单有效,为全维
    发表于 08-14 09:38 8次下载

    机器人足球比赛研究

    摘 要: 机器人足球比赛是一个有趣且复杂的人工智能的新兴研究领域, 它试图利用一个将各种理论、算法和 A gent 体系结构集成在一起的任务来促进机器人学和人工智能研究的发展. 论述
    发表于 04-29 10:54 153次下载

    足球比赛视频中的多运动员行为表示

    为提高足球比赛视频中的多运动员行为识别的准确率,提出一种基于尺度自适应局部时空特征的足球比赛视频中的多
    发表于 12-13 17:17 0次下载

    平面全息图与体全息图的成像及白光原理

    运用物理光学相干与衍射的理论‚分析与阐述了平面全息图与体全息图的 成像及白光再现原理‚并对全息防伪印刷应用作了简要介绍。
    发表于 08-31 09:17 3次下载

    微美全息(NASDAQ:WIMI)开发基于深度学习3D计算机生成全息图技术

    物体时,会产生干涉条纹,并记录下这些条纹的信息,然后再通过光的反射和折射来呈现出物体的3D效果。全息图技术可以将真实的3D物体以光学的方式呈现,它
    的头像 发表于 05-11 11:03 550次阅读
    微美<b class='flag-5'>全息</b>(NASDAQ:WIMI)开发基于<b class='flag-5'>深度</b><b class='flag-5'>学习</b>的<b class='flag-5'>3D</b>计算机生成<b class='flag-5'>全息图</b>技术