0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

智能感知与物联网技术研究所 来源:未知 2023-06-11 21:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Tracking Everything Everywhere All at Once.

前段时间,Meta 发布「分割一切(SAM)」AI 模型,可以为任何图像或视频中的任何物体生成 mask,让计算机视觉(CV)领域研究者惊呼:「CV 不存在了」。之后,CV 领域掀起了一阵「二创」狂潮,一些工作陆续在分割的基础上结合目标检测、图像生成等功能,但大部分研究是基于静态图像的。

现在,一项称为「追踪一切」的新研究为动态视频中的运动估计提出了新方法,能够准确、完整地追踪物体的运动轨迹。

该研究由来自康奈尔大学、谷歌研究院和 UC 伯克利的研究者共同完成。他们联合提出了一种完整且全局一致的运动表征 OmniMotion,并提出一种新的测试时(test-time)优化方法,对视频中每个像素进行准确、完整的运动估计。

04c39d40-085d-11ee-962d-dac502259ad0.png

  • 论文地址:https://arxiv.org/abs/2306.05422

  • 项目主页:https://omnimotion.github.io/

有网友在推特上转发了这项研究,仅一天时间就收获了 3500 + 的点赞量,研究内容大受好评。

从该研究发布的 demo 看,运动追踪的效果非常好,例如追踪跳跃袋鼠的运动轨迹:

荡秋千的运动曲线:

还能交互式查看运动追踪情况:

即使物体被遮挡也能追踪运动轨迹,如狗在跑动的过程中被树遮挡:

在计算机视觉领域,常用的运动估计方法有两种:稀疏特征追踪和密集光流。但这两种方法各有缺点,稀疏特征追踪不能建模所有像素的运动;密集光流无法长时间捕获运动轨迹。

该研究提出的 OmniMotion 使用 quasi-3D 规范体积来表征视频,并通过局部空间和规范空间之间的双射(bijection)对每个像素进行追踪。这种表征能够保证全局一致性,即使在物体被遮挡的情况下也能进行运动追踪,并对相机和物体运动的任何组合进行建模。该研究通过实验表明所提方法大大优于现有 SOTA 方法。

方法概述

该研究将帧的集合与成对的噪声运动估计(例如光流场)作为输入,以形成整个视频的完整、全局一致的运动表征。然后,该研究添加了一个优化过程,使其可以用任何帧中的任何像素查询表征,以在整个视频中产生平滑、准确的运动轨迹。值得注意的是,该方法可以识别画面中的点何时被遮挡,甚至可以穿过遮挡追踪点。

OmniMotion 表征

传统的运动估计方法(例如成对光流),当物体被遮挡时会失去对物体的追踪。为了在遮挡的情况下也能提供准确、一致的运动轨迹,该研究提出全局运动表征 OmniMotion。

该研究试图在没有显式动态 3D 重建的情况下准确追踪真实世界的运动。OmniMotion 表征将视频中的场景表示为规范的 3D 体积,通过局部规范双射(local-canonical bijection)映射成每个帧中的局部体积。局部规范双射被参数化为神经网络,并在不分离两者的情况下捕获相机和场景运动。基于此种方法,视频可以被视为来自固定静态相机局部体积的渲染结果。

wKgaomTYgtOAbH4KAAXBMZBqqCE495.png

由于 OmniMotion 没有明确区分相机和场景运动,所以形成的表征不是物理上准确的 3D 场景重建。因此,该研究称其为 quasi-3D 表征。

OmniMotion 保留了投影到每个像素的所有场景点的信息,以及它们的相对深度顺序,这让画面中的点即使暂时被遮挡,也能对其进行追踪。

实验及结果

定量比较

研究者将提出的方法与 TAP-Vid 基准进行比较,结果如表 1 所示。可以看出,在不同的数据集上,他们的方法始终能实现最佳的位置准确性、遮挡准确性和时序一致性。他们的方法可以很好地处理来自 RAFT 和 TAP-Net 的不同的成对对应输入,并且在这两种基准方法上提供了一致的改进。

0d73db26-085d-11ee-962d-dac502259ad0.png

定性比较

如图 3 所示,研究者对他们的方法和基线方法进行了定性比较。新方法在(长时间)遮挡事件中显示出了出色的识别和追踪的能力,同时在遮挡期间为点提供合理的位置,并处理很大的摄像机运动视差。

wKgZomTYgxOAVFZRAAepLTl23yo522.png

消融实验与分析

研究者利用消融实验来验证他们设计决策的有效性,结果如表 2 所示。

0e4b0f56-085d-11ee-962d-dac502259ad0.png

在图 4 中,他们展示了由他们的模型生成的伪深度图,以展示学习到的深度排序。

wKgaomTYgy6APHeiAAcuO0q5oxM428.png

需要注意的是,这些图并不对应于物理深度,然而,它们展示了仅使用光度和光流信号时,新方法能够有效地确定不同表面之间的相对顺序,这对于在遮挡中进行追踪至关重要。更多的消融实验和分析结果可以在补充材料中找到。


原文标题:随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

文章出处:【微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2939

    文章

    47317

    浏览量

    407779

原文标题:随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    索尼基于时识科技Speck2f芯片打造可穿戴眼动追踪系统

    传统帧式相机长期受高功耗瓶颈制约,可穿戴设备难以实现持续眼动追踪。近日,索尼研究团队基于时识科技(SynSense)Speck2f芯片,成功研发出全球首个全集成、电池供电的可穿戴眼动追踪系统。该方案
    的头像 发表于 12-04 17:05 524次阅读

    设备管理进入 “手机时代”:随时随地盯生产成常态

    对于企业而言,拥抱设备管理的 “手机时代” 已不是选择题,而是提升核心竞争力的必修课。套好用的手机端设备管理系统,如同给每台设备配备专属 “管家”,让管理者随时随地掌控生产脉搏,线人员告别繁琐流程,最终实现 “少停机、降成本
    的头像 发表于 11-07 10:02 151次阅读
    设备管理进入 “手机时代”:<b class='flag-5'>随时随地</b>盯生产成常态

    目标追踪的简易实现:模板匹配

    直不变的,当目标靠近或者远离摄像头的时候,在视频中就会表现出目标尺度大小的变化,这给算法的自适应能力带来了挑战;遮挡与消失,即目标物体在运
    发表于 10-28 07:21

    拼多多商品推广链接生成API:社交裂变的转化追踪利器

    ​ 在社交电商时代,拼多多通过 商品推广链接生成API 为商家提供了精准的流量转化解决方案。该工具不仅简化了社交裂变活动的落地,更实现了全链路转化效果追踪,成为提升营销效率的核心引擎。 、核心
    的头像 发表于 09-08 16:22 480次阅读
    拼多多商品推广链接生成API:社交裂变的转化<b class='flag-5'>追踪</b>利器

    资产追踪设备市场对Cat.1模组与NTN的融合需求

    的兴起,Cat.1模组市场将呈现持续增长态势。预计到2025年,全球Cat.1模组出货量将突破1.8亿片,其中资产追踪领域占比超过30% ;到2030年,Cat.1模组在资产追踪设备中的渗透率仍将保持在65%以上,主要依赖其成本优势和与NTN的协同方案。这
    的头像 发表于 08-25 15:53 501次阅读

    如何使用树莓派与OpenCV实现面部和运动追踪的云台系统?

    大家好,这是个树莓派和OpenCV的连载专题。使用树莓派与OpenCV实现姿态估计和面部特征点追踪使用树莓派与OpenCV实现面部和运动追踪的云台系统使用树莓派和OpenCV实现手部识别与手指识别
    的头像 发表于 08-14 17:45 957次阅读
    如何使用树莓派与OpenCV实现面部和运动<b class='flag-5'>追踪</b>的云台系统?

    用树莓派追踪400公里内的飞机?

    都能掌握它们的详细信息,包括它们之前的飞行轨迹。这一切都要归功于树莓派和FlightAwareProStick。将它们组合在起,你就能创建个PiAware系统
    的头像 发表于 08-08 14:59 524次阅读
    用树莓派<b class='flag-5'>追踪</b>400公里内的飞机?

    资产追踪与室内导航

    面展现出巨大潜力。 :资产追踪 资产追踪是指通过技术手段实时监控物理资产的位置、状态和使用情况,帮助企业优化资源利用,减少丢失或闲置。无论是医疗设备、物流货物还是零售库存,资产追踪
    的头像 发表于 07-04 18:22 366次阅读

    RFID在资产追踪中的应用

    RFID是种通过无线电波进行数据读写和物体识别的技术。它由电子标签、读写器和天线组成,能够实现非接触式的数据交互。相比传统的条形码技术,RFID具有更高的效率、更强的抗污染能力和更远的读取距离
    的头像 发表于 04-11 16:39 647次阅读
    RFID在资产<b class='flag-5'>追踪</b>中的应用

    RFID在物流追踪中的应用

    RFID是种通过无线电波进行数据读写和物体识别的技术。它由标签、读写器和天线组成,能够实现非接触式的数据交互。相比传统的条形码技术,RFID具有更高的效率、更强的抗污染能力和更远的读取距离
    的头像 发表于 04-03 15:03 754次阅读
    RFID在物流<b class='flag-5'>追踪</b>中的应用

    个树莓派,是如何同时实现飞机追踪、气象监测、家居控制?

    SwadeWhite设计了款非常酷的ADS-B飞机跟踪器,内置气象站和家庭自动化功能。我们已经看过不少树莓派飞机追踪项目,但这个项目绝对有点额外的东西。在Reddit上,制作者和开发者
    的头像 发表于 03-24 14:51 577次阅读
    <b class='flag-5'>一</b>个树莓派,是如何同时实现飞机<b class='flag-5'>追踪</b>、气象监测、家居控制?

    随时随地,轻松测量:在线投影图像测量工具​

    在线投影图像测量仪以其随时随地、轻松测量的特性,在工业生产的多种环境中展现出了强大的应用价值。它不仅为企业提供了精准可靠的测量解决方案,还助力企业提升生产效率、保障产品质量,推动工业生产向智能化、数字化迈进。
    的头像 发表于 03-10 11:29 1439次阅读
    <b class='flag-5'>随时随地</b>,轻松测量:在线投影图像测量工具​

    智慧园区人员定位及轨迹追踪技术哪个好?

    智慧园区作为城市发展的重要组成部分,其管理和服务效率的提升日益受到重视。人员定位及轨迹追踪技术作为智慧园区建设的核心环节之,对于提高园区安全性、优化资源配置、提升服务体验具有重要意义。然而,传统
    的头像 发表于 01-22 11:18 879次阅读
    智慧园区人员定位及轨迹<b class='flag-5'>追踪</b>技术哪个好?

    PieX AI发布情绪追踪挂坠,革新心理健康管理

    近日,PieX AI公司宣布了项令人瞩目的创新成果——款基于人工智能(AI)的情绪追踪挂坠传感器。这款挂坠融合了先进的感应技术与AI算法,旨在为用户提供
    的头像 发表于 01-08 13:51 1170次阅读

    人员轨迹如何追踪管理?人员定位系统键解决难题

    在快节奏的现代工业生产中,有效追踪与管理人员轨迹是确保生产流程顺畅、提升工作效率与保障员工安全的重要环。然而,在大型工厂环境中,人员轨迹的追踪如何做到呢?其实很多重工业已经用上人员定位系统了,来看
    的头像 发表于 12-10 10:42 1240次阅读