0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI隐身术:能让物体在视频中消失的魔法

电子设计 来源:电子设计 作者:电子设计 2020-12-08 22:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

点赞再看,养成习惯,微信公众号搜索【JackCui-AI】关注这个爱发技术干货程序员。本文 GitHub https://github.com/Jack-Cherish/PythonPark 已收录,有一线大厂面试完整考点、资料以及我的系列文章。

1 前言

刚刚过去的 2020 年 ECCV,有一项 AI“隐身”技术引人瞩目。

正在坐秋千的小孩,突然只剩下秋千架。

让漫步的行人消失,让奔驰的汽车消失。

这么好玩的 AI 算法,你想学吗?

老规矩,今天,继续手把手教学。

算法原理、环境搭建、效果实现,一条龙服务,尽在下文!

2 FGVC

FGVC 的作者是一位 90 后北京小伙,目前在弗吉尼亚理工大学计算机工程专业就读博士三年级,师从华人教授 Jia-Bin Huang。

FGVC 算法本质上是一个基于光流法的视频修复算法。

光流法是视域中物体运动检测的概念,其用于描述运动所造成的观测目标、表面或边缘的运动,主要应用于计算机视觉和影像处理等。

使用光流法,可寻到不同帧之间的关系,并通过在不同帧之间传播信息来补全视频。

FGVC 主要包含三个步骤:Flow completion、Temporal propagation、Fusion。

Flow completion:具体操作时,要计算相邻帧之间的正向光流和反向光流、以及一组非相邻帧 (Non-local) 的正向光流和反向光流。

Temporal propagation:按照光流的轨迹,为每个丢失的像素找到一组候选像素,对于每个候选帧,都要估计一个置信分数以及一个二进制有效性指标。

Fusion:使用置信加权平均值,将每个缺失像素的候选像素与至少一个有效候选像素融合。对于没有候选像素,则使用一个关键帧,并使用单个图像补全技术来填充它。

更具体的原理,比如边缘引导的光流补充等,可以去「啃下」论文,学习一下。

Paper 地址:

https://arxiv.org/abs/2009.01835

3 环境配置

想要测试算法效果,先要部署下开发环境。

Github 开源项目地址:

https://github.com/vt-vl-lab/...

Github 下载慢的,可以下载我已经打包的代码(提取码:jack):

https://pan.baidu.com/s/1t/_EDDDgMCHBS83QFywuFdg

这里推荐使用 Anaconda 完成部署,不知道 conda 用法的,可以看下我写过的另一篇基础教程:

《别再折腾开发环境了,一劳永逸的搭建方法

FGVC 算法依赖于另外两个算法 DeepFill 和 RAFT。

所以,可以创建两个虚拟环境 FGVC 和 raft。

FGVC 环境使用 PyTorch 0.4.0,并配置算法 DeepFill 的环境。

DeepFill 环境配置方法:

https://github.com/nbei/Deep-...

直接使用指令安装依赖库:

pip install -r requirements.txt

raft 环境使用 PyTorch 1.6.0,并配置算法 RAFT 的环境。

RAFT 环境配置方法:

https://github.com/princeton-...

这里比较简单,使用 conda 安装需要的库即可。

都配置完毕,就可以测试算法效果了!

4 效果测试

先激活 raft 虚拟环境,直到运行结果出现提示:

「Please switch to Pytorch 0.4.0」

然后切换到 FGVC 虚拟环境,然后再运行一次代码。

Object removal:

cd tool

FOV extrapolation:

cd tool

想要计算速度更快些,可以去掉 seamless 参数。

算法需要 rgb 图片和 mask 图片,这些数据是已知的,想要去除什么物体,给个物体的 mask 即可。

运行效果示意图

5 最后

关注我带你玩转各种好玩的 AI 算法,我是 Jack Cui,我们下期见!

作者:Jack Cui
原文:https://mp.weixin.qq.com/s/2c...
关注作者公众号,获取更多有趣AI应用~

系列篇

更多AIoT领域有趣的算法应用及产品请关注有趣的AIoT应用专栏。

审核编辑:符乾江
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38245

    浏览量

    297223
  • 人工智能
    +关注

    关注

    1813

    文章

    49775

    浏览量

    261835
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RK3576智能工程机械的应用|三屏八摄AI视觉解决方案

    特性,为智能工程机械提供了稳定高效的计算平台。 二、RK3576的核心技术优势 1. 三屏异显:多界面协同控制 工程机械驾驶舱,操作员通常需要同时查看作业参数、监控画面和导航信息。RK3576
    发表于 11-07 22:11

    轻触开关:指尖上的 “魔法钥匙”,寰立为你开启便捷电子世界

    电子设备如繁星般遍布生活的今天,有这样一种看似不起眼,却能让设备 “听令于指尖” 的关键元件 —— 轻触开关。它如同藏在电子设备里的 “魔法钥匙”,轻轻一按,就能触发设备的各种功能,而寰立开关旗下
    的头像 发表于 10-14 11:47 475次阅读
    轻触开关:指尖上的 “<b class='flag-5'>魔法</b>钥匙”,寰立为你开启便捷电子世界

    电磁兼容与雷达隐身技术测试系统解析

    电磁兼容与雷达隐身技术测试系统解析(精简版)
    的头像 发表于 09-15 17:11 344次阅读
    电磁兼容与雷达<b class='flag-5'>隐身</b>技术测试系统解析

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    的不同。随着AI热潮的兴起,大脑的抽象模型已被提炼成各种的AI算法,并使用半导体芯片技术加以实现。 而大脑是一个由无数神经元通过突触连接而成的复杂网络,是极其复杂和精密的。大脑本质上就是一台湿润的软组织
    发表于 09-06 19:12

    RK3576赋能无人机巡检:多路视频+AI识别引领智能化变革

    巡检,需要快速、大量的采集作物表型信息并进行分析; 难点在于: 1)多路视频同步采集对带宽和处理能力要求高; 2)飞行过程AI识别必须实时,否则漏检率高; 3)机载设备功耗过高会
    发表于 08-20 17:26

    AI视频分析系统

    方案背景人工智能大时代背景下,视频应用领域相关的行业应用方式已经发生了深刻的变化,各论安防监控还是各类垂直行业视频应用,都需要AI视觉分析与识别技术助力,而且需求广泛而迫切。应用层面
    的头像 发表于 08-06 14:39 729次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>视频</b>分析系统

    扫描白光干涉高精度表面测量的应用

    扫描白光干涉(SWLI)是目前最精确的表面形貌测量技术之一,被广泛应用于工业与科研领域。从发明至今的三十余年间,精密光学、半导体、汽车及航天等先进制造领域的需求牵引下,该技术不断取得新的进展
    的头像 发表于 08-05 17:54 1027次阅读
    扫描白光干涉<b class='flag-5'>术</b><b class='flag-5'>在</b>高精度表面测量<b class='flag-5'>中</b>的应用

    AI视频分析化工领域的应用和开发

    AI视频分析化工领域的应用正深刻改变这一高风险行业的安全生产模式,通过智能视觉技术实现从“人防”到“技防”的升级。以下是关键技术落地场景及实施案例:   一、核心应用场景 1. 人员安全管
    的头像 发表于 07-22 11:47 610次阅读

    超声波换能器--声波世界的 “神奇魔法师”

    反射回来的声波,从而确定水下物体的位置、形状和距离。广泛应用于海洋测绘,帮助我们绘制出精确的海底地形图;水下考古,协助考古学家发现沉没的历史遗迹;渔业探测里,为渔民精准定位鱼群的
    发表于 06-11 17:30

    探索PWM技术:数字世界的模拟魔法

    科技飞速发展的今天,我们身边充斥着各种智能设备和创新技术。其中,脉冲宽度调制(PWM)技术就像一位神奇的魔法师,在数字与模拟的交汇处施展魔法,让我们的生活变得更加便捷和舒适。那么,究竟什么是PWM
    的头像 发表于 05-12 09:52 941次阅读
    探索PWM技术:数字世界的模拟<b class='flag-5'>魔法</b>

    为什么贴片电阻有字,而贴片电容没有?

    制造工艺的差异,更隐藏着电子元件设计的底层逻辑。 一、参数标识:电阻的“身份证”与电容的“隐身术” 1. 电阻的精确性要求 电阻是电路的“交通警察”,负责精确控制电流和电压。其阻值范围极广(从1Ω到
    发表于 04-22 11:29

    克拉克变换&amp;帕克变换:电机界的“变形金刚”双人组

    ”综合征。它们能让复杂的旋转电流瞬间变老实,就像把孙悟空绑在五指山下,任你施法! 二、克拉克变换:三相变两相的“空间折叠” 1. 核心功能:把三相静止坐标系“拍扁” 操作方式:用一个2/3的“魔法系数”把
    发表于 03-22 17:48

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    学习、自然语言处理(NLP)、计算机视觉(CV)等先进技术提供的强大的数据处理和分析能力。 视频应用开发AI Agent可以用于视频
    发表于 03-05 19:52

    变频器出现输出突然消失故障原因及解决

          变频器作为现代工业自动化不可或缺的重要设备,其电机调速、节能降耗等方面发挥着关键作用。然而,实际应用,变频器偶尔会出现输出突然
    的头像 发表于 01-03 07:38 2427次阅读

    Luma AI Ray 2视频模型即将发布

    近日,2024年亚马逊云科技re:Invent全球大会上,Luma AI宣布了一个令人振奋的消息:其最新版Luma AI Ray 2视频模型即将面向广大消费者、专业人士及开发者开放。
    的头像 发表于 12-20 11:37 995次阅读