0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数字视频稳定调查:概念、方法和挑战

共熵服务中心 来源:未知 2022-11-16 20:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文翻译自《ACM技术洞察》科学杂志上的一篇文章:《Survey on Digital Video Stabilization: Concepts, Methods, and Challenges》,原文链接如下:

https://dl.acm.org/doi/pdf/10.1145/3494525


CSUR-IG是谁?

CSUR-IG是计算调研兴趣小组 Computing SURveys Interest Group的缩写。我们是ACM技术洞察研究团队。我们是来自4个地方的同学:

1名深圳大学大三学生

2名中原工学院研一学生

1名安阳工学院大三学生

1名南通科技学院大三学生

我们在OpenHarmony成长计划啃论文俱乐部里,与华为、软通动力、鸿湖万联等公司一起,学习和研究操作系统技术…


1. 简介

1.1 本文摘要

数字视频稳定是一项具有挑战性的任务,旨在通过平滑相机轨迹将可能不稳定的视频转换为令人愉快的视频。

稳定可以借助硬件(稳定器)的方式实现,也可以通过软件算法的方式实现。本文谈的是后者。

尽管在解决这一任务的文献中发现了各种作品,但它们的组织和分析尚未受到太多关注。在这项工作中,我们根据提议的分类法对视频稳定的文献进行了全面回顾。介绍了该问题的正式定义,以及物理术语的简要解释。我们还就这一活跃领域的主要挑战和未来趋势进行了全面讨论。

1.2 数字视频稳定的定义

数字视频稳定就是通过平滑相机轨迹将可能不稳定的视频转换为令人愉快的视频。视频可以表示为一系列照片(帧)。

图中,真实世界裁剪(白色)产生的照片和视频(蓝色)的表示。左:以矩形表示的照片。中间和右侧:以音量表示的稳定和不稳定视频。

数字视频稳定就想解决不用设备(直接用手)的情况下,把视频拍得好看,很有商业价值。


2. 正式定义和分类

2.1 相机运动方法

我拿着相机,可以前后左右走,举高举低(第一个图),我拍特别角度,拿着相机转(第二个图),合起来就是复杂运动(第三个图)。

2.2数字视频稳定的一些方法

2.2.1 经典的方法(三步走):

数字视频稳定的典型过程涉及三个不同的步骤,如下图所示:(1) 摄像机运动估计,(2) 不需要的运动确定,以及 (3) 稳定视图渲染。

2.2.2 基于深度学习的方法:

深度学习的方法提出了深度神经网络架构,以有监督或无监督的方式稳定视频。


3.主要挑战场景

3.1相机的估计运动

拍摄的过程中,人会带着相机运动,拍摄的事物也会运动,组合起来就是表观运动,也就是拍出来的东西。相机的估计运动就是通过表观运动(拍出来的东西)估计出相机本身是怎么运动的。

相机运动估计技术地图,主要讲了估计出相机本身是怎么运动中2D(二维),3D(三维)和2.5D(混合方法)的一些处理方法,并且给出了相应的描述和优缺点比较:

表 1. 对数字视频稳定中摄像机运动估计的进步做出贡献的一些主要工作总结

3.2怎么确定不需要的运动

拍摄过程中因为不必要的抖动导致画质不好,这种运动需要确定,就是确定不需要的运动。

不需要的运动确认技术地图,主要讲了为了去除的不需要的运动部分以获得更平滑的路径中基于过滤的方法,基于插值的方法,基于优化的方法,并且给出了相应的描述和优缺点比较:

表 2. 有助于推动数字视频稳定中的无用运动确定的一些主要工作总结

3.3稳定视图渲染

我们要处理一些丢失或者模糊的帧,也就是帧的修复。

稳定渲染的技术地图,主要讲了渲染稳定的帧中中基于填充的方法和基于裁剪的方法,并且给出了相应的描述和优缺点比较:

表 3. 推动数字视频稳定渲染新视图的一些主要工作总

4.基于深度学习的方法

基于深度学习的视频稳定方法,大多数使用带有配对视频的数据集进行训练,其中每一对都有一个不稳定的和一个真实稳定的视频。在这种情况下,如下图所示,目标是找到一个网络,该网络从不稳定版本中预测帧,使其与稳定版本尽可能相似。

图中,基于深度学习的方法中常用的方法。不稳定的帧和一些时间信息提供给深度网络,以在训练/推理阶段预测稳定/稳定的帧。

深度学习数字视频稳定技术地图,这种方法没有明确地估计相机运动,但他们使用的是表观运动。通常,不需要的运动的确定和移除是隐式完成的:网络学习预测类似于真实稳定视频的视频,以下就是给出论文技术的盘点:

表 4. 基于深度神经网络执行数字视频稳定的方法总结

5.结论

5.1 过去的回顾
这项工作对数字视频稳定文献中可用的方法进行了回顾。我们根据使用的方法对方法进行分类,无论是经典的还是基于深度学习的。经典方法分为三个主要阶段:(1)相机运动估计,(2)确定不需要的运动,以及(3)稳定帧的渲染。对于这些步骤中的每一个,我们定义并分类了这些方法。
5.2本文结论
  • 一些实际应用可以受益于数字视频稳定及其开发所产生的知识。

  • 需要更好地定义使用这些方法的场景。

  • 与其计算机视觉领域类似,深度学习已成为近年来视频稳定的趋势。

  • 数字视频稳定文献中的关键点之一是还没有明确定义的评估指标。

<本文完>


写在最后


OpenHarmony 成长计划—“啃论文俱乐部”(以下简称“啃论文俱乐部”)是在 2022年 1 月 11 日的一次日常活动中诞生的。截至 3 月 31 日,啃论文俱乐部已有 87 名师生和企业导师参与,目前共有十二个技术方向并行探索,每个方向都有专业的技术老师带领同学们通过啃综述论文制定技术地图,按“降龙十八掌”的学习方法编排技术开发内容,并通过专业推广培养高校开发者成为软件技术学术级人才。


啃论文俱乐部的宗旨是希望同学们在开源活动中得到软件技术能力提升、得到技术写作能力提升、得到讲解技术能力提升。大学一年级新生〇门槛参与,已有俱乐部来自多所高校的大一同学写出高居榜首的技术文章。


如今,搜索“啃论文”,人们不禁想到、而且看到的都是我们——OpenHarmony 成长计划—“啃论文俱乐部”的产出。






OpenHarmony开源与开发者成长计划—“啃论文俱乐部”学习资料合集


1)入门资料:啃论文可以有怎样的体验

https://docs.qq.com/slide/DY0RXWElBTVlHaXhi?u=4e311e072cbf4f93968e09c44294987d


2)操作办法:怎么从啃论文到开源提交以及深度技术文章输出https://docs.qq.com/slide/DY05kbGtsYVFmcUhU


3)企业/学校/老师/学生为什么要参与 & 啃论文俱乐部的运营办法https://docs.qq.com/slide/DY2JkS2ZEb2FWckhq


4)往期啃论文俱乐部同学分享会精彩回顾:

同学分享会No1.成长计划啃论文分享会纪要(2022/02/18)https://docs.qq.com/doc/DY2RZZmVNU2hTQlFY

同学分享会No.2 成长计划啃论文分享会纪要(2022/03/11)https://docs.qq.com/doc/DUkJ5c2NRd2FRZkhF

同学们分享会No.3 成长计划啃论文分享会纪要(2022/03/25)

https://docs.qq.com/doc/DUm5pUEF3ck1VcG92?u=4e311e072cbf4f93968e09c44294987d


现在,你是不是也热血沸腾,摩拳擦掌地准备加入这个俱乐部呢?当然欢迎啦!啃论文俱乐部向任何对开源技术感兴趣的大学生开发者敞开大门。



扫码添加 OpenHarmony 高校小助手,加入“啃论文俱乐部”微信群


后续,我们会在服务中心公众号陆续分享一些 OpenHarmony 开源与开发者成长计划—“啃论文俱乐部”学习心得体会和总结资料。记得呼朋引伴来看哦。

























原文标题:数字视频稳定调查:概念、方法和挑战

文章出处:【微信公众号:开源技术服务中心】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源技术
    +关注

    关注

    0

    文章

    389

    浏览量

    8698
  • OpenHarmony
    +关注

    关注

    31

    文章

    3928

    浏览量

    20740

原文标题:数字视频稳定调查:概念、方法和挑战

文章出处:【微信号:开源技术服务中心,微信公众号:共熵服务中心】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    通过FPGA控制ADV7513芯片实现HDMI音视频输出

    (数字视频接口,只能用来传输视频,而不能同时传输音频)。DVI 和HDMI 接口协议在物理层均使用TMDS 标准传输数据。
    的头像 发表于 12-11 13:57 4370次阅读
    通过FPGA控制ADV7513芯片实现HDMI音<b class='flag-5'>视频</b>输出

    视频光端机的使用方法

    视频光端机使用指南 视频光端机,全称为视频光端传输终端,是安防监控、智能交通、广播电视等领域中不可或缺的设备。它的核心作用是将摄像头的模拟或数字视频信号转换成光信号,通过光纤进行远距离
    的头像 发表于 12-03 10:00 194次阅读

    ‌LMH1983 3G/HD/SD视频时钟发生器技术文档总结

    该LMH1983是一款高度集成的可编程音频/视频 (A/V) 时钟发生器 适用于广播和专业应用。它可以取代使用的多个 PLL 和 VCXO 在支持 SMPTE 串行数字视频 (SDI) 和数字
    的头像 发表于 09-16 15:26 757次阅读
    ‌LMH1983 3G/HD/SD<b class='flag-5'>视频</b>时钟发生器技术文档总结

    海康威视推出激光雷达视频交调一体机,助力交通调查数字化升级

    优化交通管理,为交通政策制定及交通规划提供依据。 当前,交通调查工作的数字化升级已成为提升交通治理现代化水平的关键环节。随着我国机动车保有量持续攀升,传统人工交通调查方式往往面临数据采集效率较低、容易存在误差
    的头像 发表于 07-30 18:11 1109次阅读
    海康威视推出激光雷达<b class='flag-5'>视频</b>交调一体机,助力交通<b class='flag-5'>调查</b><b class='flag-5'>数字</b>化升级

    千方科技推出多功能交通调查站解决方案

    2025年初,交通运输部印发《普通国省道多功能交通调查站布局和建设方案》,要求各省市加快建设多功能交通调查站,提升国省道交通调查能力,推进公路数字化。千方科技快速响应并推出“智能感知+
    的头像 发表于 07-09 15:52 1029次阅读

    双路MIPI数字视频接口AI图像处理板Viztra-LE048上线

    MIPI视频接口具备高数据传输速率的特点,能够满足高分辨率和高刷新率显示的需求。其传输速度最高可达数Gbps,确保图像和视频数据能够迅速且准确地传输和处理‌,在图像处理领域能够和摄像头高效、兼容
    的头像 发表于 07-01 17:55 951次阅读
    双路MIPI<b class='flag-5'>数字视频</b>接口AI图像处理板Viztra-LE048上线

    STM32+VCXO搞定智能电表采样同步,用的就是FVC-3X

    常用频点 总结 FVC-3X与FVC-5X作为FCom富士晶振推出的电压控制晶体振荡器系列产品,在低相位抖动控制、精准拉频特性与多样化封装支持上表现出色,满足高速通信、电网同步、数字视频传输等对稳定
    发表于 05-20 17:05

    GM7121-D视频编码芯片技术解析与应用指南

    (电子工程师参考版)   #### 一、器件概述   GM7121-D是成都振芯科技股份有限公司推出的一款高性能视频编码芯片,专用于数字视频信号到模拟复合视频信号的转换。其核心功能包括数字视频
    的头像 发表于 04-23 15:27 721次阅读

    开关变换器环路设计指南从模拟到数字控制

    资料介绍 本书的特色是:作者对开关变换器的环路控制不进行过于“学术化”的讨论,只对一些必要的理论给出数学方程,并由浅入深,用通俗易懂的语言,比较全面地介绍了环路控制的基本概念、环路稳定的条件、输入
    发表于 04-17 13:55

    混合信号设计的概念挑战与发展趋势

    本文介绍了集成电路设计领域中混合信号设计的概念挑战与发展趋势。
    的头像 发表于 04-01 10:30 1230次阅读

    吉时利数字源表2450电流稳定性测试报告

    性表现直接影响着它在各种应用场景中的效能。本文将详细介绍吉时利2450数字源表电流稳定性的测试过程、方法和结果分析。   一、测试背景与目的 吉时利2450数字源表是一款广泛应用于电子
    的头像 发表于 03-24 13:09 564次阅读
    吉时利<b class='flag-5'>数字</b>源表2450电流<b class='flag-5'>稳定</b>性测试报告

    欧盟重审对科技巨头调查

    ,可能涉及减少或改变对科技巨头的调查内容。欧盟委员会正在审慎考虑如何调整其监管策略,以更好地适应数字市场的快速发展和变化。 值得注意的是,此次重新评估将涵盖自2024年3月欧盟《数字市场法》(DMA)启动以来的所有相关案件。DM
    的头像 发表于 01-16 10:38 777次阅读

    欧盟重新评估科技巨头调查

    的监管审查提出挑战。特朗普的立场和政策走向,无疑将对欧盟的调查产生一定影响。 此次欧盟的重新评估,旨在更全面、深入地审视这些科技巨头的市场行为。知情人士指出,审查的结果可能导致欧盟减少或改变原有的调查范围,以适应新的市场环境
    的头像 发表于 01-15 15:33 754次阅读

    以智能制造为导向的数字孪生工厂构建方法与应用

    数字孪生工厂的构建方法与应用,以期为制造企业实现智能制造提供参考与指导。 1?数字孪生的概念及内涵 1.1 数字孪生的
    的头像 发表于 01-06 10:41 791次阅读

    从DP到HDMI,山泽连接新的桥梁

    山泽是一个专注于设计和制造高质量音视频连接线材及配件的品牌。它以提供稳定可靠的信号传输解决方案而闻名,尤其是在数字视频接口(如DP,即DisplayPort)到模拟或其它类型的数字视频
    的头像 发表于 12-19 17:43 961次阅读