0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在多个数据集的光流预测任务上大幅提升了预测性能

DPVg_AI_era 来源:lq 2019-07-07 07:56 次阅读

对光流的学习和跟踪是计算机视觉领域的基本任务。在3D目标跟踪、处理和重建等实际任务中,经常需要对被遮挡的光流进行预测。本文介绍在CVPR2019上发表的一篇论文,在多个数据集的光流预测任务上大幅提升了预测性能。

光流是计算机视觉的一个基本任务,它描述了视频中的运动信息,相关技术广泛应用于视频理解和处理、物体跟踪、三维重建、自动驾驶等场景。近日,来自香港中文大学和腾讯AI实验室团队的一篇论文入选了CVPR2019。

论文题为《一种自监督的光流学习方法》。论文团队探索了使用卷积神经网络估计光流的一个关键挑战:预测被遮挡像素的光流。

论文地址:

https://arxiv.org/abs/1904.09117

论文第一作者刘鹏鹏详细阐述了该论文的意义:“首先,我们提出了一种从没有标注的数据中学习光流的自监督训练框架。这个方法会人为创造一些遮挡,然后利用已经学习到的比较准确的没有被遮挡像素的光流去指导神经网络学习被遮挡像素的光流。其次,我们设计一个可以利用多帧图像时序连续性的网络结构来更好地学习光流。

基于这两个原则,我们的方法在MPI Sintel, KITTI 2012和KITTI 2015等数据集上取得了最好的无监督学习效果。更重要的是,我们的无监督方法得到的模型为有监督的微调提供了一个很好的初始化,消除了训练光流神经网络对仿真数据的依赖。经过有监督微调,我们的模型在以上三个数据集上取得了目前最优的性能,这是光流研究历史上第一次不使用额外仿真数据达到的最高准确度。

我们在写这篇文章的时候(2018年11月),我们的模型在Sintel评测集上取得EPE=4.26,超过来自世界各地研究机构的所有180多种已经提交的方法。直到今天,我们的算法在Sintel榜单上还是第一。”

自监督光流学习框架SelFlow:刷新多项预测精度纪录

表1:与基于最先进学习的光流估计方法的比较。我们的方法优于所有数据集上的所有无监督光流学习方法。我们的监督微调模型在Sintel Final数据集和KITTI 2012数据集上实现了最高精度。除KITTI 2012和KITTI 2015测试集的最后一列外,所有数字均为EPE,我们报告了所有像素(Fl-all)上的错误像素百分比。( - )表示未报告相应方法的结果。括号表示训练和测试是在同一数据集上执行的。粗体字为无监督和监督方法中的最佳结果。

图2 在每个级别的网络架构(类似于PWC-Net)。˙wl表示水平l的初始粗流,F l表示翘曲的特征表示。在每个级别,将初始流量和成本量作为输入交换,以便同时估计前向流量和后向流量。再将这些估计传递到l-1层上,估计更高分辨率的流。

图3 多帧自训练的数据流。为了估计三帧流学习的遮挡图,我们使用五个图像作为输入。这样,我们可以进行前后一致性检查,以分别估计I t和I t + 1之间,I t和I t-1之间的遮挡图。

图4 在Sintel和KITTI数据集上对无监督结果进行抽样。图中由上至下依次为在Sintel Final,KITTI 2012和KITTI 2015数据集上的取样。

图5 在Sintel Clean培训和Sintel Final测试数据集的不同设置下的定性比较。遮挡处理,多帧制定和自我监督不断提高性能

实验结果与分析:多项数据集预测性能显著提升

如表1所示,我们在所有评估指标下的所有数据集上实现了无监督和监督光流学习的最新结果。图4所示为Sintel和KITTI的样本结果。

无监督学习

本文中的方法在基准测试中实现了无监督学习方法的最高精度。在Sintel Final基准测试中,将之前的最佳EPE从7.40 降低到6.57,相对提升幅度为11.2%。这甚至比包括FlowNetS,FlowNetC和SpyNet在内的几种完全监督方法更优秀。在KITTI数据集上的改进更为明显。

对于训练数据集,我们实现了EPE = 1.69,KITTI 2012的相对改进幅度为28.1%,EPE = 4.84,与之前最佳无监督方法DDFlow相比,KITTI 2015的相对改进为15.3%。在KITTI 2012测试集中,实现了Fl-all = 7.68%,这比包括FlowNet2,PWC-Net,ProFlow和MFF在内的最先进的监督学习方法实现了更好的性能。在KITTI 2015基准测试中,实现了Fl-all=14.19%,优于所有无监督方法。其中一些无监督学习的结果也优于一些完全监督的方法,包括DCFlow和ProFlow等。

监督式微调

使用Ground-truth流程进一步对无监督学习模型进行微调后,模型在所有三个数据集上都获得了最先进的结果,KITTI 2012上的Fl-all = 6.19%,KITTI 2015上的Fl-all = 8.42%。最重要的是,我们的方法在Sintel Final数据集上实现了EPE = 4.26 ,在所有提交的方法中实现Sintel了基准测试的最高精度。所有这些都表明,我们的方法减少了预训练对合成数据集的依赖,不必再遵循不同数据集来专门制定训练计划。

结论与未来方向:有效降低对标记数据集的依赖

本文提出了一种自我监督的方法来学习准确的光流估计,此方法将噪声注入到超级像素中以创建遮挡,让一个模型引导另一个模型来学习遮挡像素的光流。我们通过简单的CNN有效地聚合来自多个帧的时间信息,改进流量预测精度。大量实验表明,我们的方法明显优于所有现有的无监督光流学习方法。在使用我们的无监督模型进行微调后,模型在所有领先的基准测试中实现了最先进的流量估算精度结果。我们的研究可以完全降低预训练过程对合成标记数据集的依赖,并通过对未标记数据进行自监督的预训练,实现优异的预测性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4565

    浏览量

    98652
  • 计算机视觉
    +关注

    关注

    8

    文章

    1591

    浏览量

    45592
  • 数据集
    +关注

    关注

    4

    文章

    1176

    浏览量

    24340

原文标题:港中大等打造光流预测新模型SelFlow,自监督学习攻克遮挡难题 | CVPR 2019

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    机器学习能诊断病情,还能预测患者出院后的情况?

    (特征)。预测模型 在数据清洗和特征选择完成后,将任务目标定义为二分类问题:预测脓毒症患者出院后90天内是否死亡。 选择的算法为梯度提升树(
    发表于 05-07 15:29

    TF之CNN:CNN实现mnist数据预测

    TF之CNN:CNN实现mnist数据预测 96%采用placeholder用法+2层C及其max_pool法+隐藏层dropout法+输出层softmax法+目标函数cross_entropy法+
    发表于 12-19 17:02

    基于Keras中建立的简单的二分类问题的神经网络模型(根据200个数据样本预测新的5+1个样本)—类别预测

    Keras之ML~P:基于Keras中建立的简单的二分类问题的神经网络模型(根据200个数据样本预测新的5+1个样本)——类别预测
    发表于 12-24 11:45

    个数可视化埋点及行为预测的创新分析

    【技术学院】个数是如何用大数据做行为预测的?
    发表于 02-26 13:39

    直接数字频率合成技术大幅提升了无杂散动态范围性能

    )也是一种DAC,可以生成数字正弦信号,并将其馈入DAC来产生相应的模拟信号。本文将重点介绍新近出现的一项技术突破,它借助DDS技术大幅提升了DAC的无杂散动态范围(SFDR)性能
    发表于 06-27 06:29

    伏功率预测系统的构成和作用

      伏功率预测是什么?伏功率预测系统就是将天气预报数据和环境检测仪所采集的数据加以分析,最后
    发表于 01-18 16:10

    蓝牙5.0提升了哪些性能

    蓝牙5.0提升了哪些性能
    发表于 05-18 06:25

    多片段时序数据建模预测实践资料分享

    进行模型的构建与预测分析的,但是实际的工程使用中会有一种特殊的情况就是:我们通过实验所采集到的数据往往不是绝对连续的而是多“片段”的。
    发表于 06-30 07:52

    伏功率预测有哪些作用

    伏功率预测有哪些作用?作用有哪些?伏功率预测是什么?伏功率预测系统就是将天气预报
    发表于 07-07 07:44

    深度学习预测和健康管理中的应用

    深度学习预测和健康管理中的应用综述摘要深度学习对预测和健康管理(PHM)引起了浓厚的兴趣,因为它具有强大的表示能力,自动化的功能学习能力以及解决复杂问题的一
    发表于 07-12 06:46

    介绍有关时间序列预测和时间序列分类

    时间序列预测和时间序列分类任务真实数据的应用,你可以以此为模板,针对自己的业务需求进行二次
    发表于 07-12 09:18

    智能电网预测负荷波动的影响

    多方面内容,基于大数据技术能够实现对抽象指标的量化操作,并明确其与负荷间所具备的关系,这样的方式可以更好地预测到负荷变化趋势,从而提升了预测精度。受分布式发电接入方式的影响,新能源也逐
    发表于 07-12 06:52

    什么是有限模型预测控制

    有限模型预测控制(finitecontrol set-model predictive control,FCS-MPC)作为一种具有运算量大的特点的控制算法,随着数字信号处理器处理能力的提高也被
    发表于 08-27 06:05

    基于机器学习的车位状态预测方法

    中每个车位在不同时间段停车状态的历史数据,形成停车状态历史数据并分别提取特征变量和目标变量;将所述特征变量
    发表于 09-21 07:24

    LabVIEW进行癌症预测模型研究

    ,然后将得到的特征向量输入到SVM中进行分类。 LabVIEW是一种视觉编程语言,与传统的文本编程语言不同,更适合于进行复杂数据分析和预测模型的开发。 LabVIEW使用数据流模型,可以并行处理
    发表于 12-13 19:04