0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

卷积神经网络 物体检测 YOLOv2

倩倩 来源:三姐的哥 2020-04-17 15:51 次阅读

继2015的YOLO后,2016年作者对YOLO升级到YOLO2,另外一个版本YOLO9000是基于wordtree跨数据集达到检测9000个分类,卷积层模型称为darknet-19,达到速度和效果的双提升,文章里充满了作者的自豪,也值得自豪;

作者正视了YOLO的两个大问题:回归框不精准和召回不够;一般的解决思路都是把网络加深加宽,不过本文不屑,作者反而要通过优化网络学习在准确率不降的情况下提升精度和召回!

升级点

Batch Normalization:每个卷积层加了BN,正则都不要了,droupout也省了,过拟合也没了,效果还好了,+2%mAP;

High Resolution Classifier - 高分辨率分类:模型训练时经典做法都是先在ImageNet上pre-train,然而ImageNet上的图片是低分辨率小于256*256的,而要检测的图片是高分辨率448*448的,这样模型需要同时在高分辨的图片上做fine-tune和检测,所以作者提出了三步骤 1) 在ImageNet低分辨率上pre-train;2) 在高分辨率数据集上fine-tune;3) 在高分辨率数据集上检测;使得模型更容易学习,+4%mAP

Convolution with Anchor Boxer - 加Anchor机制:YOLO是通过最后的全连接层直接预估绝对坐标,而FasterRCNN是通过卷积层预估相对坐标,作者认为这样更容易学习,因此YOLOv2去掉了全连接层,在最后一层卷积层下采样后用Anchor,yolo有7*7*2 = 98个框,而YOLOv2有超过1k的anchor,最终效果上虽然mAP略有下降3个千分点,但是召回提升7个百分点,值了!

Dimension Clusters - 维度聚类: Anchor的尺寸faster rcnn里人工选定的,YOLOv2通过k-mean聚类的方法,将训练数据里gt的框进行聚类,注意这里不能直接用欧式距离,大框会比小框影响大,我们的目标是IOU,因此距离为: d(box, centroid) = 1 IOU(box, centroid);下图是结果,左图是k和IOU的trand-off,右图是5个中心的框尺寸,明显看出和人工指定的差异很大;

Direct location prediction - 直接预测位置:直接预测x,y会导致模型训练不稳定,本文预测如下tx,ty,tw,th,to,通过sigmolid归一化到(0,1),结合dimension clusters,+5%mAP

Fine-Grained Freture - 细粒度特征:引入passthrough layer,将低维度特征传递给高维度,类似于resnet的shortcut,+1%mAP;

Multi-Scale Training - 多尺度训练:这里的多尺度是图片的尺寸,多了迫使模型适应更大范围的尺寸,每隔一定的epoch就强制改变输入图片的尺寸;

效果

如下是在VOC数据集上效率(每秒处理帧数)和效果(mAP)空间里不同算法的变现,其中YOLOv2为蓝色,有不同的trade-off,效率和效果都超过已有的方法;

如下是更多的实验结果:

如下是COCO上的效果,看得出COCO数据集还是很难的,小物体上YOLO2依然是差一些;

YOLO9000: Better, Faster, Stronger

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4453

    浏览量

    90746
  • 数据集
    +关注

    关注

    4

    文章

    1178

    浏览量

    24348
  • voc
    voc
    +关注

    关注

    0

    文章

    89

    浏览量

    15571
收藏 人收藏

    评论

    相关推荐

    卷积神经网络的定义、结构和发展历史

    卷积神经网络(Convolutional Neural Network,CNN)是一种非常重要的机器学习算法,主要应用于图像处理领域,用于图像分类、目标识别、物体检测等任务。该算法是深度学习领域的一个重要分支。下面具体介绍
    发表于 08-21 17:26 513次阅读

    cnn卷积神经网络算法 cnn卷积神经网络模型

    cnn卷积神经网络算法 cnn卷积神经网络模型 卷积神经网络(CNN)是一种特殊的
    的头像 发表于 08-21 17:15 1160次阅读

    卷积神经网络模型的优缺点

    等领域中非常流行,可用于分类、分割、检测等任务。而在实际应用中,卷积神经网络模型有其优点和缺点。这篇文章将详细介绍卷积神经网络模型的特点、优
    的头像 发表于 08-21 17:15 2309次阅读

    卷积神经网络模型搭建

    卷积神经网络模型搭建 卷积神经网络模型是一种深度学习算法。它已经成为了计算机视觉和自然语言处理等各种领域的主流算法,具有很大的应用前景。本篇文章将详细介绍
    的头像 发表于 08-21 17:11 610次阅读

    卷积神经网络算法流程 卷积神经网络模型工作流程

    ,其独特的卷积结构可以有效地提取图像和音频等信息的特征,以用于分类、识别等任务。本文将从卷积神经网络的基本结构、前向传播算法、反向传播算法等方面探讨其算法流程与模型工作流程,并介绍其在图像分类、
    的头像 发表于 08-21 16:50 1570次阅读

    卷积神经网络的介绍 什么是卷积神经网络算法

    卷积神经网络的介绍 什么是卷积神经网络算法 卷积神经网络涉及的关键技术
    的头像 发表于 08-21 16:49 1425次阅读

    卷积神经网络层级结构 卷积神经网络卷积层讲解

    像分类、目标检测、人脸识别等。卷积神经网络的核心是卷积层和池化层,它们构成了网络的主干,实现了对图像特征的提取和抽象。 一、
    的头像 发表于 08-21 16:49 4372次阅读

    卷积神经网络的基本原理 卷积神经网络发展 卷积神经网络三大特点

    卷积神经网络的基本原理 卷积神经网络发展历程 卷积神经网络三大特点 
    的头像 发表于 08-21 16:49 1435次阅读

    卷积神经网络三大特点

    卷积神经网络三大特点  卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习模型,其具有三大特点:局部感知、参数共享和下采样。 一、局部感知
    的头像 发表于 08-21 16:49 3567次阅读

    卷积神经网络如何识别图像

    为多层卷积层、池化层和全连接层。CNN模型通过训练识别并学习高度复杂的图像模式,对于识别物体和进行图像分类等任务有着非常优越的表现。本文将会详细介绍卷积神经网络如何识别图像,主要包括以
    的头像 发表于 08-21 16:49 1415次阅读

    卷积神经网络的工作原理 卷积神经网络通俗解释

    。CNN可以帮助人们实现许多有趣的任务,如图像分类、物体检测、语音识别、自然语言处理和视频分析等。本文将详细介绍卷积神经网络的工作原理并用通俗易懂的语言解释。 1.概述 卷积
    的头像 发表于 08-21 16:49 2734次阅读

    卷积神经网络概述 卷积神经网络的特点 cnn卷积神经网络的优点

    卷积神经网络概述 卷积神经网络的特点 cnn卷积神经网络的优点 
    的头像 发表于 08-21 16:41 1931次阅读

    卷积神经网络的应用 卷积神经网络通常用来处理什么

    卷积神经网络的应用 卷积神经网络通常用来处理什么 卷积神经网络(Convolutional Ne
    的头像 发表于 08-21 16:41 3976次阅读

    卷积神经网络结构

    Learning)的应用,通过运用多层卷积神经网络结构,可以自动地进行特征提取和学习,进而实现图像分类、物体识别、目标检测、语音识别和自然语言翻译等任务。
    的头像 发表于 08-17 16:30 881次阅读

    卷积神经网络原理:卷积神经网络模型和卷积神经网络算法

    卷积神经网络原理:卷积神经网络模型和卷积神经网络算法 卷积
    的头像 发表于 08-17 16:30 913次阅读