0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

目标检测和模型介绍

新机器视觉 来源:Coggle数据科学 作者:Coggle数据科学 2022-07-21 15:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

目标检测介绍

目标检测是计算机视觉领域中最基础且最具挑战性的任务之一,其包含物体分类和定位。它为实例分割、图像捕获、视频跟踪等任务提供了强有力的特 征分类基础。

传统的目标检测方法包括预处理、区域提案、特征提取、特征选择、特征分类和后处理六个阶段,大多数检测模型关注于物体特征的提取和区域分类算法的选择。

Deformable Part⁃based Model(DPM)算法三次在PASCAL VOC目标检测竞赛上获得冠军,是传统目标检测方法的巅峰之作. 然而在2008年至2012年期间,目标检测模型在PASCAL VOC数据集上的检测准确率逐渐达到瓶颈. 传统方法的弊端也展现出来,主要包括:

算法在区域提案生成阶段产生大量冗余的候选框且正负样本失衡;

特征提取器如HOG、SIFT等未能充分捕捉图像的高级语义特征和上下文内容;

传统检测算法分阶段进行,整体缺乏一种全局优化策略

目标检测数据集

目前主流的通用目标检测数据集有PASCAL VOC、ImageNet、MS COCO、Open Images和Objects365。

目标检测评价指标

当前用于评估检测模型的性能指标主要有帧率每秒(Frames Per Second,FPS)、准确率(accuracy)、精确率(precision)、召回率(recall)、平均精度(Average Precision,AP)、平均 精度均值(mean Average Precision,mAP)等。

FPS即每秒识别图像的数量,用于评估目标检测模型的检测速度;

accuracy是正确预测类别的样本数占样本总数的比例;

precision是预测正确的正样本数占所有预测为正样本个数的比例;

recall是预测正确的正样本数占所有真实值为正样本个数的比例;

PR曲线是对应precision和recall构成的曲线;

AP是对不同召回率点上的精确率进行平均,在PR曲线图上表现为 PR 曲线下的面积;

mAP是所有类别AP的平均;

目标检测模型

基于深度学习的目标检测方法根据有无区域提案阶段划分为双阶段模型和单阶段检测模型。

a4770d36-07e1-11ed-ba43-dac502259ad0.png

双阶段模型

区域检测模型将目标检测任务分为区域提案生成、特征提取和分类预测三个阶段。在区域提案生成阶段,检测模型利用搜索算法如选择性搜索(SelectiveSearch,SS)、EdgeBoxes、区 域 提 案 网 络(Region Proposal Network,RPN) 等在图像中搜寻可能包含物体的区域。在特征提取阶段,模型利用深度卷积网络提取区域提案中的目标特征。在分类预测阶段,模型从预定义的类别标签对区域提案进行分类和边框信息预测。

单阶段模型

单阶段检测模型联合区域提案和分类预测,输入整张图像到卷积神经网络中提取特征,最后直接输出目标类别和边框位置信息。这类代表性的方法有:YOLO、SSD和CenterNet等。

目标检测研究方向

目标检测方法可分为检测部件、数据增强、优化方法和学习策略四个方面 。其中检测部件包含基准模型和基准网络;数据增强包含几何变换、光学变换等;优化方法包含特征图、上下文模型、边框优化、区域提案方法、类别不平衡和训练策略六个方面,学习策略涵盖监督学习、弱监督学习和无监督学习。

a496b686-07e1-11ed-ba43-dac502259ad0.png

特征图融合

特征图是图像经过卷积池化层输出的结果,大多数基准检测模型只在顶层特征图做预测,这在很大程度上限制了模型的性能。

多层特征图单层预测模型

分层预测模型

结合多层特征图多层预测模型

上下文信息融合

在物体遮挡、背景信息杂乱或图像质量不佳的情况下,根据图像的上下文信息能更有效更精确地检测。

全局上下文信息

局部上下文信息

边框优化

当前检测模型在小目标检测表现不佳的主要原因是定位错误偏多,包含定位偏差大和重复预测。

优化边框定位

NMS优化

类别不均衡优化

类别不平衡的主要矛盾是负样本数远多于正样本数,导致训练的深度模型效率低。

Online Hard Example Mining,OHEM

Focal Loss损失函数

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4803

    浏览量

    98528
  • 目标检测
    +关注

    关注

    0

    文章

    234

    浏览量

    16541
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26261

原文标题:小白学CV:目标检测任务和模型介绍

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Firefly-RK1828 赋能视频大模型:多目标+全场景,引领智能分析新风向

    如今,在视频分析领域,传统检测模型存在这一局限:单个模型只能聚焦单一目标检测,面对复杂场景中多样的检测
    的头像 发表于 04-15 16:35 821次阅读
    Firefly-RK1828 赋能视频大<b class='flag-5'>模型</b>:多<b class='flag-5'>目标</b>+全场景,引领智能分析新风向

    一种可跨不同领域的异常检测通用模型UniOD介绍

    本研究提出了一种可跨不同领域、适用于特征维度各异且特征空间异构的数据集的异常检测通用模型
    的头像 发表于 03-18 09:09 533次阅读
    一种可跨不同领域的异常<b class='flag-5'>检测</b>通用<b class='flag-5'>模型</b>UniOD<b class='flag-5'>介绍</b>

    YOLO5目标检测方案-基于米尔RK3576开发板

    本文基于米尔MYD-LR3576开发板,详细记录了如何利用500万像素USB摄像头实现640×640分辨率的YOLO5s目标检测,并将结果实时输出至1080P屏幕的全流程。通过系统级的软硬件协同优化
    发表于 01-22 19:21

    广和通发布端侧目标检测模型FiboDet

    为提升端侧设备视觉感知与决策能力,广和通全自研端侧目标检测模型FiboDet应运而生。该模型基于广和通在边缘计算与人工智能领域的深度积累,面向工业、交通、零售等多个行业提供高性能、低功
    的头像 发表于 09-26 13:39 1722次阅读

    AIcube1.4目标检测模型导入yolotxt格式数据集后一直显示数据正在解析,为什么?

    AIcube1.4目标检测模型导入yolotxt格式数据集后一直显示数据正在解析 数据有问题,把数据情况说的详细点
    发表于 08-13 07:16

    使用aicube进行目标检测识别数字项目的时候,在评估环节卡住了,怎么解决?

    使用aicube进行目标检测识别数字项目的时候,前面一切正常 但是在评估环节卡住了,一直显示正在测试,但是完全没有测试结果, 在部署完模型后在k230上运行也没有任何识别结果 期待结果和实际结果
    发表于 08-13 06:45

    【VisionFive 2单板计算机试用体验】在 VisionFive 2 上为目标检测准备软件环境并运行 MobileNet-SSD 模型

    目标: 本教程将实现在 StarFive VisionFive 2 开发板上为目标检测应用准备所需软件环境,并最终运行一个基于 MobileNet-SSD 的目标
    发表于 07-10 19:51

    基于FPGA的SSD目标检测算法设计

    随着人工智能的发展,神经网络正被逐步应用于智能安防、自动驾驶、医疗等各行各业。目标识别作为人工智能的一项重要应用也拥有着巨大的前景,随着深度学习的普及和框架的成熟,卷积神经网络模型的识别精度越来越高
    的头像 发表于 07-10 11:12 2748次阅读
    基于FPGA的SSD<b class='flag-5'>目标</b><b class='flag-5'>检测</b>算法设计

    气密性检测仪的核心应用范畴及其所针对的检测目标

    在工业生产与质量控制领域,气密性检测仪是保障产品品质与性能的关键设备。以下将围绕气密性检测仪的核心应用范畴及其所针对的检测目标展开介绍,以下
    的头像 发表于 06-27 15:03 740次阅读
    气密性<b class='flag-5'>检测</b>仪的核心应用范畴及其所针对的<b class='flag-5'>检测</b><b class='flag-5'>目标</b>

    基于LockAI视觉识别模块:C++目标检测

    /LockzhinerAI/LockzhinerVisionModule/tree/master/Cpp_example/D01_test_detection 1. 基础知识讲解 1.1 目标检测的基本介绍
    发表于 06-06 14:43

    基于LockAI视觉识别模块:C++目标检测

    本文档基于瑞芯微RV1106的LockAI凌智视觉识别模块,通过C++语言做的目标检测实验。本文档展示了如何使用lockzhiner_vision_module::PaddleDet类进行目标
    的头像 发表于 06-06 13:56 1013次阅读
    基于LockAI视觉识别模块:C++<b class='flag-5'>目标</b><b class='flag-5'>检测</b>

    FA模型的DataAbility的切换介绍

    ,Stage模型下的DataShareExtensionAbility为系统API,只有系统应用才可以创建。因此,FA模型的DataAbility的切换,对于系统应用和三方应用策略有所不同。下面分别介绍
    发表于 06-06 08:10

    FA模型的ServiceAbility的切换介绍

    的ServiceExtensionAbility为系统API,只有系统应用才可以创建。因此,FA模型的ServiceAbility的切换,对于系统应用和三方应用策略有所不同。下面分别介绍这两种场景。 系统
    发表于 06-05 07:24

    FA模型绑定Stage模型ServiceExtensionAbility介绍

    FA模型绑定Stage模型ServiceExtensionAbility 本文介绍FA模型的三种应用组件如何绑定Stage模型的Servi
    发表于 06-04 07:55

    KaihongOS操作系统FA模型与Stage模型介绍

    FA模型与Stage模型介绍 KaihongOS操作系统中,FA模型(Feature Ability)和Stage模型是两种不同的应用
    发表于 04-24 07:27