0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

目标检测模型和Objectness的知识

电子设计 来源:电子设计 作者:电子设计 2022-02-12 17:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Nathan Zhao
编译:ronghuaiyang

导读

在本文中,我们将讨论目标检测模型和Objectness的基础知识。

什么是物体检测模型?

物体检测模型本质上,正如其名称所示,检测物体。这意味着给定一个图像,它可以告诉你物体在哪里,以及这个物体是什么。例如,在上面的图像中,我们有许多物体,并且使用物体检测模型,我们已经检测出不同的物体在图像中的位置。

这类模型有很多应用。举几个例子,物体检测在以下方面很有用:

自动驾驶汽车,可以检测到乘客、其他车辆、红绿灯和停车标志。

安保,模型可以探测到公共区域的枪支或炸弹,并向附近的警察报警。

总的来说,这类模型非常有用,在过去几年里,机器学习社区已经对它们进行了大量的研究。

物体检测中区域建议的介绍

首先,让我们了解一下物体检测模型是如何工作的。首先,我们必须给出一个物体的建议位置。我们把这个建议的位置称为我们感兴趣的区域,通常显示在一个边界框(也称为图像窗口)中。根据物体检测模型的类型,我们可以通过许多不同的方式来实现这一点。

朴素方法:我们将图像分割成多个部分,并对每个部分进行分类。这种方法效率低下是因为必须对每个生成的窗口应用分类网络(CNN),导致计算时间长。

滑动窗口方法:我们预先确定好窗口比例(或“锚”),然后滑过图像。对于每个窗口,我们处理它并继续滑动。与朴素方法类似,这种方法生成的窗口较多,处理时间也比较长。

选择性搜索:使用颜色相似度,纹理相似度,和一些其他的图像细节,我们可以用算法将图像分割成区域。虽然选择性搜索算法本身是耗时的,但这使得分类网络的应用需求较少。

区域建议网络:我们创建一个单独的网络来确定图像中感兴趣的区域。这使得我们的模型工作得更快,但也使得我们最终模型的准确性依赖于多个网络。

上面列出的这些不同选项之间有一些区别,但一般来说,当我们加快网络的处理时间时,我们往往会牺牲模型的准确性。

区域建议机制的主要问题是,如果建议的区域不包含物体,那么你的分类网络也会去分类这个区域,并给出一个错误的标记。

那么,什么是Objectness?

Objectness本质上是物体存在于感兴趣区域内的概率的度量。如果我们Objectness很高,这意味着图像窗口可能包含一个物体。这允许我们快速地删除不包含任何物体的图像窗口。

如果一幅图像具有较高的Objectness,我们期望它具有:

在整个图像中具有唯一性

物体周围有严格的边界

与周围环境的外观不同

例如,在上面的图像中,我们期望红色框具有较低的Objectness,蓝色框具有中等的Objectness,绿色框具有较高的Objectness。这是因为绿色的框“紧密”地围绕着我们的物体,而蓝色的框则很松散,而红色的框根本不包含任何物体。

我们如何度量Objectness?

有大量的参数影响图像窗口的objectness。

多尺度显著性:这本质上是对图像窗口的外观独特性的度量。与整个图像相比,框中唯一性像素的密度越高,该值就越高。

颜色对比度:框内像素与建议图像窗口周围区域的颜色对比度越大,该值越大。

边缘密度:我们定义边缘为物体的边界,这个值是图像窗口边界附近的边缘的度量值。一个有趣的算法可以找到这些边缘:https://cv-tricks.com/opencv-dnn/edge-detection-hed/。

超像素跨越:我们定义超像素是几乎相同颜色的像素团。如果该值很高,则框内的所有超像素只包含在其边界内。

超像素区域以不同颜色显示。请注意,框内的超像素大部分不会泄漏到图像窗口之外。因此,这个“超素跨界”值将会很高。

以上参数值越高,objectness越高。试着将上述参数与我们前面列出的具有高objectness的图像的期望联系起来。

英文原文:https://medium.com/@zhao.nathan/understanding-objectness-in-object-detection-models-5d8c9d032488
本文转自:AI公园,作者:Nathan Zhao,编译:ronghuaiyang,
转载此文目的在于传递更多信息,版权归原作者所有。

审核编辑:何安

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物体检测
    +关注

    关注

    0

    文章

    8

    浏览量

    9362
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RetinaNet深度学习模型突破航空图像目标检测难题

    的深度学习模型交出了亮眼的答卷——它让One-stage检测器超越了传统Two-stage方法的精度,成为了航空图像分析领域的重要工具。
    的头像 发表于 05-15 09:23 1210次阅读
    RetinaNet深度学习<b class='flag-5'>模型</b>突破航空图像<b class='flag-5'>目标</b><b class='flag-5'>检测</b>难题

    Firefly-RK1828 赋能视频大模型:多目标+全场景,引领智能分析新风向

    如今,在视频分析领域,传统检测模型存在这一局限:单个模型只能聚焦单一目标检测,面对复杂场景中多样的检测
    的头像 发表于 04-15 16:35 1364次阅读
    Firefly-RK1828 赋能视频大<b class='flag-5'>模型</b>:多<b class='flag-5'>目标</b>+全场景,引领智能分析新风向

    YOLO5目标检测方案-基于米尔RK3576开发板

    本文基于米尔MYD-LR3576开发板,详细记录了如何利用500万像素USB摄像头实现640×640分辨率的YOLO5s目标检测,并将结果实时输出至1080P屏幕的全流程。通过系统级的软硬件协同优化
    发表于 01-22 19:21

    广和通发布端侧目标检测模型FiboDet

    为提升端侧设备视觉感知与决策能力,广和通全自研端侧目标检测模型FiboDet应运而生。该模型基于广和通在边缘计算与人工智能领域的深度积累,面向工业、交通、零售等多个行业提供高性能、低功
    的头像 发表于 09-26 13:39 1781次阅读

    知识分享 | 使用MXAM进行AUTOSAR模型的静态分析:Embedded Coder与TargetLink模型

    知识分享在知识分享栏目中,我们会定期与读者分享来自MES模赛思的基于模型的软件开发相关Know-How干货,关注公众号,随时掌握基于模型的软件设计的技术
    的头像 发表于 08-27 10:04 935次阅读
    <b class='flag-5'>知识</b>分享 | 使用MXAM进行AUTOSAR<b class='flag-5'>模型</b>的静态分析:Embedded Coder与TargetLink<b class='flag-5'>模型</b>

    润和软件“润知“知识处理大模型荣登“2025中国大模型TOP30”榜单

    知识处理大模型成功入选。这一荣誉不仅体现了润和软件在多模态大模型技术上的领先地位,也标志着其在推动企业智能化转型方面迈出了坚实一步。  润和软件“润知”知识处理大
    的头像 发表于 08-22 10:13 4479次阅读

    AIcube1.4目标检测模型导入yolotxt格式数据集后一直显示数据正在解析,为什么?

    AIcube1.4目标检测模型导入yolotxt格式数据集后一直显示数据正在解析 数据有问题,把数据情况说的详细点
    发表于 08-13 07:16

    使用aicube进行目标检测识别数字项目的时候,在评估环节卡住了,怎么解决?

    使用aicube进行目标检测识别数字项目的时候,前面一切正常 但是在评估环节卡住了,一直显示正在测试,但是完全没有测试结果, 在部署完模型后在k230上运行也没有任何识别结果 期待结果和实际结果
    发表于 08-13 06:45

    【VisionFive 2单板计算机试用体验】在 VisionFive 2 上为目标检测准备软件环境并运行 MobileNet-SSD 模型

    目标: 本教程将实现在 StarFive VisionFive 2 开发板上为目标检测应用准备所需软件环境,并最终运行一个基于 MobileNet-SSD 的目标
    发表于 07-10 19:51

    基于FPGA的SSD目标检测算法设计

    随着人工智能的发展,神经网络正被逐步应用于智能安防、自动驾驶、医疗等各行各业。目标识别作为人工智能的一项重要应用也拥有着巨大的前景,随着深度学习的普及和框架的成熟,卷积神经网络模型的识别精度越来越高
    的头像 发表于 07-10 11:12 2859次阅读
    基于FPGA的SSD<b class='flag-5'>目标</b><b class='flag-5'>检测</b>算法设计

    气密性检测仪的核心应用范畴及其所针对的检测目标

    在工业生产与质量控制领域,气密性检测仪是保障产品品质与性能的关键设备。以下将围绕气密性检测仪的核心应用范畴及其所针对的检测目标展开介绍,以下是对上述关于气密性
    的头像 发表于 06-27 15:03 740次阅读
    气密性<b class='flag-5'>检测</b>仪的核心应用范畴及其所针对的<b class='flag-5'>检测</b><b class='flag-5'>目标</b>

    模型在半导体行业的应用可行性分析

    有没有这样的半导体专用大模型,能缩短芯片设计时间,提高成功率,还能帮助新工程师更快上手。或者软硬件可以在设计和制造环节确实有实际应用。会不会存在AI缺陷检测。 能否应用在工艺优化和预测性维护中
    发表于 06-24 15:10

    请问嘉楠平台k230训练的跌倒检测模型里面的设置是怎么样的?

    我想要了解K230所使用的跌倒检测模型中的设置,例如人体检测是如何实现的,在模型检测中,人体的节点是多少。或者想请教一下相关的文档或者内容在
    发表于 06-23 07:05

    基于LockAI视觉识别模块:C++目标检测

    /LockzhinerAI/LockzhinerVisionModule/tree/master/Cpp_example/D01_test_detection 1. 基础知识讲解 1.1 目标检测的基本介绍
    发表于 06-06 14:43

    基于LockAI视觉识别模块:C++目标检测

    本文档基于瑞芯微RV1106的LockAI凌智视觉识别模块,通过C++语言做的目标检测实验。本文档展示了如何使用lockzhiner_vision_module::PaddleDet类进行目标
    的头像 发表于 06-06 13:56 1072次阅读
    基于LockAI视觉识别模块:C++<b class='flag-5'>目标</b><b class='flag-5'>检测</b>