0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

简述图像检测和图像分割之间的区别

机器视觉自动化 来源:雷锋网 作者:雷锋字幕组 2021-04-19 09:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

英语原文:

What is the difference between Object Detection and Image Segmentation?

翻译:雷锋字幕组(明明知道)

人工智能对于图像处理有不同的任务。在本文中,我将介绍目标检测和图像分割之间的区别。

在这两个任务中,我们都希望找到图像中某些感兴趣的项目的位置。例如,我们可以有一组安全摄像头照片,在每张照片上,我们想要识别照片中所有人的位置。

通常有两种方法可以用于此:目标检测(Object Detection)和图像分割(Image Segmentation)。

目标检测-预测包围盒

当我们说到物体检测时,我们通常会说到边界盒。这意味着我们的图像处理将在我们的图片中识别每个人周围的矩形。

边框通常由左上角的位置(2 个坐标)和宽度和高度(以像素为单位)定义。

来自开放图像数据集的注释图像。家庭堆雪人,来自 mwvchamber。在CC BY 2.0 许可下使用的图像。

如何理解目标检测

如果我们回到任务:识别图片上的所有人,则可以理解通过边界框进行对象检测的逻辑。

我们首先想到的解决方案是将图像切成小块,然后在每个子图像上应用图像分类,以区别该图像是否是人类。对单个图像进行分类是一项较容易的任务,并且是对象检测的一项,因此,他们采用了这种分步方法。

当前,YOLO模型(You Only Look Once)是解决此问题的伟大发明。YOLO模型的开发人员已经构建了一个神经网络,该神经网络能够立即执行整个边界框方法!

当前用于目标检测的最佳模型

YOLO

Faster RCNN

目标分割-预测掩模

一步一步地扫描图像的逻辑替代方法是远离画框,而是逐像素地注释图像。

如果你这样做,你将会有一个更详细的模型,它基本上是输入图像的一个转换。

来自开放图像数据集的注释图像。家庭堆雪人,来自 mwvchamber。在CC BY 2.0 许可下使用的图像。

如何理解图像分割

这个想法很基本:即使在扫描产品上的条形码时,也可以应用一种算法来转换输入信息(通过应用各种过滤器),这样,除了条形码序列以外的所有信息在最终图像中都不可见。

这是在图像上定位条形码的基本方法,但与在图像分割中所发生的情况类似。

图像分割的返回格式称为掩码:与原始图像大小相同的图像,但是对于每个像素,它只有一个布尔值来指示对象是否存在。

如果我们允许多个类别,它就会变得更加复杂:例如,它可以将一个海滩景观分为三类:空气、海洋和沙子。

当下图像分割的最佳模型

Mask RCNN

Unet

Segnet

比较总结

对象检测

输入是一个矩阵(输入图像),每个像素有 3 个值(红、绿、蓝),如果是黑色和白色,则每个像素有 1 个值

输出是由左上角和大小定义的边框列表

图像分割

输入是一个矩阵(输入图像),每个像素有 3 个值(红、绿、蓝),如果是黑色和白色,则每个像素有 1 个值

输出是一个矩阵(掩模图像),每个像素有一个包含指定类别的值

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像处理
    +关注

    关注

    29

    文章

    1350

    浏览量

    59722
  • 人工智能
    +关注

    关注

    1821

    文章

    50376

    浏览量

    267093

原文标题:计算机视觉:图像检测和图像分割有什么区别?

文章出处:【微信号:jiqishijue2020,微信公众号:机器视觉自动化】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    多通道兼容图像采集卡:一机搞定多路图像信号处理

    在工业自动化、安防监控、智能检测、医疗影像等领域,随着应用场景的不断升级,单路图像采集已无法满足多路信号同步接入、实时处理的重要需求。多通道兼容图像采集卡应运而生,以“一机集成、多路协同”为重要优势
    的头像 发表于 03-19 14:17 234次阅读
    多通道兼容<b class='flag-5'>图像</b>采集卡:一机搞定多路<b class='flag-5'>图像</b>信号处理

    视频信号检测板卡:208-Base Camera Link 图像信号模拟器

    标签: AD 子卡模块, DA子卡模块, 图像信号模拟器, 视频信号检测
    的头像 发表于 03-19 10:09 320次阅读
    视频信号<b class='flag-5'>检测</b>板卡:208-Base Camera Link <b class='flag-5'>图像</b>信号模拟器

    列车360°动态图像检测系统 赋能列车高效安全检测

    列车360°动态图像检测系统是一套专为列车运维检修设计的智能图像检测解决方案,该系统具有360°全车成像、智能故障诊断与数据驱动运维三大核心功能,显著提升列车
    的头像 发表于 03-09 17:33 429次阅读
    列车360°动态<b class='flag-5'>图像</b><b class='flag-5'>检测</b>系统 赋能列车高效安全<b class='flag-5'>检测</b>

    图像采集卡:连接设备与数据的图像枢纽

    在机器视觉与图像传输体系中,图像采集卡是无可替代的重要枢纽——它一端承接相机、内窥镜、摄像机等前端图像设备的信号输出,另一端对接后端数据处理、存储、展示系统,通过信号转换、同步协调、高速传输三大能力
    的头像 发表于 01-22 13:51 390次阅读
    <b class='flag-5'>图像</b>采集卡:连接设备与数据的<b class='flag-5'>图像</b>枢纽

    SAM(通用图像分割基础模型)丨基于BM1684X模型部署指南

    前言SAM是Meta提出的一个分割一切的提示型模型,其在1100万张图像上训练了超过10亿个掩码,实现了强大的零样本泛化,突破了分割界限。本例程对SAM官方开源仓库的模型和算法进行移植,使之能
    的头像 发表于 01-12 16:17 518次阅读
    SAM(通用<b class='flag-5'>图像</b><b class='flag-5'>分割</b>基础模型)丨基于BM1684X模型部署指南

    东芝推出缩小图像型CCD线性图像传感器TCD2400DG

    东芝电子元件及存储装置株式会社(“东芝”)宣布,推出一款专为视觉检测中使用的线阵相机[1]开发的缩小图像型[2]CCD[3]线性图像传感器——“TCD2400DG”。该产品于近日起开始支持批量出货。
    的头像 发表于 01-09 16:37 1321次阅读
    东芝推出缩小<b class='flag-5'>图像</b>型CCD线性<b class='flag-5'>图像</b>传感器TCD2400DG

    千兆工业图像采集卡 | 稳定网络传输,适配远程工业检测

    在工业自动化检测迈向远程化、分布式部署的趋势下,千兆工业图像采集卡以其卓越的网络传输稳定性和广泛的场景适配能力,成为连接工业相机与后端处理系统的核心枢纽。千兆工业图像采集卡深度契合远程工业检测
    的头像 发表于 12-23 15:58 384次阅读
    千兆工业<b class='flag-5'>图像</b>采集卡 | 稳定网络传输,适配远程工业<b class='flag-5'>检测</b>

    图像采集卡终极指南:从原理到选型

    在机器视觉、工业检测、医疗影像等领域,图像采集卡是连接前端图像设备与后端计算系统的核心枢纽。它不仅解决了原始图像信号与计算机数据的“格式互通”问题,更决定了
    的头像 发表于 11-19 15:54 923次阅读
    <b class='flag-5'>图像</b>采集卡终极指南:从原理到选型

    图像采集卡:机器视觉时代的图像数据核心枢纽

    的采集、转换、传输与初步处理,搭建起图像传感器(相机/摄像头)与计算机之间的高速数据链路。其核心价值在于解决“原始图像信号如何高效、精准、稳定地转化为计算机可处理数据
    的头像 发表于 11-12 15:15 895次阅读
    <b class='flag-5'>图像</b>采集卡:机器视觉时代的<b class='flag-5'>图像</b>数据核心枢纽

    图像采集卡:连接现实与数字世界的关键桥梁

    当您点开一个高清直播画面、见证工厂精密零件被自动化检测、或是看到医院里清晰的医学影像时,您可曾想过这些动态图像如何从摄像机实时跃入电脑屏幕?图像采集卡正是驱动这一切的核心技术。作为专业视频采集领域
    的头像 发表于 09-05 14:30 839次阅读
    <b class='flag-5'>图像</b>采集卡:连接现实与数字世界的关键桥梁

    在k230上使用yolov5检测图像卡死,怎么解决?

    在Ubuntu上将onnx转换kmodel后,使用示例仓库中的test_det_kmodel.py检测图像没问题 打印位置: 模型转换过程中也没有报错,onnx与kmodel对比结果也在
    发表于 08-11 07:41

    迅为RK3576开发板摄像头实时推理测试-ppseg 图像分割

    迅为RK3576开发板摄像头实时推理测试-ppseg 图像分割
    的头像 发表于 07-11 14:31 1063次阅读
    迅为RK3576开发板摄像头实时推理测试-ppseg <b class='flag-5'>图像</b><b class='flag-5'>分割</b>

    图像采集卡与视频采集卡的主要区别对比

    图像采集卡和视频采集卡的核心区别在于它们的设计目标、处理对象和典型应用场景。尽管名称相似,且有时功能会有重叠(尤其是高端设备),但它们侧重点不同:以下是主要区别:1.处理对象与目标图像
    的头像 发表于 06-27 14:42 1234次阅读
    <b class='flag-5'>图像</b>采集卡与视频采集卡的主要<b class='flag-5'>区别</b>对比

    【正点原子STM32MP257开发板试用】基于 DeepLab 模型的图像分割

    【正点原子STM32MP257开发板试用】图像分割 本文介绍了正点原子 STM32MP257 开发板基于 DeepLab 模型实现图像分割的项目设计。 DeepLab 模型 DeepL
    发表于 06-21 21:11

    HarmonyOS应用图像stride处理方案

    图像存储在内存中时,内存缓冲区可能在每行像素之后包含额外的填充字节。填充字节会影响图像在内存中的存储方式,但不会影响图像的显示方式。stride是内存中一行像素到内存中下一行像素的字节数;如果存在填充字节,则步幅比
    的头像 发表于 06-10 14:17 1376次阅读
    HarmonyOS应用<b class='flag-5'>图像</b>stride处理方案