0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

图像标注的种类,应用场景,以及各种标注的优缺点

新机器视觉 来源:AI公园 作者:AI公园 2020-12-28 14:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读

本文从五个需要进行标注的计算机视觉任务(物体检测、线/边缘检测、分割、姿态预测、图像分类)给大家介绍图像标注的种类,应用场景,以及各种标注的优缺点。

介绍

“如果没有数据分析,公司就会变得既盲又聋,就像高速公路上的鹿一样在网络上游荡。”

— Geoffrey Moore

每个数据科学任务都需要数据。具体地说,是输入系统的干净易懂的数据。说到图像,计算机需要看到人类眼睛看到的东西。

例如,人类有识别和分类物体的能力。同样,我们可以使用计算机视觉来解释它接收到的视觉数据。这就是图像标注的作用。

图像标注在计算机视觉中起着至关重要的作用。图像标注的目标是为和任务相关的、特定于任务的标签。这可能包括基于文本的标签(类),绘制在图像上的标签(即边框),甚至是像素级的标签。我们将在下面探讨这一系列不同的标注技术。

人工智能需要的人工干预比我们想象的要多。为了准备高精度的训练数据,我们必须对图像进行标注以得到正确的结果。数据注释通常需要较高水平的领域知识,只有来自特定领域的专家才能提供这些知识。

需要标注的计算机视觉任务:

物体检测

线/边缘检测

分割

姿态预测/关键点识别

图像分类

1) 目标检测

进行目标检测的技术主要有两种,即2D和3D包围框。

对于多边形物体,可以使用多边形方法。让我们详细讨论一下。

2D 包围框

在这种方法中,只需要在被检测的物体周围绘制矩形框。它们用于定义对象在图像中的位置。边框可以由矩形左上角的x、y轴坐标和右下角的x、y轴坐标来确定。

优点和缺点:

标注起来快速和容易。

不能提供重要的信息,如物体的方向,这对许多应用来说是至关重要的。

包括不属于物体一部分的背景像素。这可能会影响训练。

3D 包围框或者立方体

类似于2D边框,除了它们还可以显示目标的深度。这种标注是通过将二维图像平面上的边界框向后投影到三维长方体来实现的。它允许系统区分三维空间中的体积和位置等特征。

优点和缺点:

解决了物体方向的问题。

当物体被遮挡,这种标注可以想象包围框的维度,这可能会影响训练。

这种标注也会包括背景像素,可能会影响训练。

多边形

有时,必须标记形状不规则的物体。在这种情况下,使用多边形。注释时只需标记物体的边缘,我们就能得到要检测的物体的完美轮廓。

优点和缺点:

多边形标记的主要优点是它消除了背景像素,并捕获了物体的精确尺寸。

非常耗时,如果物体的形状是复杂的,很难标注。

注:多边形方法也用于物体形状的分割。我们将在下面讨论分割。

数据采集是ML冷启动的问题。但是,即使你有了一个可行的数据集,构建和测试模型也是需要技巧的。

2) 线/边缘检测(线和样条)

在划分边界时,线和样条是有用的。将区分一个区域和另一个区域的像素进行标注。

优点和缺点:

这种方法的优点是,连线上的像素不需要都是连续的。这样在检测有中断的线或部分遮挡的物体是非常有用的。

手动标注图像中的线是非常累人和费时的,特别是图像中有很多的线的时候。

当物体碰巧是对齐的时候,可能会给出误导的结果。

3) 姿态预测 / 关键点识别

在许多计算机视觉应用中,神经网络常常需要识别输入图像中重要的感兴趣的点。我们把这些点称为地标或关键点。在这种应用中,我们希望神经网络输出关键点的坐标(x, y)。

4) 分割

图像分割是将一幅图像分割为多个部分的过程。图像分割通常用于在像素级定位图像中的物体和边界。图像分割方法有很多种。

语义分割: 语义分割是一项机器学习任务,它需要像素级标注,其中图像中的每个像素都被分配给一个类。每个像素都带有语义意义。这主要用于环境背景非常重要的情况。

实例分割: 实例分割是图像分割的一种子类型,它在像素级别上标识图像中每个物体的每个实例。实例分割和语义分割是图像分割的两种粒度级别之一。

全景分割: 全景分割结合了语义分割和实例分割,所有像素都被分配一个类标签,所有目标实例都被唯一地分割。

5) 图像分类

图像分类不同于目标检测。目标检测的目的是识别和定位目标,而图像分类的目的是识别和识别特定的目标类。这个用例的一个常见示例是对猫和狗的图片进行分类。标注者必须为一只狗的图像分配一个类标签“dog”,对猫的图像分配类标签“cat”。

图像标注的用例

在本节中,我们将讨论如何使用图像标注来帮助机器模型执行特定行业的任务:

零售:2D边框可以用于标注产品的图像,然后机器学习算法可以使用这些图像来预测成本和其他属性。图像分类在这方面也有帮助。

医学:多边形可用于在医用x射线中标记器官,以便将它们输入深度学习模型,以训练x射线中的畸形或缺陷。这是图像标注最重要的应用之一,需要医学专家具有较高的领域知识。

自动驾驶汽车:这是另一个重要的领域,图像标注可以应用。利用语义分割对图像中的每个像素进行标记,使车辆能够感知到道路上的障碍物。这一领域的研究仍在进行中。

情绪检测:这是里程碑,可以用来检测一个人的情绪(高兴,悲伤,或自然)。这可以应用于评估受试者对特定内容的情绪反应。

制造行业:线和样条可用于标注工厂的图像线跟随机器人工作。这可以帮助自动化生产过程,人力劳动可以最小化。

图像标注的一些挑战

时间复杂度:手工标注图像需要很多时间,机器学习需要大量的数据集,需要大量的时间来有效地标注这些基于图像的数据集。

计算复杂度:机器学习需要精确标注的数据来运行模型。如果标注者在给图像做标注的时候,注入任何一种错误,都可能会影响到训练,所有的努力都可能付诸东流。

领域知识:如前所述,图像标注通常需要特定领域的高级领域知识。因此,我们需要知道该标注什么的注解者,以及该领域的专家。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1096

    浏览量

    42435
  • 人工智能
    +关注

    关注

    1819

    文章

    50287

    浏览量

    266826
  • 数据分析
    +关注

    关注

    2

    文章

    1523

    浏览量

    36355

原文标题:图像标注的基础内容介绍

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    大模型时代自动驾驶标注有什么特殊要求?

    的端到端架构和占用网络,标注工作已经从平面的像素点位,跨越到了四维时空的深度重建。 空间的立体化与时间的连贯性挑战 自动驾驶标注的难点在于从二维图像向三维向量空间的跃迁。早期的算法
    的头像 发表于 03-01 09:09 3055次阅读
    大模型时代自动驾驶<b class='flag-5'>标注</b>有什么特殊要求?

    自动驾驶数据标注是所有信息都要标注吗?

    [首发于智驾最前沿微信公众号]数据标注对于自动驾驶来说,就像是老师教小朋友知识,数据标注可以让车辆学习辨别道路交通信息的能力。摄像头、雷达、激光雷达(LiDAR)拍下来的只是一堆原始信号,这些信号
    的头像 发表于 12-04 09:05 1104次阅读
    自动驾驶数据<b class='flag-5'>标注</b>是所有信息都要<b class='flag-5'>标注</b>吗?

    算法工程师不愿做标注工作,怎么办?

    对于算法而言,图像标注是一项关键性工作,越是大量的新数据集标注,对于算法的性能提升越有帮助。但是图像标注是一项极其费时费力的工作,特别是遇到
    的头像 发表于 12-02 17:56 675次阅读
    算法工程师不愿做<b class='flag-5'>标注</b>工作,怎么办?

    浅析多模态标注对大模型应用落地的重要性与标注实例

    ”的关键工序——多模态标注重要性日益凸显。 一、什么是多模态标注? 多模态标注是指对文本、图像、语音、视频、点云等异构数据进行跨模态语义关联的标注
    的头像 发表于 09-05 13:49 2714次阅读

    小语种OCR标注效率提升10+倍:PaddleOCR+ERNIE 4.5自动标注实战解析

    摘要 :小语种OCR研发的核心瓶颈在于高质量标注数据的稀缺与高昂成本。本文介绍一种创新的自动化标注方案,利用 PaddleOCR 进行文本检测与裁剪,并调用 ERNIE 4.5 大模型进行双重预测
    的头像 发表于 08-29 11:26 3870次阅读
    小语种OCR<b class='flag-5'>标注</b>效率提升10+倍:PaddleOCR+ERNIE 4.5自动<b class='flag-5'>标注</b>实战解析

    请问AICube所需的目标检测数据集标注可以使用什么工具?

    请问AICube所需的目标检测数据集标注可以使用什么工具? 我使用labelimg进行标注标注后的数据集改好文件名后导入不进去。一直卡在数据解析界面。 下图所示,数据集文件夹目录,以及
    发表于 08-11 08:07

    自动驾驶数据标注主要是标注什么?

    [首发于智驾最前沿微信公众号]在自动驾驶系统的研发过程中,数据标注是实现高性能感知模型的基础环节,其核心目标是将车辆从环境中采集到的原始感知数据(主要包括图像、点云、视频序列等)转化为具有语义信息
    的头像 发表于 07-30 11:54 1582次阅读
    自动驾驶数据<b class='flag-5'>标注</b>主要是<b class='flag-5'>标注</b>什么?

    什么是自动驾驶数据标注?如何好做数据标注

    、精准且高效的数据标注流程显得尤为关键。那什么是数据标注?如何做数据标注? 自动驾驶数据标注是指在自动驾驶系统所采集的感知数据(如摄像头图像
    的头像 发表于 07-09 09:19 1609次阅读
    什么是自动驾驶数据<b class='flag-5'>标注</b>?如何好做数据<b class='flag-5'>标注</b>?

    数据标注与大模型的双向赋能:效率与性能的跃升

    ​‌在人工智能蓬勃发展的时代,大模型凭借其强大的学习与泛化能力,已成为众多领域创新变革的核心驱动力。而数据标注作为大模型训练的基石,为大模型性能提升注入关键动力,是模型不可或缺的“养料。大模型则凭借
    的头像 发表于 06-04 17:15 2196次阅读
    数据<b class='flag-5'>标注</b>与大模型的双向赋能:效率与性能的跃升

    AI时代 图像标注不要没苦硬吃

    识别算法的性能提升依靠大量的图像标注,传统模式下,需要人工对同类型数据集进行一步步手动拉框,这个过程的痛苦只有做过的人才知道。越多素材的数据集对于算法的提升越有帮助,常规情况下,一个20秒时长30帧
    的头像 发表于 05-20 17:54 627次阅读
    AI时代   <b class='flag-5'>图像</b><b class='flag-5'>标注</b>不要没苦硬吃

    东软集团入选国家数据局数据标注优秀案例

    近日,东软飞标医学影像标注平台在国家数据局发布数据标注优秀案例集名单中排名第一(案例名称“多模态医学影像智能数据标注平台”)。评选专家认为东软案例取得了显著成效,一方面,抢占了自主可控的数据
    的头像 发表于 05-09 14:37 1394次阅读

    桥式整流电路的原理、优缺点及应用场景分析

    控制系统等领域占据重要地位。本文将从技术原理出发,深入剖析桥式整流电路的优缺点,并结合实际应用场景探讨其设计优化方向。 一、桥式整流电路的基本原理 桥式整流电路(Bridge Rectifier)由4个二极管按菱形结构连接而成。当输入交
    的头像 发表于 05-05 15:00 5678次阅读
    桥式整流电路的原理、<b class='flag-5'>优缺点</b>及应<b class='flag-5'>用场景</b>分析

    PCBA 表面处理:优缺点大揭秘,应用场景全解析

    一站式PCBA加工厂家今天为大家讲讲PCBA加工如何选择合适的表面处理工艺?PCBA表面处理优缺点与应用场景。在电子制造中,PCBA板的表面处理工艺对电路板的性能、可靠性和成本都有重要影响。选择合适
    的头像 发表于 05-05 09:39 1572次阅读
    PCBA 表面处理:<b class='flag-5'>优缺点</b>大揭秘,应<b class='flag-5'>用场景</b>全解析

    标贝科技“4D-BEV上亿点云标注系统”入选国家数据局首批数据标注优秀案例

    4月29日,作为第八届数字中国建设峰会的重要组成部分,由国家数据局主办的高质量数据集和数据标注主题交流活动在福州市数字中国会展中心举行。会议交流活动聚焦“推动高质量数据集建设,加快赋能人工智能发展
    的头像 发表于 04-30 14:38 824次阅读
    标贝科技“4D-BEV上亿点云<b class='flag-5'>标注</b>系统”入选国家数据局首批数据<b class='flag-5'>标注</b>优秀案例

    3D打印耗材种类有哪些?各有什么优缺点

    这篇文章将为你详细介绍3D打印耗材的基础知识,帮助你了解这些材料的特性、优缺点以及它们适合的应用场景
    的头像 发表于 04-29 09:40 5.4w次阅读
    3D打印耗材<b class='flag-5'>种类</b>有哪些?各有什么<b class='flag-5'>优缺点</b>?