0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

图像标注在计算机视觉中起着至关重要的作用

Dbwd_Imgtec 来源:AI公园 作者:AI公园 2021-01-08 14:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读

给大家介绍图像标注的种类,应用场景,以及各种标注的优缺点。

介绍

“如果没有数据分析,公司就会变得既盲又聋,就像高速公路上的鹿一样在网络上游荡。”

— Geoffrey Moore

每个数据科学任务都需要数据。具体地说,是输入系统的干净易懂的数据。说到图像,计算机需要看到人类眼睛看到的东西。

例如,人类有识别和分类物体的能力。同样,我们可以使用计算机视觉来解释它接收到的视觉数据。这就是图像标注的作用。

图像标注在计算机视觉中起着至关重要的作用。图像标注的目标是为和任务相关的、特定于任务的标签。这可能包括基于文本的标签(类),绘制在图像上的标签(即边框),甚至是像素级的标签。我们将在下面探讨这一系列不同的标注技术。

人工智能需要的人工干预比我们想象的要多。为了准备高精度的训练数据,我们必须对图像进行标注以得到正确的结果。数据注释通常需要较高水平的领域知识,只有来自特定领域的专家才能提供这些知识。

需要标注的计算机视觉任务:

物体检测

线/边缘检测

分割

姿态预测/关键点识别

图像分类

目标检测

进行目标检测的技术主要有两种,即2D和3D包围框。 对于多边形物体,可以使用多边形方法。让我们详细讨论一下。

2D 包围框

在这种方法中,只需要在被检测的物体周围绘制矩形框。它们用于定义对象在图像中的位置。边框可以由矩形左上角的x、y轴坐标和右下角的x、y轴坐标来确定。

优点和缺点:

标注起来快速和容易。

不能提供重要的信息,如物体的方向,这对许多应用来说是至关重要的。

包括不属于物体一部分的背景像素。这可能会影响训练。

3D 包围框或者立方体

类似于2D边框,除了它们还可以显示目标的深度。这种标注是通过将二维图像平面上的边界框向后投影到三维长方体来实现的。它允许系统区分三维空间中的体积和位置等特征。

优点和缺点:

解决了物体方向的问题。

当物体被遮挡,这种标注可以想象包围框的维度,这可能会影响训练。

这种标注也会包括背景像素,可能会影响训练。

多边形

有时,必须标记形状不规则的物体。在这种情况下,使用多边形。注释时只需标记物体的边缘,我们就能得到要检测的物体的完美轮廓。

优点和缺点:

多边形标记的主要优点是它消除了背景像素,并捕获了物体的精确尺寸。

非常耗时,如果物体的形状是复杂的,很难标注。

注:多边形方法也用于物体形状的分割。我们将在下面讨论分割。

数据采集是ML冷启动的问题。但是,即使你有了一个可行的数据集,构建和测试模型也是需要技巧的。

线/边缘检测(线和样条)

在划分边界时,线和样条是有用的。将区分一个区域和另一个区域的像素进行标注。

优点和缺点:

这种方法的优点是,连线上的像素不需要都是连续的。这样在检测有中断的线或部分遮挡的物体是非常有用的。

手动标注图像中的线是非常累人和费时的,特别是图像中有很多的线的时候。

当物体碰巧是对齐的时候,可能会给出误导的结果。

姿态预测 / 关键点识别

在许多计算机视觉应用中,神经网络常常需要识别输入图像中重要的感兴趣的点。我们把这些点称为地标或关键点。在这种应用中,我们希望神经网络输出关键点的坐标(x, y)。

分割

图像分割是将一幅图像分割为多个部分的过程。图像分割通常用于在像素级定位图像中的物体和边界。图像分割方法有很多种。

语义分割:语义分割是一项机器学习任务,它需要像素级标注,其中图像中的每个像素都被分配给一个类。每个像素都带有语义意义。这主要用于环境背景非常重要的情况。

实例分割:实例分割是图像分割的一种子类型,它在像素级别上标识图像中每个物体的每个实例。实例分割和语义分割是图像分割的两种粒度级别之一。

全景分割:全景分割结合了语义分割和实例分割,所有像素都被分配一个类标签,所有目标实例都被唯一地分割。

图像分类

图像分类不同于目标检测。目标检测的目的是识别和定位目标,而图像分类的目的是识别和识别特定的目标类。这个用例的一个常见示例是对猫和狗的图片进行分类。标注者必须为一只狗的图像分配一个类标签“dog”,对猫的图像分配类标签“cat”。

图像标注的用例

在本节中,我们将讨论如何使用图像标注来帮助机器模型执行特定行业的任务:

零售:

2D边框可以用于标注产品的图像,然后机器学习算法可以使用这些图像来预测成本和其他属性。图像分类在这方面也有帮助。

医学:

多边形可用于在医用x射线中标记器官,以便将它们输入深度学习模型,以训练x射线中的畸形或缺陷。这是图像标注最重要的应用之一,需要医学专家具有较高的领域知识。

自动驾驶汽车:

这是另一个重要的领域,图像标注可以应用。利用语义分割对图像中的每个像素进行标记,使车辆能够感知到道路上的障碍物。这一领域的研究仍在进行中。

情绪检测:

这是里程碑,可以用来检测一个人的情绪(高兴,悲伤,或自然)。这可以应用于评估受试者对特定内容的情绪反应。

制造行业:

线和样条可用于标注工厂的图像线跟随机器人工作。这可以帮助自动化生产过程,人力劳动可以最小化。

图像标注的一些挑战

时间复杂度

手工标注图像需要很多时间,机器学习需要大量的数据集,需要大量的时间来有效地标注这些基于图像的数据集。

计算复杂度

机器学习需要精确标注的数据来运行模型。如果标注者在给图像做标注的时候,注入任何一种错误,都可能会影响到训练,所有的努力都可能付诸东流。

领域知识

如前所述,图像标注通常需要特定领域的高级领域知识。因此,我们需要知道该标注什么的注解者,以及该领域的专家。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1095

    浏览量

    42157
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47451
  • 图像标注
    +关注

    关注

    0

    文章

    10

    浏览量

    2698

原文标题:图像标注的基础内容介绍

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工业图像采集卡:机器视觉的“信号中枢”

    一、定位:连接物理视界与数字大脑的重要枢纽工业自动化生产线的精密检测工位上,当高速相机捕捉到PCB板的微米级纹路时,一个常被忽视却至关重要的硬件正在完成关键转换——工业图像采集卡如同
    的头像 发表于 11-06 15:09 144次阅读
    工业<b class='flag-5'>图像</b>采集卡:机器<b class='flag-5'>视觉</b>的“信号中枢”

    工业计算机重要

    工业计算机对某些行业至关重要。我们将在下面详细解释这些行业的工业计算机应用。1.制造与工业自动化工业级计算机非常适合制造工厂,特别是那些想
    的头像 发表于 07-28 16:07 398次阅读
    工业<b class='flag-5'>计算机</b>的<b class='flag-5'>重要</b>性

    什么是自动驾驶数据标注?如何好做数据标注

    [首发于智驾最前沿微信公众号]自动驾驶系统的开发过程,数据标注是一项至关重要的工作。它不仅决定了模型训练的质量,也直接影响了车辆感知、决策与控制的性能表现。随着传感器种类和数据量的
    的头像 发表于 07-09 09:19 927次阅读
    什么是自动驾驶数据<b class='flag-5'>标注</b>?如何好做数据<b class='flag-5'>标注</b>?

    图像采集卡:机器视觉与专业成像的关键桥梁

    在当今数字化时代,从工业自动化检测到医疗影像诊断,从科学研究到高清视频制作,图像信息的实时获取和处理变得至关重要。而将现实世界的光信号(通过摄像头或相机)高效、准确地转换为计算机能够处理的数字
    的头像 发表于 06-19 12:25 634次阅读
    <b class='flag-5'>图像</b>采集卡:机器<b class='flag-5'>视觉</b>与专业成像的关键桥梁

    电源滤波器医疗设备重要作用

    电源滤波器现代医疗设备起着至关重要作用,通过抑制电源线电磁干扰和射频干扰,保证设备性能稳
    的头像 发表于 06-13 14:34 545次阅读
    电源滤波器<b class='flag-5'>在</b>医疗设备<b class='flag-5'>中</b>的<b class='flag-5'>重要作用</b>

    工业相机图像采集卡:技术剖析、应用场景与未来发展

    工业相机图像采集卡,作为连接工业相机与计算机系统的桥梁,机器视觉领域扮演着至关重要的角色。它将工业相机采集的模拟或数字
    的头像 发表于 05-28 13:49 537次阅读
    工业相机<b class='flag-5'>图像</b>采集卡:技术剖析、应用场景与未来发展

    工业相机图像采集卡:机器视觉的核心枢纽

    应用广泛。工业相机图像采集卡的主要功能在机器视觉系统,工业相机负责捕获目标对象的图像,而图像采集卡则负责将这些
    的头像 发表于 05-21 12:13 537次阅读
    工业相机<b class='flag-5'>图像</b>采集卡:机器<b class='flag-5'>视觉</b>的核心枢纽

    基于LockAI视觉识别模块:C++图像的基本运算

    图像处理,理解图像的基本操作是掌握计算机视觉技术的关键。本文章将介绍基于LockAI
    的头像 发表于 05-06 16:20 529次阅读
    基于LockAI<b class='flag-5'>视觉</b>识别模块:C++<b class='flag-5'>图像</b>的基本运算

    时钟同步通信系统中有哪些重要作用

    时钟同步是指在一个系统,各个时钟能够准确地显示相同的时间。现代科技发展,时钟同步是非常重要的,特别是
    的头像 发表于 04-29 13:44 929次阅读
    时钟同步<b class='flag-5'>在</b>通信系统中有哪些<b class='flag-5'>重要作用</b>?

    Arm KleidiCV与OpenCV集成助力移动端计算机视觉性能优化

    等多种应用。然而,这些计算机视觉应用可能很难实现最优化的延迟性能和处理速度,特别是在内存大小、电池容量和处理能力有限的移动设备上难度更高。 而 Arm KleidiCV 便能在其中大显身手。该开源库利用了最新 Arm CPU
    的头像 发表于 02-24 10:15 876次阅读

    工业安卓主板智慧粮仓设备中发挥着至关重要作用

    工业安卓主板智慧粮仓设备中发挥着至关重要作用。以下是关于其作用的具体分析:  一、提供稳定可靠的运行平台 智慧粮仓设备需要长时间稳定运行,以实现对粮食储存环境的实时监测和精准控制。
    的头像 发表于 02-20 17:50 533次阅读

    安卓工控一体机印刷机械设备中发挥着至关重要作用

    安卓工控触屏一体机印刷机械设备确实发挥着至关重要作用,主要体现在以下几个方面:
    的头像 发表于 02-14 18:11 623次阅读
    安卓工控一体机<b class='flag-5'>在</b>印刷机械设备中发挥着<b class='flag-5'>至关重要</b>的<b class='flag-5'>作用</b>

    AR和VR计算机视觉

    ):计算机视觉引领混合现实体验增强现实(AR)和虚拟现实(VR)正在彻底改变我们与外部世界的互动方式。即便是引人入胜的沉浸式
    的头像 发表于 02-08 14:29 2125次阅读
    AR和VR<b class='flag-5'>中</b>的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>

    工业计算机的定义与重要

    运行。随着现代产业向智能化、自动化和数据化的转型,工业计算机制造业、交通运输、能源、电信等多个领域中扮演着越来越重要的角色。工业计算机的广阔应用促进了生产效率的提
    的头像 发表于 12-25 15:11 976次阅读
    工业<b class='flag-5'>计算机</b>的定义与<b class='flag-5'>重要</b>性

    RS232设备与计算机连接的实现步骤

    标准定义了电压水平、数据格式、控制信号等。了解这些标准对于正确连接和通信至关重要。 2. 检查设备和计算机的RS-232端口 确认你的设备和计算机都有RS-232端口。如果没有,你可能需要一个适配器或转换器。 3. 获取RS-2
    的头像 发表于 12-10 17:21 5060次阅读