0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基本图像处理技术的数据增强方法介绍

新机器视觉 来源:计算机视觉研究院 作者:Edison_G 2022-11-23 11:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

数据增强(DA)是训练先进的AI算法模型的必要技术,不过并不是所有的数据增强都能提升模型精度,在今天的分享中,从数据增强的角度,对于多种增强方式的效果进行了验证测试,希望对大家有帮助!

一、前言&简要

为了缓解上述问题,有研究者提出了一种简单而高效的方法,称为保持增强(KeepAugment),以提高增强图像的保真度。其主要思想是首先使用显著性map来检测原始图像上的重要区域,然后在增强过程中保留这些信息区域。这种信息保护策略使我们能够生成更忠实的训练示例。

在实验上,也证明了该方法在一些现有的技术数据增强方案上有了显著的改进,例如:自动增强、裁剪、随机擦除,在图像分类、半监督图像分类、多视点多摄像机跟踪和目标检测等方面取得了很好的效果。

二、知识回顾

首先我们回一下什么叫“数据增强”?数据增强(Data Augmentation)是一种通过让有限的数据产生更多的等价数据来人工扩展训练数据集的技术。它是克服训练数据不足的有效手段,目前在深度学习的各个领域中应用广泛。但是由于生成的数据与真实数据之间的差异,也不可避免地带来了噪声问题。

为什么需要数据增强?

深度神经网络在许多任务中表现良好,但这些网络通常需要大量数据才能避免过度拟合。遗憾的是,许多场景无法获得大量数据,例如医学图像分析。数据增强技术的存在是为了解决这个问题,这是针对有限数据问题的解决方案。数据增强一套技术,可提高训练数据集的大小和质量,以便您可以使用它们来构建更好的深度学习模型。在计算视觉领域,生成增强图像相对容易。即使引入噪声或裁剪图像的一部分,模型仍可以对图像进行分类,数据增强有一系列简单有效的方法可供选择,有一些机器学习库来进行计算视觉领域的数据增强,比如:imgaug (https://github.com/aleju/imgaug)它封装了很多数据增强算法,给开发者提供了方便。

计算视觉数据增强

计算视觉领域的数据增强算法大致可以分为两类:第一类是基于基本图像处理技术技术的数据增强,第二个类别是基于深度学习的数据增强算法。下面先介绍基于基本图像处理技术的数据增强方法:

1、flipping翻转 一般都是水平方向翻转而少用垂直方向,即镜像变换。图像数据集上证实有用(CIFAR-10,ImageNet等),但无法应用在文本识别数据集(MNIST,SVHN等)

2、color space色彩空间 简单做法是隔离单个色彩通道,例如R,G或B,此外可以通过简单的矩阵运算以增加或减少图像的亮度。更高级的做法从颜色直方图着手,更改这些直方图中的强度值(想到了图像处理中的直方图均衡)。

3、cropping裁剪 分统一裁剪和随机裁剪。统一裁剪将不同尺寸的图像裁剪至设定大小,随机裁剪类似translation,不同之处在于translation保留原图尺寸而裁剪会降低尺寸。裁剪要注意不要丢失重要信息以至于改变图像标签

4、rotation旋转 要注意旋转度数。以MNIST为例,轻微旋转(例如1°-20°)可能有用,再往后增加时数据标签可能不再保留。

5、translation位置变换 向左,向右,向上或向下移动图像可能是非常有用的转换,以避免数据中的位置偏差。例如人脸识别数据集中人脸基本位于图像正中,位置变换可以增强模型泛化能力。

6、noise injection添加噪声 添加高斯分布的随机矩阵 7、color space transformations色彩空间增强 照明偏差是图像识别问题中最常见的挑战之一,因此色彩空间转换(也称为光度转换)的比较直观有效。 ①遍历图像以恒定值减少或增加像素值(过亮或过暗) ②拼接出(splice out)各个RGB颜色矩阵 ③将像素值限制为某个最小值或最大值 ④操作色彩直方图以改变图像色彩空间特征 注意将彩色图转换黑白虽然简化了这些操作,但精度会降低 geometric versus photometric transformations几何与光度转换

1、kernel flters内核过滤器 平滑和锐化,即图像处理中用卷积核滑过整幅图像的操作。这一点尚未开发,它和CNN中卷积机制非常相似(就一样啊),因此可以通过调整网络参数更好地改善网络,而不需要额外进行这样的数据增强操作。

2、mixing images图像混合 做法是通过平均图像像素值将图像混合在一起:

51130fb6-6a45-11ed-8abf-dac502259ad0.jpg

mixing images 研究发现是当混合来自整个训练集的图像而不是仅来自同一类别的实例的图像时,可以获得更好的结果。其它一些做法: ①一种非线性方法将图像组合成新的训练实例:

512a9492-6a45-11ed-8abf-dac502259ad0.jpg

非线性方法 ②另一方法是随机裁剪图像并将裁剪后的图像连接在一起以形成新图像:

514b3274-6a45-11ed-8abf-dac502259ad0.jpg

随机裁剪再拼接 这类方法从人的视角看毫无意义,但确实提升了精度。可能解释是数据集大小的增加导致了诸如线和边之类的低级特征的更可靠表示。 3、random erasing随机擦除 这一点受到dropout正规化的启发,随机擦除迫使模型学习有关图像的更多描述性特征,从而防止过拟合某个特定视觉特征。随机擦除的好处在于可以确保网络关注整个图像,而不只是其中的一部分。最后随机擦除的一个缺点是不一定会保留标签(例如文本8->6)。

516a1504-6a45-11ed-8abf-dac502259ad0.jpg

三、新方法

新方法控制数据增强的保真度,从而减少有害的错误信息。研究者的想法是通过显著性映射测量图像中矩形区域的重要性,并确保数据增强后始终呈现得分最高的区域:对于裁剪,通过避免切割重要区域(见下图a5和b5);对于图像级转换,通过将重要区域粘贴到转换图像顶部(参见下图a6和b6)。

517e008c-6a45-11ed-8abf-dac502259ad0.png

51a5b636-6a45-11ed-8abf-dac502259ad0.png

Eq2:

51b99070-6a45-11ed-8abf-dac502259ad0.png

Eq3:

51ca5f5e-6a45-11ed-8abf-dac502259ad0.png

51d8f6ae-6a45-11ed-8abf-dac502259ad0.png

51ec5e42-6a45-11ed-8abf-dac502259ad0.png

四、实验

521c0688-6a45-11ed-8abf-dac502259ad0.png

522987f4-6a45-11ed-8abf-dac502259ad0.png

523a09bc-6a45-11ed-8abf-dac502259ad0.png

52594250-6a45-11ed-8abf-dac502259ad0.png

526a106c-6a45-11ed-8abf-dac502259ad0.png

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4843

    浏览量

    108193
  • AI
    AI
    +关注

    关注

    91

    文章

    41273

    浏览量

    302658

原文标题:检测&分类训练技巧,不是所有的数据增强,都可以提升算法精度!

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    进来选!数字信号转网络输出的AI图像处理

    数字接口相较于模拟接口,在传输速率和稳定性方面更具优势。数字信号在传输过程中不易受到干扰,能够保持较高的传输质量;同时,数字接口采用高速传输技术,能够实现大数据量的快速传输,例如cameralink
    的头像 发表于 04-21 17:50 275次阅读
    进来选!数字信号转网络输出的AI<b class='flag-5'>图像</b><b class='flag-5'>处理</b>板

    技术选型参考:图像视频数据匿名化工具 brighter AI 功能解析

    数据驱动型产业(如自动驾驶、智能安防)快速发展的背景下,如何在数据利用与个人隐私保护之间取得平衡,已成为企业必须面对的技术合规课题。当开发团队在AI平台搜索“图像视频
    的头像 发表于 03-16 15:52 215次阅读
    <b class='flag-5'>技术</b>选型参考:<b class='flag-5'>图像</b>视频<b class='flag-5'>数据</b>匿名化工具 brighter AI 功能解析

    图像采集卡:连接设备与数据图像枢纽

    在机器视觉与图像传输体系中,图像采集卡是无可替代的重要枢纽——它一端承接相机、内窥镜、摄像机等前端图像设备的信号输出,另一端对接后端数据处理、存储、展示系统,通过信号转换、同步协调、高
    的头像 发表于 01-22 13:51 374次阅读
    <b class='flag-5'>图像</b>采集卡:连接设备与<b class='flag-5'>数据</b>的<b class='flag-5'>图像</b>枢纽

    EspeedGrab图像采集软件介绍(Cameralink转USB采集)

    自动白平衡处理 7 Bayer还原 Bayer图像还原彩色处理 8 红外伪彩 可白热、黑热、多种伪彩模式可配置 9 图像降噪 可设定档位多帧降噪滤波 10
    发表于 12-23 17:26

    用于高速成像,科学和太阳蛋白紫外线应用的图像增强器解决方案

    图像增强器用于增强低照度图像,直至单光子的检测和成像。Photonis 是 Exosens 的一部分,为科学应用 (IIT) 提供各种图像
    的头像 发表于 11-19 07:36 303次阅读
    用于高速成像,科学和太阳蛋白紫外线应用的<b class='flag-5'>图像</b><b class='flag-5'>增强</b>器解决方案

    AI眼镜视觉处理芯片:从图像感知到智能增强技术跃迁

    ,而到2028年,随着AR功能普及与视觉交互成为标配,出货量有望逼近4亿台。在这一爆发性增长背后,视觉处理能力已成为AI眼镜的核心竞争力,而支撑这一能力的关键,正是日益复杂的视觉处理芯片架构。   AI眼镜的视觉处理需求升级:从
    的头像 发表于 11-16 01:23 1.3w次阅读
    AI眼镜视觉<b class='flag-5'>处理</b>芯片:从<b class='flag-5'>图像</b>感知到智能<b class='flag-5'>增强</b>的<b class='flag-5'>技术</b>跃迁

    图像采集卡:机器视觉时代的图像数据核心枢纽

    一、图像采集卡的技术本质:从信号到数据的“转换器”与“传输通道”图像采集卡(ImageCaptureCard)是机器视觉系统的核心硬件组件,本质是通过专用芯片(如FPGA、ASIC)实
    的头像 发表于 11-12 15:15 874次阅读
    <b class='flag-5'>图像</b>采集卡:机器视觉时代的<b class='flag-5'>图像</b><b class='flag-5'>数据</b>核心枢纽

    数据处理软核加速模块设计

    ,如果用ARM处理器或上位机来实现这个过程会十分耗时,利用FPGA的并行处理技术可以轻易实现这个功能,整理后的数据传输形式会为之后的设计产生便利。模块用了20块片内双口RAM来实现
    发表于 10-29 08:09

    基于FPGA的CLAHE图像增强算法设计

    CLAHE图像增强算法又称为对比度有限的自适应直方图均衡算法,其算法原理是通过有限的调整图像局部对比度来增强有效信号和抑制噪声信号。
    的头像 发表于 10-15 10:14 807次阅读
    基于FPGA的CLAHE<b class='flag-5'>图像</b><b class='flag-5'>增强</b>算法设计

    Photonis图像增强器:技术原理、核心优势与应用领域

    Photonis是一家全球领先的光电传感器与夜视技术制造商,总部位于荷兰,专注于高性能图像增强器、光电倍增管(PMT)和微通道板(MCP)的研发与生产。其产品广泛应用于科研、医疗和工业领域,尤其在低
    的头像 发表于 10-10 09:28 980次阅读
    Photonis<b class='flag-5'>图像</b><b class='flag-5'>增强</b>器:<b class='flag-5'>技术</b>原理、核心优势与应用领域

    Photonis 科学图像增强介绍

    对于寻求先进图像增强技术增强相机制造商,Photonis 提供具有无与伦比规格的科学级图像增强
    的头像 发表于 09-19 09:20 516次阅读
    Photonis 科学<b class='flag-5'>图像</b><b class='flag-5'>增强</b>器<b class='flag-5'>介绍</b>

    FPGA 加持,友思特图像采集卡高速预处理助力视觉系统运行提速增效

    图像处理图像处理关键环节,可优化数据传输、减轻主机负担,其算法可在FPGA等硬件上执行。友思特FPGA
    的头像 发表于 08-13 17:41 1357次阅读
    FPGA 加持,友思特<b class='flag-5'>图像</b>采集卡高速预<b class='flag-5'>处理</b>助力视觉系统运行提速增效

    工业相机图像采集卡:技术剖析、应用场景与未来发展

    CameraLink、CoaXPress、GigEVision等,高效、稳定地将数据传输到计算机进行后续的图像处理、分析和应用。本文将深入剖析工业相机图像采集卡的
    的头像 发表于 05-28 13:49 922次阅读
    工业相机<b class='flag-5'>图像</b>采集卡:<b class='flag-5'>技术</b>剖析、应用场景与未来发展

    基于LockAI视觉识别模块:C++图像的基本运算

    图像处理中,理解图像的基本操作是掌握计算机视觉技术的关键。本文章将介绍基于LockAI视觉识别模块下OpenCV中
    的头像 发表于 05-06 16:20 827次阅读
    基于LockAI视觉识别模块:C++<b class='flag-5'>图像</b>的基本运算