0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何实现遥感图像等超大尺寸图像快速识别

OpenCV学堂 来源:OpenCV学堂 作者:OpenCV学堂 2022-07-14 09:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一般情况下,遥感目标检测中,遥感图像的图片尺寸都会很大,且图像中元素极为复杂,近期开赛的亚马逊云科技【AI For Good - 2022 遥感光学影像目标检测挑战赛】也不例外,动辄超过10000 x 10000的卫星遥感图像让许多选手感到头疼。同时遥感影像中目标尺寸差别大、小而密集、角度各异也导致常见的CV框架难以实现快速精准的目标识别。所以,如何实现遥感图像等超大尺寸图像快速识别?

目前比较成熟的卫星图像识别算法并不少,但大多依托于强大的计算资源,为了用有限的计算资源实现大尺寸图像识别,我们找到了一个可行的开源框架,给大尺寸图像识别提供了不错的思路。

YOLT 是一个基于YOLO v2的卫星图像识别开源算法,核心思路是:

1. 通过图片裁切和图像网络重构解决图像尺寸问题;

2. 通过“上采样”提升小而聚集的目标的检测精度;

3. 通过将不同尺寸模型融合,提升整体检测精度。

YOLT项目地址:GitHub - avanetten/yolt: You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery

YOLO是经典的图像识别算法,YOLT在YOLO的基础上针对卫星图像特有的问题提出了特定的解决思路。详细思路参见论文「You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery」(GitHub项目中附有论文链接)。

e58432fc-0310-11ed-ba43-dac502259ad0.png

▲左侧为常见问题,右侧为解决办法

1. 针对物体尺寸不规则、方向多样的问题,YOLT对卫星图像数据进行尺寸变换与旋转等数据增强的处理。

2. 针对目标尺寸过小并聚集的问题,YOLT框架主要采用3种方式进行处理:

(1) 修改图像网络结构,将YOLO v2框架中的stride由32改为16,有利于检测出大小在32 x 32以下的目标

(2) 对图像进行上采样,完成图片的“解压缩”操作,即把原先的图片放大,以便检测小而密集的物体

(3) 将不同尺寸的检测模型进行融合,即Ensemble操作,由于不同目标的尺寸差异可能较大,如海港与船只、机场与飞机,Ensemble操作能够提升大尺寸差异下的识别精度。

针对卫星图像尺寸过大的问题,YOLT采用切块的方式,将原始图像切割成小块后输入模型进行训练,并结合2-(3)进行模型融合。

e5b76f8c-0310-11ed-ba43-dac502259ad0.png

▲ YOLT的网络结构,输出特征尺寸多为26 x 26,可以提升检测精度

应用实例

从下面的检测实例中,我们可以看到YOLT是如何工作的:

首先,开发团队将一张卫星图片调整至416 x 416大小(如上左),发现无法检测出车辆目标;而从原图中切割出416 x 416的区域(称其为Chips)则可以实现部分车辆目标的检测。

顺着这个思路,开发团队采用划窗方式将原始图像切割为许多chips,并使相邻chips之间有一定重合(如上图),以确保图像检测的完整性。再利用NMS算法将重复检测过滤,最后将各块的检测结果进行融合,即可得出最后的结果。

▲ 检测实例:采用YOLT v4识别机场中的飞机

YOLT的思路不止可以应用于卫星图像识别,同样可以在目标尺寸小且密集的其他类图像识别问题中发挥作用。

对本次亚马逊【AI For Good - 2022 遥感光学影像目标检测挑战赛】的选手而言,YOLT的解决思路能够帮助大家越过图片尺寸过大的第一道坎。

原文标题:如何实现超大尺寸图像快速识别

文章出处:【微信公众号:OpenCV学堂】欢迎添加关注!文章转载请注明出处。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 卫星
    +关注

    关注

    18

    文章

    1822

    浏览量

    69574
  • 模型
    +关注

    关注

    1

    文章

    3655

    浏览量

    51753
  • 遥感图像
    +关注

    关注

    0

    文章

    40

    浏览量

    10801

原文标题:如何实现超大尺寸图像快速识别

文章出处:【微信号:CVSCHOOL,微信公众号:OpenCV学堂】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    火车车号图像识别系统如何应对不同光照条件下的识别问题?

    在铁路运输管理中,准确识别火车车号是实现自动化车辆管理的关键环节。然而,实际应用场景中复杂多变的光照条件给车号识别带来了巨大挑战。现代火车车号图像识别系统通过多项技术创新,有效解决了这
    的头像 发表于 07-15 11:37 540次阅读
    火车车号<b class='flag-5'>图像识别</b>系统如何应对不同光照条件下的<b class='flag-5'>识别</b>问题?

    多光谱图像技术在苗期作物与杂草识别中的研究进展

    、劳动强度大、完全依赖人工主体的经验与知识,在大面积杂草苗情观测上,人工识别是无能为力的。遥感识别法则克服了人工监测的诸多弊端,可以在短时间内获得作物大范围的图像,自动
    的头像 发表于 06-10 18:13 284次阅读

    基于LockAI视觉识别模块:C++使用图像的统计信息

    图像处理中,统计信息可以帮助我们了解图像的特性,例如区域内的像素分布、颜色转换以及特定区域的分析。本文将介绍基于LockAI视觉识别模块如何提取兴趣区域(ROI)、转换颜色通道、计算均值和标准差
    发表于 05-08 10:31

    基于LockAI视觉识别模块:C++使用图像的统计信息

    图像处理中,统计信息可以帮助我们了解图像的特性,例如区域内的像素分布、颜色转换以及特定区域的分析。本文将介绍基于LockAI视觉识别模块如何提取兴趣区域(ROI)、转换颜色通道、计算均值和标准差,以及查找最小值和最大值,并通过
    的头像 发表于 05-08 10:09 573次阅读
    基于LockAI视觉<b class='flag-5'>识别</b>模块:C++使用<b class='flag-5'>图像</b>的统计信息

    基于LockAI视觉识别模块:C++图像的基本运算

    ::Mat) 返回值: 结果储存在dst中 2.7.5 复杂的图像逻辑运算 如果需要实现复杂的逻辑运算(如NAND、NOR、NXOR),可以通过组合上述基本函数来完成。例如: **NAND 与非
    发表于 05-06 16:56

    基于LockAI视觉识别模块:C++图像的基本运算

    图像处理中,理解图像的基本操作是掌握计算机视觉技术的关键。本文章将介绍基于LockAI视觉识别模块下OpenCV中图像的基本运算方法,包括像素操作、逻辑运算和差值运算,并通过一个综合
    的头像 发表于 05-06 16:20 545次阅读
    基于LockAI视觉<b class='flag-5'>识别</b>模块:C++<b class='flag-5'>图像</b>的基本运算

    基于LockAI视觉识别模块:C++图像采集例程

    本文主要演示如何使用LockAI视觉识别模块进行视频流的读取,同时使用Edit模块进行图像传输。基础知识讲解1.1OpenCV简介OpenCV(OpenSourceComputerVisionLibra
    的头像 发表于 04-30 18:23 582次阅读
    基于LockAI视觉<b class='flag-5'>识别</b>模块:C++<b class='flag-5'>图像</b>采集例程

    手持终端集装箱识别系统的图像识别技术

    在港口、码头、物流园区场景中,集装箱的高效管理一直是行业智能化升级的核心需求。基于先进的OCR(光学字符识别)与AI技术,手持终端集装箱识别系统实现了从大型设备到移动终端的全场景箱号
    的头像 发表于 04-03 10:49 561次阅读

    图像采集卡:现代图像处理技术的关键组件

    在现代科技快速发展的背景下,图像处理技术已成为信息技术领域不可或缺的一部分。图像采集卡,作为连接计算机与各种图像采集设备的重要硬件组件,扮演着至关重要的角色。它不仅涉及
    的头像 发表于 02-20 10:42 970次阅读
    <b class='flag-5'>图像</b>采集卡:现代<b class='flag-5'>图像</b>处理技术的关键组件

    FPGA图像处理基础----实现缓存卷积窗口

    像素行与像素窗口 一幅图像是由一个个像素点构成的,对于一幅480*272大小的图片来说,其宽度是480,高度是272。在使用FPGA进行图像处理时,最关键的就是使用FPGA内部的存储资源对像
    的头像 发表于 02-07 10:43 1450次阅读
    FPGA<b class='flag-5'>图像</b>处理基础----<b class='flag-5'>实现</b>缓存卷积窗口

    图像尺寸测量优势:数量识别

    普密斯图像尺寸测量仪运用了先进的光学成像与图像处理技术,这一技术是其实现高效精准测量的核心。当面对多个电子产品同时测量时,测量仪的高分辨率镜头能迅速捕捉产品的清晰
    的头像 发表于 01-17 15:13 783次阅读
    <b class='flag-5'>图像</b><b class='flag-5'>尺寸</b>测量优势:数量<b class='flag-5'>识别</b>

    高精度图像尺寸测量仪优势

    高精度图像尺寸测量仪凭借其超高的测量精度、非接触式测量优势、强大的多功能测量能力、高效的测量速度以及广泛的应用领域,成为电子制造行业提升产品质量和生产效率的有力工具。
    的头像 发表于 01-13 11:32 1058次阅读
    高精度<b class='flag-5'>图像</b><b class='flag-5'>尺寸</b>测量仪优势

    图像尺寸测量仪在人造骨骼尺寸测量中的创新应用

    图像尺寸测量仪的出现为人造骨骼尺寸测量带来了革命性的突破。它依托先进的光学成像技术与精密的算法软件,能够快速、精准地测量人造骨骼的平面尺寸
    的头像 发表于 12-27 11:13 1035次阅读
    <b class='flag-5'>图像</b><b class='flag-5'>尺寸</b>测量仪在人造骨骼<b class='flag-5'>尺寸</b>测量中的创新应用

    基于FPGA实现图像直方图设计

    直方图统计的原理 直方图统计从数学上来说,是对图像中的像素点进行统计。图像直方图统计常用于统计灰度图像,表示图像中各个灰度级出现的次数或者概率。统计直方图的
    的头像 发表于 12-24 10:24 1225次阅读
    基于FPGA<b class='flag-5'>实现</b><b class='flag-5'>图像</b>直方图设计