0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何实现遥感图像等超大尺寸图像快速识别

OpenCV学堂 来源:OpenCV学堂 作者:OpenCV学堂 2022-07-14 09:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一般情况下,遥感目标检测中,遥感图像的图片尺寸都会很大,且图像中元素极为复杂,近期开赛的亚马逊云科技【AI For Good - 2022 遥感光学影像目标检测挑战赛】也不例外,动辄超过10000 x 10000的卫星遥感图像让许多选手感到头疼。同时遥感影像中目标尺寸差别大、小而密集、角度各异也导致常见的CV框架难以实现快速精准的目标识别。所以,如何实现遥感图像等超大尺寸图像快速识别?

目前比较成熟的卫星图像识别算法并不少,但大多依托于强大的计算资源,为了用有限的计算资源实现大尺寸图像识别,我们找到了一个可行的开源框架,给大尺寸图像识别提供了不错的思路。

YOLT 是一个基于YOLO v2的卫星图像识别开源算法,核心思路是:

1. 通过图片裁切和图像网络重构解决图像尺寸问题;

2. 通过“上采样”提升小而聚集的目标的检测精度;

3. 通过将不同尺寸模型融合,提升整体检测精度。

YOLT项目地址:GitHub - avanetten/yolt: You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery

YOLO是经典的图像识别算法,YOLT在YOLO的基础上针对卫星图像特有的问题提出了特定的解决思路。详细思路参见论文「You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery」(GitHub项目中附有论文链接)。

e58432fc-0310-11ed-ba43-dac502259ad0.png

▲左侧为常见问题,右侧为解决办法

1. 针对物体尺寸不规则、方向多样的问题,YOLT对卫星图像数据进行尺寸变换与旋转等数据增强的处理。

2. 针对目标尺寸过小并聚集的问题,YOLT框架主要采用3种方式进行处理:

(1) 修改图像网络结构,将YOLO v2框架中的stride由32改为16,有利于检测出大小在32 x 32以下的目标

(2) 对图像进行上采样,完成图片的“解压缩”操作,即把原先的图片放大,以便检测小而密集的物体

(3) 将不同尺寸的检测模型进行融合,即Ensemble操作,由于不同目标的尺寸差异可能较大,如海港与船只、机场与飞机,Ensemble操作能够提升大尺寸差异下的识别精度。

针对卫星图像尺寸过大的问题,YOLT采用切块的方式,将原始图像切割成小块后输入模型进行训练,并结合2-(3)进行模型融合。

e5b76f8c-0310-11ed-ba43-dac502259ad0.png

▲ YOLT的网络结构,输出特征尺寸多为26 x 26,可以提升检测精度

应用实例

从下面的检测实例中,我们可以看到YOLT是如何工作的:

首先,开发团队将一张卫星图片调整至416 x 416大小(如上左),发现无法检测出车辆目标;而从原图中切割出416 x 416的区域(称其为Chips)则可以实现部分车辆目标的检测。

顺着这个思路,开发团队采用划窗方式将原始图像切割为许多chips,并使相邻chips之间有一定重合(如上图),以确保图像检测的完整性。再利用NMS算法将重复检测过滤,最后将各块的检测结果进行融合,即可得出最后的结果。

▲ 检测实例:采用YOLT v4识别机场中的飞机

YOLT的思路不止可以应用于卫星图像识别,同样可以在目标尺寸小且密集的其他类图像识别问题中发挥作用。

对本次亚马逊【AI For Good - 2022 遥感光学影像目标检测挑战赛】的选手而言,YOLT的解决思路能够帮助大家越过图片尺寸过大的第一道坎。

原文标题:如何实现超大尺寸图像快速识别

文章出处:【微信公众号:OpenCV学堂】欢迎添加关注!文章转载请注明出处。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 卫星
    +关注

    关注

    18

    文章

    1886

    浏览量

    70534
  • 模型
    +关注

    关注

    1

    文章

    3879

    浏览量

    52353
  • 遥感图像
    +关注

    关注

    0

    文章

    40

    浏览量

    10926

原文标题:如何实现超大尺寸图像快速识别

文章出处:【微信号:CVSCHOOL,微信公众号:OpenCV学堂】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    机器视觉必备:图像采集卡基础知识与行业应用

    并不是相机和算法不够好,而是图像采集环节不够扎实。简单来讲,图像采集卡就是整套视觉系统的数据入口,也是画面传输的重要枢纽。所有视觉识别尺寸测量、缺陷检测、三维建模
    的头像 发表于 05-06 14:26 183次阅读
    机器视觉必备:<b class='flag-5'>图像</b>采集卡基础知识与行业应用

    多通道兼容图像采集卡:一机搞定多路图像信号处理

    在工业自动化、安防监控、智能检测、医疗影像领域,随着应用场景的不断升级,单路图像采集已无法满足多路信号同步接入、实时处理的重要需求。多通道兼容图像采集卡应运而生,以“一机集成、多路协同”为重要优势
    的头像 发表于 03-19 14:17 285次阅读
    多通道兼容<b class='flag-5'>图像</b>采集卡:一机搞定多路<b class='flag-5'>图像</b>信号处理

    图像采集卡:连接设备与数据的图像枢纽

    在机器视觉与图像传输体系中,图像采集卡是无可替代的重要枢纽——它一端承接相机、内窥镜、摄像机前端图像设备的信号输出,另一端对接后端数据处理、存储、展示系统,通过信号转换、同步协调、高
    的头像 发表于 01-22 13:51 449次阅读
    <b class='flag-5'>图像</b>采集卡:连接设备与数据的<b class='flag-5'>图像</b>枢纽

    数字图像采集的核心载体——图像采集卡技术白皮书

    在工业自动化、医疗影像、广电直播、科研成像领域,图像采集卡作为连接前端图像设备与后端计算系统的核心硬件,是实现物理图像向数字信号转化并高效
    的头像 发表于 01-21 16:18 476次阅读
    数字<b class='flag-5'>图像</b>采集的核心载体——<b class='flag-5'>图像</b>采集卡技术白皮书

    EspeedGrab图像采集软件介绍(Cameralink转USB采集)

    时序 设置好tap数,可自动识别分辨率信息 15 中心十字丝 可设置中心十字丝,辅助光学调试 16 等分网格线 可设置等分虚线网格,辅助画面内容分析 17 镜像、翻转 图像可设置上下镜像、左右翻转
    发表于 12-23 17:26

    RK3588采集Cameralink图像快速搭建系统办法

    对于一些特种相机,在进行嵌入式开发的时候,会遇到诸如ARM+Cameralink接口的图像采集架构。下面距离介绍一种嵌入式图像采集方案。代替Dalsa采集卡,xtium系列。也可以代替
    发表于 12-19 10:07

    图像采集卡:机器视觉时代的图像数据核心枢纽

    一、图像采集卡的技术本质:从信号到数据的“转换器”与“传输通道”图像采集卡(ImageCaptureCard)是机器视觉系统的核心硬件组件,本质是通过专用芯片(如FPGA、ASIC)实现图像
    的头像 发表于 11-12 15:15 971次阅读
    <b class='flag-5'>图像</b>采集卡:机器视觉时代的<b class='flag-5'>图像</b>数据核心枢纽

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    图像快速鉴别,满足实时或准实时的应用需求。 3. 数据采集 AI图片数据集,本项目使用gemini生成图片,使用的是gem来实现的。 提示词如下 你是一个能够生成美术绘本风格插画的智能Agent
    发表于 08-21 13:59

    基于米尔MYC-YM90X安路飞龙DR1开发板仪表图像识别系统开发

    图像识别流程中,FPGA 可承担图像预处理工作,如利用其并行处理能力实现图像的灰度化、降噪、滤波操作。同时,对于一些计算密集型的特征提取算
    发表于 08-17 21:29

    华怡丰推出ISC-B/C系列图像识别传感器

    在工业自动化领域,精准、高效的视觉检测是提升生产效率的关键。华怡丰全新推出的ISC-B/C系列图像识别传感器集高精度定位、测量算法与先进图像处理技术于一体,为各类工业场景提供稳定、可靠的解决方案!
    的头像 发表于 08-15 11:36 2116次阅读
    华怡丰推出ISC-B/C系列<b class='flag-5'>图像识别</b>传感器

    基于FPGA的数字识别系统设计

    图像处理领域,图像识别是较为困难而关键的技术。这项技术被广泛的应用到娱乐、工业、军事领域。本次设计数字识别系统已经在车牌识别、运动员号码
    的头像 发表于 07-16 14:28 2097次阅读
    基于FPGA的数字<b class='flag-5'>识别</b>系统设计

    火车车号图像识别系统如何应对不同光照条件下的识别问题?

    在铁路运输管理中,准确识别火车车号是实现自动化车辆管理的关键环节。然而,实际应用场景中复杂多变的光照条件给车号识别带来了巨大挑战。现代火车车号图像识别系统通过多项技术创新,有效解决了这
    的头像 发表于 07-15 11:37 1004次阅读
    火车车号<b class='flag-5'>图像识别</b>系统如何应对不同光照条件下的<b class='flag-5'>识别</b>问题?

    【正点原子STM32MP257开发板试用】基于 DeepLab 模型的图像分割

    目标的分割。 Demo 测试 介绍了正点原子官方 AI 例程实现图像分割的主要流程。 Demo 例程下载,路径01、程序源码/05、AI例程源码/02、deeplab
    发表于 06-21 21:11

    多光谱图像技术在苗期作物与杂草识别中的研究进展

    、劳动强度大、完全依赖人工主体的经验与知识,在大面积杂草苗情观测上,人工识别是无能为力的。遥感识别法则克服了人工监测的诸多弊端,可以在短时间内获得作物大范围的图像,自动
    的头像 发表于 06-10 18:13 604次阅读