如何实现遥感图像等超大尺寸图像快速识别-电子发烧友网

一般情况下，遥感目标检测中，遥感图像的图片尺寸都会很大，且图像中元素极为复杂，近期开赛的亚马逊云科技【AI For Good - 2022 遥感光学影像目标检测挑战赛】也不例外，动辄超过10000 x 10000的卫星遥感图像让许多选手感到头疼。同时遥感影像中目标尺寸差别大、小而密集、角度各异也导致常见的CV框架难以实现快速精准的目标识别。所以，如何实现遥感图像等超大尺寸图像快速识别？

目前比较成熟的卫星图像识别算法并不少，但大多依托于强大的计算资源，为了用有限的计算资源实现大尺寸图像识别，我们找到了一个可行的开源框架，给大尺寸图像识别提供了不错的思路。

YOLT 是一个基于YOLO v2的卫星图像识别开源算法，核心思路是：

1. 通过图片裁切和图像网络重构解决图像尺寸问题；

2. 通过“上采样”提升小而聚集的目标的检测精度；

3. 通过将不同尺寸模型融合，提升整体检测精度。

YOLT项目地址：GitHub - avanetten/yolt： You Only Look Twice： Rapid Multi-Scale Object Detection In Satellite Imagery

YOLO是经典的图像识别算法，YOLT在YOLO的基础上针对卫星图像特有的问题提出了特定的解决思路。详细思路参见论文「You Only Look Twice： Rapid Multi-Scale Object Detection In Satellite Imagery」（GitHub项目中附有论文链接）。

▲左侧为常见问题，右侧为解决办法

1. 针对物体尺寸不规则、方向多样的问题，YOLT对卫星图像数据进行尺寸变换与旋转等数据增强的处理。

2. 针对目标尺寸过小并聚集的问题，YOLT框架主要采用3种方式进行处理：

（1）修改图像网络结构，将YOLO v2框架中的stride由32改为16，有利于检测出大小在32 x 32以下的目标

（2）对图像进行上采样，完成图片的“解压缩”操作，即把原先的图片放大，以便检测小而密集的物体

（3）将不同尺寸的检测模型进行融合，即Ensemble操作，由于不同目标的尺寸差异可能较大，如海港与船只、机场与飞机，Ensemble操作能够提升大尺寸差异下的识别精度。

针对卫星图像尺寸过大的问题，YOLT采用切块的方式，将原始图像切割成小块后输入模型进行训练，并结合2-（3）进行模型融合。

▲ YOLT的网络结构，输出特征尺寸多为26 x 26，可以提升检测精度

应用实例

从下面的检测实例中，我们可以看到YOLT是如何工作的：

首先，开发团队将一张卫星图片调整至416 x 416大小（如上左），发现无法检测出车辆目标；而从原图中切割出416 x 416的区域（称其为Chips）则可以实现部分车辆目标的检测。

顺着这个思路，开发团队采用划窗方式将原始图像切割为许多chips，并使相邻chips之间有一定重合（如上图），以确保图像检测的完整性。再利用NMS算法将重复检测过滤，最后将各块的检测结果进行融合，即可得出最后的结果。

▲ 检测实例：采用YOLT v4识别机场中的飞机

YOLT的思路不止可以应用于卫星图像识别，同样可以在目标尺寸小且密集的其他类图像识别问题中发挥作用。

对本次亚马逊【AI For Good - 2022 遥感光学影像目标检测挑战赛】的选手而言，YOLT的解决思路能够帮助大家越过图片尺寸过大的第一道坎。

原文标题：如何实现超大尺寸图像快速识别

文章出处：【微信公众号：OpenCV学堂】欢迎添加关注！文章转载请注明出处。

审核编辑：彭静

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

卫星

卫星

+关注

关注
17

文章
1617

浏览量
65836
模型

模型

+关注

关注
1

文章
2707

浏览量
47710
遥感图像

遥感图像

+关注

关注
0

文章
40

浏览量
9989

原文标题：如何实现超大尺寸图像快速识别

文章出处：【微信号：CVSCHOOL，微信公众号：OpenCV学堂】欢迎添加关注！文章转载请注明出处。

图像识别技术原理图像识别技术的应用领域

。图像识别技术已经在各个领域广泛应用，其应用领域包括但不限于以下几个方面。一、智能安防领域 图像识别技术在智能安防领域得到了广泛的应用。通过对监控摄像头中的图像进行实时分析和处理，可以实现

发表于 02-02 11:01 •681次阅读

如何使用Python进行图像识别的自动学习自动训练？

如何使用Python进行图像识别的自动学习自动训练？使用Python进行图像识别的自动学习和自动训练需要掌握一些重要的概念和技术。在本文中，我们将介绍如何使用Python中的一些常用库和算法来实现

发表于 01-12 16:06 •221次阅读

如何用单片机实现图像识别？

如何用单片机实现图像识别

发表于 10-25 06:43

图像尺寸测量仪：解析适用零部件与应用领域

冲压、接插件、连接器、端子、手机、家电、印刷电路板、医疗器械、钟表、刀具等领域。无论是机械零件、电子元器件还是复杂曲面零件，VX系列图像尺寸测量仪都能够提供准确、高效的测量解决方案。它实现

发表于 09-11 16:44

模拟矩阵在图像识别中的应用

讯维模拟矩阵在图像识别中的应用主要是通过构建一个包含多种图像数据的模拟矩阵，来训练和测试深度学习模型，从而提高图像识别的准确性和效率。在图像识别中，讯维模拟矩阵可以用来做以下几方面的

发表于 09-04 14:17 •331次阅读

卷积神经网络用于图像识别的原理

在机器视觉领域，图像识别是指软件识别人物、场景、物体、动作和图像写入的能力。为了实现图像识别，计算机可以结合人工智能软件和摄像机使用机器视觉

发表于 08-20 09:56 •900次阅读

深度学习视角下的猫狗图像识别实现

来源：易百纳技术社区，作者：稗子酿的酒人工智能技术在图像识别领域取得了显著进展，其中基于深度学习的图像分类方法在猫狗图像识别中表现出色。本文将介绍使用深度学习技术实现猫狗

发表于 08-15 10:38 •1944次阅读

使用LabVIEW 实现物体识别、图像分割、文字识别、人脸识别等深度视觉

LabVIEW可以实现深度学习嘛，今天我们一起来看看使用LabVIEW 实现物体识别、图像分割、文字识别、人脸

发表于 08-11 16:02 •915次阅读

Imagga利用DGX Station实现快速图像识别

Imagga利用DGX Station实现快速图像识别

发表于 08-01 15:10 •405次阅读

人体分割识别图像技术的原理及应用

人体分割识别图像技术是一种将人体从图像中分割出来，并对人体进行识别和特征提取的技术。该技术主要利用计算机视觉和图像处理算法对人体

发表于 06-15 17:44 •696次阅读

人脸识别图像技术的原理及其应用

人脸识别图像技术是一种利用计算机视觉技术来自动识别和认证人的生物特征的技术，其主要依据是人脸图像的面部特征。该技术通过摄像头等设备捕捉到人脸图像

发表于 05-31 17:33 •1037次阅读

人体识别图像技术的原理及分类

人体识别图像技术是一种通过分析人体图像（如照片或视频）来识别个体身份的技术。它主要基于人体特征（如肤色、体型等）进行分析，通过对人体姿态、步态、外观等因素的提取与建模，

发表于 05-25 14:57 •1132次阅读

【EsDA应用】5分钟快速实现图像人脸检测

全性的生物识别技术，在安防、身份验证等领域被广泛应用。本文在【EsDA应用】5分钟快速实现摄像头图像采集的基础上，使用M6G2C核心板，简单介绍如何基于EsDA设

发表于 05-18 10:48 •403次阅读

【EsDA应用】5分钟快速实现图像人脸检测

是一种高安全性的生物识别技术，在安防、身份验证等领域被广泛应用。本文在【EsDA应用】5分钟快速实现摄像头图像采集的基础上，使用M6G2C核心板，简单介绍如何基于EsDA设计的

发表于 05-17 12:20 •382次阅读

Google Drive推荐的图像尺寸是多少？

发布图片时我看到的都是；未登录时，是一个小图标，图标旁边带有“图像”。尝试过使用 Google Drive 托管图片；登录或未登录均无效。另外，尝试过附加文件，然后复制链接地址并在图像标签之间粘贴我也尝试过调整图像大小。包含

发表于 05-11 08:11