用于计算机视觉训练的图像数据集-电子发烧友网

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类视觉系统可以实现任务自动化。

计算机视觉任务包括图像采集、图像处理和图像分析。图像数据可以采用不同的形式，例如视频序列，从多个角度的不同的摄像机查看图像或来自医疗扫描仪的多维数据。

用于计算机视觉训练的图像数据集

Labelme：麻省理工学院计算机科学与人工智能实验室（CSAIL）创建的大型数据集，包含187,240张图像、62,197条带注释的图像和658,992张带标签的对象。

乐高积木：通过文件夹和使用Blender渲染的计算机对大约16700种乐高积木进行分类的大约12,700张图像。

ImageNet：用于新算法的实际图像数据集。根据WordNet层次结构进行组织，其中层次结构的每个节点都以成千上万的图像进行描绘。

LSUN：具有许多辅助任务的场景理解（房间布局估计、显着性预测等）

MS COCO：COCO是包含200,000多个标记图像的大规模对象检测、分割和字幕数据集。它可以用于对象分割，上下文识别以及许多其他用例。

哥伦比亚大学图像库：COIL100是一个数据集，其中包含360个旋转角度中每个角度成像的100个不同对象。

视觉基因组：视觉基因组是一个数据集和知识库，旨在将结构化图像概念与语言联系起来。该数据库具有详细的视觉知识库，并带有108,077张图像的字幕。

Google的开放图像：“Creative Commons”下900万个URL的图像集合，这些URL已用6000多个类别的标签进行了注释。

来自“打开图像”数据集的带注释的图像。

左：Kevin Krejci的《鬼拱门》。右：J B制造的银制厨房用具。两个图像均在CC BY 2.0许可下使用。

Youtube-8M：带有标签的大规模数据集，由数百万个YouTube视频ID组成，带有超过3,800多个视觉实体的注释。

带标签的野外面孔：13,000个带标签的人脸图像，用于开发涉及面部识别的应用程序。

斯坦福犬类数据集：包含20,580张图像和120种不同的犬种类别，每个类别约有150张图像。

地点：以场景为中心的数据库，其中包含205个场景类别和250万个带有类别标签的图像。

CelebFaces：具有超过200,000张名人图像的人脸数据集，每个图像带有40个属性注释。

花卉：在英国常见的花朵图像数据集，包含102个不同类别。每个花类由40至258张图像组成，这些图像具有不同的姿势和光线变化。

植物图像分析：涵盖超过一百万张植物图像的数据集。可以从11种植物中选择。

家庭对象：一个数据集，其中包含来自家庭的随机对象，大部分来自厨房、浴室和客厅，这些对象分为训练和测试数据集。

CIFAR-10：包含60,000张32×32彩色图像的大型图像数据集，分为10类。数据集分为五个训练批次和一个测试批次，每个批次包含10,000张图像。

CompCars：包含163种车型，包含1,716种车型，每种车型都标有五个属性，包括最大速度、排量、门数、座位数和汽车类型。

室内场景识别：非常具体的数据集，非常有用，因为大多数场景识别模型在“外部”效果更好。包含67个室内类别，共15620张图像。

VisualQA：VQA是一个数据集，包含有关265,016张图像的开放式问题。这些问题需要对视觉和语言的理解。对于每个图像，至少有3个问题，每个问题10个答案。

原文标题：机器学习和计算机视觉的前20个图像数据集

文章出处：【微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

责任编辑：haq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

原文标题：机器学习和计算机视觉的前20个图像数据集

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

用于计算机视觉训练的图像数据集