0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用于计算机视觉训练的图像数据集

新机器视觉 来源:AI科技大本营 作者:AI科技大本营 2020-12-31 09:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类视觉系统可以实现任务自动化。

计算机视觉任务包括图像采集、图像处理和图像分析。图像数据可以采用不同的形式,例如视频序列,从多个角度的不同的摄像机查看图像或来自医疗扫描仪的多维数据。

用于计算机视觉训练的图像数据集

Labelme:麻省理工学院计算机科学与人工智能实验室(CSAIL)创建的大型数据集,包含187,240张图像、62,197条带注释的图像和658,992张带标签的对象。

乐高积木:通过文件夹和使用Blender渲染的计算机对大约16700种乐高积木进行分类的大约12,700张图像。

ImageNet:用于新算法的实际图像数据集。根据WordNet层次结构进行组织,其中层次结构的每个节点都以成千上万的图像进行描绘。

LSUN:具有许多辅助任务的场景理解(房间布局估计、显着性预测等)

MS COCO:COCO是包含200,000多个标记图像的大规模对象检测、分割和字幕数据集。它可以用于对象分割,上下文识别以及许多其他用例。

哥伦比亚大学图像库:COIL100是一个数据集,其中包含360个旋转角度中每个角度成像的100个不同对象。

视觉基因组:视觉基因组是一个数据集和知识库,旨在将结构化图像概念与语言联系起来。该数据库具有详细的视觉知识库,并带有108,077张图像的字幕。

Google的开放图像:“Creative Commons”下900万个URL的图像集合,这些URL已用6000多个类别的标签进行了注释。

来自“打开图像”数据集的带注释的图像。

左:Kevin Krejci的《鬼拱门》。右:J B制造的银制厨房用具。两个图像均在CC BY 2.0许可下使用。

Youtube-8M:带有标签的大规模数据集,由数百万个YouTube视频ID组成,带有超过3,800多个视觉实体的注释。

带标签的野外面孔:13,000个带标签的人脸图像,用于开发涉及面部识别的应用程序。

斯坦福犬类数据集:包含20,580张图像和120种不同的犬种类别,每个类别约有150张图像。

地点:以场景为中心的数据库,其中包含205个场景类别和250万个带有类别标签的图像。

CelebFaces:具有超过200,000张名人图像的人脸数据集,每个图像带有40个属性注释。

花卉:在英国常见的花朵图像数据集,包含102个不同类别。每个花类由40至258张图像组成,这些图像具有不同的姿势和光线变化。

植物图像分析:涵盖超过一百万张植物图像的数据集。可以从11种植物中选择。

家庭对象:一个数据集,其中包含来自家庭的随机对象,大部分来自厨房、浴室和客厅,这些对象分为训练和测试数据集。

CIFAR-10:包含60,000张32×32彩色图像的大型图像数据集,分为10类。数据集分为五个训练批次和一个测试批次,每个批次包含10,000张图像。

CompCars:包含163种车型,包含1,716种车型,每种车型都标有五个属性,包括最大速度、排量、门数、座位数和汽车类型。

室内场景识别:非常具体的数据集,非常有用,因为大多数场景识别模型在“外部”效果更好。包含67个室内类别,共15620张图像。

VisualQA:VQA是一个数据集,包含有关265,016张图像的开放式问题。这些问题需要对视觉和语言的理解。对于每个图像,至少有3个问题,每个问题10个答案。

原文标题:机器学习和计算机视觉的前20个图像数据集

文章出处:【微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器视觉
    +关注

    关注

    163

    文章

    4727

    浏览量

    124972
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261395
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136216

原文标题:机器学习和计算机视觉的前20个图像数据集

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    图像采集卡:机器视觉时代的图像数据核心枢纽

    的采集、转换、传输与初步处理,搭建起图像传感器(相机/摄像头)与计算机之间的高速数据链路。其核心价值在于解决“原始图像信号如何高效、精准、稳定地转化为
    的头像 发表于 11-12 15:15 270次阅读
    <b class='flag-5'>图像</b>采集卡:机器<b class='flag-5'>视觉</b>时代的<b class='flag-5'>图像</b><b class='flag-5'>数据</b>核心枢纽

    STM32计算机视觉开发套件:B-CAMS-IMX摄像头模块技术解析

    STMicroelectronics用于 STM32开发板的B-CAMS-IMX摄像头模块提供强大的硬件,可处理多种计算机视觉场景和用例。该模块具有高分辨率500万像素IMX335
    的头像 发表于 10-20 09:46 698次阅读
    STM32<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>开发套件:B-CAMS-IMX摄像头模块技术解析

    【作品合集】赛昉科技VisionFive 2单板计算机开发板测评

    单板计算机试用体验】驱动LED点阵屏【VisionFive 2单板计算机试用体验】二维码检测与解码【VisionFive 2单板计算机试用体验】人脸及物体识别、图像边缘检测 作者:jf
    发表于 09-04 09:08

    易控智驾荣获计算机视觉顶会CVPR 2025认可

    近日,2025年国际计算机视觉与模式识别顶级会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美国田纳西州纳什维尔召开。
    的头像 发表于 07-29 16:54 967次阅读

    工业计算机的重要性

    管理用于产品检查、数据记录和数据分析的运动控制系统,以提高制造生产率。例如,汽车行业从工业边缘计算机中受益匪浅,这些计算机
    的头像 发表于 07-28 16:07 396次阅读
    工业<b class='flag-5'>计算机</b>的重要性

    训练平台数据过大无法下载数据至本地怎么解决?

    起因是现在平台限制了图片数量,想要本地训练下载数据时发现只会跳出网络异常的错误,请问这有什么解决办法?
    发表于 07-22 06:03

    工业计算机与商用计算机的区别有哪些

    工业计算机是一种专为工厂和工业环境设计的计算系统,具有高可靠性和稳定性,能够应对恶劣环境下的自动化、制造和机器人操作。其特点包括无风扇散热技术、无电缆连接和防尘防水设计,使其在各种工业自动化场景中
    的头像 发表于 07-10 16:36 509次阅读
    工业<b class='flag-5'>计算机</b>与商用<b class='flag-5'>计算机</b>的区别有哪些

    工业相机图像采集卡:机器视觉的核心枢纽

    工业相机图像采集卡是用于连接工业相机与计算机的关键硬件设备,主要负责将相机输出的图像信号转换为计算机可处理的数字信号,并实现高速、稳定的
    的头像 发表于 05-21 12:13 533次阅读
    工业相机<b class='flag-5'>图像</b>采集卡:机器<b class='flag-5'>视觉</b>的核心枢纽

    工业计算机如何设计用于冲击和振动

    工业计算机是为挑战消费级系统耐用性的环境而构建的。在制造业、运输业、国防和采矿业等领域,计算机面临着持续的冲击、振动和其他物理压力。设计这些系统以在这种条件下保持可靠需要卓越的工程和创新技术。本文
    的头像 发表于 05-19 15:27 358次阅读
    工业<b class='flag-5'>计算机</b>如何设计<b class='flag-5'>用于</b>冲击和振动

    基于LockAI视觉识别模块:C++图像的基本运算

    图像处理中,理解图像的基本操作是掌握计算机视觉技术的关键。本文章将介绍基于LockAI视觉识别模块下OpenCV中
    的头像 发表于 05-06 16:20 525次阅读
    基于LockAI<b class='flag-5'>视觉</b>识别模块:C++<b class='flag-5'>图像</b>的基本运算

    英飞凌边缘AI平台通过Ultralytics YOLO模型增加对计算机视觉的支持

    计算机视觉的支持,扩大了当前对音频、雷达和其他时间序列信号数据的支持范围。在增加这项支持后,该平台将能够用于开发低功耗、低内存的边缘AI视觉
    的头像 发表于 03-11 15:11 651次阅读
    英飞凌边缘AI平台通过Ultralytics YOLO模型增加对<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的支持

    Arm KleidiCV与OpenCV集成助力移动端计算机视觉性能优化

    生成式及多模态人工智能 (AI) 工作负载的广泛增长,推动了对计算机视觉 (CV) 技术日益高涨的需求。此类技术能够解释并分析源自现实世界的视觉信息,并可应用于人脸识别、照片分类、滤镜
    的头像 发表于 02-24 10:15 874次阅读

    微软OmniParser V2:大模型转化为计算机智能体

    的精度和更快的推理速度。这一显著提升得益于V2采用了更大规模的交互元素检测数据和图标功能描述数据进行训练。通过这些训练,OmniParse
    的头像 发表于 02-18 09:31 2664次阅读

    AR和VR中的计算机视觉

    ):计算机视觉引领混合现实体验增强现实(AR)和虚拟现实(VR)正在彻底改变我们与外部世界的互动方式。即便是在引人入胜的沉浸式
    的头像 发表于 02-08 14:29 2119次阅读
    AR和VR中的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>

    云端超级计算机使用教程

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的计算服务。下面,AI部落小编为
    的头像 发表于 12-17 10:19 932次阅读