0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

facebook AI研究院又发布了一个大规模的词汇实例分割数据集

nlfO_thejiangme 来源:lq 2019-10-01 16:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

聚焦于关键科学问题的数据不断促进着目标检测领域的技术进步,使得目标检测的性能从简单的图像扩展到了复杂的场景,从边框标注拓展到了语义分割掩膜。

近日来自facebook AI研究院的研究人员们又发布了一个大规模的词汇实例分割数据集(Large Vocabulary Instance Segmentation,LVIS ),包含了164k图像,并针对超过1000类物体进行了约200万个高质量的实例分割标注。由于数据集中包含自然图像中的物体分布天然具有长尾属性,LVIS数据集将促进深度学习在图像分割领域的进一步发展。

目标检测是计算机视觉领域的重要任务,适用性强、用途广泛、发展迅速,近年来在数据集、基准算法和检测能力上都得到了大幅度提升,并衍生出一系列新的能力,包括图像分割、三维表示和三维目标检测等内容。

目前针对目标检测算法的严格测评只在少量的分类上进行(例如20类/80类),那么在真实环境中有大规模类别的物体或者出现了罕见的物体时该如何处理?这就为科学家们提出了新的问题。

图像中目标类别的长尾效应是不可避免的,标注更多的数据集虽然可以有效地发现先前未见或罕见的类别,但有效地从小样本中学习至今还是机器学习与计算机视觉领域一个重要的开放问题,也使得这一领域成为科学界与工业界研究最为活跃的领域。但要深入的对这一领域进行研究,一个高质量的数据集和基准必不可少!

FAIR的研究人员针对这一研究方向设计并收集了称为LVIS的针对于大规模词汇实例分割的数据集,这一数据集包含了164k图像,超过1000类数据,约两百万个标注。

值得一提的是,这个数据集的收集流程没有预先确定的类别(没有类别先验),首先收集图像然后根据图像中目标的自然分布来进行标注。大量的人工标注代替了机器的自动化标注使得图像中自然存在的长尾分布可以被有效识别。

COCO和ADE20K数据集

研究人员设计了一个有效的众包标注流程,可以在高质量标注的前提下获取大规模的数据集。对于目标检测和实例分割来说,标注的质量对于算法十分重要。类似COCO这样相对较粗的标注限制了算法对于mask预测质量的提升。与COCO和ADE20K相比,LVIS数据的标注mask具有更大的重叠面积和更好的边缘连续性。

在构建数据集的过程中,研究人员采用了评价优先的设计原则。这意味着研究人员首先确定了对算法性能进行评价的方法,并基于这一方法来进行数据集的收集和构建,以满足评测方法的需求。研究人员提出的测评基准使用了类似coco风格的的实例分割和AP计算方法。

但针对自然图像中较为长尾的数据集,需要解决两个不可避免的问题:

1)在类别庞大的情况下,如果某个目标拥有多个标签,该如何公平的评测检测器的性能?

2)针对164k图像超过一千个类别的标注任务,如何设计合适的标注流程来减少工作量?

解决这些问题的关键在于构建联合数据集:通过多个小数据集联合构建大规模的完整数据集,而每一个子数据集则类似于只聚焦于某个单一类别的传统数据集。在标注过程中,每一个小数据集将集中标注某一个特定的类别,将图中某个特定类别的所有目标穷尽(exhaustive )标注。

对于完整的大数据集来说,构成的子数据集间可能会有重叠,单一目标可能会有多个标签。此外由于在每个小数据集中进行了针对一类物体的穷尽标注,在完整的联合数据集中就无需对所有的类别进行穷尽标注,这样的方法极大地减小了标注的工作量。

更为关键的是,在测试评价时算法并不知道每张图片组成的标记类别,它将对所有的标记类别一视同仁地进行处理,这将对联合数据集内的各个数据集提供公平的测评。

LVIS数据集针对的是实例分割任务,这一任务的主要目标是在给定分类已知固定类别的情况下,算法可以针对一张事先未见过的图像进行处理,并输出图像中出现的每一个实例及其对应的分类和置信度分数。通过算法生成的一系列输出,可以计算出掩膜的平均精度mAP。

但在算法的测评中,研究人员将面临着一系列问题。随着分类数目的增加,实例的标签不可避免的将会出现重叠和混淆:部分视觉概念的重合、父子分类关系的的界定和同义词的识别等等。如果没有有效的方法处理这些问题,测评的方法将会产生很大的不公平性。

例如很多玩具都不是鹿,大多数鹿都是不是玩具,但是一只玩具鹿同时是玩具也是一只鹿,这时目标检测算法很有可能得到错误的标记。再比如,一辆车的标记是交通工具vehicle,算法如果输入了car那么就会被判定为错误。

这些问题的发生主要来源于GT标注缺失了一个或者多个描述目标的标签。如果算法预测到了某个标签但是没有在GT中标注过就会得到错误的惩罚。但对于这个新的数据集来说,每一个物体的标签都被穷尽且正确的标注,上面的问题就可以迎刃而解。

数据集标注流程

数据集的标注流程分为了六个主要的步骤包括目标定点、穷尽标记、实例分割和验证、穷尽标注验证、负例标签等。

目标定点中标注者被要求将图像中输入不同类别的实例进行标记,这个阶段将迭代进行,使得标注者可以不断从图像中发掘出自然场景下目标的长尾信息。随后再针对第一阶段标记的每一个类别,将进行彻底的实例标记,找出每一类别包含的所有实例。在图中可以看到标记者又标记出了更多的书。

在第三和第四阶段,分别对前面标记的实例进行实例分割标注和验真,重复进行直到准确率超过99%通过验证。第五阶段将进行穷尽标注验证检测,检查是否所有的实例都被分割和标注类别,如果有就将缺失标注实例的类别筛选出来进行补充标注。最后一步的负例标签将用来验证类别子类的标签没有出现在图像中。更详细的标注细节请参看论文的第三部分。

探索数据集

下面让我们来探索一下数据集,下图中可以看到每张图像里对于某一类图像都进行了完善地标注,小的、被遮掩的难以辨认的,目标实例都被标注了出来。比如第一行最后一列的车牌标注和第三行最后一列的相机标注,尽管很小但也别明确地画出掩膜。这些目标对于图像的抽象和理解十分重要。

下图中各类实例也别分别标注出来了:

子数据集中,每个实例都被穷尽标注。例如对于飞机这个分类,下图展示了每张图片中所有的飞机,无论是飞机的一部分还是完整的飞机都被标注了出来。

还有这些诱人的水果,都被一个个挑了出来。就拿菠萝来说吧,无论是商店里的完整菠萝还是沙拉里的菠萝,就连披萨里的菠萝丁也被标记出来了。

还有更多好玩的的数据集和详细的分类信息,请参看数据集网站:

https://www.lvisdataset.org

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1096

    浏览量

    42448
  • Facebook
    +关注

    关注

    3

    文章

    1432

    浏览量

    59380
  • 计算机视觉
    +关注

    关注

    9

    文章

    1716

    浏览量

    47733
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26264

原文标题:FAIR提出大规模细粒度词汇级标记数据集LVIS,有效识别长尾分布

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    赛昉科技携手中国移动研究院,深度参与RISC-V国际协会复数矩阵指令标准化,填补高端计算空白

    近日,中国移动研究院在RISC-V国际协会正式提出复数矩阵运算指令提案,填补了RISC-V在复数矩阵原生硬件级支持方面的空白。赛昉科技作为中国移动研究院的重要技术创新合作伙伴,深度参与该指令
    的头像 发表于 04-22 15:04 165次阅读
    赛昉科技携手中国移动<b class='flag-5'>研究院</b>,深度参与RISC-V国际协会复数矩阵指令<b class='flag-5'>集</b>标准化,填补高端计算空白

    意法半导体为超大规模AI数据中心破解供电难题

    AI大模型算力需求呈指数级飙升,兆瓦级AI机柜成为主流,传统54V低压配电系统早已触到物理极限,供电端的多重挑战正成为AI数据中心规模化发展
    的头像 发表于 04-07 15:46 330次阅读
    意法半导体为超<b class='flag-5'>大规模</b><b class='flag-5'>AI</b><b class='flag-5'>数据</b>中心破解供电难题

    中国移动研究院联合发布实时通信智能体CallingClaw

    近日,中国移动研究院携手中国移动江苏公司及华为,正式发布基于OpenClaw的实时通信智能体CallingClaw,依托中国移动安全、可信的网络底座,将通话能力与OpenClaw深度结合,打造出款“能办事、会成长、不设限”的个
    的头像 发表于 03-28 13:49 3276次阅读

    沐曦股份北京AI研究院暨企业开源中心正式揭牌启动

    3月20日,沐曦股份北京AI研究院暨“企业开源中心”正式揭牌启动。活动以“沐曦芯生,开源共创”为主题,标志着沐曦股份生态建设的战略布局全面升级。
    的头像 发表于 03-24 10:11 357次阅读

    摩尔线程与中国移动研究院等,联合发布128卡高密超节点参考设计,定义超大规模智算底座新标准

    ,依托OISA协同创新平台,摩尔线程、中国移动研究院、之江实验室等产业伙伴正式发布《OISA高密超节点参考设计技术规范》。该规范针对当前智算中心面临的互联瓶颈、供电压力及散热极限,提出了全栈式解决方案,为构建自主可控、
    发表于 03-17 08:40 866次阅读

    全球首个最大规模跨本体视触觉多模态数据白虎-VTouch发布

    具身智能走向真实世界规模化应用,离不开可复现、可扩展、可协同演进的数据基础设施。围绕真实物理交互能力构建这核心工程目标,1月26日,国家地方共建人形机器人创新中心联合上海纬钛科技有限公司正式
    的头像 发表于 01-29 14:41 831次阅读

    诚迈科技携手应急管理大学、中铁十九局共建智慧应急科技创新研究院

    1月25日,由诚迈科技、应急管理大学、中铁十九局共同组建的智慧应急科技创新研究院(以下简称“研究院”)在应急管理大学南校区正式启动。应急管理大学党委书记赵峰华,中铁十九局党委常委、副总经理赵琦,诚迈
    的头像 发表于 01-27 11:51 741次阅读
    诚迈科技携手应急管理大学、中铁十九局共建智慧应急科技创新<b class='flag-5'>研究院</b>

    燧原科技荣获2025年超大规模智算集群创新应用实践成果

    近日,中国信息通信研究院(以下简称“中国信通”)成功召开2025AI云产业发展大会。中国通信标准化协会理事长闻库、中国信通副院长王志勤出席会议并致辞。中国工程
    的头像 发表于 12-29 09:59 535次阅读
    燧原科技荣获2025年超<b class='flag-5'>大规模</b>智算集群创新应用实践成果

    纤纳光电获得2025年度浙江省企业研究院认定

    近日,浙江省经济和信息化厅发布2025年度拟认定省企业研究院名单。经企业申报、县级审查、市级推荐、专家评审等程序,纤纳光电建设的“浙江省纤纳新能源钙钛矿技术企业研究院”成功入选。
    的头像 发表于 12-16 17:31 1472次阅读

    广电计量与长沙三大研究院达成战略合作

    11月26-27日,广电计量与长沙北斗产业安全技术研究院集团股份有限公司(简称“长沙北斗研究院”)、长沙量子测量产业技术研究院有限公司(简称“长沙量子研究院”)、湖南大学长沙半导体技术
    的头像 发表于 12-04 14:36 691次阅读

    广电计量携手南山研究院打造大健康产业新生态

    10月19日, “南山研究院南海四周年系列活动”在广东省南山医药创新研究院(简称“南山研究院”)成功举办。期间,南山研究院与广电计量等多家单位联合共建的华南医学健康功效循证评价中心正式
    的头像 发表于 10-23 17:42 1321次阅读

    AI Cube如何导入数据

    我从在线平台标注完并且下载数据,也按照ai cube的要求修改了文件夹名称,但是导入提示 不知道是什么原因,我该怎么办? 以下是我修改后的文件夹目录
    发表于 08-11 08:12

    今日看点丨亚马逊上海AI研究院解散;索尼拟出售以色列芯片部门

          1、 亚马逊上海AI研究院解散! 据报道,AWS亚马逊云科技上海AI研究院的首席应用科学家王敏捷发朋友圈称,他们收到通知,AWS亚马逊云科技上海
    发表于 07-24 09:42 1468次阅读
    今日看点丨亚马逊上海<b class='flag-5'>AI</b><b class='flag-5'>研究院</b>解散;索尼拟出售以色列芯片部门

    中国传感器市场规模突破4000亿!工信部产业研究院最新数据出炉

        近期,工信部直属产业研究机构赛迪研究院发布最新的中国传感器产业市场数据,较具有参考性。本文仅做相关核心数据分享,报告原文请于赛迪顾
    的头像 发表于 06-14 17:37 1887次阅读
    中国传感器市场<b class='flag-5'>规模</b>突破4000亿!工信部产业<b class='flag-5'>研究院</b>最新<b class='flag-5'>数据</b>出炉

    导远科技与清华大学无锡应用技术研究院达成合作

    近日,导远科技与清华大学无锡应用技术研究院(以下简称:研究院)达成合作。导远科技将提供高精度定位产品及解决方案,以支持研究院在L4级自动驾驶和人形机器人领域的技术研发及转化落地。
    的头像 发表于 06-12 16:34 1249次阅读