0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Open Images Extended合集中引入了更具包容性的人物注释MIAP数据集

硬件三人行 来源:TensorFlow 作者:TensorFlow 2021-08-16 17:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

发布人:Google Research 软件工程师 Candice Schumann 和 Susanna Ricco

2016 年,我们推出了 Open Images。此协作版本包含约 900 万张含有标签的图像,涵盖数千个对象类别和 600 个类的边界框注释。从那之后,我们进行了多次更新,如将众包数据发布到 Open Images Extended 合集,以此提高对象注释的多样性。

更新

https://ai.googleblog.com/2019/05/announcing-open-images-v5-and-iccv-2019.html

Open Images Extended

https://storage.googleapis.com/openimages/web/extended.html

虽然这些数据集提供的标签扩展性很强,但此类标签并没有关注人物的敏感属性,这些属性对于许多机器学习 (ML) 公平性任务(例如公平性评估和偏见缓解)至关重要。事实上,找到包含彻底标记此类敏感属性的数据集是很困难的,尤其是在计算机视觉领域。

公平性任务

https://developers.google.com/machine-learning/crash-course/fairness/video-lecture

今天,我们在 Open Images Extended 合集中引入了更具包容性的人物注释 (MIAP) 数据集。此合集包含更多完整的边界框注释,用于包含 10 万张人物图像中的的人物类层级结构。每个注释还带有可感知到的性别呈现和年龄范围等公平相关属性的标签。作为 Responsible AI 研究的一部分,越来越多的人开始关注如何减少不公平偏见,我们希望这些注释能够激励已经在使用 Open Images 的研究者,将公平分析纳入他们的研究中。

Responsible AI 研究

https://ai.google/principles/

交叉描述通过为现有图像-描述对和辅助描述添加语义相似度人工评分来扩展 MS-COCO 评估集(实线),并通过为新的图像-描述、描述-描述和图像-图像对添加人工评分来提高评分密度(虚线)*

Open Images 中的注释

原始 Open Images 数据集中的每个图像都包含图像级注释(宽泛地描述图像)和包围特定对象的边界框。为了避免对同一个对象绘制多个边界框,我们从标签候选集中临时删减了具体性较弱的类,我们将这一过程称为层级去重。举个例子,若一个图像的标签包括动物、 猫,和洗衣机则该图像的注释边界框为猫和洗衣机,而不会注释多余的类 ——动物。

图像级注释

https://cloud.google.com/vision/docs/labels

边界框

https://cloud.google.com/vision/docs/object-localizer

MIAP 数据集可用于原始 Open Images 数据,集中人物 层级包含的五个类:人物、男人、女人、男孩、女孩。由于这些标签的存在,Open Images 数据集对于推进 Responsible AI 的研究具有独特的价值,能够帮助开发者训练通用的人物检测器,访问性别和年龄范围特定的标签,以实现公平分析和偏见缓解。

Responsible AI

https://ai.google/responsibilities/responsible-ai-practices/

人物检测器

https://cloud.google.com/video-intelligence/docs/people-detection

然而,我们发现结合了层级去重和女人/女孩与男人/男孩之间的社会性区别后,原始注释会受到限制。举个例子,如果要求注释器针对女孩这一分类绘制边界框,它们便不会在图像中的男孩周围绘制边界框。注释器可能会也可能不会在某位女性周围绘制边界框,这取决于其对个人年龄的评估以及对女孩这一概念的文化性理解。此类判断在不同图像中可能会存在不一致,这取决于单独的注释器的文化背景、图像人物的外表和场景的上下文。因此,某些图像中的边界框注释会不完整,一些较为显眼的人物没有得到注释。

MIAP 中的注释

新的 MIAP 注释旨在解决这些限制,实现让 Open Images 成为推动机器学习公平性研究取得新进展的数据集的保障。我们不要求注释器为层级结构中最具体的类(例如,女孩)绘制边界框,而是将此程序反过来,要求它们为性别和年龄未知的人物分类绘制边界框。

所有人物边界框届时都将获得感知到的性别呈现(很大可能是女性、很大可能是男性,或未知)以及年龄呈现(青年、中年、老年,或未知)等标签。我们认识到性别不是二元的,个人的性别认同可能与其感知或预期的性别呈现不符,为了缓解无意识偏见对注释的影响,这里提示:注释器,与性别呈现相关的规范因文化而异,且会随时间的推移而变化。

这个过程添加了大量先前丢失的边界框。

在包含人物的 10 万张图像中,人物边界框的数量从 35.8 万左右增加到 45.4 万左右。各个感知性别呈现和感知年龄呈现的边界框数量持续增加。这些新注释为人物检测器的训练提供了更完整的基本事实,并提供了更准确的子组标签,以将公平性纳入计算机视觉研究。

预期用例

我们为人物边界框的感知年龄范围和性别呈现纳入了注释,因为我们认为有必要添加此类注释,以便提高能力,实现更好的理解以及努力缓解并消除图像理解领域,受保护子组之间的不公平偏见或不同性能。

我们注意到,标签捕获的性别和年龄范围是第三方仅根据视觉线索,而不是个人的自我认知性别或实际年龄评估出来的。我们不支持也不容忍构建或部署根据这些注释训练的性别或年龄呈现分类器,因为我们认为在公平性研究之外使用这些技术的相关风险大于任何潜在好处。

风险

https://dl.acm.org/doi/10.1145/3173574.3173582

致谢

这项研究背后的核心团队成员包括 Utsav Prabhu、Vittorio Ferrari 和 Caroline Pantofaru。同时,我们还要感谢 Alex Hanna、Reena Jana、Alina Kuznetsova、Matteo Malloci、Stefano Pellegrini、Jordi Pont-Tuset 和 Mahima Pushkarna 对本项目的贡献。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296558
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47451
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136232
  • 数据集
    +关注

    关注

    4

    文章

    1230

    浏览量

    26046

原文标题:最新进展:将包容性人物注释纳入 Open Image Extended 数据集

文章出处:【微信号:yingjiansanrenxing,微信公众号:硬件三人行】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MIAP2200D凭何突破?双5G并发×全千兆网口×毫秒级无缝漫游!

    随着工业自动化、智能化进程加速,工业无线通信的重要日益凸显,MIAP2200系列工业无线客户端凭借前三款明星产品——MIAP2200S-1N2-T、MIAP
    的头像 发表于 08-29 11:36 1485次阅读
    <b class='flag-5'>MIAP</b>2200D凭何突破?双5G并发×全千兆网口×毫秒级无缝漫游!

    案例 | Cogent DataHub: 高效实现风电场数据集中管理与自动化

    案例概况CaseOverview一家跨国电力公司使用宏CogentDataHub软件,在美国西南地区建立起风电场的集中控制和数据采集系统。该系统整合来自不同风力涡轮机的OPC服务器数据
    的头像 发表于 08-08 18:29 396次阅读
    宏<b class='flag-5'>集</b>案例 | Cogent DataHub: 高效实现风电场<b class='flag-5'>数据</b><b class='flag-5'>集中</b>管理与自动化

    分享 | 集中告警管理如何提升设施安全

    提高团队响应速度,优化维护运营在工业或商业建筑中,集中告警管理已成为确保安全或检测故障的必备工具。通过将所有安全系统集中管理,企业能够将所有告警统一在一个HMI界面中,大幅提升响应速度。关键要点
    的头像 发表于 08-08 18:25 316次阅读
    宏<b class='flag-5'>集</b>分享 | <b class='flag-5'>集中</b>告警管理如何提升设施安全<b class='flag-5'>性</b>?

    分享 | 集中式架构还是分布式架构?SCADA架构选型的新趋势

    HongraxIIoT在工业数字化不断推进的今天,SCADA系统早已不仅是简单的数据监控工具,它正在成为保障企业运行效率、安全和业务连续的战略核心。而“选择集中式、分布式还是混合式
    的头像 发表于 08-08 18:15 471次阅读
    宏<b class='flag-5'>集</b>分享 | <b class='flag-5'>集中</b>式架构还是分布式架构?SCADA架构选型的新趋势

    数据下载失败的原因?

    数据下载失败什么原因太大了吗,小的可以下载,想把大的下载去本地训练报错网络错误 大的数据多大?数据量有多少?
    发表于 06-18 07:04

    你知道什么是“二极管发言”吗?

    。 缺乏包容性: 对不同意见、细微差别或妥协方案完全无法理解和接受,认为不是朋友就是敌人。 容易站队、贴标签: 喜欢将人或事物快速归入某个极端阵营,并贴上非此即彼的标签。 为什么说这种发言是“二极管
    发表于 06-11 09:47

    LitePoint如何助力客户克服5G O-RAN测试挑战

    随着5G开放无线接入网(O-RAN)领域的日益成熟,无线通信提供商们迎来了一个契机:通过引入包容性的多供应商模式,在现今单一供应商5G部署的基础上,兑现O-RAN作为开源标准的承诺。
    的头像 发表于 06-09 10:48 921次阅读
    LitePoint如何助力客户克服5G O-RAN测试挑战

    关于CCG5 platform Flash问题,在烧写images时,如何保留产线校准数据

    和板卡信息丢失 2. PSoC Programmermer没法擦除指定flash,都是整个128K擦除,例如在flash中分配一个row来存储产线校准数据,如何保证在烧写images后,保留产线校准数据呢?谢谢
    发表于 05-30 07:50

    贸泽电子田吉平荣膺产业特别贡献人物

    平女士荣获《国际电子商情》40周年“产业特别贡献人物”大奖。该奖项旨在表彰推动中国电子产业创新发展的标杆人物,田吉平女士凭借前瞻的战略眼光、卓越领导才能及对产业生态建设的突出贡献,获此殊荣。     田吉平女士表示:“收获这份
    发表于 03-28 14:39 304次阅读
      贸泽电子田吉平荣膺产业特别贡献<b class='flag-5'>人物</b>奖

    无法将自定义COCO数据导入到OpenVINO™ DL Workbench怎么解决?

    JSON包含以下格式注释的文件:{ \"images\": [], \"annotations\": [] } 创建自定义 COCO 数据。 无法将自定义 COCO
    发表于 03-05 06:02

    领克汽车成都工厂引入优必选无人物流方案

    近日,领克汽车成都工厂在智能制造领域迈出了重要一步,引入了优必选智慧物流子公司UQI优奇的全栈式无人物流解决方案。这一创新举措标志着领克汽车在提升生产效率、优化物流流程方面取得了新的突破。
    的头像 发表于 01-24 14:26 991次阅读

    Open-E JovianDSS Up31增强的功能和新特性

    我们非常高兴地宣布发布 Open-E JovianDSS Up31 版本,该版本包含多项强大的增强功能和新特性,旨在提高数据存储基础架构的性能、安全和集成能力。以下是最新更新的详细概述
    的头像 发表于 01-24 11:20 697次阅读

    Arm与阿斯顿·马丁沙特阿美一级方程式赛车车队达成合作

    公平包容性是 Arm DEI(多样、公平包容性)战略的核心支柱之一,对公司内外的业务发展与文化建设具有深远影响。在今年的国际消费类
    的头像 发表于 01-13 11:13 780次阅读

    AMC1200BDUBR在工作时引入了112MHz和132MHz的EMC噪声,怎么消除?

    请问前辈,我用的TI芯片:AMC1200BDUBR 在工作时引入了112MHz和132MHz的EMC 噪声。请问电路要怎么改进才能消除这个噪声?望前辈能帮忙推荐解决方法 不胜感激!
    发表于 12-23 07:31

    沙特阿拉伯发布《利雅得宣言》 共筑包容性、创新和有影响力的人工智能未来

    政府、私营部门、非营利部门、企业家与创新者在数字领域的国际合作。 沙特通信与信息技术大臣阿卜杜拉•斯瓦哈(H.E. Abdullah Alswaha) 表示,《利雅得宣言》得到了沙特王储兼首相的支持与授权。《利雅得宣言》重点聚焦于人工智能的包容性、创新和影响力。
    的头像 发表于 12-18 09:56 543次阅读