0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究人员开发了一种工具用于训练人工智能系统的图像集中的潜在偏差

倩倩 来源:新经网 作者:新经网 2020-10-15 14:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

普林斯顿大学的研究人员开发了一种工具,用于标记用于训练人工智能AI)系统的图像集中的潜在偏差。这项工作是纠正和防止AI系统中普遍存在的偏见的一项较大努力的一部分,该偏见影响了从信贷服务到法庭判决程序的所有内容。

尽管AI系统中偏见的来源多种多样,但一个主要的原因是从在线资源收集的大量图像中包含的定型图像,工程师使用这些图像来开发计算机视觉,这是AI的一个分支,允许计算机识别人,物体和动作。由于计算机视觉的基础是建立在这些数据集上的,因此反映社会定型观念和偏见的图像会无意间影响计算机视觉模型。

为了从源头上解决这个问题,普林斯顿视觉AI实验室的研究人员开发了一种开源工具,该工具可以自动发现视觉数据集中的潜在偏差。该工具允许数据集创建者和用户在使用图像收集来训练计算机视觉模型之前纠正代表性不足或刻板印象的问题。在相关工作中,Visual AI Lab的成员发布了现有方法的比较,这些方法可防止计算机视觉模型本身出现偏差,并提出了一种新的,更有效的缓解偏差的方法。

第一个工具称为REVISE(揭示视觉偏见),它使用统计方法来检查数据集的三个方面:基于对象,基于性别和基于地理位置的潜在偏见或代表性不足。REVISE是一种全自动工具,建立在早期工作的基础上,涉及以需要用户更多指导的方式来过滤和平衡数据集的图像。该研究报告于8月24日在虚拟的欧洲计算机视觉会议上发表。

REVISE使用现有的图像注释和度量来评估数据集的内容,例如对象计数,对象和人的共现以及图像的原产国。在这些测量中,该工具可显示不同于中值分布的图案。

例如,在一个测试的数据集中,REVISE显示,包括人和花朵在内的图像在雄性和雌性之间是不同的:雄性更经常出现在仪式或会议上,并带有花朵,而雌性则倾向于出现在舞台上或绘画中。(分析仅限于反映图像中出现的人的二元性别的注释。)

一旦该工具揭示了这些差异,“那么,这就是一个完全无害的事实,或者是否正在发生更深层的事情,而这很难自动化,”计算机科学与专业副教授奥尔加·鲁萨科夫斯基(Olga Russakovsky)说。视觉AI实验室的调查员。Russakovsky与研究生Angelina Wang和计算机科学副教授Arvind Narayanan共同撰写了该论文。

例如,REVISE显示,包括飞机,床和比萨饼在内的物体在包含它们的图像中比在其中一个数据集中的典型物体更大。这样的问题可能不会永久保留社会定型观念,但是对于训练计算机视觉模型可能会出现问题。作为补救措施,研究人员建议收集飞机图像,其中还包括山峰,沙漠或天空标签

但是,计算机视觉数据集中全球区域的代表性不足,可能会导致AI算法出现偏差。与以前的分析一致,研究人员发现,对于图像的来源国(按人口标准化),美国和欧洲国家在数据集中的代表过多。除此之外,REVISE还显示,对于来自世界其他地区的图像,图像标题通常不是使用本地语言,这表明其中许多图像是被游客捕获的,并可能导致某个国家/地区的视角偏斜。

Russakovsky说,专注于对象检测的研究人员可能会忽略计算机视觉的公平性问题。她说:“但是,这种地理分析表明,物体识别仍然可能存在很大的偏见和排他性,并且会不平等地影响不同的地区和人民。”

共同作者,计算机科学研究生安吉丽娜·王说:“直到最近,才对计算机科学中的数据集收集实践进行彻底的审查。”她说,图片大多是“从互联网上抓取的,人们并不总是意识到他们的图片在[数据集中]被使用。我们应该从更多的人群中收集图片,但是当我们这样做时,我们应该小心我们以尊重的方式获得图像。”

“工具和基准测试是重要的一步……它们使我们能够在开发初期就抓住这些偏见,并重新考虑我们的问题设置和假设以及数据收集实践,”计算机科学助理教授Vicente Ordonez-Roman说。未参与研究的弗吉尼亚大学。“在计算机视觉中,有关刻板印象的表示和传播存在一些特定的挑战。诸如普林斯顿视觉AI实验室所做的工作有助于阐明这些问题并引起计算机视觉界的注意,并提供了缓解这些问题的策略。 ”

视觉AI实验室的一项相关研究对防止计算机视觉模型学习可能反映偏差的虚假关联进行了研究,这些虚假关联可能会反映偏差,例如过度预测活动(例如以女性形象烹饪或以男性形象进行计算机编程)。视觉提示(例如,斑马是黑白的,或者篮球运动员经常穿着球衣)有助于提高模型的准确性,因此在开发有效模型的同时避免出现问题性关联是该领域的重大挑战。

在6月举行的虚拟计算机视觉和模式识别国际国际会议上提出的研究中,电气工程专业的研究生Zeyu Wang及其同事比较了四种缓解计算机视觉模型偏差的技术。

他们发现一种称为对抗训练或“盲目的公平”的流行技术损害了图像识别模型的整体性能。在对抗训练中,模型无法考虑有关受保护变量的信息-在研究中,研究人员使用性别作为测试案例。在团队的分析中,另一种方法称为域独立培训,即“通过意识进行公平”,效果更好。

鲁萨科夫斯基说:“从本质上讲,这意味着我们将针对不同性别进行不同的活动频率,是的,这一预测将取决于性别。因此,我们只是接受这一观点。”

本文中概述的技术通过与其他视觉提示分开考虑受保护的属性来减轻潜在的偏见。

王泽宇说:“我们如何真正解决偏差问题是一个更深层次的问题,因为我们当然可以看到它存在于数据本身中。”他说:“但是在现实世界中,人们仍然可以在意识到我们的偏见的同时做出良好的判断”,并且可以设置计算机视觉模型以类似的方式工作。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1097

    浏览量

    42505
  • 人工智能
    +关注

    关注

    1821

    文章

    50542

    浏览量

    267885
  • 数据集
    +关注

    关注

    4

    文章

    1242

    浏览量

    26309
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    OPAQUE从TII收购阿布扎比研发的加密人工智能技术,借助后量子保护技术,将机密人工智能的应用范围扩展至整

    应用场景中得到验证的技术,为OPAQUE的平台增添了两项关键能力:由多方计算和全同态加密等先进加密技术支持的机密人工智能模型训练,以及后量子加密保护。 OPAQUE由加州大学伯克利分校RISELab的研究人员创立,此次收购完成后
    的头像 发表于 05-07 16:43 828次阅读

    嵌入式人工智能课程(华清远见)

    嵌入式 AI 编译器优化:华清远见课程,解锁极致端侧性能 随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着个巨大的技术鸿沟:在算力受限
    发表于 04-16 18:47

    人工智能多模态与视觉大模型开发实战 - 2026必会

    视觉大模型特训:从原理到部署站式学会 在科技飞速发展的当下,视觉大模型已成为人工智能领域的颗璀璨明星,广泛应用于安防监控、自动驾驶、医疗影像分析等众多领域,深刻改变着我们的生活与
    发表于 04-15 16:06

    九天菜菜大模型agent智能开发实战2026月班

    自主 AI 新范式:大模型 Agent 开发实战火爆开课 在科技浪潮汹涌澎湃的当下,人工智能领域正经历着场深刻变革,大模型 Agent 开发实战课程如璀璨新星般闪耀登场,迅速成为科
    发表于 04-15 16:04

    人工智能测试开发训练营2期

    霍格沃兹干货:AI 测试常见误区与避坑指南 在2026年的技术版图中,人工智能已不再是锦上添花的点缀,而是软件质量的基石。然而,随着大模型(LLM)和生成式AI的深度应用,传统的测试方法论
    发表于 04-11 16:42

    智能检测】基于AI深度学习与飞拍技术的影像测量系统:实现高效精准的全自动光学检测与智能制造数据闭环

    内容概要:文档内容介绍了中图仪器(Chotest)影像测量仪融合人工智能深度学习与飞拍技术的自动化检测解决方案。系统通过AI深度学习实现抗干扰能力强、自适应高的智能寻边,精准识别复杂工件边界
    发表于 03-31 17:11

    人工智能应用开发-中级(大模型)》认证证书含金量如何?怎么考?

    ,且能完成智能系统设计与任务编排的工程师备受企业青睐。《人工智能应用开发-中级(大模型)》专业技术人才培训授证项目正是为应对这趋势推出,
    的头像 发表于 01-28 15:11 1208次阅读
    《<b class='flag-5'>人工智能</b>应用<b class='flag-5'>开发</b>-中级(大模型)》认证证书含金量如何?怎么考?

    文了解Mojo编程语言

    Mojo 是一种由 Modular AI 公司开发的编程语言,旨在将 Python 的易用性与 C 语言的高性能相结合,特别适合人工智能(AI)、高性能计算(HPC)和系统级编程场景。
    发表于 11-07 05:59

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保护科学

    从中获得有意义的信息。而这正是深度学习改变游戏规则的地方。 深度学习模型和人工智能加速硬件释放了PAM真正的可扩展潜力,使科学家能够在合理的时间内分析数TB的记录。迁移学习意味着研究人员可以使用自己
    发表于 10-27 09:18

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    应用。 为什么选择 Neuton 作为开发人员,在产品中使用边缘人工智能的两个最大障碍是: ML 模型对于您所选微控制器的内存来说太大。 创建自定义 ML 模型本质上是个手动过程,需要高度的数据科学知识
    发表于 08-31 20:54

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    任务。这套系统为艺术市场、教育行业和内容平台提供了一种实用的工具,有效应对AI生成内容带来的挑战。虽然有些识别会出错,但是还是值得继续优化以及探讨方案的可行性。
    发表于 08-21 13:59

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆)
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    家人们,最近在研究人工智能相关设备,挖到了款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆)
    发表于 08-07 14:23

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍
    发表于 07-31 11:38

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究
    发表于 07-04 11:10