0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于AI算法能否对不同年龄、性别和肤色的人一视同仁的详细解答

IEEE电气电子工程师 来源:贤集网 作者:电气传播 2021-04-25 11:06 次阅读

Facebook研究人员发布了一个数据集,旨在帮助机器学习开发人员测试算法的偏差。

即使在不同的光照条件下,算法是否能够对不同年龄、性别和肤色的人一视同仁呢?Facebook的AI Red团队近日发布了一个名为“Casual Conversations”的数据集,用于回答这个问题。10兆字节的数据由3011名参与者录制的视频组成;数据集由每人约15个1分钟片段组成,总时长超过45000分钟。视频分别被标记出年龄和性别,由每个参与者自我报告,肤色由训练有素的注解者使用标准比例确定,以及照明条件,也由注解者确定。

Facebook AI Red团队的研究经理Cristian Canton给了我一个简单的例子,说明了开发人员是如何使用数据集的。

“考虑门户(Portal)设备,”他说。(门户是Facebook价值150美元的桌面智能屏幕。)“我们有一个摄像头,可以跟踪人们。如果我现在是工程师来构建这项技术,为了确保它的包容性,我可以获取临时会话数据集,通过门户中的跟踪算法来运行它,并测量它在哪些地方表现不好。比如说,你可能会发现,对于一个特定年龄、肤色或性别的人来说,在昏暗的光线下,这是行不通的。然后我就会知道我的算法对于特定的子组有缺陷。”

Facebook的研究人员在去年的Deepfake Detection Challenge(一项旨在开发自动识别欺诈媒体工具的竞赛)的前五名获奖者身上测试了该数据集。

在近日发布的一篇研究论文和博客文章中,他们报告说,虽然所有五种算法都在与较暗的肤色作斗争,但在年龄、性别和光照条件等方面表现最为一致的模型并不是第一名得主Selim Seferbekov,而是排名第三的团队NTechLab。有趣的是,排名第四的18岁的研究小组最擅长分析的是年龄在45岁以上的年龄组中的受试者的视频。

在不同的人群中表现平平,并不是Deep Fake Challenge的评判标准之一,因为还没有完整的非正式对话数据集。

Said Canton说:“如果我们今天重新开始比赛,也许我们会考虑寻找一个更具包容性的方法。”

Canton说,近日发布的Casual Conversations数据集只是创造人工智能公平所需工作的开始。首先,他指出,这个问题是多方面的,虽然有这样的数据是有帮助的,但这并不是最终的解决办法。

Image: FacebookThese pie charts show the frequency of the different tags for age, gender, apparent skin tone, and lighting conditions in the 45,186 videos that make up the Casual Conversations data set.

至于数据集开发本身,他说,该团队还只是在“漫长旅程的第一步”。我们已经确定了年龄、性别、肤色和光照条件,但(这些视频)都是在美国录制的。如果我们在其他国家录制,我们可能会发现更多我们需要考虑且尚未看到的多样性。”

Canton指出,录音的音频部分也代表了尚未开发的潜力。这些音频文件是通过要求受试者回答简单的对话提示(如“你最喜欢的菜是什么”)而创建的,目前只针对年龄和性别进行标记。“我们还没有对口音进行注释,但这是未来可实现的一个潜在途径。我们确实认为这篇文章可以有一些有趣的结果。不过,我们要测试音频模型的包容性。”

Canton希望,将这些数据公之于众将引发反馈,从而使数据集更丰富、更具包容性。“我很希望看到它得到采用,然后让我的同事和学者告诉我们更多他们的想法。我们希望进行自我批评。有了反馈,我们可以不断改进它。我们希望它成为衡量人工智能公平性的标准方式。”

Canton还希望这个数据集的发展能够树立一个新的标准。他对这个数据集的创建方式感到自豪,包括它是可信来源。他在我们的谈话中多次强调,3000多名受试者的付出是有报酬的,并且他们了解自己的声音和视频图像是如何被使用的,如果他们改变了参与的想法,以后可以退出。

他说:“我们正试图为负责任的人工智能在未来的样子设定一个标准,”他补充说,Facebook团队希望“激励更多的人记录扩充数据集。重要的是要做正确的事情 -- 通过使用正确的工具。”
编辑:lyn

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Facebook
    +关注

    关注

    3

    文章

    1427

    浏览量

    54028
  • 机器学习
    +关注

    关注

    66

    文章

    8112

    浏览量

    130545
  • 数据集
    +关注

    关注

    4

    文章

    1178

    浏览量

    24347
  • AI算法
    +关注

    关注

    0

    文章

    214

    浏览量

    12098

原文标题:人工智能算法对年龄、性别和肤色一视同仁吗?

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NanoEdge AI的技术原理、应用场景及优势

    NanoEdge AI种基于边缘计算的人工智能技术,旨在将人工智能算法应用于物联网(IoT)设备和传感器。这种技术的核心思想是将数据处理和分析从云端转移到设备本身,从而减少数据传
    发表于 03-12 08:09

    TC1728芯片和TC1724芯片的算法是否是相同?

    你好,请帮忙解答下问题: 1.下载程序至TC1728芯片和TC1724芯片的算法是否是相同的,用PEmicro的CYCLONE-LC-UNIVERSAL下载器所支持的芯片列表中只看到TC1724
    发表于 02-01 07:46

    各位技术大佬,请问下通信距离能否人为控制呢?

    请问各位论坛技术专家们个问题,短距离无线通信能否控制距离呢?比如设置或者做到仅在半米/米/50米.....之内做通信的效果呢?就拿半米这个距离限定举例,能否仅在半米内通讯,范围以外
    发表于 01-07 13:47

    关于400G光模块的常见问题解答

    最近在后台收到了很多用户咨询关于400G光模块的信息,那400G光模块作为当下主流的光模块类型,有哪些问题是备受关注的呢?下面来看看小易的详细解答
    的头像 发表于 11-16 17:07 363次阅读
    <b class='flag-5'>关于</b>400G光模块的常见问题<b class='flag-5'>解答</b>

    什么是边缘计算盒子(AI算法盒子)?

    边缘计算盒子是一种基于边缘计算和人工智能技术的智能设备,它内置了灵活可配的多样化AI算法库,所以也被称为AI算法盒子或智能边缘分析一体机,可以将数据处理和分析的能力推至离数据源最近的边
    的头像 发表于 10-31 14:29 1249次阅读
    什么是边缘计算盒子(<b class='flag-5'>AI</b><b class='flag-5'>算法</b>盒子)?

    AI智能呼叫中心

    、数据驱动决策以及人力成本节约,旨在深入剖析其核心优势和对企业的重要意义。、自动化处理AI智能呼叫中心通过引入自然语言处理(NLP)、机器学习和自动化技术,使得呼叫中心的处理过程更加高效和准确,AI
    发表于 09-20 17:53

    OpenHarmony AI框架开发指导

    、概述 1、功能简介 AI业务子系统是OpenHarmony提供原生的分布式AI能力的子系统。AI业务子系统提供了统
    发表于 09-19 18:54

    AI算法有哪些?

    AI算法有哪些? 随着人工智能技术的不断发展和应用,越来越多的AI算法被发明和应用于各个领域。本文将介绍一些常见难度较低但易于理解的AI
    的头像 发表于 08-24 15:40 1947次阅读

    一个基于AI的无参考视频质量评估算法RedVQA

    小红书最初主要面向消费场景,比如美妆产品的分享和购买攻略。经过近几年的发展,小红书已经变成了一个综合的 UGC 分享社区,在“衣食住行玩”各方面都有大量的用户真实分享,提供很多有价值的信息。同时用户群体也发生了较大的变化,性别以及各年龄段的用户比例变得更加均衡。
    的头像 发表于 08-22 09:41 1023次阅读
    一个基于<b class='flag-5'>AI</b>的无参考视频质量评估<b class='flag-5'>算法</b>RedVQA

    人工智能算法有哪些

    AI中的重要技术之一,本文将从人工智能算法的概念入手,详细讲述常见的人工智能算法。 一、人工智能算法的概念 人工智能
    的头像 发表于 08-12 16:58 4827次阅读

    ai算法和模型的区别

    非常重要。本文将详细探讨AI算法和模型的区别,并解释它们在AI应用中的作用。 AI算法 人工智能
    的头像 发表于 08-08 17:35 2783次阅读

    AI大模型的开源算法介绍

    AI大模型的开源算法介绍 什么是开源?简单来说就是不收取任何费用,免费提供给用户的软件或应用程序。开源是主要用于软件的术语,除了免费用户还可以对开源软件的源代码进行更改,并根据自身的使用情况进行
    的头像 发表于 08-08 17:25 1372次阅读

    AI大模型的工作原理、技术特点及应用领域

      AI大模型是指参数数量巨大的人工智能模型。它们通常用于处理大量数据,并使用深度学习等复杂算法来学习和识别数据中的模式和趋势。本文将详细介绍AI
    发表于 08-08 17:02 4337次阅读

    RS-485收发器常见问题解答

    您是否希望学习 RS-485 收发器的设计教程?本文基于 TI E2E™ 社区中的常见问题提供了一些解答,对于任何希望详细了解此通信标准的人来说都是非常有用的资源。
    的头像 发表于 07-12 15:49 569次阅读
    RS-485收发器常见问题<b class='flag-5'>解答</b>

    100行Python实现人体肤色检测

    本文中的人体肤色检测功能采用 OpenCV 库实现。OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和Mac OS操作系统
    的头像 发表于 05-06 10:46 490次阅读