0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

消除人工智能模型偏见的方法

如意 来源:企业网D1Net 作者:Anupam Datta 2021-03-04 15:20 次阅读

自动化决策工具在组织的应用中正变得越来越普遍。然而,其背后的一些机器学习(ML)模型(从面部识别系统到在线广告)都清楚地表明在种族和性别方面存在偏见。随着机器学习模型的广泛采用,需要专业知识来确保人工智能更加公平。

机器学习模型应该消除偏见,而不是加剧歧视。为了构建公平的人工智能模型,必须首先使用更好的方法来识别产生人工智能偏见的原因,因此必须了解人工智能模型如何学习其输入和输出之间的偏差关系。

研究人员已经确定了人工智能中具有的三种偏见:算法偏见、负面影响、低估。当受保护的特性和用于决策的信息之间存在统计的依赖性时,就会出现算法偏见。负面影响是指用于训练人工智能模型的数据中已经存在的偏差。当没有足够的数据使人工智能模型对人口的某些部分做出可靠的结论时,就会出现低估。

以下深入研究每一个问题:

1. 算法偏见

算法上的偏见源于受保护的特性与其他因素之间的相关性。当发生这种情况时,不能仅通过从分析中删除受保护的特性来减少偏差,因为其相关性可能导致基于非保护因素的有偏见的决策。

例如,美国早期的预测性警务算法在进行预测时并不能直接获取种族的数据,这些模型严重依赖于与种族相关的地理数据(如邮政编码)。这样,对性别和种族等人口统计数据“盲目”的模型仍然可以通过与受保护属性统计相关的其他特征对这些信息进行判断。

美国消费者金融保护局致力于确保贷款机构遵守其公平贷款法规,该局发现了一些统计方法将地理和姓氏信息结合起来,对于种族和族裔代理的判断提供了更高的准确率。这个发现驳斥了一种普遍存在的误解,即如果算法不能访问受保护的数据,将自动减少偏差。这种被称为代理歧视的现象,一旦查明了根本原因,就可以缓解这种称为代理歧视的现象。也就是说,可以通过在创建代理功能的模型中定位中间计算,并将其替换为与受保护属性相关性较小的值来纠正违规行为。

与人们的直觉相反,在某些情况下,从模型训练中删除受保护特性的解决方案实际上会伤害到已经处于不利地位的群体。例如,在美国司法系统中,美国惩教机构和假释委员会使用风险因素清单对监禁和释放做出公正的决定。当人类和人工智能模型处理具有诸如性别、年龄、当前指控以及先前成人和青少年犯罪数量等基本信息时,人类和人工智能模型的表现是相当的。

然而,通过给人类和人工智能模型10个额外的与教育和物质使用相关的风险因素,研究人员发现机器学习模型更准确,更不容易产生偏见。这强调了需要了解人工智能模型偏差的根本原因,而不是盲目地采用补救策略。

2. 负面影响

人工智能算法的偏见也有可能直接来自其训练数据中存在的类似偏差。例如,受过训练以执行语言翻译任务的机器学习模型倾向于将女性名字与“父母”和“婚礼”等属性相关联,而男性名字与诸如“专业”和“薪酬”之类的单词之间的关联性更强。该模型不太可能会自己建立关联。与其相反,它是在反映这些性别取向的文本素材库上进行训练的。这是产生负面影响的一个例子。

在自然语言处理中,性别偏见是一个令人困扰但经过充分研究的问题:对原因的清晰了解提供了纠正它的途径。在英语这样的名词和形容词倾向于性别的语言中,研究人员发现了强制词嵌入以保持性别中立的方法。而在其他语言具有固有性别词语的情况下,可以通过引入打破性别和中性词之间因果关系的示例来增强语言素材库,以防止出现偏见。

在其他应用领域中,负面影响可能是最难缓解的偏见之一,因为偏见固有地内置于机器学习模型从中学习的数据集中。因此,该模型可以将多年来对某一人群的系统性偏见进行编码。例如,或者根据人们居住的地方拒绝向他们提供贷款,可能会使贷款批准数据集更侧重于白人。数据中的这种偏差会导致人工智能模型的偏见。

尽管现有的缓解偏见策略可能会尝试提高黑人申请者的信用接受率,但这可能会掩盖该模型偏见的真正原因,并使其难以解决根本问题。FICO分数通常用作信贷决策的输入,已经显示出种族歧视。在这种情况下,事后偏差缓解策略的有效性将低于寻找与信用价值也存在因果关系的替代数据源。因此,通过寻找替代数据可以减轻负面影响。

3. 低估

正如数据可能存在偏差一样,也可能出现数据不足的情况。如果没有足够的数据,机器学习模型可能无法提供可靠的预测。这是被低估的问题。亚马逊公司最近训练了一种机器学习模型,以在招聘过程中筛选求职者,但与许多其他科技公司一样,亚马逊的劳动力队伍男性比例过高。这种数据失衡使得其人工智能模型在评估男性时更加侧重,亚马逊公司认识到这种模型的推荐人选存在偏差,因此在其招聘渠道中取消了这种模型。

如果寻找更多或更好的数据,亚马逊公司或许能够构建出一种无偏见的招聘工具,但是如果不能正确地理解出现这种偏见的原因,这是不可能实现的。而在低估的情况下,模型的预测确定性可以跨人群的子组进行分析,通过自动增加新实例,可以使基础数据集实现多样化。

衡量模型确定性和稳定性的方法对于了解模型是否准备好对所有人群做出可靠的预测至关重要。在低估的情况下,提供的数据集无法充分表现出数据的细微差别。但是,用于促进公平或事后偏向缓解策略的对抗性训练技术可能不会像将数据集扩展得更全面。

人工智能算法可以编码并保持偏见,这已经不是什么秘密,这可能会带来不良的后果。尽管这描绘了一种严峻的场景,但重要的是要记住,如果处理得当,算法偏差(与人类偏见不同)最终是可以量化和固定的。与盲目减少人工智能偏见不同,准确理解偏见背后的真正原因对部署安全可靠的人工智能至关重要。

尽管这些原因很复杂,但研究人员仍在继续开发更好的方法来衡量特定人群的不同结果,确定导致这些差异的特征,并为特定的偏见来源选择合理的缓解策略。随着越来越多的决策实现自动化,必须从根本上消除人工智能偏见,以创建公平和公正的模型。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43899

    浏览量

    230646
  • 模型
    +关注

    关注

    1

    文章

    2707

    浏览量

    47707
  • 机器学习
    +关注

    关注

    66

    文章

    8134

    浏览量

    130580
收藏 人收藏

    评论

    相关推荐

    人工智能是什么?

    ` 人工智能是什么?什么是人工智能人工智能是未来发展的必然趋势吗?以后人工智能技术真的能达到电影里机器人的智能水平吗?如果技术成熟的那一天
    发表于 09-16 15:40

    百度人工智能大神离职,人工智能的出路在哪?

    `今天,吴恩达确认离职百度的消息迅速在业界刷屏。吴恩达曾不止一次感慨,现在人工智能最大的问题就是“机会太多,但人才太少”。AI,人工智能,该领域的研究包括机器人、语言识别、图像识别、自然语言处理
    发表于 03-23 17:00

    【下载】人工智能 : 一种现代方法(第3版)(中文版)

    `《人工智能:一种现代的方法(第3版)》最权威、最经典的人工智能教材,已被全世界100多个国家的1200多所大学用作教材。《人工智能:一种现代的方法
    发表于 05-24 14:44

    人工智能就业前景

    据相关招聘机构数据显示,2018年AI领域仍然是大部分资深技术人才转岗的首选目标,在人才最紧缺的前十大职位中,时下最火的大数据、人工智能、算法类岗位占据半壁江山。据调查指出,2017年技术研发类岗位
    发表于 03-29 15:46

    解读人工智能的未来

    `已历经60多年的人工智能在物联网以及大数据的推动下,实现飞跃式的发展,并且迎来了第三个黄金周期。必优传感今天和大家解读一下关于人工智能的未来。自从有了人工智能,引发了人类的各种“未来论”。有人说
    发表于 11-14 10:43

    人工智能医生未来或上线,人工智能医疗市场规模持续增长

      导读:机构预测,中国医疗人工智能的市场需求已达数百亿元。专家认为,“人工智能医生”的应用,有利于缓解社会老龄化带来的医疗资源供需失衡以及地域分配不均等问题。那么,“人工智能医生”何时能真正
    发表于 02-24 09:29

    人工智能:超越炒作

    ,英国神经科学家和人工智能先驱大卫马尔说:人工智能的目标是识别和解决有用的信息处理问题,并给出如何解决它的抽象说明,这被称为一个方法人工智能的一个小但具有决定性的细节是它处理的信息处
    发表于 05-29 10:46

    人工智能在哪些方面可以对IT运营产生重大影响 精选资料分享

    在考虑人工智能可以在哪些方面对IT运营产生直接影响时,有一个应用程序会比其他的应用更为重要:智能的超大规模自动化。人工智能(AI)被誉为是所有IT问题的解决方案,包括消除可怕的技能差距
    发表于 07-12 06:46

    人工智能芯片是人工智能发展的

    人工智能芯片是人工智能发展的 | 特伦斯谢诺夫斯基责编 | 屠敏本文内容经授权摘自《深度学习 智能时代的核心驱动力量》从AlphaGo的人机对战,到无人驾驶汽车的上路,再到AI合成主播上岗
    发表于 07-27 07:02

    人工智能基本概念机器学习算法

    目录人工智能基本概念机器学习算法1. 决策树2. KNN3. KMEANS4. SVM5. 线性回归深度学习算法1. BP2. GANs3. CNN4. LSTM应用人工智能基本概念数据集:训练集
    发表于 09-06 08:21

    物联网人工智能是什么?

    一、人工智能介绍工作以后想要拿高薪的话,人工智能是你的不二之选,那么问题来了,究竟什么是人工智能呢?又需要了解哪些才能去开发人工智能产品呢?接下来小编带领大家进入
    发表于 09-09 14:12

    《移动终端人工智能技术与应用开发》人工智能的发展与AI技术的进步

    人工智能的发展是随着人类生活需要,产业需求不断提升的,其中人工智能的发展很大程度上受到了计算机算力的影响,随着数据处理量的增大,人工智能算法对算力的要求逐年增加,而且没过两年算力上升一倍,因此往往
    发表于 02-17 11:00

    人工智能遭遇的偏见 算法偏见带来的问题

    偏见人工智能面临一个挑战,主要是来自算法偏见,当然偏见并不止这些。与人类不同,算法不能撒谎,那么产生结果的不同必将是数据带来的问题。人工智能
    发表于 02-06 14:04 1.2w次阅读

    你对人工智能偏见担忧吗?

    随着人工智能继续进军企业,许多IT专业人士开始对其使用的系统中可能存在的AI偏见表示担忧。一份来自DataRobot的最新报告发现,美国和英国近一半的人工智能专业人士“非常”担心人工智能
    的头像 发表于 01-20 17:35 1196次阅读

    探究人工智能偏见的识别和管理

    人工智能风险管理旨在最大限度地减少人工智能的负面影响,包括对公民自由和权利的威胁等。而在谈论人工智能风险时,“偏见”是一个重要话题。
    的头像 发表于 04-17 10:21 1222次阅读