0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能和机器学习中暗含的算法偏见

电子设计 来源:电子设计 作者:电子设计 2020-12-25 19:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我们又能通过开源社区做些什么?

在我们的世界里,算法无处不在,偏见也是一样。从社会媒体新闻的提供到流式媒体服务的推荐到线上购物,计算机算法,尤其是机器学习算法,已经渗透到我们日常生活的每一个角落。至于偏见,我们只需要参考 2016 年美国大选就可以知道,偏见是怎样在明处与暗处影响着我们的社会。

很难想像,我们经常忽略的一点是这二者的交集:计算机算法中存在的偏见。

与我们大多数人的认知相反,科技并不是客观的。 AI算法和它们的决策程序是由它们的研发者塑造的,他们写入的代码,使用的“训练”数据还有他们对算法进行应力测试 的过程,都会影响这些算法今后的选择。这意味着研发者的价值观、偏见和人类缺陷都会反映在软件上。如果我只给实验室中的人脸识别算法提供白人的照片,当遇到不是白人照片时,它不会认为照片中的是人类 。这结论并不意味着 AI 是“愚蠢的”或是“天真的”,它显示的是训练数据的分布偏差:缺乏多种的脸部照片。这会引来非常严重的后果。

这样的例子并不少。全美范围内的州法院系统 都使用“黑盒”对罪犯进行宣判。由于训练数据的问题,这些算法对黑人有偏见 ,他们对黑人罪犯会选择更长的服刑期,因此监狱中的种族差异会一直存在。而这些都发生在科技的客观性伪装下,这是“科学的”选择。

美国联邦政府使用机器学习算法来计算福利性支出和各类政府补贴。但这些算法中的信息,例如它们的创造者和训练信息,都很难找到。这增加了政府工作人员进行不平等补助金分发操作的几率。

算法偏见情况还不止这些。从 Facebook 的新闻算法到医疗系统再到警用携带相机,我们作为社会的一部分极有可能对这些算法输入各式各样的偏见、性别歧视、仇外思想、社会经济地位歧视、确认偏误等等。这些被输入了偏见的机器会大量生产分配,将种种社会偏见潜藏于科技客观性的面纱之下。

这种状况绝对不能再继续下去了。

在我们对人工智能进行不断开发研究的同时,需要降低它的开发速度,小心仔细地开发。算法偏见的危害已经足够大了。

我们能怎样减少算法偏见?

最好的方式是从算法训练的数据开始审查,根据微软的研究人员 所说,这方法很有效。

数据分布本身就带有一定的偏见性。编程者手中的美国公民数据分布并不均衡,本地居民的数据多于移民者,富人的数据多于穷人,这是极有可能出现的情况。这种数据的不平均会使 AI 对我们是社会组成得出错误的结论。例如机器学习算法仅仅通过统计分析,就得出“大多数美国人都是富有的白人”这个结论。

即使男性和女性的样本在训练数据中等量分布,也可能出现偏见的结果。如果训练数据中所有男性的职业都是 CEO,而所有女性的职业都是秘书(即使现实中男性 CEO 的数量要多于女性),AI 也可能得出女性天生不适合做 CEO 的结论。

同样的,大量研究表明,用于执法部门的 AI 在检测新闻中出现的罪犯照片时,结果会惊人地偏向 黑人及拉丁美洲裔居民。

在训练数据中存在的偏见还有很多其他形式,不幸的是比这里提到的要多得多。但是训练数据只是审查方式的一种,通过“应力测验”找出人类存在的偏见也同样重要。

如果提供一张印度人的照片,我们自己的相机能够识别吗?在两名同样水平的应聘者中,我们的AI是否会倾向于推荐住在市区的应聘者呢?对于情报中本地白人恐怖分子和伊拉克籍恐怖分子,反恐算法会怎样选择呢?急诊室的相机可以调出儿童的病历吗?

这些对于AI来说是十分复杂的数据,但我们可以通过多项测试对它们进行定义和传达。

为什么开源很适合这项任务?

开源方法和开源技术都有着极大的潜力改变算法偏见。

现代人工智能已经被开源软件占领,TensorFlow、IBM Watson 还有 scikit-learn 这类的程序包都是开源软件。开源社区已经证明它能够开发出强健的,经得住严酷测试的机器学习工具。同样的,我相信,开源社区也能开发出消除偏见的测试程序,并将其应用于这些软件中。

调试工具如哥伦比亚大学和理海大学推出的 DeepXplore,增强了 AI 应力测试的强度,同时提高了其操控性。还有 麻省理工学院的计算机科学和人工智能实验室完成的项目,它开发出敏捷快速的样机研究软件,这些应该会被开源社区采纳。

开源技术也已经证明了其在审查和分类大组数据方面的能力。最明显的体现在开源工具在数据分析市场的占有率上(Weka、Rapid Miner 等等)。应当由开源社区来设计识别数据偏见的工具,已经在网上发布的大量训练数据组比如 Kaggle 也应当使用这种技术进行识别筛选。

开源方法本身十分适合消除偏见程序的设计。内部谈话、私人软件开发及非民主的决策制定引起了很多问题。开源社区能够进行软件公开的谈话,进行大众化,维持好与大众的关系,这对于处理以上问题是十分重要的。如果线上社团,组织和院校能够接受这些开源特质,那么由开源社区进行消除算法偏见的机器设计也会顺利很多。

我们怎样才能够参与其中?

教育是一个很重要的环节。我们身边有很多还没意识到算法偏见的人,但算法偏见在立法、社会公正、政策及更多领域产生的影响与他们息息相关。让这些人知道算法偏见是怎样形成的和它们带来的重要影响是很重要的,因为想要改变目前的局面,从我们自身做起是唯一的方法。

对于我们中间那些与人工智能一起工作的人来说,这种沟通尤其重要。不论是人工智能的研发者、警方或是科研人员,当他们为今后设计人工智能时,应当格外意识到现今这种偏见存在的危险性,很明显,想要消除人工智能中存在的偏见,就要从意识到偏见的存在开始。

最后,我们需要围绕 AI 伦理化建立并加强开源社区。不论是需要建立应力实验训练模型、软件工具,或是从千兆字节的训练数据中筛选,现在已经到了我们利用开源方法来应对数字化时代最大的威胁的时间了。

审核编辑:符乾江
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    40940

    浏览量

    302515
  • 机器学习
    +关注

    关注

    67

    文章

    8561

    浏览量

    137208
  • 智能计算
    +关注

    关注

    0

    文章

    199

    浏览量

    17094
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入式人工智能课程(华清远见)

    嵌入式 AI 编译器优化:华清远见课程,解锁极致端侧性能 随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着一个巨大的技术鸿沟:在算力受限
    发表于 04-16 18:47

    人工智能五大核心:芯片、算力、数据、算法、能源 !

    在全球科技革命的浩荡浪潮人工智能已成为重塑人类文明形态的核心驱动力。那么,人工智能究竟由何构成?支撑其持续迭代进化的内在技术体系又是什么?本文聚焦人工智能发展的五大核心支柱:芯片、
    的头像 发表于 04-16 12:47 456次阅读
    <b class='flag-5'>人工智能</b>五大核心:芯片、算力、数据、<b class='flag-5'>算法</b>、能源 !

    浅谈人工智能(2)

    接前文《浅谈人工智能(1)》。 (5)什么是弱人工智能、强人工智能以及超人工智能? 弱人工智能(Weak AI),也称限制领域
    的头像 发表于 02-22 08:24 321次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    人工智能机器学习在这些行业的深度应用

    人工智能机器学习问世以来,多个在线领域的数字化格局迎来了翻天覆地的变化。这些技术从诞生之初就为企业赋予了竞争优势,而在线行业正是受其影响最为显著的领域。人工智能(AI)与
    的头像 发表于 02-04 14:44 651次阅读

    机器学习和深度学习需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作一段时间,机器学习和深度学习中都存在一些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不理,日后可能会引发诸多麻烦!只要我们密切关注
    的头像 发表于 01-07 15:37 336次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b><b class='flag-5'>中</b>需避免的 7 个常见错误与局限性

    嵌入式系统人工智能

    等领域,让这些领域的设备能够实时学习、适应并做出决策。然而,人工智能的发展也让网络安全威胁愈发普遍,这些安全隐患必须得到解决。英伟达等科技企业率先在嵌入式系统
    的头像 发表于 12-18 11:49 1177次阅读
    嵌入式系统<b class='flag-5'>中</b>的<b class='flag-5'>人工智能</b>

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    nRF52805),只占用几千字节的非易失性存储器(NVM)。这使得以前被认为不可能的应用也能增加 ML 功能。例如,您现在可以在广泛的传感器网络的每个节点上进行人工智能处理,而在这种网络,传感器的尺寸和成本
    发表于 08-31 20:54

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    的深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    的深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入
    发表于 08-07 14:23

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍
    发表于 07-31 11:38

    人工智能在汽车行业的应用

    人工智能(AI)是许多行业和应用领域的热门话题。但对于汽车行业而言,这并非一个新概念。人工智能,尤其是机器学习——即通过数据让机器
    的头像 发表于 07-31 11:07 2158次阅读

    人工智能究竟对电子产业产生哪些的影响?

    人工智能已彻底改变了全球技术格局,在众多工业领域得到广泛应用。在电子产业,它正成为实现新功能、提升效率以及优化制造流程的关键推动力。例如,嵌入式行业受益于将人工智能集成到电子设备
    的头像 发表于 07-28 18:26 1347次阅读
    <b class='flag-5'>人工智能</b>究竟对电子产业产生哪些的影响?

    FPGA在机器学习的具体应用

    随着机器学习人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 3066次阅读

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10

    机器人主控芯片平台有哪些 机器人主控芯片一文搞懂

    AI芯片在人形机器人中的应用越来越广泛。这些AI芯片专门设计用于执行人工智能算法,如深度学习机器学习等。
    的头像 发表于 04-25 16:26 8290次阅读
    <b class='flag-5'>机器</b>人主控芯片平台有哪些  <b class='flag-5'>机器</b>人主控芯片一文搞懂