0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究人员对计算机领域中的性别问题做了深入分析

DPVg_AI_era 来源:lq 2019-06-29 07:45 次阅读

近期,来自艾伦人工智能研究所的研究人员对计算机领域中的性别问题做了深入分析。实验表明,本世纪男性和女性作者数量将不会持平、不同性别作者之间协作率在下降。

性别平等问题似乎一直是个热议的话题,学术界也是如此。

去年8月,名称一直饱受争议的国际顶会NIPS,因在会议中遇到的性骚扰,再次将NIPS推上风口浪尖。

同年11月17日,NIPS官网将会议名称默默改为NeurIPS。至此,有关该顶会性别歧视、性别平等的问题算是得到了相应的解决。

而近期,一项来自艾伦人工智能研究所(Allen Institute for Artificial Intelligence)的论文对计算机领域中的性别问题做了深入的分析与研究。

论文地址:

https://arxiv.org/pdf/1906.07883.pdf

这项研究对计算机领域近287万篇文献(截至2018年)进行了全面的分析,结果表明:

如果按照当前的趋势发展下去,本世纪男性和女性作者数量将不会持平;

若是按照较为乐观的预测结果,性别平等预计将在2100年之前实现;

对计算机科学协作趋势进行分析后表明,不同性别作者之间协作率在下降。

287万篇计算机论文做实验数据

研究人员所要试图解决的问题包括:

论文作者之间的性别平衡如何随时间而变化?

论文作者的性别将在何时达到平衡状态?

协同作者之间的性别存在怎样的关系?

研究人员通过对计算机科学会议和期刊(287万篇论文)中的文献原数据进行自动化研究,并利用Semantic Scholar学术搜索引擎中的数据来回答上述这些问题。

数据统计如下所示:

表1Computer Science and Medline语料库统计

作者列表从所有出版物中提取,并编译成一个名字列表。研究人员使用Gender API为每个名称执行性别查找。对于每个名称,Gender API输出预测的二进制性别(女性或男性),以及与预测相关的准确性和用于确定的样本数量。只有首字母可用的作者(少于语料库中所有作者的0.5%)被排除在分析之外。

(性别应用程序接口(Gender API)是一个大型的在线数据库,通过将各国公开的政府数据与社交媒体资料链接起来,可以获得已知的姓名和性别关系。)

但此时却存在一个问题:很多名字都是性别模糊的。因此研究人员使用Gender API返回的准确性来表示每个作者是男性和女性的复合。

例如,第一个名字Matthew被确定为男性,准确率最高为100。这个结果是明确的。然而,Taylor这个名字被确定为女性的正确率仅为55分。

精度用于为每个名称生成两个概率(m, f),其中m为关联作者为男性的概率,f为关联作者为女性的概率,其中m + f = 1。在本例中,每个姓Matthew的作者将用概率元组(1.0,0.0)表示,每个姓Taylor的作者将用概率元组(0.45,0.55)表示。

本世纪男女性别平衡较为困难,女性协作者呈下降趋势

通过实验,计算机科学语料库中的287万篇论文产生了824万个 author-paper units。

作者的趋势

图1

如图1所示,按照目前的增长速度,女性作者的比例预计在2137年左右达到0.45(95%置信区间:[2109,2172])。

图2

图2显示了一段时间内女性和男性作者的数量。随着时间的推移,作家的总数在增加,女性作家的比例也在增加。

图3

图3显示了对均衡女性作者比例参数α的敏感性分析。该分析显示了在每个均衡比例中首次达到平等的年份。

当均衡比例被认为有利于女性而非男性(高于0.5)时,达到平衡的年份会更早。即使女性最终将占所有出版物的90%,但按照目前的增长速度,预计到2100年左右将实现男女平等。

协作者趋势

此处统计的是每年计算机科学中相同和不同性别的协作者人数。

图4

图4显示了自1995年以来相同/不同性别协作者的额外和缺失的数量。在男性和女性中,相同性别的合作作者比预期的要多,而不同性别的合作作者比预期的要少。近年来(与预期数字相比),每年有超过2万个不同性别的合作项目消失。

通过分析观察到的与预期的比率,协作者的趋势还是较为悲观的。

虽然男性和女性都更有可能与自己性别的作者合作,但在女性作者中,同性偏好的程度正在下降,而在男性作者中却在上升。

与此同时,不同性别之间的协作差距(O/E < 1.0)也在不断扩大。尽管近年来有更多的跨性别合作机会(由于在该领域工作的女性科学家的增加),但观察到的跨性别合作的数量并没有如预期的那样增加。

与Medline的比较

Medline语料库包括1163万篇论文,可以产生4766万个author-paper units。

图5

图5显示了Medline语料库中女性和男性作者的数量。

图6

图6显示了使用ARIMA预测女性作者的预计比例。

2002年Medline语料库数据中可以观察到不连续性。这是由于Medline索引记录中的完整作者姓名是从2002年才开始要求的。

2002年这一比例的下降表明,Medline期刊没有对作者使用全名,才造成了2002年以前女性作者比例高的假象。

工作总结

研究人员对计算机科学文献(287万篇论文)进行了全面分析,以评估作者之间的性别趋势。

根据最近的趋势,预计计算机科学中女性作者的比例在本世纪不会达到平等,并且在更现实的假设下,可能需要更长的时间。

研究人员还观察到跨性别合作的数量低于预期,观察到的预期比率随着时间的推移而下降。

计算机科学领域女性科学家的比例增长缓慢,这继续对进入该领域的女性构成挑战。并且女性科学家在寻找合作者方面可能比男性科学家面临更多的挑战。

研究人员希望,这些发现将激励该领域的其他人评估他们与这些性别偏见的关系,并考虑改善现状的方法。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    6642

    浏览量

    84467
  • 数据库
    +关注

    关注

    7

    文章

    3589

    浏览量

    63363
  • 人工智能
    +关注

    关注

    1776

    文章

    43766

    浏览量

    230552

原文标题:287万篇CS文献数据分析:性别差距100年难消除,男女搭配协作更累?

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    系统日志在计算机取证中的研究和应用

    系统日志在计算机取证中的研究和应用摘要:为了重塑犯罪现场,寻找作案线索,最终将犯罪嫌疑人绳之以法,对系统日志文件的分析便显得十分重要.对计算机取证和系统日志文件进行了介绍,探讨了系统日
    发表于 10-10 15:15

    uCOS任务堆栈的深入分析(转)

    uCOS任务堆栈的深入分析(转)
    发表于 08-24 23:30

    计算机图形图像处理最新应用分析

    计算机图形图像处理最新应用分析 图形图像处理是研究计算机除了图形图像的原理、方法和技术的科学。它是计算机科学和应用的重要分支之一,同时随着
    发表于 09-23 14:56

    美科学家建新设备将光束变固体 可用于研制量子计算机

    更进一步地分析和探究之外,还将有助于他们最终制造出量子计算机。  为了制造出最新设备,研究人员制造出了一个结构,由包含有1000亿个原子的超导材料组成,科学家们采用工程学方法,使这1000亿个原子的行为
    发表于 09-28 10:34

    量子计算机或将提前实现

    ,一些顶尖研究团队根据最新发现,认为量子计算机的实现可以比我们想象的更早。前日,谷歌和西班牙巴斯克大学的研究人员公布了一项研究成果,根据该成果,人类有望以较之前简便的多的方法构建一台能
    发表于 06-13 10:31

    先进SMT研究分析手段

    下来,不可避免地要求许多领域部门或企业的联合开发,最终成果共享,促进行业的技术进步。 在可靠性和缺陷分析范畴,实验人员和设备的帮助更是价值不菲的,研究人员的经验和智慧,再加上现代化的实
    发表于 08-23 06:45

    计算机图形学研究和应用

    计算机图形学研究和应用论文关于计算机图形学的发展及应用探究  【摘要】计算机图形学经过三十多年的发展,在计算机艺术、
    发表于 08-31 08:05

    浅析计算机仿真技术

    引言计算机仿真技术是应用电子计算机研究对象的数学模型进行计算分析的方法。对于从事控制系统研究
    发表于 09-07 07:01

    计算机应用领域的划分

    计算机应用领域的划分小型专用型:玩具,汽车桌面通用型:电脑高端服务型:服务器**嵌入式系统的含义:**将计算机的硬件或者软件嵌入到其他机电设备或者应用系统中去,构成的新的系统构造原则:以应用为中心
    发表于 10-27 07:08

    基于嵌入式实时软件在计算机中的应用研究

    王琳琳摘要:随着时代的前进,网络信息技术得以在我国广泛应用,众多技术人员基于计算機网络理论研究基础大力推进计算机更新升级工作。本文分析了嵌入
    发表于 11-09 07:05

    研究人员利用量子计算机来模拟下一代锂硫电池

    据外媒报道,美国国际商用机器公司(IBM)和戴姆勒公司(Daimler AG)的研究人员,利用量子计算机,对三种含锂分子的偶极矩进行建模,并着眼于开发下一代锂硫电池。
    的头像 发表于 03-12 17:20 2756次阅读

    研究人员最新展示了未来光晶体管的平台

    纳米光子学领域研究人员一直在努力开发光学晶体管,这是未来光学计算机的关键组件。
    的头像 发表于 04-12 17:35 2397次阅读

    NVIDIA研究人员创建可以疏通计算机网络拥堵的AI模型

    NVIDIA 研究人员创建了可以疏通计算机网络拥堵的 AI 模型,该模型很快就会出现在大众附近的数据中心。
    的头像 发表于 07-03 10:04 671次阅读

    浅谈深度学习在计算机视觉领域的三大瓶颈

    深度学习能够实现的前提是大量经过标注的数据,这使得计算机视觉领域研究人员倾向于在数据资源丰富的领域研究,而不是去重要的
    发表于 06-11 10:22 266次阅读
    浅谈深度学习在<b class='flag-5'>计算机</b>视觉<b class='flag-5'>领域</b>的三大瓶颈

    NVIDIA Cambridge-1 AI 超级计算机通过云让更多研究人员能够访问

    继成功打造 Cambridge-1 之后,NVIDIA 将该超级计算机连入 NVIDIA DGX Cloud,实现更多领域、更广泛的访问。 科学研究人员需要海量计算资源来支持各个
    的头像 发表于 06-19 19:05 294次阅读