0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用谷歌的PageRank算法原理的新指标

ExMh_zhishexues 来源:未知 作者:李倩 2018-11-23 10:24 次阅读

两位欧洲核子研究中心的理论物理学家从谷歌的搜索页中获得灵感,试图开发一个新算法以更好地评价科学家及他们的工作。在arXiv最近发表的一项研究中,Alessandro Strumia和Riccardo Torre提出了使用谷歌的PageRank算法原理的新指标,该算法之前主要用于决定网页在搜索结果中的显示顺序。

图片来自网络

如今,生产率指数,例如H因子等越来越成为研究基金申请,学术工作评价的一部分。提出新指标的两位物理学家认为他们关于综合指数的提议将改善这些评价,但是也有其他研究人员对其透明度表示担忧。

许多研究工作者都在致力于找到一个能够综合评测学者研究工作的指标,Strumia和Torre只是其中的两个。Torre说:“因为如今作者和论文的数量越来越巨大,实现文献计量评估是非常重要的。”现有的评价体系过于简单而存在缺陷,他们担心有的学者会钻空子来提高自己的评价指数,比如不断地自引。

两位物理学家选择了一种依赖于扩大引文定义的方法。传统的计算方法只统计了那些正在被引用的研究工作,但忽略了Strumia和Torre口中的“二次引用”的东西,也就是当你引用某篇文章时,这篇文章其实是引用之前一篇文章的,而之前那篇的引用贡献就被忽略了。

为了能让这些二次引用也发挥价值,Strumia和Torre采用了PaperRank, 一种以所有前引数据为基础的研究影响力评估方法。它与谷歌的PageRank类似,后者通过计算链接到特定网站的网页的数量和质量对网站进行排名。Torre表示,PaperRank展现出真正的价值需要一些时间,随着时间的推移那些二代三代甚至未来的引用被计入其中,其结果才能展现出意义。另一方面,由于PaperRank会评价所有文献中的所有其他相似研究,而不仅仅针对其中一个或几个作者的工作,因此很难钻空子。如果有人做了比你做了更重要的工作,即便你的引用数很高,你得到的贡献值也很小。

此外,并非所有的引用都是平等的,研究人员会更希望得到他们自己研究领域内大牛们的认可。所以Strumia和Torre又创建了AuthorRank,以此来鼓励那些被高引作者所引用的研究人员。

Torre说在现实世界里,当求职者申请某一岗位的时候,雇主会对他递交的文件进行筛查,对这个人的能力进行评估,但出现上百个申请人的时候,这一工作便很艰难。Torre说,他们希望自己提出的评估体系在这一场景中也能发挥作用。AuthorRank在识别评估那些年代已久,未能上线的工作方面也表现十分出色。

为了测试他们的这套指标, Strumia和Torre在拥有70,000多名作者,超过一百万篇论文的在线物理数据库INSPIRE中运行了AuthorRank和PaperRank。AuthorRank的结果显示,Paul Dirac是历史上最具影响力的物理学家。上了名单的,目前还在世并依然投身科研的三位物理学分别是新泽西州普林斯顿高级研究所的Edward Witten,德克萨斯大学奥斯汀分校的诺贝尔奖获得者Steven Weinberg,和荷兰乌特勒支大学的诺贝尔奖获得者Gerard't Hooft。根据PaperRank的计算,Weinberg 1967年关于统一弱电磁力的文章“轻子模型”是在INSPIRE中最有影响力的工作。

Strumia和Torre还对一些最新的论文进行了评测。在自2010年以来发表的研究中,2012年关于黑洞防火墙的论文“Black holes: Complementarity or firewalls?”位居榜首。

而对于近年来蜂拥涌现的各种评价指数比较熟悉的学者们就Strumia和Torre的新指数也意见不一。芬兰赫尔辛基大学的生物学家Justin Flatt说:“这些指标在某些特定情境下非常有用,例如在基础物理学等特定领域为研究人员终身成就做出评价。但在做招聘、推广和资助决策时,我会避免使用它们,特别是对于年轻的研究人员。”

荷兰莱顿大学科学与技术研究中心副主任Ludo Waltman觉得他们的体系非常有意义并且值得探讨。但由于其复杂性,PaperRank和AuthorRank透明度不如简单的基于引用的指标,这意味着可能会产生一些误读。虽然这些指数难以被钻空子,但它们可能会被单独一篇高引论文影响综合结果。

Strumia和Torre还建立了第三个指标CitationCoin,这个指标将消除两个研究人员之间互引的数据。该指数旨在解决过度自引和大型引用联盟的问题,即同组研究人员之间的过度互引。

但是,Flatt说,这样的衡量标准可能会将引用简单地变成一种认可度的标识,而不是“将概念,技术和进步联系在一起”的工具。Flatt自己也开发过一个针对自引做法的指标,他认为 “自引和非自引都很重要,只要它们来自协作,持续,前沿的工作”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5838

    浏览量

    103221
  • 算法
    +关注

    关注

    23

    文章

    4448

    浏览量

    90718

原文标题:消除自引和组内互引,新的论文评价体系能否带来真正公平?

文章出处:【微信号:zhishexueshuquan,微信公众号:知社学术圈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    谷歌模型框架是什么软件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌开发的用于机器学习和人工智能的软件框架,其中最著名的是TensorFlow。TensorFlow是一个开源的机器学习框架,由谷歌的机器学习团队开发,用于构建和训练各种机器学习模型。
    的头像 发表于 03-01 16:25 210次阅读

    谷歌模型训练软件有哪些?谷歌模型训练软件哪个好?

    谷歌在模型训练方面提供了一些强大的软件工具和平台。以下是几个常用的谷歌模型训练软件及其特点。
    的头像 发表于 03-01 16:24 253次阅读

    谷歌模型怎么用手机打开

    要使用手机打开谷歌模型,首先需要明确一点:谷歌模型本身是在计算机上运行的程序或算法,而不是可以直接在手机上打开的应用程序。然而,你可以通过手机访问谷歌提供的服务或应用,这些服务或应用可
    的头像 发表于 03-01 16:23 186次阅读

    谷歌模型合成软件有哪些

    谷歌模型合成软件通常指的是谷歌提供的用于创建、修改和共享3D模型的软件。目前,谷歌推出的模型合成软件中最知名的是Google SketchUp。
    的头像 发表于 02-29 18:20 883次阅读

    谷歌模型框架是什么?有哪些功能和应用?

    谷歌模型框架(Google Model Framework)并不是一个特定的框架,而是指谷歌开发的一系列软件框架,用于支持机器学习和人工智能的应用。以下是一些与谷歌模型框架相关的关键组件和技术:
    的头像 发表于 02-29 18:11 632次阅读

    谷歌交互世界模型重磅发布

    谷歌模型
    北京中科同志科技股份有限公司
    发布于 :2024年02月28日 09:13:06

    标准PID算法的一些改进措施

    前面的几篇文章分别分享了PID算法的原理、增量式和位置式PID算法的区别、以及过程控制中一些重要的指标,感兴趣的朋友可以回看之前的文章或者自行查阅资料。
    的头像 发表于 08-22 11:06 841次阅读
    标准PID<b class='flag-5'>算法</b>的一些改进措施

    PID算法在控制系统中的特性和指标

    PID算法广泛的被应用在很多的控制系统中,最终的目的都是希望通过pid控制器实现被控量能稳定在预期的目标值。
    的头像 发表于 08-22 11:05 693次阅读
    PID<b class='flag-5'>算法</b>在控制系统中的特性和<b class='flag-5'>指标</b>

    谷歌称TCP拥塞控制算法BBRv3表现出色,本月提交到Linux内核主线

    谷歌工程师于 7 月底出席了在旧金山举行的 IETF 117 活动。根据工程师的介绍,BBRv3 包含各种修复和算法更新。此外 BBRv3 的数据包重传率降低了 12%,延迟也略有改善。
    的头像 发表于 08-08 16:24 523次阅读
    <b class='flag-5'>谷歌</b>称TCP拥塞控制<b class='flag-5'>算法</b>BBRv3表现出色,本月提交到Linux内核主线

    PageRank排序算法(1)#大学计算机

    计算机
    未来加油dz
    发布于 :2023年07月11日 00:00:48

    Dijkstra算法和A*算法

    在本文中,我们将主要介绍Dijkstra算法和A*算法,从成本计算的角度出发,并逐步展开讨论。 我们将从广度优先搜索开始,然后引入Dijkstra算法,与贪心算法进行比较,最终得出A*
    的头像 发表于 07-07 10:56 597次阅读
    Dijkstra<b class='flag-5'>算法</b>和A*<b class='flag-5'>算法</b>

    最流行的回归评估指标

    回归评价指标综述
    的头像 发表于 07-05 16:30 562次阅读
    最流行的回归评估<b class='flag-5'>指标</b>

    谷歌或面临被分拆风险

    谷歌或面临被分拆风险 谷歌因为在欧盟被调查反垄断;甚至或面临被分拆风险。 欧盟指控谷歌滥用其在广告技术上的优势地位压制竞争对手形成垄断;而且如果欧盟委员会认定谷歌存在违法行为,
    的头像 发表于 06-15 20:58 834次阅读

    雷达指标:接收机ADC

    接收机指标中补充最后一个需要关注的指标,虽然这个指标也是选好以后我们管不了(完全靠设计师的选择),但是它里面涉及一些重要的原理知识。
    的头像 发表于 06-13 17:30 966次阅读