0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

首届时间检验应用科学奖公布,清华大学研究团队获奖

电子设计 来源:电子设计 作者:电子设计 2020-12-24 16:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

ACM SIGKDD(ACM SIGKDD Conference on Knowledge Discovery and Data Mining,国际数据挖掘与知识发现大会,简称 KDD)是数据挖掘领域国际顶级学术会议,今年的 KDD 大会将于 8 月 23 日至 27 日在线上召开。

8 月 13 日, SIGKDD 2020 官方公布了 2020 年 ACM SIGKDD 创新奖、服务奖、论文奖、新星奖、时间检验研究奖、时间检验应用科学奖等六项大奖的获得者,这些奖项是针对数据科学、机器学习、大数据和计算机科学领域的杰出个人和研究团队而设立的。

值得一提的是,今年 KDD 颁发了首届时间检验应用科学奖(Test of Time Award for Applied Science)奖项,以表彰在数据科学的实际应用中具有影响力的研究。清华大学计算机科学与技术系唐杰、李涓子等人凭借他们在 2008 年发表的关于学术社交网络挖掘的研究成果获得了这一奖项。

获奖论文题目为 ArnetMiner: Extraction And Mining Of Academic Social Networks,论文作者包括清华大学计算机科学与技术系的唐杰、张静、姚利敏、李涓子,以及来自 IBM 中国研究实验室的张莉和苏中。

在这篇文章中,作者主要介绍了一个自主研发的面向研究者社会网络的挖掘搜索系统 ArnetMiner 的体系结构和关键技术。下面我们来将详细解读一下这篇文章。

研究背景

近些年,学术社交网络发展迅速,为众多研究学者提供了良好的交流平台,也产生了巨大的学术信息数据集。随着数据挖掘和人工智能技术的发展,针对学术社交网络进行数据挖掘和知识提取,进而为科学研究领域提供全方位的服务成为一大研究热点。

在作者开始这项研究之时,学术圈已有 DBLP、CiteSeer、Google Scholar 等学术搜索系统发布,但是往往存在以下两项不足之处:

1)缺乏语义信息。无论用户输入的个人资料或使用启发式方法提取的各类信息,语义存在不完整或不一致性,缺少有效获得大规模语义信息的方法;

2)缺乏异构对象的统一建模方法。以前,学术网络中不同类型的信息如学者、论文、会议期刊是单独建模的,因此无法准确捕捉它们之间的依赖关系。

为解决这两个问题,作者所在的研究团队开发了ArnetMiner系统。该系统旨在解决以下几个问题:

1)如何自动从互联网海量信息中提取研究人员的个人档案?

2)如何集成不同来源提取的学术相关信息(例如研究人员的个人档案和出版物)?

3)如何以统一的方法为不同类型的信息建模?

4)如何基于已构建的网络,提供强大的挖掘和搜索服务?

ArnetMiner系统(简称AMiner)

图1:AMiner系统框架图

图 1 给出了 AMiner 系统框架图,AMiner 系统自下而上主要包括五个部分:

1)研究者个人信息抽取(Extraction):即从网络上自动识别到研究者的个人主页,并训练一个统一的模型,从中抽取研究者的各种基本信息。同时,从不同来源的论文数据库抽取或收集作者所发表的论文信息;

2)个人信息融合(Integration):通过使用研究者姓名作为标识符,将提取的研究者的个人资料和提取的出版物信息进行整合。提出了马尔科夫随机场概率模型,以解决融合不同来源论文数据时面临的重名歧义问题;

3)存储和访问(Storage and Access):系统将集成的数据存储在研究者网络知识库(RNKB)中,利用MySQL作为存储数据库,并使用反向文件索引方法进行信息索引;

4)建模(Modeling):文章提出一个概率生成模型,通过对学术网络中的研究者、论文、会议等不同类型的信息进行综合分析,对每种信息进行主题分布估计;

5)搜索服务(Search Services):基于建模结果,提供多种搜索服务,包括专家搜索、关联关系搜索、论文推荐以及引用推荐等。

该系统重点解决三个技术难点:

1)学术网络中研究者个人信息自动抽取问题;

2)不同来源学术论文融合过程中的重名排歧问题;

3)学术网络中研究者、论文、会议等异质实体的统一建模问题。

审核编辑:符乾江
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    55

    文章

    11321

    浏览量

    108855
  • 计算机
    +关注

    关注

    19

    文章

    7764

    浏览量

    92682
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    普华基础软件走进清华大学研究生课堂

    近日,普华基础软件走进清华大学车辆与运载学院,在《车辆控制工程》课堂上开展研究生专题授课和交流。本次授课聚焦智能驾驶汽车基础软件发展与关键技术,旨在搭建校企知识传递桥梁,为高校学子带来产业前沿视角,助力培养符合行业需求的复合型人才。
    的头像 发表于 11-26 15:53 189次阅读

    英创汇智荣获2025年度中国汽车工程学会科学技术二等

    近日,在第三十二届中国汽车工程学会年会暨展览会上,2025年度“中国汽车工程学会科学技术”正式公布。由奇瑞汽车、清华大学、英创汇智等单位联合申报的“高性能乘用车底盘关键技术及其产业化
    的头像 发表于 11-04 16:44 513次阅读

    清华大学TOP EE+项目参访美光上海

    此前,2025年6月4日至6日,清华大学TOP EE+ 项目于美光上海的参访活动圆满举行。为期三天的活动汇聚了来自清华大学电子工程系的优秀留学生与美光的多位管理者和工程师,展开了深入的技术交流与文化互动之旅。
    的头像 发表于 07-07 18:02 1263次阅读

    导远科技与清华大学无锡应用技术研究院达成合作

    近日,导远科技与清华大学无锡应用技术研究院(以下简称:研究院)达成合作。导远科技将提供高精度定位产品及解决方案,以支持研究院在L4级自动驾驶和人形机器人领域的技术研发及转化落地。
    的头像 发表于 06-12 16:34 804次阅读

    清华大学到镓未来科技,张大江先生在半导体功率器件十八年的坚守!

    清华大学到镓未来科技,张大江先生在半导体功率器件十八年的坚守!近年来,珠海市镓未来科技有限公司(以下简称“镓未来”)在第三代半导体行业异军突起,凭借领先的氮化镓(GaN)技术储备和不断推出的新产品
    发表于 05-19 10:16

    清华大学携手华为打造业内首个园区网络智能体

    清华大学响应国家教育新基建战略,正在加速推进网络管理平台升级:为满足在线教育、协同创新及智慧校园的发展需求,为清华大学跻身世界一流大学创造基础条件,清华大学携手华为打造业内首个园区网络
    的头像 发表于 05-07 09:51 642次阅读

    2025年开放原子校源行清华大学站成功举办

    近日,由开放原子开源基金会、清华大学计算机科学与技术系、清华大学软件学院主办的开放原子“校源行”(清华站)在清华大学成功举办。
    的头像 发表于 04-22 16:46 757次阅读

    清华大学鲲鹏昇腾科教创新卓越中心专项合作启动,引领高校科研和人才培养新模式

    计算机系教授郑纬民,清华大学计算机系主任、教授尹霞,清华大学科研院副院长、教授李水清,华为常务董事、ICT基础设施业务管理委员会主任汪涛,华为北京研究所所长姜向中,华为公司北京总经理张东亚,华为昇腾计算业务总裁张
    的头像 发表于 02-18 16:46 874次阅读

    清华大学与华为启动“卓越中心”专项合作

    、中国工程院院士郑纬民教授、清华大学计算机系主任尹霞教授、清华大学科研院副院长李水清教授,以及华为常务董事汪涛、华为北京研究所所长姜向中、华为公司北京总经理张东亚、华为昇腾计算业务总裁张迪煊等。 签约仪式由
    的头像 发表于 02-18 14:11 1062次阅读

    清华大学发布:DeepSeek从入门到精通

    《DeepSeek:从入门到精通》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后团队精心撰写的一份专业文档。该文档篇幅长达104页,文档的核心内容围绕DeepSeek的技术
    的头像 发表于 02-14 09:49 1.2w次阅读
    <b class='flag-5'>清华大学</b>发布:DeepSeek从入门到精通

    清华大学自动化系学子走进华砺智行研学交流

    近日,清华大学自动化系的11名学子走进华砺智行研学交流,开展科技前沿探索的社会实践活动。
    的头像 发表于 02-13 10:03 696次阅读

    清华大学DeepSeek指南:从入门到精通

    本资料由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室余梦珑博士后团队出品,细致讲述了DeepSeek的应用技巧。                    
    的头像 发表于 02-11 09:16 1.4w次阅读
    <b class='flag-5'>清华大学</b>DeepSeek指南:从入门到精通

    清华大学未央书院一行到访光峰科技参观交流

    近日,清华大学未央书院“机动万里”实践支队到访光峰科技进行参观交流,期间与光峰研究院的研发成员就激光光学应用的创新与发展,进行交流互动。
    的头像 发表于 01-16 10:41 792次阅读

    清华大学师生到访智行者科技交流学习

    近日,清华大学 “技术创新原理与实践” 研究生课程师生一行到访智行者进行交流学习。作为课程实践环节的重要一站,此次来访开启了一场深度的参观学习之旅。智行者董事长&CEO张德兆先生作为清华校友同时也是技术创业者,与到访师生进行了面
    的头像 发表于 12-23 11:39 1007次阅读

    商汤科技徐立论文再获“时间检验

    十几年前的论文为何还能获奖?因为经过了时间检验
    的头像 发表于 12-12 10:23 894次阅读