0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

清华大学发布首个开源自动图学工具包

如意 来源:机器之心 作者:机器之心 2020-12-22 16:32 次阅读

如何应用自动机器学习 (AutoML) 加速图机器学习任务的处理?清华大学发布全球首个开源自动图学习工具包:AutoGL (Auto Graph Learning),支持在图数据上全自动进行机器学习。

人工智能的蓬勃发展离不开数据、算力、算法这三大要素。而在浩瀚的数据中,有一种数据结构既普遍又复杂,它就是图(graph)。

图是一种用于描述事物之间关系的结构,其基本构成元素为节点和连接节点的边。

很多不同领域的研究问题都可以很自然地建模成图机器学习,例如蛋白质建模、物理系统模拟、组合优化等基础研究;社交媒体分析、推荐系统、虚假新闻检测等互联网应用;以及金融风控、知识表征、交通流量预测、新药发现等。

图结构丰富且具有与生俱来的导向能力,因此非常适合机器学习模型。同时,它又无比复杂,难以进行大规模扩展应用。而且不同的图数据在结构、内容和任务上千差万别,所需要的图机器学习模型也可能相差甚远,这就导致不同任务的模型自动化面临巨大挑战。如何设计最优的图自动机器学习模型,是一个尚未解决的难题。

图 + AutoML = ?

自动机器学习 (AutoML) 旨在将机器学习的过程自动化,在降低机器学习使用门槛的同时,提升机器学习的效果。但现有的自动机器学习工具,无法考虑图数据的特殊性,因此无法应用在图机器学习模型中。

为了解决该问题,清华大学朱文武教授带领的网络与媒体实验室发布了全球首个开源自动图学习工具包:AutoGL (Auto Graph Learning)。该工具支持在图数据上全自动进行机器学习,并且支持图机器学习中最常见的两个任务:节点分类任务(node classification)与图分类任务(graph classification)。

AutoGL 流程图。

AutoGL 工具包首先使用 AutoGL Dataset 维护图机器学习任务所需数据集。AutoGL Dataset 导入了大规模图表示学习工具包 CogDL 和图神经网络库 PyTorch Geometric (PyG) 中的数据集模块,并添加对 OGB 数据集的支持,同时还添加了一些支持以便集成 auto solver 框架。

不同的图机器学习任务可以通过不同的 AutoGL Solver 得到解决。AutoGL Solver 使用四个主要模块自动化解决给定任务,分别是特征工程(Feature Engineering)、图学习模型(Graph Learning Model)、超参数优化(HPO),以及模型自动集成(Auto Ensemble)。每个部分在设计时都引入了对图数据特殊性的考虑。

模块 1:特征工程

AutoGL 特征工程模块包含了图机器学习过程中常用的特征工程方法,包括节点 / 边 / 子图特征提取、变换和筛选,如节点度数、节点 ID、特征向量等。这些方法显著丰富了目标图数据上的信息,提高了图学习的效果。同时,用户还可以非常方便地扩展特征工程模块,以实现个性化的需求。

模块 2:图学习模型

AutoGL 目前支持 GCN、GAT、GIN 等常见图学习模型,可以完成包括点分类、图分类在内的多种常见任务,使用方式简单,上手方便。同时,AutoGL 主页还提供了详细的说明文档,支持用户自定义模型,可扩展性良好。

模块 3:超参数优化

AutoGL 目前集成了多种通用超参数优化方法, 如网格搜索、随机搜索、贝叶斯优化、模拟退火、TPE 等算法,同时还包含专门针对图学习优化的自动机器学习算法 AutoNE。该模块省去了图学习中繁杂的手动调参过程,极大地提高了工程效率。同时,该模块易于使用,用户只需给出各个超参数的类型和搜索空间、指定超参数优化方法,即可快速上手运行若干自动图学习模型。

AutoGL 会在给定的资源预算(时间、搜索次数等)内给出最优的超参数组合。该模块同样支持扩展,用户可以自定义新的超参数优化算法。

模块 4:模型自动集成

自动集成模块目前支持两类常用的集成学习方法:voting 和 stacking。该模块通过组合多个基模型得到一个博采众长的集成模型,从而进一步提升图学习的效果。

AutoGL 工具包目前支持多种算法,如下表所示:

清华大学发布首个开源自动图学工具包

AutoGL 工具包四个不同模块所支持的算法。

AutoGL 工具包极大地方便了开发人员进行对应的图学习算法设计和调优。用户只需按照 AutoGL 的数据集标准提供目标数据集,AutoGL 就会自动寻找最优的模型和对应的超参数,从而简化图学习算法开发与应用的流程,极大提升图学习相关的科研和应用效率。

此外,AutoGL 工具包还提供了一个供使用者公平地测试与对比算法的平台。AutoGL 在设计时遵循模块化思想,每个模块均可扩展,用户只需实现对应模块类的接口,即可方便地测试自己的算法,为快速获得 baseline 效果、公平对比不同模型性能提供方便。

未来展望

据 AutoGL 研发团队透露,他们将进一步深入研发,以方便其他研究者、业界使用者和初学者快速上手 AutoGL,解决学术界、产业界遇到的图学习相关问题。

AutoGL 网站显示,该工具包将在近期支持以下功能:

神经架构搜索;

大规模图数据集支持;

更多图任务(如链接预测、异构图任务、时空任务);

Graph Boosting & Bagging;

对更多图模型库提供后端支持(如 DGL)。

AutoGL 研发团队期待得到各类使用反馈,以更好地完善 AutoGL 的各项功能。「我们的最终目的是推动自动图机器学习在学术界与工业界的深层次探索和应用。」AutoGL 研发者谈及之后的计划时表示。

相关链接

AutoGL 网站地址:http://mn.cs.tsinghua.edu.cn/autogl/

AutoGL 代码链接:https://github.com/THUMNLab/AutoGL

AutoGL 说明文档:https://autogl.readthedocs.io/en/latest/index.html

深度学习模型综述:https://arxiv.org/abs/1812.04202
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26459

    浏览量

    264081
  • 机器学习
    +关注

    关注

    66

    文章

    8126

    浏览量

    130571
  • 工具包
    +关注

    关注

    0

    文章

    45

    浏览量

    9458
收藏 人收藏

    评论

    相关推荐

    直线电机生产厂家谈清华大学获芯片领域重要突破

    化设备制造商、医学设备制造商、科研机构以及各大高校。 像大家熟知的清华大学、北京航空航天大学、西安交通大学、哈尔滨工业大学、浙江大学、南京
    的头像 发表于 04-24 08:18 42次阅读
    直线电机生产厂家谈<b class='flag-5'>清华大学</b>获芯片领域重要突破

    清华大学研发成功大规模干涉-衍射异构集成芯片——太极

    4月12日公布,清华大学研发出太极芯片,实现了每瓦160TOPS的高性能通用智能计算,这是该校电子工程系与自动化系共同攻克的难题。
    的头像 发表于 04-12 15:50 149次阅读

    清华大学突破性成果!全球首个无串扰量子网络节点诞生

    清华大学交叉信息研究院的段路明教授课题组长期以来进行了创新性的研究,并提出使用同种离子的双类型量子比特来实现量子网络节点的方案。
    的头像 发表于 01-24 16:07 543次阅读

    清华大学研发光电融合芯片,算力超商用芯片三千余倍

    清华大学官方消息,在计算能力方面,清华大学攻关团队创造性地提出的计算框架光电深度融合,从最本质的物理原理出发,电磁波传播的空间为基础的光计算和基尔霍夫定律为基础的纯结合了模拟电子计算。“
    的头像 发表于 10-31 11:18 598次阅读

    清华大学团队在超高性能计算芯片领域取得新突破

    清华大学团队在超高性能计算芯片领域取得新突破,相关研究发表在Nature上。
    的头像 发表于 10-29 09:20 627次阅读
    <b class='flag-5'>清华大学</b>团队在超高性能计算芯片领域取得新突破

    我国芯片突破!清华大学全球首枚!

    10月10日消息,据清华大学公众号,近日,清华大学集成电路学院教授吴华强、副教授高滨基于存算一体计算范式,研制出全球首颗全系统集成的、支持高效片上学习(机器学习能在硬件端直接完成)的忆阻器存算一体
    的头像 发表于 10-14 08:11 356次阅读
    我国芯片突破!<b class='flag-5'>清华大学</b>全球首枚!

    存算一体芯片新突破!清华大学研制出首颗存算一体芯片

    这几天清华大学又火出圈了。但这次并不是因为招生抢人和饭堂,而是清华大学的芯片研发团队研制出全球首颗全系统集成的存算一体芯片。这是我国、乃至全世界对半导体行业的又一重大突破。 这个芯片由清华大学
    的头像 发表于 10-11 14:39 684次阅读

    利用OpenVINO工具包检测汽车品牌

    作为ISV,DGCT有一项检测汽车品牌的要求。因此,有必要设计、开发和测试汽车品牌检测原型,以证明Intel@DistributionofOpenVINOTM用于铝秤的工具包的可行性,从而准确、高效
    发表于 08-04 07:36

    2023年开放原子校源行(清华大学站)成功举行

    清华大学举办了以“聚缘于校,开源共行”为主题的2023年开放原子校源行活动。该活动由开放原子开源基金会和清华大学共同主办,得到工信部的大力支持。活动吸引了政府部门、行业协会、全国高校、
    的头像 发表于 08-01 16:10 297次阅读
    2023年开放原子校源行(<b class='flag-5'>清华大学</b>站)成功举行

    百度—清华自动驾驶立法座谈会在清华法学院举行

    本文转自: 清华大学法学院 2023年7月15日上午,百度—清华自动驾驶立法座谈会在清华大学法律图书馆楼召开。 本次会议从高级别自动 驾驶的
    的头像 发表于 07-17 17:05 873次阅读
    百度—<b class='flag-5'>清华</b><b class='flag-5'>自动</b>驾驶立法座谈会在<b class='flag-5'>清华</b>法学院举行

    直播预告|开放原子校源行(清华大学站)

    校源行(清华大学站)活动将在清华大学蒙民伟音乐厅举办。本次活动拟通过邀请政府领导、知名高校嘉宾、头部科技企业、权威主流媒体代表共聚校园共话开源,集中展示“开放原子校源行”公益项目进展及成果,在高校学子中推广优秀
    的头像 发表于 06-26 21:55 325次阅读
    直播预告|开放原子校源行(<b class='flag-5'>清华大学</b>站)

    国仪量子携手清华大学!《如何精准测孔?》系列讲座开讲

    5月31日,清华大学分析中心磁共振实验室举行的《如何精准测孔?》系列讲座正式开讲,国仪精测总经理夏攀分享了《材料孔径精确测定要点及测试实例分析》报告,线上线下近60余位相关领域的研究人员参加并进
    的头像 发表于 06-09 10:28 398次阅读
    国仪量子携手<b class='flag-5'>清华大学</b>!《如何精准测孔?》系列讲座开讲

    清华开源工具学习基准」ToolBench,微调模型ToolLLaMA性能超越ChatGPT

    最近,清华大学自然语言处理实验室等支持的开源社区OpenBMB (Open Lab for Big Model Base)发布了ToolBench项目,可以帮助开发者构建开源、大规模、
    的头像 发表于 06-08 11:39 391次阅读
    <b class='flag-5'>清华</b>等<b class='flag-5'>开源</b>「<b class='flag-5'>工具</b>学习基准」ToolBench,微调模型ToolLLaMA性能超越ChatGPT

    清华大学在超快激光微纳制造领域获得新进展

    近日,清华大学机械系在超快激光微纳制造领域获得新进展,提出了基于超快激光等离激元分子调节实现自下而上的微纳功能器件加工制造策略,并揭示了激光诱导等离激元与材料的非线性作用机理,利用超快激光激发纳米腔等离激元效应
    的头像 发表于 05-31 14:38 588次阅读
    <b class='flag-5'>清华大学</b>在超快激光微纳制造领域获得新进展

    纵目科技与清华大学共同成立智能辅助驾驶系统联合研究中心

    与运载学院教授李克强等校领导出席了此次活动。 此次合作,清华大学将为纵目科技提供强大的人才储备以及先进的技术和理论支持,为自动驾驶技术的发展注入强大的知识动能。同时,纵目科技也将为清华大学提供实践平台和技术
    的头像 发表于 05-31 09:52 322次阅读
    纵目科技与<b class='flag-5'>清华大学</b>共同成立智能辅助驾驶系统联合研究中心