0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

清华大学发布全球首个开源自动图学习工具包:AutoGL

新机器视觉 来源:新机器视觉 作者:机器之心 2020-12-26 10:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如何应用自动机器学习 (AutoML) 加速图机器学习任务的处理?清华大学发布全球首个开源自动图学习工具包:AutoGL (Auto Graph Learning),支持在图数据上全自动进行机器学习。

人工智能的蓬勃发展离不开数据、算力、算法这三大要素。而在浩瀚的数据中,有一种数据结构既普遍又复杂,它就是图(graph)。

图是一种用于描述事物之间关系的结构,其基本构成元素为节点和连接节点的边。 很多不同领域的研究问题都可以很自然地建模成图机器学习,例如蛋白质建模、物理系统模拟、组合优化等基础研究;社交媒体分析、推荐系统、虚假新闻检测等互联网应用;以及金融风控、知识表征、交通流量预测、新药发现等。

社交网络图示例。 图结构丰富且具有与生俱来的导向能力,因此非常适合机器学习模型。同时,它又无比复杂,难以进行大规模扩展应用。而且不同的图数据在结构、内容和任务上千差万别,所需要的图机器学习模型也可能相差甚远,这就导致不同任务的模型自动化面临巨大挑战。如何设计最优的图自动机器学习模型,是一个尚未解决的难题。

图 + AutoML = ? 自动机器学习 (AutoML) 旨在将机器学习的过程自动化,在降低机器学习使用门槛的同时,提升机器学习的效果。但现有的自动机器学习工具,无法考虑图数据的特殊性,因此无法应用在图机器学习模型中。 为了解决该问题,清华大学朱文武教授带领的网络与媒体实验室发布了全球首个开源自动图学习工具包:AutoGL (Auto Graph Learning)。该工具支持在图数据上全自动进行机器学习,并且支持图机器学习中最常见的两个任务:节点分类任务(node classification)与图分类任务(graph classification)。

AutoGL 流程图。 AutoGL 工具包首先使用 AutoGL Dataset 维护图机器学习任务所需数据集。AutoGL Dataset 导入了大规模图表示学习工具包 CogDL 和图神经网络库 PyTorch Geometric (PyG) 中的数据集模块,并添加对OGB 数据集的支持,同时还添加了一些支持以便集成 auto solver 框架。 不同的图机器学习任务可以通过不同的 AutoGL Solver 得到解决。AutoGL Solver 使用四个主要模块自动化解决给定任务,分别是特征工程(Feature Engineering)、图学习模型(Graph Learning Model)、超参数优化(HPO),以及模型自动集成(Auto Ensemble)。每个部分在设计时都引入了对图数据特殊性的考虑。

模块 1:特征工程 AutoGL 特征工程模块包含了图机器学习过程中常用的特征工程方法,包括节点 / 边 / 子图特征提取、变换和筛选,如节点度数、节点 ID、特征向量等。这些方法显著丰富了目标图数据上的信息,提高了图学习的效果。同时,用户还可以非常方便地扩展特征工程模块,以实现个性化的需求。

模块 2:图学习模型 AutoGL 目前支持 GCN、GAT、GIN 等常见图学习模型,可以完成包括点分类、图分类在内的多种常见任务,使用方式简单,上手方便。同时,AutoGL 主页还提供了详细的说明文档,支持用户自定义模型,可扩展性良好。

模块 3:超参数优化 AutoGL 目前集成了多种通用超参数优化方法, 如网格搜索、随机搜索、贝叶斯优化、模拟退火、TPE 等算法,同时还包含专门针对图学习优化的自动机器学习算法 AutoNE。该模块省去了图学习中繁杂的手动调参过程,极大地提高了工程效率。同时,该模块易于使用,用户只需给出各个超参数的类型和搜索空间、指定超参数优化方法,即可快速上手运行若干自动图学习模型。 AutoGL 会在给定的资源预算(时间、搜索次数等)内给出最优的超参数组合。该模块同样支持扩展,用户可以自定义新的超参数优化算法。

模块 4:模型自动集成 自动集成模块目前支持两类常用的集成学习方法:voting 和 stacking。该模块通过组合多个基模型得到一个博采众长的集成模型,从而进一步提升图学习的效果。 AutoGL 工具包目前支持多种算法,如下表所示:

AutoGL 工具包四个不同模块所支持的算法。 AutoGL 工具包极大地方便了开发人员进行对应的图学习算法设计和调优。用户只需按照 AutoGL 的数据集标准提供目标数据集,AutoGL 就会自动寻找最优的模型和对应的超参数,从而简化图学习算法开发与应用的流程,极大提升图学习相关的科研和应用效率。

此外,AutoGL 工具包还提供了一个供使用者公平地测试与对比算法的平台。AutoGL 在设计时遵循模块化思想,每个模块均可扩展,用户只需实现对应模块类的接口,即可方便地测试自己的算法,为快速获得 baseline 效果、公平对比不同模型性能提供方便。 未来展望 据 AutoGL 研发团队透露,他们将进一步深入研发,以方便其他研究者、业界使用者和初学者快速上手 AutoGL,解决学术界、产业界遇到的图学习相关问题。 AutoGL 网站显示,该工具包将在近期支持以下功能:

神经架构搜索;

大规模图数据集支持;

更多图任务(如链接预测、异构图任务、时空任务);

Graph Boosting & Bagging;

对更多图模型库提供后端支持(如 DGL)。

AutoGL 研发团队期待得到各类使用反馈,以更好地完善 AutoGL 的各项功能。「我们的最终目的是推动自动图机器学习在学术界与工业界的深层次探索和应用。」AutoGL 研发者谈及之后的计划时表示。 相关链接

AutoGL 网站地址:http://mn.cs.tsinghua.edu.cn/autogl/

AutoGL 代码链接:https://github.com/THUMNLab/AutoGL

AutoGL 说明文档:https://autogl.readthedocs.io/en/latest/index.html

深度学习模型综述:https://arxiv.org/abs/1812.04202

责任编辑:xj

原文标题:清华大学发布首个自动图机器学习工具包AutoGL,开源易用可扩展,支持自定义模型

文章出处:【微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    67

    文章

    8561

    浏览量

    137208
  • 深度学习
    +关注

    关注

    73

    文章

    5604

    浏览量

    124610

原文标题:清华大学发布首个自动图机器学习工具包AutoGL,开源易用可扩展,支持自定义模型

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    清华大学体育锻炼数字化案例:基于蓝牙物联网的学生运动健康管理

    项目背景 清华大学作为中国顶尖的高等学府,一贯秉承“无体育,不清华”的育人传统。从早期的“强迫运动”到著名的“为祖国健康工作五十年”口号,体育精神深深融入了清华的校园文化。然而,随着时代
    发表于 04-15 17:31

    清华大学电子工程系到访天数智芯参观交流

    近日,清华大学电子工程系、清华校友总会电子工程系分会、清华大学上海校友会电子信息专委会组织师生、校友代表到访天数智芯,开展深度校企交流活动,共话国产算力创新与产学研协同发展。
    的头像 发表于 04-07 17:40 1528次阅读

    沐曦股份联合清华大学发布磁性材料AI原子基座模型

    2月27日,沐曦股份联合清华大学等多家研究机构联合发布了磁性材料AI原子基座模型。该模型是首个覆盖宽温压域的磁性材料AI原子模型,经权威专家鉴定,整体技术水平达到国际领先。
    的头像 发表于 03-03 15:25 565次阅读
    沐曦股份联合<b class='flag-5'>清华大学</b><b class='flag-5'>发布</b>磁性材料AI原子基座模型

    清华大学研学团到访国民技术参观交流

    近日,清华大学集成电路学院、社会科学学院、土木工程系的博士及硕士研究生一行16人走进国民技术深圳总部,开展了一场别开生面的研学实践活动。本次活动聚焦技术交流与人才培养,推动校企合作迈向新阶段。
    的头像 发表于 02-11 14:54 647次阅读

    清华大学“启·创”计划走进拓维信息,校企共探AI时代产学研合作新范式

    1月13日,清华大学“启·创”计划第十三期赴湘社会实践活动暨TalkwebHouse创业私董会第二期在拓维信息圆满举办。清华大学创业团队20余名师生,与拓维信息团队深入对话,围绕“AI+”产业融合
    的头像 发表于 01-16 14:04 668次阅读
    <b class='flag-5'>清华大学</b>“启·创”计划走进拓维信息,校企共探AI时代产学研合作新范式

    沐曦与Arm、熠知一同到访清华大学交流座谈

    为助力顶尖学府清华大学在“AI+教科研”领域取得新突破,培养具备AI创新能力的人才,1月12日,沐曦集成电路(上海)股份有限公司(股票代码:688802)、半导体头部企业Arm控股有限公司(纳斯达克
    的头像 发表于 01-14 13:52 472次阅读

    普华基础软件走进清华大学研究生课堂

    近日,普华基础软件走进清华大学车辆与运载学院,在《车辆控制工程》课堂上开展研究生专题授课和交流。本次授课聚焦智能驾驶汽车基础软件发展与关键技术,旨在搭建校企知识传递桥梁,为高校学子带来产业前沿视角,助力培养符合行业需求的复合型人才。
    的头像 发表于 11-26 15:53 489次阅读

    清华大学企业家协会一行到访立讯精密参观交流

    11月14日上午,立讯精密CPBG事业群与技术委员会在昆山园区,热情接待了到访的清华大学企业家协会(TEEC)一行。此次交流,不仅是一次企业展示,更是一次思想碰撞与智慧交融的契机。
    的头像 发表于 11-20 15:14 892次阅读

    爱芯元智出席第四届清华大学汽车芯片设计及产业应用研讨会

    近日,第四届清华大学汽车芯片设计及产业应用研讨会暨校友论坛在苏州市吴江区举行。作为清华大学自动化系校友,爱芯元智创始人兼董事长仇肖莘博士应邀发表主旨演讲,深入剖析了高智价比AI芯片推动智能汽车普惠发展的实施路径。
    的头像 发表于 11-02 09:18 554次阅读

    清华大学五道口金融学院走进赛目科技

    近日,聚焦自动驾驶未来路径的专题沙龙在中关村国际创新大厦成功举办。此次活动由清华大学五道口金融学院主办,北京赛目科技股份有限公司、北京海新域城市更新集团提供活动支持,为清华-康奈尔双学位金融MBA项目在读学生及校友、
    的头像 发表于 07-18 16:15 903次阅读

    清华大学TOP EE+项目参访美光上海

    此前,2025年6月4日至6日,清华大学TOP EE+ 项目于美光上海的参访活动圆满举行。为期三天的活动汇聚了来自清华大学电子工程系的优秀留学生与美光的多位管理者和工程师,展开了深入的技术交流与文化互动之旅。
    的头像 发表于 07-07 18:02 1647次阅读

    导远科技与清华大学无锡应用技术研究院达成合作

    近日,导远科技与清华大学无锡应用技术研究院(以下简称:研究院)达成合作。导远科技将提供高精度定位产品及解决方案,以支持研究院在L4级自动驾驶和人形机器人领域的技术研发及转化落地。
    的头像 发表于 06-12 16:34 1198次阅读

    清华大学到镓未来科技,张大江先生在半导体功率器件十八年的坚守!

    清华大学到镓未来科技,张大江先生在半导体功率器件十八年的坚守!近年来,珠海市镓未来科技有限公司(以下简称“镓未来”)在第三代半导体行业异军突起,凭借领先的氮化镓(GaN)技术储备和不断推出的新产品
    发表于 05-19 10:16

    清华大学携手华为打造业内首个园区网络智能体

    清华大学响应国家教育新基建战略,正在加速推进网络管理平台升级:为满足在线教育、协同创新及智慧校园的发展需求,为清华大学跻身世界一流大学创造基础条件,清华大学携手华为打造业内
    的头像 发表于 05-07 09:51 973次阅读

    2025年开放原子校源行清华大学站成功举办

    近日,由开放原子开源基金会、清华大学计算机科学与技术系、清华大学软件学院主办的开放原子“校源行”(清华站)在清华大学成功举办。
    的头像 发表于 04-22 16:46 1070次阅读