0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度飞桨登顶图神经网络权威榜单3项榜首,重磅推出UniMP

电子设计 来源:电子设计 作者:电子设计 2020-12-08 23:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

百度又有“大动作”?9月18日,百度正式公布在图神经网络领域取得新突破,提出融合标签传递和图神经网络的统一模型 UniMP(Unified Message Passing),在图神经网络权威榜单 OGB(Open Graph Benchmark)取得多项榜首,引发业界关注。

Leaderboard for ogbn-products

Leaderboard for ogbn-proteins

Leaderboard for ogbn-arxiv

图神经网络最权威榜单 OGB

图神经网络是用于图结构数据的深度学习架构,将端到端学习与归纳推理相结合,有望解决传统深度学习无法处理的因果推理、可解释性等问题,是非常有潜力的人工智能研究方向。但是,这个领域一直缺乏规模比较大且认可度较高的数据集。目前大量的论文仍然在 Cora、PubMed、Citeseer 等小数据集上进行实验,实验的效果也没有普适性。在此情况下,OGB(Open Graph Benchmark)应运而生:

权威性高:OGB 是由斯坦福大学图神经网络权威 Jure Leskovec 教授团队建立的大规模图学习任务的评测基准数据集,指导委员会包含 Yoshua Bengio、Will Hamilton、Max Welling 等业界大牛。Jure Leskovec 教授在 NeurlPS 2019大会的演讲中正式对外发布 OGB 并开源,是目前公认最权威的图学习相关基准测试数据集。
数据丰富:OGB 面向不同的图学习任务(包括节点分类,边预测,图分类)分别提供了多个数据集,如学术引用网络、知识图谱、分子图、生物网络等。其中最热门的三个半监督节点分类数据集:商品推荐 ogbn-products、论文引用 ogbn-arxiv 和化学分子 ogbn-proteins,对图神经网络研究者有极强的吸引力。
夺榜激烈:OGB 吸引了包括斯坦福、纽约大学、加州大学洛杉矶分校、康奈尔大学、亚马逊等多个机构参与打榜;榜单上也诞生了层出不穷的新颖图神经网络结构,如堆积112层的深度图卷积网络 DeeperGCN,发表在 ICML 2020的多层图网络 GCNII,还有多种形式不同的图采样算法
近日,百度 PGL 团队创新提出统一消息传递图神经网络模型 UniMP,在三大半监督节点分类数据集均荣登榜首。榜单上放出的开源代码与论文地址如下:

UniMP开源代码地址
https://github.com/PaddlePadd...

UniMP论文地址
https://arxiv.org/pdf/2009.03...

UniMP:统一消息传递模型

在半监督图节点分类场景下,节点之间通过边相连接,部分节点被打上标签。任务要求模型通过监督学习的方式,拟合被标注节点数据,并对未标注的节点进行预测。如下图所示,在一般机器学习的问题上,已标注的训练数据在新数据的推断上,并不能发挥直接的作用,因为数据的输入是独立的。然而在图神经网络的场景下,已有的标注数据可以从节点与节点的连接中,根据图结构关系推广到新的未标注数据中。

一般应用于半监督节点分类的算法分为图神经网络和标签传递算法两类,它们都是通过消息传递的方式(前者传递特征、后者传递标签)进行节点标签的学习和预测。其中经典标签传递算法如 LPA,只考虑了将标签在图上进行传递,而图神经网络算法大多也只是使用了节点特征以及图的链接信息进行分类。但是单纯考虑标签传递或者节点特征都是不足够的。

百度 PGL 团队提出的统一消息传递模型 UniMP,将上述两种消息统一到框架中,同时实现了节点的特征与标签传递,显著提升了模型的泛化效果。UniMP 以 Graph Transformer 模型作为基础骨架,联合使用标签嵌入方法,将节点特征和部分节点标签同时输入至模型中,从而实现了节点特征和标签的同时传递。

简单的加入标签信息会带来标签泄漏的问题,即标签信息即是特征又是训练目标。实际上,标签大部分是有顺序的,例如在引用网络中,论文是按照时间先后顺序出现的,其标签也应该有一定的先后顺序。在无法得知训练集标签顺序的情况下,UniMP 提出了标签掩码学习方法。UniMP 每一次随机将一定量的节点标签掩码为未知,用部分已有的标注信息、图结构信息以及节点特征来还原训练数据的标签。最终,UniMP 在 OGB 上取得 SOTA 效果,并在论文的消融实验上,验证了方法的有效性。

屠榜背后:飞桨图学习框架 PGL 加持

UniMP 基于飞桨图学习框架 PGL(Paddle Graph Learning)实现,依托飞桨核心框架以及自研的图引擎。PGL 支持十亿节点百亿边的超巨图训练,原生支持异构图 Metapath 采样以及 Message Passing 双模式,预置多种业界主流图学习算法以及自研模型如 ERNIESage、UniMP 等,方便开发者熟悉和使用图神经网络领域模型。

飞桨 PGL 已经在搜索、广告、信息流、金融风控、贴吧、用户画像、智能地图等场景全面落地,可支持百亿巨图场景。图学习作为通用人工智能算法之一,势必成为这个时代新的基础设施,赋能各行各业,助燃智能经济腾飞。

PGL 获得喜人成绩,背后离不开强有力的后盾——飞桨。飞桨是我国首个开源开放、功能完备的产业级深度学习平台,向下对接芯片,能够和芯片进行软硬一体的优化,向上支撑各种应用,助力技术创新和业务发展,可以说是“智能时代的操作系统”。近期,飞桨动态图和 API 体系全面升级,让开发者可以更便捷地开发、更高效地部署模型。

百度希望有志之士加入 PGL,一起共建未来。PGL 代码完全开源开放,欢迎欢迎开发者们使用并贡献您的奇思妙想。如果您觉得还不错,欢迎“Star”;如果您有意见需要交流,欢迎“Issue”,PGL 开源代码和入门教程链接:

PGL 开源代码
https://github.com/PaddlePadd...
图学习入门教程
https://aistudio.baidu.com/ai...

审核编辑:符乾江

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 百度
    +关注

    关注

    9

    文章

    2401

    浏览量

    95391
  • 人工智能
    +关注

    关注

    1821

    文章

    50547

    浏览量

    267923
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度Create 2026发布“百度胜算”

    近期,百度Create 2026开发者大会如期召开,百度创始人李彦宏抛出一个足以撼动行业的新概念: **DAA(日活智能体数,Daily Active Agents)** ,并宣布将以这把"
    的头像 发表于 05-17 09:47 1512次阅读

    百度智能云正式发布Hogee

    5月13日,在Create2026百度AI开发者大会上,百度智能云正式发布了一款全新的企业一站式AI营销应用——Hogee。这款产品的亮相,标志着百度智能云在AI营销领域迈出了重要一步,也为企业营销效率的提升提供了一个全新的解决
    的头像 发表于 05-15 09:18 836次阅读

    瀚博半导体宣布深度参与百度黑客松生态活动

    近日,瀚博半导体正式宣布深度参与百度主办的黑客松生态活动。面向全球开发者开放旗下载天系列加速卡开发环境,支持部署百度文心ERNIE-4.5 系列开源模型与PP-OCRv4 文档理解
    的头像 发表于 04-11 09:41 822次阅读

    沐曦股份与百度黑客松硬核赛题来袭

    沐曦股份作为黑客松第十期文心合作伙伴赛道核心出题方之一,携专属赛题「优化 PaddleOCR-VL-1.5+MetaX GPU」重磅来袭,邀全球开发者共探深度学习框架与国产GPU的软硬协同优化之道,用代码解锁智能文字识别的性
    的头像 发表于 04-02 09:20 538次阅读
    沐曦股份与<b class='flag-5'>百度</b><b class='flag-5'>飞</b><b class='flag-5'>桨</b>黑客松硬核赛题来袭

    百度文心衍生模型PaddleOCR登顶GitHub Star OCR全球第一

    3月30日,百度文心衍生模型PaddleOCR在GitHub上的Star数突破73.3K,超越谷歌Tesseract OCR,成为全球Star数最高的OCR项目。
    的头像 发表于 03-31 11:40 587次阅读

    百度萝卜快跑入选Fast Company 2026年最具创新力企业榜单

    今天,《Fast Company》2026年“最具创新力企业”榜单正式公布。百度凭萝卜快跑(Apollo Go)入选Automotive类别全球第二,成为唯一进入该榜单前三的中国企业。
    的头像 发表于 03-25 11:32 690次阅读

    百度正式发布并开源新一代文档解析模型PaddleOCR-VL-1.5

    1 月 29 日,百度正式发布并开源新一代文档解析模型 PaddleOCR-VL-1.5。该模型以仅 0.9B 参数的轻量架构,在全球权威文档解析评测榜单 OmniDocBench V1.5 中取得
    的头像 发表于 01-30 10:03 916次阅读
    <b class='flag-5'>百度</b>正式发布并开源新一代文档解析模型PaddleOCR-VL-1.5

    神经网络的初步认识

    日常生活中的智能应用都离不开深度学习,而深度学习则依赖于神经网络的实现。什么是神经网络神经网络的核心思想是模仿生物神经系统的结构,特别是大脑中神经
    的头像 发表于 12-17 15:05 536次阅读
    <b class='flag-5'>神经网络</b>的初步认识

    百度世界2025进行中 百度昆仑芯超节点亮相 性能巨幅提升

    百度世界大会是百度每年面向行业、媒体、合作伙伴和广大用户的最高级别盛事,作为百度年度最重要的的战略、技术、产品发布会,自2006年以来已连续举办19年,持续为行业搭建起交流前沿技术、碰撞创新
    的头像 发表于 11-13 11:51 1576次阅读

    CNN卷积神经网络设计原理及在MCU200T上仿真测试

    数的提出很大程度的解决了BP算法在优化深层神经网络时的梯度耗散问题。当x&gt;0 时,梯度恒为1,无梯度耗散问题,收敛快;当x&lt;0 时,该层的输出为0。 CNN
    发表于 10-29 07:49

    NMSIS神经网络库使用介绍

    (q7_t) 和 16 位整数 (q15_t)。 卷积神经网络示例: 本示例中使用的 CNN 基于来自 Caffe 的 CIFAR-10 示例。神经网络3 个卷积层组成,中间散布着 ReLU
    发表于 10-29 06:08

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    本帖欲分享在Ubuntu20.04系统中训练神经网络模型的一些经验。我们采用jupyter notebook作为开发IDE,以TensorFlow2为训练框架,目标是训练一个手写数字识别的神经网络
    发表于 10-22 07:03

    液态神经网络(LNN):时间连续性与动态适应性的神经网络

    1.算法简介液态神经网络(LiquidNeuralNetworks,LNN)是一种新型的神经网络架构,其设计理念借鉴自生物神经系统,特别是秀丽隐杆线虫的神经结构,尽管这种微生物的
    的头像 发表于 09-28 10:03 1724次阅读
    液态<b class='flag-5'>神经网络</b>(LNN):时间连续性与动态适应性的<b class='flag-5'>神经网络</b>

    神经网络的并行计算与加速技术

    随着人工智能技术的飞速发展,神经网络在众多领域展现出了巨大的潜力和广泛的应用前景。然而,神经网络模型的复杂和规模也在不断增加,这使得传统的串行计算方式面临着巨大的挑战,如计算速度慢、训练时间长等
    的头像 发表于 09-17 13:31 1386次阅读
    <b class='flag-5'>神经网络</b>的并行计算与加速技术

    商汤日日新V6.5多模态大模型登顶全球权威榜单

    根据权威评测平台OpenCompass多模态大模型学术榜单(Multi-modal Academic Leaderboard)最新数据显示,商汤「日日新 V6.5」(SenseNova-V6.5
    的头像 发表于 09-10 09:55 1051次阅读