全面阐述GNN及其方法和应用,深度学习的最大软肋是什么？-电子发烧友网

深度学习无法进行因果推理，而图模型(GNN)或是解决方案之一。清华大学孙茂松教授组发表综述论文，全面阐述GNN及其方法和应用，并提出一个能表征各种不同GNN模型中传播步骤的统一表示。文中图表，建议高清打印过塑贴放手边作参考。

深度学习的最大软肋是什么？

这个问题的回答仁者见仁，但图灵奖得主Judea Pearl大概有99.9%的几率会说，是无法进行因果推理。

对于这个问题，业界正在进行积极探索，而其中一个很有前景的方向就是图神经网络(Graph Neural Network, GNN)。

最近，清华大学孙茂松教授组在 arXiv 发布了论文Graph Neural Networks: A Review of Methods and Applications，作者对现有的GNN模型做了详尽且全面的综述。

“图神经网络是连接主义与符号主义的有机结合，不仅使深度学习模型能够应用在图这种非欧几里德结构上，还为深度学习模型赋予了一定的因果推理能力。”论文的共同第一作者周界说。

“在深度学习方法的鲁棒性与可解释性受到质疑的今天，图神经网络可能为今后人工智能的发展提供了一个可行的方向。”

GNN最近在深度学习领域受到了广泛关注。然而，对于想要快速了解这一领域的研究人员来说，可能会面临着模型复杂、应用门类众多的问题。

“本文希望为读者提供一个更高层次的视角，快速了解GNN领域不同模型的动机与优势。”周界告诉新智元：“同时，通过对不同的应用进行分类，方便不同领域的研究者快速了解将GNN应用到不同领域的文献。”

毫不夸张地说，论文中的图表对于想要了解学习GNN乃至因果推理等方向的研究者来说，简直应该高清打印过塑然后贴在墙上以作参考——

GNN的各种变体，通过比对各自的 aggregator & updater，就能轻松分辨不同的GNN模型。这只是这篇综述强大图表的一个示例。

想要快速了解GNN，看这篇文章绝对没错

在内容上，模型方面，本文从GNN原始模型的构建方式与存在的问题出发，介绍了对其进行不同改进的GNN变体，包括如何处理不同的图的类型、如何进行高效的信息传递以及如何加速训练过程。最后介绍了几个近年来提出的通用框架，它们总结概括了多个现有的方法，具有较强的表达能力。

在应用上，文章将GNN的应用领域分为了结构化场景、非结构化场景以及其他场景并介绍了诸如物理、化学、图像、文本、图生成模型、组合优化问题等经典的GNN应用。

典型应用场景介绍

文章最后提出了四个开放性问题，包括如何处理堆叠多层GNN造成的平滑问题，如何处理动态变化的图结构，如何使用通用的方法处理非结构化的数据以及如何将其扩展到更大规模的网络上。

作者还整理了一个GNN论文列表：

https://github.com/thunlp/GNNPapers

原始GNN及其局限性

GNN的概念首先是在F. Scarselli等人的论文The graph neural network model（F. Scarselli et. al. 2009）中提出的。在这里，我们描述了原始的GNN，并列举了原始GNN在表示能力和训练效率方面的局限性。

接着，我们介绍了几种不同的GNN变体，这些变体具有不同的图形类型，利用不同的传播函数和训练方法。

最后，我们介绍了三个通用框架，分别是message passing neural network (MPNN)，non-local neural network (NLNN)，以及graph network(GN)。MPNN结合了各种图神经网络和图卷积网络方法；NLNN结合了几种“self-attention”类型的方法；而图网络GN可以概括本文提到的几乎所有图神经网络变体。

图神经网络

如前所述，图神经网络(GNN)的概念最早是Scarselli等人在2009年提出的，它扩展了现有的神经网络，用于处理图(graph)中表示的数据。在图中，每个节点是由其特性和相关节点定义的。

虽然实验结果表明，GNN是建模结构化数据的强大架构，但原始GNN仍存在一些局限性。

首先，对于固定节点，原始GNN迭代更新节点的隐藏状态是低效的。如果放宽了固定点的假设，我们可以设计一个多层的GNN来得到节点及其邻域的稳定表示。

其次，GNN在迭代中使用相同的参数，而大多数流行的神经网络在不同的层中使用不同的参数，这是一种分层特征提取方法。此外，节点隐藏状态的更新是一个顺序过程，可以从RNN内核(如GRU 和 LSTM)中获益。

第三，在边上也有一些无法在原始GNN中建模的信息特征。此外，如何学习边的隐藏状态也是一个重要的问题。

最后，如果我们把焦点放在节点的表示上而不是图形上，就不适合使用固定点，因为在固定点上的表示的分布在数值上是平滑的，区分每个节点的信息量也比较少。

图神经网络的变体

在这一节，我们提出图神经网络的几种变体。首先是在不同图类型上运行的变体，这些变体扩展了原始模型的表示能力。其次，我们列出了在传播步骤进行修改（卷积、门机制、注意力机制和skip connection）的几种变体，这些模型可以更好地学习表示。最后，我们描述了使用高级训练方法的标题，这些方法提高了训练效率。

图2概述了GNN的不同变体。

一览GNN的不同变体

图的类型(Graph Types)

在原始GNN中，输入的图由带有标签信息的节点和无向的边组成，这是最简单的图形格式。然而，世界上有许多不同的图形。这里，我们将介绍一些用于建模不同类型图形的方法。

图类型的变体

有向图(Directed Graphs )

图形的第一个变体是有向图。无向边可以看作是两个有向边，表明两个节点之间存在着关系。然而，有向边比无向边能带来更多的信息。例如，在一个知识图中，边从head实体开始到tail实体结束，head实体是tail实体的父类，这表明我们应该区别对待父类和子类的信息传播过程。有向图的实例有ADGPM (M. Kampffmeyer et. al. 2018)。

异构图(Heterogeneous Graphs)

图的第二个变体是异构图，异构图有几种类型的节点。处理异构图最简单的方法是将每个节点的类型转换为与原始特征连接的一个one-hot特征向量。异构图如GraphInception。

带边信息的图(Edge-informative Graph)

图的另外一个变体是，每条边都有信息，比如权值或边的类型。例如G2S和R-GCN。

使用不同训练方法的图变体

训练方法变体

在传播步骤进行修改的GNN变体

传播步骤变体

GNN的三大通用框架

除了图神经网络的不同变体之外，我们还介绍了几个通用框架，旨在将不同的模型集成到一个框架中。

J. Gilmer等人(J. Gilmer et. al. 2017)提出了消息传递神经网络(message passing neural network， MPNN)，统一了各种图神经网络和图卷积网络方法。

X. Wang等人(X. Wang et. al. 2017)提出了非局部神经网络(non-local neural network, NLNN)，它结合了几种“self-attention”风格的方法。

P. W. Battaglia等人(P. W. Battaglia et. al. 2018)提出了图网络(graph network, GN)，它统一了统一了MPNN和NLNN方法以及许多其他变体，如交互网络(Interaction Networks)，神经物理引擎(Neural Physics Engine)，CommNet，structure2vec，GGNN，关系网络(Relation Network)，Deep Sets和Point Net。

几个尚未解决的问题

尽管GNN在不同领域取得了巨大成功，但值得注意的是，GNN模型还不能在任何条件下，为任何图任务提供令人满意的解决方案。这里，我们将陈述一些开放性问题以供进一步研究。

浅层结构

传统的深度神经网络可以堆叠数百层，以获得更好的性能，因为更深的结构具备更多的参数，可以显著提高网络的表达能力。然而，GNN总是很浅，大多数不超过三层。

实验显示，堆叠多个GCN层将导致过度平滑，也就是说，所有顶点将收敛到相同的值。尽管一些研究人员设法解决了这个问题，但这仍然是GNN的最大局限所在。设计真正的深度GNN对于未来的研究来说是一个令人兴奋的挑战，并将对进一步深入理解GNN做出相当大的贡献。

动态图形另一个具有挑战性的问题是如何处理具有动态结构的图形。静态图总是稳定的，因此对其进行建模是可行的，而动态图引入了变化的结构。当边和节点出现或消失时，GNN不能自适应地做出改变。目前对动态GNN的研究也在积极进行中，我们认为它是一般GNN的具备稳定性和自适应性的重要里程碑。

非结构性场景

我们讨论了GNN在非结构场景中的应用，但我们没有找到从原始数据中生成图的最佳方法。在图像域中，一些研究可以利用CNN获取特征图，然后对其进行上采样，形成超像素作为节点，还有的直接利用一些对象检测算法来获取对象节点。在文本域中，有些研究使用句法树作为句法图，还有的研究采用全连接图。因此，关键是找到图生成的最佳方法，使GNN在更广泛的领域发挥更大的作用。

可扩展性问题

如何将嵌入式算法应用于社交网络或推荐系统这类大规模网络环境，是几乎所有图形嵌入算法面对的一个致命问题，GNN也不例外。对GNN进行扩展是很困难的，因为涉及其中的许多核心流程在大数据环境中都要消耗算力。

这种困难体现在几个方面：首先，图数据并不规则，每个节点都有自己的邻域结构，因此不能批量化处理。其次，当存在的节点和边数量达到数百万时，计算图的拉普拉斯算子也是不可行的。此外，我们需要指出，可扩展性的高低，决定了算法是否能够应用于实际场景。目前已经有一些研究提出了解决这个问题的办法，我们正在密切关注这些新进展。

结论

在过去几年中，GNN已经成为图领域机器学习任务的强大而实用的工具。这一进展有赖于表现力，模型灵活性和训练算法的进步。在本文中，我们对图神经网络进行了全面综述。对于GNN模型，我们引入了按图类型、传播类型和训练类型分类的GNN变体。

此外，我们还总结了几个统一表示不同GNN变体的通用框架。在应用程序分类方面，我们将GNN应用程序分为结构场景、非结构场景和其他18个场景，然后对每个场景中的应用程序进行详细介绍。最后，我们提出了四个开放性问题，指出了图神经网络的主要挑战和未来的研究方向，包括模型深度、可扩展性、动态图处理和对非结构场景的处理能力。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4572

浏览量
98746
深度学习

深度学习

+关注

关注
73

文章
5237

浏览量
119908

原文标题：CNN已老，GNN来了！清华大学孙茂松组一文综述GNN

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

图神经网络概述第三弹：来自IEEE Fellow的GNN综述

本文来源：机器之心编译作者：Zonghan Wu 图神经网络（GNN）热度持续上升，之前我们曾介绍了清华两篇综述论文，参见：深度学习时代的图模型，清华发文综述图网络，和清华大学图神经网络综述：模型

发表于 01-10 10:26 •1.2w次阅读

图神经网络概述第三弹：来自IEEE Fellow的<b class='flag-5'>GNN</b>综述

基于深度学习的三维点云配准方法

基于深度学习的三维点云配准方法成为研究的主流，并随之诞生了DeepVCP、DGR、Predator等著名的方法。

发表于 11-29 11:41 •1396次阅读

深度学习的改进方法

深度学习如何改进（一）

发表于 07-01 16:46

机器学习实战：GNN加速器的FPGA解决方案

的提升，对传统的机器学习算法设计以及其实现技术带来了严峻的挑战。在此背景之下，诸多基于Graph的新型机器学习算法—GNN（图神经网络），在学术界和产业界不断的涌现出来。

发表于 10-20 09:48

人工智能AI-深度学习C#&LabVIEW视觉控制演示效果

不断变化的，因此深度学习是人工智能AI的重要组成部分。可以说人脑视觉系统和神经网络。2、目标检测、目标跟踪、图像增强、强化学习、模型压缩、视频理解、人脸技术、三维视觉、SLAM、GAN、GNN

发表于 11-27 11:54

扩大软件定义无线电动态范围的方法是什么？

扩大软件定义无线电动态范围的方法是什么？

发表于 05-20 06:03

GNN（图神经网络）硬件加速的FPGA实战解决方案

，对传统的机器学习算法设计以及其实现技术带来了严峻的挑战。在此背景之下，诸多基于Graph的新型机器学习算法—GNN（图神经网络），在学术界和产业界不断的涌现出来。

发表于 07-07 08:00

异常检测的深度学习：一项调查（翻译）精选资料分享

摘要异常检测是一个重要的问题，在不同的研究领域和应用领域都得到了充分的研究。本调查的目的有两个方面，首先我们对基于深度学习的异常检测的研究方法进行了结构化和全面的概述。此外，我们回顾了

发表于 07-12 08:05

基于深度学习的异常检测的研究方法

的研究方法进行了系统而全面的综述。此外，我们回顾了这些方法在不同应用领域中的应用，并评估了它们的有效性。我们根据所采用的基本假设和方法，将最先进的深

发表于 07-12 07:10

基于深度学习的异常检测的研究方法

ABSTRACT1.基于深度学习的异常检测的研究方法进行结构化和全面的概述2.回顾这些方法在各个领域这个中的应用情况，并评估他们的有效性。3

发表于 07-12 06:36

什么是深度学习？使用FPGA进行深度学习的好处？

，即使使用具有一定低位宽的数据，深度学习推理也不会降低最终精度。目前据说8位左右可以提供稳定的准确率，但最新的研究表明，已经出现了即使降低到4位或2位也能获得很好准确率的模型和学习方法，越来越多的正在

发表于 02-17 16:56

人工智能的两面性认知深度学习或成软肋

人工智能技术足以惊艳世人眼球，但是任何事物都具备双面性，人工智能也存在诸多安全隐患，随着技术的提升，人们发现深度学习或将成人工智能安全软肋，它存在安全盲点。

发表于 02-24 15:58 •4556次阅读

如何解决数据稀疏而对深度学习的影响问题？详细方法概述

学习带来的红利了么？近日来自卡内基梅隆大学、亚马逊研究院、加州理工学院的研究员，在人工智能顶级会议 UAI 上阐述了多种方法，尝试缓解甚至解决数据稀疏对深度

发表于 08-12 11:49 •1.9w次阅读

全面回顾Graph深度学习，一文看尽GNN、GCN、GAE、GRNN、GRL

不规则域(Irregular domain)。与图像、音频、文本等具有清晰网格结构的数据不同，图处于不规则的域中，使得很难将一些基本的数学运算推广到图中。例如，卷积神经网络(CNN)中的基本操作“卷积”和“池化”，在图数据中并不能直接地定义。这通常被称为几何深度学习问题。

发表于 02-04 08:46 •8.3w次阅读

基于深度学习的行为识别算法及其应用

基于深度学习的行为识别算法及其应用

发表于 06-16 14:56 •20次下载

搜索历史

全面阐述GNN及其方法和应用,深度学习的最大软肋是什么？

评论

图神经网络概述第三弹：来自IEEE Fellow的GNN综述

基于深度学习的三维点云配准方法

深度学习的改进方法

机器学习实战：GNN加速器的FPGA解决方案

人工智能AI-深度学习C#&LabVIEW视觉控制演示效果

扩大软件定义无线电动态范围的方法是什么？

GNN（图神经网络）硬件加速的FPGA实战解决方案

异常检测的深度学习：一项调查（翻译）精选资料分享

基于深度学习的异常检测的研究方法

基于深度学习的异常检测的研究方法

什么是深度学习？使用FPGA进行深度学习的好处？

人工智能的两面性认知深度学习或成软肋

如何解决数据稀疏而对深度学习的影响问题？详细方法概述

全面回顾Graph深度学习，一文看尽GNN、GCN、GAE、GRNN、GRL

基于深度学习的行为识别算法及其应用