0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

图深度学习与曾经风靡一时的流形学习有何关系?

智能感知与物联网技术研究所 来源:通信信号处理研究所 作者:通信信号处理研究 2020-10-30 17:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如今引领风潮的图深度学习与曾经风靡一时的流形学习有何关系?请看本文娓娓道来。

神经网络利用关系的归纳偏置获取以图的形式存在的数据。然而,在很多情况下,我们并没有现成的可用的图。

那么,在这种情况下,是否还仍然还可以应用图深度学习呢?在本文中,伦敦帝国理工学院和卢加诺大学的教授Michael Bronstein对近期关于隐图学习的工作和以前的流形学习技术进行了比较。

在过去的几年里,人们对用于图结构数据的机器学习方法的研究兴趣大增。这类数据自然而然地出现在社会科学(例如,Twitter 或 Facebook 上的用户关注图)、化学(分子可以被建模为原子通过化学键相连的图)、生物(不同生物分子之间的交互作用通常被建模为一个被称为「相互作用组」的图)等应用场景下。

图神经网络(GNN)是一类当下非常流行的方法,它们通过共享参数的局部操作对图进行学习,这些操作会在相邻节点之间交换信息。然而,在某些场景下,我们并不能奢求拥有一个作为输入的图。这种情况在许多生物学问题中屡见不鲜,在最好的情况下,由于发现交互作用的实验开销相当大并且充满噪声,「蛋白质-蛋白质」交互网络等图往往也只有部分数据被观测到。

因此,我们对于根据数据推理出图并且将图神经网络应用在该图上十分感兴趣,在本文中,我们将这一过程称为「隐图学习」(latent graph learning)。

隐图可能是面向特定应用的,并且针对下游任务进行了优化。此外,由于这样的图可能会传达关于数据的重要理解并提供解释某些结论的方式,有时它们可能甚至会比任务本身更加重要。我们可以将隐图学习看做学习一个带有空边集的图。

在这种情况下,输入为一些高维特征空间中的点云。

与 PointNet 等针对集合的深度学习方法(它们将一些共享的、可学习的点层面函数应用于每个节点上)不同,我们还试图在点之间传递信息。这是通过在一个根据点特征本身构建的图上传递消息实现的。

本文介绍的第一种此类架构为 MIT 的 Yue Wang 研发的「动态图卷积网络」(DGCNN,这篇论文在计算图形学研究社区十分有名,并常常被用作点云方法的对比基线)。

受到计算图形学领域中进行 3D 点云分析的工作的启发,DGCNN 试图将图用作点云底层的局部平滑流形结构的一种粗糙的表征。

Yue Wang 观察到的一个关键结论是,在整个神经网络的处理过程中,该图并不需要保持不变。而且事实上,顾名思义,「动态图卷积网络」可以、也应该被动态地更新。图 1 说明了 DGCNN 在计算图形学中十分有用的原因:

图 1:动态图卷积网络利用飞机图像构建了一个被用于特征传播的 K 最近邻图。这种图依赖于特定的任务,会被每一层网络更新。

图中的不同颜色表明了点距离红点的距离(黄色表示与红点距离较近的点)。

本图说明在分割任务中,较深的层中的图捕获了语义关系(例如,一对翅膀、飞机引擎等)而不是几何关系。

DGCNN 其中的一个不足之处在于,它使用了同一个空间构建图以及图上的特征。如图 2 所示,在慕尼黑工业大学的 Anees Kazi 与 Luca Cosmo 近期发表的工作中,作者提出了一种名为「可微图模块」(DGM)的新型架构,它通过将构建图和构建特征的过程解耦对 DGCNN 进行了扩展:

图 2:可微图模块(DGM)提出了一种构建图及其特征的机制,从而利用输入数据在图上进行信息传播。

在被用于医学领域的问题(例如,根据脑成像数据预测疾病)时,DGM 表现出了非常优异的性能。在这些任务中,我们拥有包括人口统计学特征(例如,年龄、性别等)、脑成像特征在内的多个病人的电子病历数据,并试图预测某个病人是否患有神经系统疾病。

论文「Disease prediction using graph convolutional networks: application to autism spectrum disorder and Alzheimer’s disease 」使用在一个根据人口统计学特征手动构建的「患者图」上的信息传播将 GNN 应用于此类任务。

DGM 在学习图的任务上具有一定优势,它可能传达了对于某些特征如何在特定的诊断任务中互相依赖的理解。除此之外,DGM 还在点云分类任务中稍稍优于 DGCNN。

DGCNN 和 DGM 在概念上与一类被称为「流形学习」或「非线性降维」相似,这类方法在 2000 年代时是机器学习领域中非常流行的课题,并且至今仍然被用于数据可视化。

流形学习的基本假设是:数据有一种内在的低维结构。

如下图所示,尽管我们可以在某个空间中使用数百个甚至数千个维度表征数据,但数据的自由度实际上也许是十分有限的:

图 3:尽管在这个数据集中的手的图像是高维的(64*64=4,096 维),但是他们本质上是低维的,而且可以通过仅仅两个自由度来解释:手腕的旋转和手指的延伸情况。

流形学习算法可以捕获数据集的这种低维的内在结构,并且在欧氏空间中表征它。该图取自论文「A Global Geometric Framework for Nonlinear Dimensionality Reduction」的补充材料。

流形学习旨在通过底层的「流形」(严格地说,这里指的并不是微分几何意义上的术语「流形」,例如不同的点上的局部维度可能不同。

然而,使用这种比喻较为方便。)捕获这些自由度,并且将数据的维度降到其本质的维度上。

流形学习与 PCA 等线性降维方式的重要区别在于,由于数据的非欧结构,用线性投影的方式恢复出流形是不可能的:

图 4:线性降维(左图)vs 流形学习。Joshua Tenenbaum 创造的「Swiss roll」曲面及其 1D 展开形式在流形学习论文中经常被用作示例。

各种流形学习算法的不同之处在于它们恢复「流形」的方式,但它们的大致框架相同。首先,它们会创建一种数据的表征,通常这是通过构建一个捕获了局部结构的 k 最近邻图完成的。接着,它们会计算一种数据的低维表征(嵌入),并试图保留原始数据的结构。

而这一步正是大多数流形学习方法各不相同的地方。

例如,Isomap试图保留图的测地线距离;局部线性嵌入找到了一种邻接点的局部表征;而拉普拉斯特征映射使用了图拉普拉斯算子的特征函数作为低维嵌入。这种新的表征将原始的非欧结构「展平」到了一个易于处理的欧氏空间中。

最后,一旦我们计算出表征,就可以将某种机器学习算法(通常为聚类算法)应用于该表征上。

图 5:流形学习方法的框架:首先,将数据表征为一个图。接着,计算出该图的低维嵌入。最后,将某种机器学习算法应用于该低维表征上。

该过程也存在着一些挑战,例如:构建图的过程与应用机器学习算法的过程是解耦的,有时还需要进行精细的参数调优(如近邻节点的数量或邻域半径),从而确定如何构建图,使得下游任务表现优异。

也许,流形学习算法的一个更为严重的缺点是,数据很少表现为低维的原始形式。

例如,当我们处理图像时,需要在预处理步骤中使用各种手动构造的特征提取技术。

图深度学习通过使用一个图神经网络代替这个三阶段的过程为其提供了一种现代化的视角。

例如,在动态图卷积网络或 DGM 中,构建图和学习的过程都是同一个架构中的某一部分:

图 6:可以将隐图学习看做一种现代环境下的流形学习问题,其中将图作为一个端到端的 GNN 工作流程的一部分进行学习,并为某些下游任务对其进行优化。

这类方法吸引人的地方在于,它们可以将处理单个数据点的过程与处理它们所在空间的过程在同一个工作流程中结合起来。

以图像为例,我们可以使用传统的卷积神经网络从每张图像中提取视觉特征,并且使用图神经网络建模它们之间的关系。

Jan Svoboda 在论文「 PeerNets: Exploiting peer wisdom against adversarial attacks」中用到了这种方法,他为卷积神经网络提出了一种基于图的正则化层「PeerNet」,它可以实现在多张图像之间交换信息。

PeerNet 与非局部(Non-local)均值滤波器在它们从多个位置聚合信息的方式上有一些相似之处,而 PeerNet 的不同之处在于它从多张图像而不是单张图像中聚合信息。

这种正则化技术显著地降低了对抗性干扰的影响,而标准的卷积神经网络则很容易受其影响。

图 7:PeerNet 是一种标准的卷积神经网络中的基于图的正则化层,它从多张图像中聚合相似的像素,从而降低对于对抗性干扰的敏感度。隐图学习还有许多其它有趣的应用,小样本学习便是其中之一。

在小样本学习中,基于图的技术可以帮助使用少量示例训练的模型泛化。如今,由于数据标注的开销十分巨大,小样本学习在计算机视觉领域变得越来越重要。生物学是隐图学习另一个重要的应用场景,人们通常通过实验观察蛋白质等生物分子的表达水平,并试图重建它们的相互作用和信息传递网络。

此外,隐图学习还可以被用于对物理系统的分析,其中图可以描述多个物体之间的相互作用。具体而言,研究复杂粒子相互作用的高能物理学家们近期对基于图的方法展现出了浓厚的兴趣。最后,隐图学习在自然语言处理(NLP)领域中也得到了重要的应用,其中图神经网络可以被看做 Transformer 架构的拓展。

许多上述的任务也提出了引入图结构的先验知识的问题,这仍然是一个有待解决的开放性问题:例如,我们也许会希望迫使图遵循某些特定的构建规则,或者与某些统计模型兼容。

在论文「Learning deep generative models of graphs」中,作者在严格遵循某些构建规则的情况下,生成化学键的分子结构图。我们相信,尽管隐图学习并不是一个完全新颖的概念,但是它为一些老的问题提供了新的视角。

它肯定是一种有趣的图机器学习问题,为图神经网络的研究者们提供了新的舞台。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7314

    浏览量

    93957
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136223
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123896

原文标题:“看不见”的图深度学习=流形学习 2.0?

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何深度学习机器视觉的应用场景

    深度学习视觉应用场景大全 工业制造领域 复杂缺陷检测:处理传统算法难以描述的非标准化缺陷模式 非标产品分类:对形状、颜色、纹理多变的产品进行智能分类 外观质量评估:基于学习的外观质量标准判定 精密
    的头像 发表于 11-27 10:19 46次阅读

    如何在机器视觉中部署深度学习神经网络

    1:基于深度学习的目标检测可定位已训练的目标类别,并通过矩形框(边界框)对其进行标识。 在讨论人工智能(AI)或深度学习时,经常会出现“
    的头像 发表于 09-10 17:38 677次阅读
    如何在机器视觉中部署<b class='flag-5'>深度</b><b class='flag-5'>学习</b>神经网络

    深度学习对工业物联网哪些帮助

    、实施路径三个维度展开分析: 深度学习如何突破工业物联网的技术瓶颈? 1. 非结构化数据处理:解锁“沉睡数据”价值 传统困境 :工业物联网中70%以上的数据为非结构化数据(如设备振动波形、红外图像、日志文本),传统方法难以
    的头像 发表于 08-20 14:56 756次阅读

    自动驾驶中Transformer大模型会取代深度学习吗?

    [首发于智驾最前沿微信公众号]近年来,随着ChatGPT、Claude、文心言等大语言模型在生成文本、对话交互等领域的惊艳表现,“Transformer架构是否正在取代传统深度学习”这
    的头像 发表于 08-13 09:15 3913次阅读
    自动驾驶中Transformer大模型会取代<b class='flag-5'>深度</b><b class='flag-5'>学习</b>吗?

    深度学习遇上嵌入式资源困境,特征空间如何破局?

    近年来,随着人工智能(AI)技术的迅猛发展,深度学习(Deep Learning)成为最热门的研究领域之。在语音识别、图像识别、自然语言处理等领域,深度
    发表于 07-14 14:50 1114次阅读
    当<b class='flag-5'>深度</b><b class='flag-5'>学习</b>遇上嵌入式资源困境,特征空间如何破局?

    使用MATLAB进行无监督学习

    无监督学习种根据未标注数据进行推断的机器学习方法。无监督学习旨在识别数据中隐藏的模式和关系,无需任何监督或关于结果的先验知识。
    的头像 发表于 05-16 14:48 1160次阅读
    使用MATLAB进行无监督<b class='flag-5'>学习</b>

    嵌入式AI技术之深度学习:数据样本预处理过程中使用合适的特征变换对深度学习的意义

      作者:苏勇Andrew 使用神经网络实现机器学习,网络的每个层都将对输入的数据做次抽象,多层神经网络构成深度学习的框架,可以深度理解数
    的头像 发表于 04-02 18:21 1280次阅读

    用树莓派搞深度学习?TensorFlow启动!

    介绍本页面将指导您在搭载64位Bullseye操作系统的RaspberryPi4上安装TensorFlow。TensorFlow是个专为深度学习开发的大型软件库,它消耗大量资源。您可以在
    的头像 发表于 03-25 09:33 959次阅读
    用树莓派搞<b class='flag-5'>深度</b><b class='flag-5'>学习</b>?TensorFlow启动!

    如何排除深度学习工作台上量化OpenVINO™的特定层?

    无法确定如何排除要在深度学习工作台上量化OpenVINO™特定层
    发表于 03-06 07:31

    SLAMTEC Aurora:把深度学习“卷”进机器人日常

    在人工智能和机器人技术飞速发展的今天,深度学习与SLAM(同步定位与地图构建)技术的结合,正引领着智能机器人行业迈向新的高度。最近科技圈顶流DeepSeek简直杀疯了!靠着逆天的深度学习
    的头像 发表于 02-19 15:49 721次阅读

    军事应用中深度学习的挑战与机遇

    人工智能尤其是深度学习技术的最新进展,加速了不同应用领域的创新与发展。深度学习技术的发展深刻影响了军事发展趋势,导致战争形式和模式发生重大变化。本文将概述
    的头像 发表于 02-14 11:15 818次阅读

    BP神经网络与深度学习关系

    BP神经网络与深度学习之间存在着密切的关系,以下是对它们之间关系的介绍: 、BP神经网络的基本概念 BP神经网络,即反向传播神经网络(Ba
    的头像 发表于 02-12 15:15 1338次阅读

    AI自动化生产:深度学习在质量控制中的应用

    随着科技的飞速发展,人工智能(AI)与深度学习技术正逐步渗透到各个行业,特别是在自动化生产中,其潜力与价值愈发凸显。深度学习软件不仅使人工和基于规则的算法难以胜任的大量生产任务得以自动
    的头像 发表于 01-17 16:35 1209次阅读
    AI自动化生产:<b class='flag-5'>深度</b><b class='flag-5'>学习</b>在质量控制中的应用

    百度深度学习专利申请量位列全球第

    近日,全球领先的知识产权解决方案提供商Questel,发布全球深度学习专利全景报告。
    的头像 发表于 01-15 09:29 818次阅读

    传统机器学习方法和应用指导

    用于开发生物学数据的机器学习方法。尽管深度学习般指神经网络算法)是个强大的工具,目前也非常流行,但它的应用领域仍然有限。与
    的头像 发表于 12-30 09:16 1968次阅读
    传统机器<b class='flag-5'>学习</b>方法和应用指导