0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于泊松方程的生成模型 PFGM

OpenCV学堂 来源:OpenCV学堂 作者:OpenCV学堂 2022-10-20 09:22 次阅读

引言

扩散模型最早来源于物理中的热力学,最近却在人工智能领域大放异彩。还有什么物理理论可以推动生成模型研究的发展呢?最近,来自 MIT 的研究者受到高维电磁理论的启发,提出了一种称作泊松流(Poisson Flow)的生成模型。理论上,这种模型具有直观的图像和严谨的理论;实验上,它在生成质量、生成速度和鲁棒性上往往比扩散模型更好。

受到静电力学的启发,研究人员提出了一种新的生成模型,名为泊松流模型 (Poisson Flow Generative Models, or PFGM)。直观上,该研究可以把 N 维的数据点看成在 N+1 维空间中新增维度 z=0 平面上的一群正电荷,它们产生了高维空间中的电场。从 z=0 平面开始沿着它们产生的电场线往外走,该研究能够把样本送到一个半球面上(如图一所示)。这些电场线的方向对应于高维空间中泊松方程 (Poisson Equation)的解的梯度。研究人员证明了当半球的半径足够大的时候,电场线能够把在 z=0 平面上的电荷分布(也就是数据分布)转换为一个在半球面上的均匀分布(图二)。

PFGM 利用了电场线的可逆性来生成 z=0 平面上的数据分布:首先研究人员在大的半球面上均匀采样,接着让样本沿着电场线从球面往 z=0 平面运动,从而生成数据。由于沿着电场线的运动可以由一个常微分方程(ODE)描述,因此在实际的采样中研究人员只需要解一个由电场线方向决定的 ODE。通过电场,PFGM 将一个球面上的简单分布转换为一个复杂的数据分布。从这个角度来看,PFGM 可以被认为是一种连续的标准化流(Normalizing Flow)。

在图像生成实验中,PFGM 是当前在标准数据集 CIFAR-10 上表现最好的标准化流模型,取得了 2.35 的 FID score (图片质量的度量)。研究人员也展示了 PFGM 的其他一些用途,比如它能够计算图片的似然 (likelihood)、进行图片编辑和扩展到高分辨率的图片数据集上。此外,研究人员发现 PFGM 比近期大热的扩散模型 (Diffusion Models)有着三个优点

(1)在相同的网络结构上,PFGM 的 ODE 生成的样本质量远好于扩散模型的 ODE;(2)在与扩散模型的 SDE (随机微分方程)生成质量差不多的情况下,PFGM 的 ODE 达到了 10 倍 - 20 倍的加速;

(3)PFGM 在表达能力更弱的网络结构上比扩散模型鲁棒。

734a16ca-4fd2-11ed-a3b6-dac502259ad0.gif

73b34398-4fd2-11ed-a3b6-dac502259ad0.gif

图一:样本点沿着电场线运动 。上图:数据分布呈爱心状;下图:数据分布呈 PFGM 状

73fa5b84-4fd2-11ed-a3b6-dac502259ad0.png

图二:左图:泊松场在三维中的轨迹;右图:在图像上使用 PFGM 的前向 ODE 和反向 ODE

方法概览

注意到上述的过程将 N 维数据嵌入到了在 N+1 维(多了 z 维度)的空间中。为了方便区分,研究人员把 N 维数据和 N+1 维用 x 和740fd6ee-4fd2-11ed-a3b6-dac502259ad0.png表示。为了得到上述的高维电场线,需要解如下的泊松方程:

741ffc90-4fd2-11ed-a3b6-dac502259ad0.png

其中74308916-4fd2-11ed-a3b6-dac502259ad0.png是位于 z=0 平面上想要生成的数据分布;743bb00c-4fd2-11ed-a3b6-dac502259ad0.png是势函数,也就是研究人员求解的目标。由于只需要知道电场线的方向,研究人员推导出了电场线的梯度(势函数的梯度)的解析形式:

74478206-4fd2-11ed-a3b6-dac502259ad0.png

电场线的轨迹(见图二)能够被下面的 ODE 所描述:

7454de06-4fd2-11ed-a3b6-dac502259ad0.png

在下面的定理中,研究人员证明了上述 ODE 定义了一个高维半球面上的均匀分布和 z=0 平面上的数据分布的双射。这个结论与图一、图二的直观相同:可以通过电场线来还原数据分布。

745fc0f0-4fd2-11ed-a3b6-dac502259ad0.png

PFGM 的训练

给定一个从数据分布中采样得到数据集746f7072-4fd2-11ed-a3b6-dac502259ad0.png,研究人员用该数据集所对应的电场线梯度,来近似数据分布所对应的电场线梯度:

74801260-4fd2-11ed-a3b6-dac502259ad0.png

该电场线梯度是学习目标。该研究通过 perturb 函数在空间中进行选点,并且平方损失函数让神经网络748cc136-4fd2-11ed-a3b6-dac502259ad0.png去学习空间中归一化的电场线梯度74998a38-4fd2-11ed-a3b6-dac502259ad0.png, 具体算法如下:

74a62e64-4fd2-11ed-a3b6-dac502259ad0.png

PFGM 的采样

当学习完归一化去学习空间中归一化的电场线梯度74be74b0-4fd2-11ed-a3b6-dac502259ad0.png后,可以通过如下的 ODE 对数据分布进行采样:

74ce2e14-4fd2-11ed-a3b6-dac502259ad0.png

该 ODE 通过减小 z,使得样本从大球面沿着电场线逐渐运动到 z=0 平面。此外,该研究提出了将大球面上的均匀分布投影到某个 z 平面以方便 ODE 模拟,并进一步通过变量替换来进一步加速采样。具体步骤请参见文章的 3.3 节。

实验结果

在表一中,该研究使用标准数据集 CIFAR-10 来评估不同模型。在该数据集上,PFGM 是表现最好的可逆标准化流模型,取得了 2.35 的 FID score。在使用相同的网络结构 (DDPM++/DDPM++ deep) 的条件下,PFGM 的表现优于扩散模型。研究人员同时观测到,在与扩散模型的 SDE (随机微分方程)生成质量差不多的情况下,PFGM 达到了 10 倍 - 20 倍的加速,更好地兼顾了生成质量与速度。此外,研究人员发现 PFGM 在表达能力更弱的网络结构上比扩散模型鲁棒,并且在更高维的数据集上依然优于同等条件下的扩散模型。具体请见文章的实验章节。在图三中,该研究可视化了 PFGM 生成图片的过程。

74d99e3e-4fd2-11ed-a3b6-dac502259ad0.png

表一:CIFAR-10 数据上的样本质量(FID, Inception)与采样步数 (NFE)

74e859ce-4fd2-11ed-a3b6-dac502259ad0.gif

75e6b1e0-4fd2-11ed-a3b6-dac502259ad0.gif

769b66e4-4fd2-11ed-a3b6-dac502259ad0.gif

图三:PFGM 在 CIFAR-10, CelebA 64x64, LSUN bedroom 256x256 上的采样过程

结论

该研究提出了一个基于泊松方程的生成模型 PFGM。这个模型预测 N+1 维的扩展空间中的归一化电场线梯度,并通过电场线对应的 ODE 来采样。实验中,该研究的模型是当前最好的标准化流模型,并在相同的网络结构上取得了比扩散模型更好的生成效果与更快的采样速度。PFGM 的采样过程对噪声更鲁棒,也能扩展到更高维的数据集中。研究人员期望 PFGM 能够在其他应用领域中也能取得亮眼表现,比如分子生成和 3D 数据生成。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6514

    浏览量

    87609
  • 人工智能
    +关注

    关注

    1776

    文章

    43899

    浏览量

    230640
  • 模型
    +关注

    关注

    1

    文章

    2707

    浏览量

    47706

原文标题:卷!MIT泊松流生成模型击败扩散模型,兼顾质量与速度

文章出处:【微信号:CVSCHOOL,微信公众号:OpenCV学堂】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Matlab偏微分方程工具箱应用说明

    hyperbolic 求解双曲线型偏微分方程parabolic 求解抛物线型偏微分方程pdeeig 求解特征型偏微分方程pdenonlin 求解非线性型微分方程poisolv 利用矩阵
    发表于 09-22 15:26

    电子学领域的基本电磁定律,归纳/总结/点评

    高斯定理3.发拉弟定律4.安培定律4个定律+3个本构关系(E,D,H,B,J,E)得到麦克斯维方程组。说这个的书太多,公式什么的自己找,略。二级定律:1.标量和拉普拉斯方程2.矢量
    发表于 07-17 16:13

    关于服从特定分布的脉冲生成与显示

    现在需要得到几种脉冲,包括三角、梯形、指数、双指数、高斯脉冲。其中,要求生成的一系列脉冲可以在脉冲生成时间间隔和幅值上服从特定分布,包括均匀、指数、正态、分布。现在,已经得到了服从
    发表于 03-06 21:04

    随机产生100个点建立SVM模型找出超平面方程的代码实例

    ML之SVM:随机产生100个点,建立SVM模型,找出超平面方程
    发表于 12-26 10:48

    计算机Fortran编程实现偏微分方程拉普拉斯变换

    。 这一特性用于通道二极管以达到层的宽度在次数10**-6厘米(cm),通过重的掺杂于普通的p-n节比较的次数10**-4cm。我们刚刚演示了方程应用的例子,包含解答一个已知电荷分布的势能分布。
    发表于 08-14 20:38

    根据转矩方程搭建速度环矢量模型

    爱自己是一生浪漫的开始。  电机控制中,无论什么观测器,最终都是为了得到电机的电角度跟角速度,这里就通过转矩方程来进行简单的速度环矢量控制模型。  目标:搭建简单的由转矩方程计算角度速度的矢量
    发表于 06-28 10:08

    Simulink模型生成代码

    本文首先通过一个简单的Simulink模型生成代码,然后将代码copy到一个STM32工程中去编译软件。最后将软件下载到STM32F407中,通过串口输出Simulink计算的结果。阅读本文需要
    发表于 08-11 07:56

    A、B、C三相坐标系中PMSM数学模型定子电压方程

    1. A、B、C三相坐标系中PMSM数学模型定子电压方程:结论:在A、B、C坐标系下,可以看出电压方程和磁链方程比较复杂,磁链的数值随永磁同步电机定转子之间的相对位置随时间而变化,而电
    发表于 08-27 07:59

    MRAS模型和可调模型参考

    1、简写MRAS参考模型和可调模型参考模型和可调模型方程:简写为如下形式:参考模型:可调
    发表于 08-27 06:44

    PMSM模型交直轴的电压方程

    PMSM模型:交直轴的电压方程为:{ud=Rid+Lddiddt−ωeLqiquq=Riq+Lqdiqdt+ωeLdid+ωeφm\left\{ \begin{array}{l}u_d
    发表于 08-27 06:41

    为什么生成模型值得研究

    1.Why study generative modeling? 人们可能很自然地想知道为什么生成模型值得研究,尤其是那些只能够生成数据而不能提供密度函数估计的生成
    发表于 09-15 06:03

    怎样去搭建一种由转矩方程计算角度速度的矢量控制模型

    怎样去搭建一种由转矩方程计算角度速度的矢量控制模型?如何对速度环矢量控制模型进行仿真?
    发表于 10-11 07:06

    OpenAI最新提出的可逆生成模型Glow

    low是一种可逆生成模型(reversible generative model),也被称为基于流的生成模型(flow-based generative model)。目前,学界还很少
    的头像 发表于 07-11 09:46 6986次阅读

    AN-715: 走近IBIS模型:什么是IBIS模型?它们是如何生成的?

    AN-715: 走近IBIS模型:什么是IBIS模型?它们是如何生成的?
    发表于 03-21 13:59 10次下载
    AN-715: 走近IBIS<b class='flag-5'>模型</b>:什么是IBIS<b class='flag-5'>模型</b>?它们是如何<b class='flag-5'>生成</b>的?

    如何加速生成2 PyTorch扩散模型

    加速生成2 PyTorch扩散模型
    的头像 发表于 09-04 16:09 821次阅读
    如何加速<b class='flag-5'>生成</b>2 PyTorch扩散<b class='flag-5'>模型</b>