0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

两种方法通过加权将先验物理知识减少或离散化为适合现有深度学习架构的机制

SSDFans 来源:未知 作者:李倩 2018-08-27 15:58 次阅读

深度学习目前仍有很大的局限性,其中之一就是无法结合先验知识,如数学或物理学的基本定律。通常,必须从训练集中理解DL,这很难真正涵盖足够的先验知识。而DL的一个卖点是,它不需要用算法编程; 而是通过一种优化形式从这些训练集中抽离出智能。当训练集足够大,可以覆盖目标的核心时,这种方法是很有效的,但如果无法很好的引入其他变量(如旋转或移动),这种方法就不是很有效。 这是一个急需解决的局限性。

解决这个问题最简单的方法是扩大训练范围以涵盖更多变量。对于旋转,可能需要108 * N个训练样本来覆盖3个旋转轴和每个轴上的36个方向(0,10,20,......度),而N个样本远远不够。也就是说收集和标记训练样本的数量必须大幅增加。对于移动这个变量,如何训练ML来确定击打母球时斯诺克台球桌上其他球会怎么移动? 利用训练重新发现牛顿300多年前编纂的东西似乎是对创造力的巨大浪费。

处理这些变量最好的方法是结合ML使用数学和物理学的先验知识。 在计算机图形学中,我们使用基于数学公式的算法推断旋转对视图的影响。在斯诺克的例子中,我们使用了牛顿运动定律,再次在算法中编码。这些算法捕获了一些简单的方程式,否则在追求无算法识别时就需要大量的训练集,这就是算法被淘汰的原因。

斯坦福大学的一篇论文中利用对弹丸力学的理解来识别和跟踪被扔出去的枕头在房间内经过的路径。据悉,他们首先对一小段路径进行模型识别,然后利用约束来排除不遵循预期的二阶运动方程的完整路径。其实他们使用了一个经典公式作为神经网络结构中的约束条件。 这项研究显示了在缺乏监督的情况下进行机器学习的希望。

奥地利科学与技术研究所的另一篇有趣的论文采用了一种完全不同的方法(通过ML)来建立机器人安全操作条件的模型(例如移动手臂或腿的范围),这些模型基于从已知安全范围的操作中学习简单的公式。这些公式允许出现超出训练范围的结果。 他们将此描述为“一种机器学习方法,这种方法可以准确地推断出无法准确辨别的情况”。其实这种方法是通过在有界的空间中进行实验,以简单线性方程的形式建立自己的先验知识。

第三个例子来自索邦大学,他们提供了预测海面温度(SST)的图示。 海面温度数据已经通过卫星图像生成,可以提供大量的信息。预测这些数据将如何发展需要基于偏微分方程(PDE)及时更新数据,这是使用数值求解方法进行预测的标准方法的基础。该研究团队使用具有离散化版PDE方程的CDNN来指导网络中时间传播的加权。与数值方法和其他一些NN方法相比,他们的研究显示更有希望看到结果。

因此,有两种方法可以通过加权将先验物理知识减少或离散化为适合现有深度学习架构的机制,一种方法是推导出简单方程以形成其自己的“先验”知识基础。不过在作者看来,Sorbonne方法似乎是最具扩展性的,因为物理学中的几乎所有问题都可以简化为PDE。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1773

    文章

    43356

    浏览量

    230126
  • 深度学习
    +关注

    关注

    73

    文章

    5200

    浏览量

    119803

原文标题:当人工智能搭配物理学定律,世界将会怎样?

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    FPGA在深度学习应用中取代GPU

    AI 框架模型映射到硬件架构。 Larzul 的公司 Mipsology 希望通过 Zebra 来弥合这一差距。Zebra 是一种软件平台,开发者可以轻松地
    发表于 03-21 15:19

    深度学习与数据挖掘的关系

    理解,但是在其高冷的背后,却有深远的应用场景和未来。深度学习是实现机器学习的一种方式一条路径。其动机在于建立、模拟人脑进行分析学习的神经网
    发表于 07-04 16:07

    两种方法解决电路设计问题

    200V的电压施加到500欧姆的抽头电阻器。找到连接到25V时需要0.1A电路的个分接点之间的电阻。我用两种方法解决了这个问题。但正确的答案只能通过
    发表于 09-14 13:54

    对畸变信号进行补偿的两种方法

    补偿系统如果满足式(10),就可以对畸变测量信号进行补偿校正。  由以上两种补偿方法的补偿效果来看,数字滤波器补偿信号基本能跟随被测信号。而差分方程模型补偿信号则更胜一筹。3、结论通过实验分析可知,差
    发表于 04-17 09:40

    讨论Linux系统中设置开机自动运行的两种方法

    有时可能会需要在重启时或者每次系统启动时运行某些命令或者脚本。我们要怎样做呢?本文中我们就对此进行讨论。 我们会用两种方法来描述如何在 CentOS/RHEL 以及 Ubuntu 系统上做到重启或者系统启动时执行命令和脚本。 两种方法
    发表于 07-09 06:38

    离散小波转换(DWT)深度神经网络是什么

    2018年全球第三大风力发电机制造商论文下载地址:https://arxiv.org/pdf/1902.05625v1.pdf论文代码地址:https://github.com/BinhangYuan/WaveletFCNN需要简单储备的知识
    发表于 07-12 07:38

    超越英伟达Pascal五倍?揭秘英特尔深度学习芯片架构 精选资料推荐

    在被英特尔收购年之后,深度学习芯片公司 Nervana 终于准备代号为「Lake Crest」的架构
    发表于 07-26 07:04

    STM32操作矩阵键盘的两种方法

    目录STM32操作矩阵键盘的两种方法——扫描和中断一、矩阵键盘的结构和原理二、扫描式矩阵键盘的原理和实现三、中断式矩阵键盘的原理和实现四、两种方案优劣STM32操作矩阵键盘的两种方法——扫描和中断
    发表于 08-12 06:33

    如何在交通领域构建基于图的深度学习架构

    学习架构因为这篇文献对于交通领域中的各种问题、方法做了一个比较清楚的综述,所以是一篇很有价值的文献,很适合刚进入这个方向的同学。
    发表于 08-31 08:05

    浅析addContext()与addWebapp()这两种方法

    addContext()与addWebapp()这两种方法都是向嵌入式tomcat添加web应用程序。addContext()需要配置相关所有内容,比如配置默认的Servlet,否则将无法访问静态
    发表于 12-16 07:02

    单片机控制IO空的两种方法

    标题单片机控制IO空的两种方法(10看成高低电平可知总控制也可实现流水灯):运算符注意:&符号:0011100 1101010在一起看时,有0便是0.结果=0001000| 符号
    发表于 01-07 08:12

    什么是深度学习?使用FPGA进行深度学习的好处?

    准确的模型。有了上述机制,现在可以通过让神经网络模型学习各种问题来自动解决问题,创建高精度模型,并对新数据进行推理。然而,由于单个神经网络只能解决简单的问题,人们尝试通过构建
    发表于 02-17 16:56

    基于信息熵的先验信息加权融合方法研究

    在小样本可靠性分析过程中,针对传统先验信息融合方法存在的主观性和复杂性缺陷,引入信息熵原理和加权思想,提出了基于信息熵的先验信息加权融合
    发表于 01-09 11:20 9次下载

    一种融合节点先验信息的图表示学习方法

    基于深度学习提出了融合节点先验信息的图表示学习方法,该方法将节点特征作为先验
    发表于 12-18 16:53 0次下载
    一种融合节点<b class='flag-5'>先验</b>信息的图表示<b class='flag-5'>学习方法</b>

    简述深度学习中的Attention机制

    Attention机制深度学习中得到了广泛的应用,本文通过公式及图片详细讲解attention机制的计算过程及意义,首先从最早引入atte
    的头像 发表于 02-22 14:21 955次阅读
    简述<b class='flag-5'>深度</b><b class='flag-5'>学习</b>中的Attention<b class='flag-5'>机制</b>