0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习已兴?数学模型将死?

Gv1N_smartman16 来源:YXQ 2019-06-13 17:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

对于那些擅长于用微分方程、概率论解决问题的数学家们来说,素有“黑盒子”之称机器学习往往是要被踢到鄙视链底端的。

但是,在与各行各业中,绝大多数公司(小到初创公司,大到国际巨鳄)都在寻求运用机器学习的方法。随着企业不断地将机器学习融入其文化与组织中,这事也变得越来越普遍。

有意思的是,在本科和硕士教育中,数学专业内部居然也都弥漫起了机器学习的热潮。举例说,牛津大学的“深度学习理论”硕士课程在其设立的第一年就被超额报名。

更惊人的是,很多数学博士生打算将机器学习嵌入到它们的研究课题中,从而形成将“传统”(ODE和PDE)和“现代”(深度学习)相结合和新型混合模型。

所以,机器学习是否会最终取代数学建模?

如果数学模型在科研领域无法突破,我们最终是否会使用机器学习的方法来获得建模上的进展呢?

当然不是!我认为,机器学习和数学模型应当是互补的关系——充分结合二者的力量一定会产生有趣的新模型。

为了说明我的观点,我构想了一个例子,让我们开启一趟科技文明之旅!在这个虚构的文明中,机器学习相当发达,然而这个文明的数学却糟糕得很,尤其是还不会微积分。

一个虚构的文明

假设我们正处于一个微积分落后但深度学习发达的科技文明中。

和大多数文明一样,它们都致力于用炮弹攻击自己的对手。两位来自同一阵营的科学家在对他们刚发行的大炮的攻击范围进行建模。

科学家可以控制下列因素:

大炮里装载的弹药总量(例如炮弹的发射速度)

大炮的角度

科学家可以测量下列内容:

弹丸从大炮中射出去的直线距离。

*假设地面完全水平。

从数学的角度上,他们希望找到一个模型/函数F,这个函数能基于所有速度v和角度θ进行预测。

s=F(v,θ)

使得这个结果接近于真实的行进距离。

由于没有炮弹在空中移动的相关知识储备,科学家们采用了数据驱动的方式。

数据采集

科学家们用一天的时间来以各种火力及角度进行大炮射击。每次他们点火发射,他们都会测量发射点和炮弹终点间的距离。但是,他们的测量结果并不完全精确,每次测量都会引入一些误差。

在那一天的时间中,他们打算发射1000次炮弹,产生1000个三元数组(vi,θi,si),其中θi是弧度制的。

这些数据点分布如下图所示:

不用模型的方法

解决问题的最简单方法就是不使用模型,因为数据就能化身为模型!在这种方法中,他们选用那些最接近于他们想预测的情景的历史数据,使用这些历史数据当作预测模型(即KNN模型)。例如:

这种纯数据驱动的方式有着明显的缺点。如果他们获得的数据不能覆盖所有的输入可能性,或者数据过于稀疏,这种方式就会产生问题。在这个例子中,如果要预测速度大于10的射击距离,没有模型的话他们就无法进行精准预测。

基于线性模型的方法

从数据看来,他们期望的函数是非线性的,而且线性模型不可能将结果预测得很准确。但是,线性模型并非完全没有价值,在很多应用场景下它是一种基础模型,所以这两位科学家决定先用个线性模型试试。

线性模型的数学表达如下:

在表达式中,wi∈R是权重,b∈R是偏移项,这些值都会被确定下来。我们用PyTorch实现线性模型,并使用随机随机梯度下降法(当然还有其他更好更简单的方法)寻找模型参数。

正如预期的那样,建模结果非常糟糕。

“黑盒”登场——深度神经网络

科学家们在机器学习研究和计算框架设计方面投入了大量资金,因此他们在面对问题时喜欢以深度神经网络的方式构想解决方案。说白了就是,他们喜欢使用多层感知器系统,它包含有多个线性层,层与层之间靠非线性激活函数相连。模型可以按如下形式描述:

我们用Adam optimizer对模型进行训练,结果如下:

对于在这方面没有经验的人,在看到神经网络的预测结果的时候,基本都会感到惊叹!至今为止,这也是深度学习流传盛广的主要原因——它不但有用,且效果显著。只是我们并不知道为什么。

用数学语言刻画“准线性方法”

在上述的黑匣子模型中,科学家们有一个能够准确预测大炮射击距离的模型,但顾名思义,他们对模型的形式没有直观理解。科学家们热衷于在使用机器学习方法的同时恢复这种直观理解,并重新使用线性模型。

我们高中的时候都学过三角函数,科学家们认为这个问题可能会涉及一些三角函数与速度的乘积。于是他们把模型写成非线性基函数的线性组合:

把非线性嵌入到线性模型之后,模型可以像线性模型一样计算参数。优化后,模型为:

在这种情况下,除了sin(2θ)的参数,优化将其他所有参数归零。

将F与数据进行比较,他们发现模型非常具有预测性。不仅如此,模型的公式短小精练!当然,他们能选中三角函数也是非常“幸运”了。

数学方法——无数据模型

很多年后,微积分终于被发现了!于是,两位老科学家开始重新审视这个问题。

1.假设方程

低速炮弹的物理模型非常简单。炮弹有垂直向下的重力加速度,恒定为-g。由于在x方向上没有作用在射弹上的力,它始终保持其初始速度。该模型可以写成二阶微分方程组:

初值条件为:

后两个方程式描述了炮弹最初发射时的速度的水平和垂直分量。这些方程描述了系统,但如何解决这些问题呢?

2.数值积分

通常在数学中,写下微分方程是一个简单的部分,大部分时间都花在试图解决它们上面!

他们写出了该问题的一阶常微分方程(ODE):

初值条件为:

易证这两个方程相同。

积分在数学中无处不在,有多种方法来进行数值积分。最简单和最直观的方法是欧拉方程,它从初始点开始,并在该点的梯度方向上走一小步,即:

使用数值积分,可以准确地预测炮弹的整个轨迹。

着陆点的位置是x(t*),它们可以从预测的轨迹中提取。

相比于机器学习模型,这一数学模型的一个明显优势是,我们可以很轻易地解决更复杂的问题——例如不平坦的地面,或者从塔上发射炮弹(y(0)≠0)

3.直接求解

最后,两位科学家使用了积分来求解,事实证明问题并非如此困难。x和y的方程可以独立求解。通过求解每个方程(并应用初始条件)给出。

他们以x和y坐标作为时间的函数。什么时候射弹击中了地面呢?当y=0时!即:

求解t*=0(大炮射击之前),并求解t*=2vsinθg(当它击中地面时)。将第二个t*值插入到x的等式中,得到最终的行进距离,等于:

那么他们的最终预测模型就是

他们发现这与准线性方法吻合。实际上,准线性方法也给出了他们对引力常数的估计。

神经常微分方程方法-学习动力系统

最后,假设他们不知道物理模型,只有一个常微分方程系统

其中f1和f2是未知的(为简洁起见省略虚拟变量)。

NIPS最近发表的一篇论文(https://papers.nips.cc/paper/7892-neural-ordinary-differential-equations)提出了一种学习常微分系统的方法。简而言之,它通过用神经网络替换f1,f2并数值积分神经网络来获得轨迹来实现这一点。学习可以正常进行,因为数值积分方法具有明确定义的梯度。在他们的例子中,如果科学家可以随时间跟踪炮弹的位置,即数据(xi,yi,ti),那么他们原则上可以恢复物理模型并了解物体随着时间的推移而下降加速。这是一个令人兴奋的深度学习新应用,它开启了学习系统行为的可能性,而不是简单地学习它们的输出。

我们学到了什么?

我们生活在一个幸运的年代,可以通过数百种不同的方式解决一个简单的问题。此外,在上述“黑盒”方法中,我们也可以将神经网络换成其他模型,并用上其他的优化方法。这突出了机器学习在数学中的作用——它是我们用以理解世界和做出预测的许多强大工具之一。

数学家对数学模型是可解释的,是直观的,而深度学习模型正好相反。在我举的例子中,构建数学模型并用机器学习填补空白(比如估测引力常数)可以带来更好的准确性和更快的计算。

如果我们能够尽可能多地融入物理理论,并利用机器学习来填补我们的知识空白,那么我们就有机会解决更复杂的问题。通常机器学习用于参数拟合,但在混合模型中,我们也可以用它来预测更复杂系统中的函数组成部分。

我相信,随着理论和技术的进步,我们将在未来看到许多混合模型。因此,数学建模和机器学习建模也应当是“合作关系”,而非“竞争关系”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数学模型
    +关注

    关注

    0

    文章

    83

    浏览量

    12491
  • 机器学习
    +关注

    关注

    67

    文章

    8561

    浏览量

    137208

原文标题:机器学习会取代数学建模吗?让我们假设一个微积分落后但深度学习发达的文明社会……

文章出处:【微信号:smartman163,微信公众号:网易智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    新思科技预测机器学习力场加速原子级仿真10000倍

    “力场”长久以来一直激发着我们的想象力,是科幻作品中保护星舰和超级英雄的隐形能量盾。但在科学探索发现的世界里,力场扮演着截然不同的角色——数学模型,让我们得以窥探物质在原子尺度上的内在本质。
    的头像 发表于 02-26 15:03 619次阅读

    强化学习会让自动驾驶模型学习更快吗?

    是一种让机器通过“试错”学会决策的办法。与监督学习不同,监督学习是有人提供示范答案,让模型去模仿;而强化学习不会把每一步的“正确答案”都告诉
    的头像 发表于 01-31 09:34 819次阅读
    强化<b class='flag-5'>学习</b>会让自动驾驶<b class='flag-5'>模型</b><b class='flag-5'>学习</b>更快吗?

    避繁就简!商汤日日新大模型灵性巧解数学难题,获赞“机器的审美”

    模型也能拥有某种数学家“直觉”! 在近日举办的第十届世界华人数学家大会“人工智能与数学”夜话活动上,由菲尔兹奖得主丘成桐院士引领,集结国内四大顶尖
    的头像 发表于 01-12 11:41 410次阅读
    避繁就简!商汤日日新大<b class='flag-5'>模型</b>灵性巧解<b class='flag-5'>数学</b>难题,获赞“<b class='flag-5'>机器</b>的审美”

    机器学习和深度学习中需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作一段时间,机器学习和深度学习中都存在一些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不理,日后可能会引发诸多麻烦!只要我们密切关注
    的头像 发表于 01-07 15:37 342次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    基于ETAS嵌入式AI工具链将机器学习模型部署到量产ECU

    AI在汽车行业的应用日益深化,如何将机器学习领域的先进模型(如虚拟传感器)集成到ECU软件中,已成为业界面临的核心挑战。
    的头像 发表于 12-24 10:55 6360次阅读
    基于ETAS嵌入式AI工具链将<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>模型</b>部署到量产ECU

    宇树王直言:人形机器人要“自主干活”,通信、AI大模型和安全需先破局

    对话,围绕人形机器人未来发展的关键节点,机器人市场爆发的关键挑战和当下发展的痛点等热点话题,王给出了精彩的阐述和技术趋势分析。
    的头像 发表于 09-25 18:04 1.2w次阅读
    宇树王<b class='flag-5'>兴</b><b class='flag-5'>兴</b>直言:人形<b class='flag-5'>机器</b>人要“自主干活”,通信、AI大<b class='flag-5'>模型</b>和安全需先破局

    量子机器学习入门:三种数据编码方法对比与应用

    在传统机器学习中数据编码确实相对直观:独热编码处理类别变量,标准化调整数值范围,然后直接输入模型训练。整个过程更像是数据清洗,而非核心算法组件。量子机器
    的头像 发表于 09-15 10:27 935次阅读
    量子<b class='flag-5'>机器</b><b class='flag-5'>学习</b>入门:三种数据编码方法对比与应用

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文
    发表于 07-31 11:38

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 3079次阅读

    通过NVIDIA Cosmos模型增强机器人学习

    通用机器人的时代已经到来,这得益于机械电子技术和机器人 AI 基础模型的进步。但目前机器人技术的发展仍面临一个关键挑战:机器人需要大量的训练
    的头像 发表于 07-14 11:49 1260次阅读
    通过NVIDIA Cosmos<b class='flag-5'>模型</b>增强<b class='flag-5'>机器人学习</b>

    无刷直线直流电机非换相期间推力分析

    在电磁弹射过程中,抑制推力波动具有很重要的意义,并且要保持推力恒定,而速度对推力具有很大的影响,因此在本文中重点分析速度对推力的影响。首先建立了非换相期间无刷直线直流电机(BLDCLM)的数学模型
    发表于 07-09 14:22

    无刷直流电机双闭环控制的仿真研究

    摘 要:为了便于对无刷直流电机的运行特性和控制策略的研究,文章详细的介绍了无刷直流电机工作原理和数学模型,提出无刷直流电机的控制策略,采用电流环为内环,速度环为外环的双闭环控制,并根据数学模型搭建
    发表于 07-08 18:33

    三相异步电机在SIMULINK下的建模与仿真

    摘要:异步电动机三相原始动态数学模型相当复杂,分析和求解这组非线性方程十分困难,因此,要简化数学模型,必须从简化磁链关展入手,简化的基本方法就是坐标变换。以异少电动机坐标变换为基础推导出同步旋转
    发表于 06-16 21:48

    绕组开放型永磁同步电机的建模及应用

    摘 要:本文以传统永磁电机 abc 坐标系下的动态数学模型为基础,推导出绕组开放型永磁电机的数学模型。将模型中的电压方程分为绕组电阻电压、绕组自感电压、绕组反电动势、绕组间的互感电压,建立绕组开放型
    发表于 06-12 13:52

    边缘计算中的机器学习:基于 Linux 系统的实时推理模型部署与工业集成!

    你好,旅行者!欢迎来到Medium的这一角落。在本文中,我们将把一个机器学习模型(神经网络)部署到边缘设备上,利用从ModbusTCP寄存器获取的实时数据来预测一台复古音频放大器的当前健康状况。你将
    的头像 发表于 06-11 17:22 1147次阅读
    边缘计算中的<b class='flag-5'>机器</b><b class='flag-5'>学习</b>:基于 Linux 系统的实时推理<b class='flag-5'>模型</b>部署与工业集成!