0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习已兴?数学模型将死?

Gv1N_smartman16 来源:YXQ 2019-06-13 17:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

对于那些擅长于用微分方程、概率论解决问题的数学家们来说,素有“黑盒子”之称机器学习往往是要被踢到鄙视链底端的。

但是,在与各行各业中,绝大多数公司(小到初创公司,大到国际巨鳄)都在寻求运用机器学习的方法。随着企业不断地将机器学习融入其文化与组织中,这事也变得越来越普遍。

有意思的是,在本科和硕士教育中,数学专业内部居然也都弥漫起了机器学习的热潮。举例说,牛津大学的“深度学习理论”硕士课程在其设立的第一年就被超额报名。

更惊人的是,很多数学博士生打算将机器学习嵌入到它们的研究课题中,从而形成将“传统”(ODE和PDE)和“现代”(深度学习)相结合和新型混合模型。

所以,机器学习是否会最终取代数学建模?

如果数学模型在科研领域无法突破,我们最终是否会使用机器学习的方法来获得建模上的进展呢?

当然不是!我认为,机器学习和数学模型应当是互补的关系——充分结合二者的力量一定会产生有趣的新模型。

为了说明我的观点,我构想了一个例子,让我们开启一趟科技文明之旅!在这个虚构的文明中,机器学习相当发达,然而这个文明的数学却糟糕得很,尤其是还不会微积分。

一个虚构的文明

假设我们正处于一个微积分落后但深度学习发达的科技文明中。

和大多数文明一样,它们都致力于用炮弹攻击自己的对手。两位来自同一阵营的科学家在对他们刚发行的大炮的攻击范围进行建模。

科学家可以控制下列因素:

大炮里装载的弹药总量(例如炮弹的发射速度)

大炮的角度

科学家可以测量下列内容:

弹丸从大炮中射出去的直线距离。

*假设地面完全水平。

从数学的角度上,他们希望找到一个模型/函数F,这个函数能基于所有速度v和角度θ进行预测。

s=F(v,θ)

使得这个结果接近于真实的行进距离。

由于没有炮弹在空中移动的相关知识储备,科学家们采用了数据驱动的方式。

数据采集

科学家们用一天的时间来以各种火力及角度进行大炮射击。每次他们点火发射,他们都会测量发射点和炮弹终点间的距离。但是,他们的测量结果并不完全精确,每次测量都会引入一些误差。

在那一天的时间中,他们打算发射1000次炮弹,产生1000个三元数组(vi,θi,si),其中θi是弧度制的。

这些数据点分布如下图所示:

不用模型的方法

解决问题的最简单方法就是不使用模型,因为数据就能化身为模型!在这种方法中,他们选用那些最接近于他们想预测的情景的历史数据,使用这些历史数据当作预测模型(即KNN模型)。例如:

这种纯数据驱动的方式有着明显的缺点。如果他们获得的数据不能覆盖所有的输入可能性,或者数据过于稀疏,这种方式就会产生问题。在这个例子中,如果要预测速度大于10的射击距离,没有模型的话他们就无法进行精准预测。

基于线性模型的方法

从数据看来,他们期望的函数是非线性的,而且线性模型不可能将结果预测得很准确。但是,线性模型并非完全没有价值,在很多应用场景下它是一种基础模型,所以这两位科学家决定先用个线性模型试试。

线性模型的数学表达如下:

在表达式中,wi∈R是权重,b∈R是偏移项,这些值都会被确定下来。我们用PyTorch实现线性模型,并使用随机随机梯度下降法(当然还有其他更好更简单的方法)寻找模型参数。

正如预期的那样,建模结果非常糟糕。

“黑盒”登场——深度神经网络

科学家们在机器学习研究和计算框架设计方面投入了大量资金,因此他们在面对问题时喜欢以深度神经网络的方式构想解决方案。说白了就是,他们喜欢使用多层感知器系统,它包含有多个线性层,层与层之间靠非线性激活函数相连。模型可以按如下形式描述:

我们用Adam optimizer对模型进行训练,结果如下:

对于在这方面没有经验的人,在看到神经网络的预测结果的时候,基本都会感到惊叹!至今为止,这也是深度学习流传盛广的主要原因——它不但有用,且效果显著。只是我们并不知道为什么。

用数学语言刻画“准线性方法”

在上述的黑匣子模型中,科学家们有一个能够准确预测大炮射击距离的模型,但顾名思义,他们对模型的形式没有直观理解。科学家们热衷于在使用机器学习方法的同时恢复这种直观理解,并重新使用线性模型。

我们高中的时候都学过三角函数,科学家们认为这个问题可能会涉及一些三角函数与速度的乘积。于是他们把模型写成非线性基函数的线性组合:

把非线性嵌入到线性模型之后,模型可以像线性模型一样计算参数。优化后,模型为:

在这种情况下,除了sin(2θ)的参数,优化将其他所有参数归零。

将F与数据进行比较,他们发现模型非常具有预测性。不仅如此,模型的公式短小精练!当然,他们能选中三角函数也是非常“幸运”了。

数学方法——无数据模型

很多年后,微积分终于被发现了!于是,两位老科学家开始重新审视这个问题。

1.假设方程

低速炮弹的物理模型非常简单。炮弹有垂直向下的重力加速度,恒定为-g。由于在x方向上没有作用在射弹上的力,它始终保持其初始速度。该模型可以写成二阶微分方程组:

初值条件为:

后两个方程式描述了炮弹最初发射时的速度的水平和垂直分量。这些方程描述了系统,但如何解决这些问题呢?

2.数值积分

通常在数学中,写下微分方程是一个简单的部分,大部分时间都花在试图解决它们上面!

他们写出了该问题的一阶常微分方程(ODE):

初值条件为:

易证这两个方程相同。

积分在数学中无处不在,有多种方法来进行数值积分。最简单和最直观的方法是欧拉方程,它从初始点开始,并在该点的梯度方向上走一小步,即:

使用数值积分,可以准确地预测炮弹的整个轨迹。

着陆点的位置是x(t*),它们可以从预测的轨迹中提取。

相比于机器学习模型,这一数学模型的一个明显优势是,我们可以很轻易地解决更复杂的问题——例如不平坦的地面,或者从塔上发射炮弹(y(0)≠0)

3.直接求解

最后,两位科学家使用了积分来求解,事实证明问题并非如此困难。x和y的方程可以独立求解。通过求解每个方程(并应用初始条件)给出。

他们以x和y坐标作为时间的函数。什么时候射弹击中了地面呢?当y=0时!即:

求解t*=0(大炮射击之前),并求解t*=2vsinθg(当它击中地面时)。将第二个t*值插入到x的等式中,得到最终的行进距离,等于:

那么他们的最终预测模型就是

他们发现这与准线性方法吻合。实际上,准线性方法也给出了他们对引力常数的估计。

神经常微分方程方法-学习动力系统

最后,假设他们不知道物理模型,只有一个常微分方程系统

其中f1和f2是未知的(为简洁起见省略虚拟变量)。

NIPS最近发表的一篇论文(https://papers.nips.cc/paper/7892-neural-ordinary-differential-equations)提出了一种学习常微分系统的方法。简而言之,它通过用神经网络替换f1,f2并数值积分神经网络来获得轨迹来实现这一点。学习可以正常进行,因为数值积分方法具有明确定义的梯度。在他们的例子中,如果科学家可以随时间跟踪炮弹的位置,即数据(xi,yi,ti),那么他们原则上可以恢复物理模型并了解物体随着时间的推移而下降加速。这是一个令人兴奋的深度学习新应用,它开启了学习系统行为的可能性,而不是简单地学习它们的输出。

我们学到了什么?

我们生活在一个幸运的年代,可以通过数百种不同的方式解决一个简单的问题。此外,在上述“黑盒”方法中,我们也可以将神经网络换成其他模型,并用上其他的优化方法。这突出了机器学习在数学中的作用——它是我们用以理解世界和做出预测的许多强大工具之一。

数学家对数学模型是可解释的,是直观的,而深度学习模型正好相反。在我举的例子中,构建数学模型并用机器学习填补空白(比如估测引力常数)可以带来更好的准确性和更快的计算。

如果我们能够尽可能多地融入物理理论,并利用机器学习来填补我们的知识空白,那么我们就有机会解决更复杂的问题。通常机器学习用于参数拟合,但在混合模型中,我们也可以用它来预测更复杂系统中的函数组成部分。

我相信,随着理论和技术的进步,我们将在未来看到许多混合模型。因此,数学建模和机器学习建模也应当是“合作关系”,而非“竞争关系”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数学模型
    +关注

    关注

    0

    文章

    83

    浏览量

    12397
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136230

原文标题:机器学习会取代数学建模吗?让我们假设一个微积分落后但深度学习发达的文明社会……

文章出处:【微信号:smartman163,微信公众号:网易智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    宇树王直言:人形机器人要“自主干活”,通信、AI大模型和安全需先破局

    对话,围绕人形机器人未来发展的关键节点,机器人市场爆发的关键挑战和当下发展的痛点等热点话题,王给出了精彩的阐述和技术趋势分析。
    的头像 发表于 09-25 18:04 1.1w次阅读
    宇树王<b class='flag-5'>兴</b><b class='flag-5'>兴</b>直言:人形<b class='flag-5'>机器</b>人要“自主干活”,通信、AI大<b class='flag-5'>模型</b>和安全需先破局

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文
    发表于 07-31 11:38

    无刷直流电机双闭环控制的仿真研究

    摘 要:为了便于对无刷直流电机的运行特性和控制策略的研究,文章详细的介绍了无刷直流电机工作原理和数学模型,提出无刷直流电机的控制策略,采用电流环为内环,速度环为外环的双闭环控制,并根据数学模型搭建
    发表于 07-08 18:33

    三相异步电机在SIMULINK下的建模与仿真

    摘要:异步电动机三相原始动态数学模型相当复杂,分析和求解这组非线性方程十分困难,因此,要简化数学模型,必须从简化磁链关展入手,简化的基本方法就是坐标变换。以异少电动机坐标变换为基础推导出同步旋转
    发表于 06-16 21:48

    绕组开放型永磁同步电机的建模及应用

    摘 要:本文以传统永磁电机 abc 坐标系下的动态数学模型为基础,推导出绕组开放型永磁电机的数学模型。将模型中的电压方程分为绕组电阻电压、绕组自感电压、绕组反电动势、绕组间的互感电压,建立绕组开放型
    发表于 06-12 13:52

    边缘计算中的机器学习:基于 Linux 系统的实时推理模型部署与工业集成!

    你好,旅行者!欢迎来到Medium的这一角落。在本文中,我们将把一个机器学习模型(神经网络)部署到边缘设备上,利用从ModbusTCP寄存器获取的实时数据来预测一台复古音频放大器的当前健康状况。你将
    的头像 发表于 06-11 17:22 769次阅读
    边缘计算中的<b class='flag-5'>机器</b><b class='flag-5'>学习</b>:基于 Linux 系统的实时推理<b class='flag-5'>模型</b>部署与工业集成!

    电机的数学模型和参数辨识

    纯分享帖,需要者可点击附件获取完整资料~~~ (免责声明:本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内容!)
    发表于 04-01 14:58

    机器人看点:宇树科技王回上海母校 加速商业化落地 宇树机器人二手租赁火爆

    给大家带来一些机器人的消息: 宇树科技王回上海母校 加速商业化落地 日前,宇树科技创始人王在接受媒体专访时候,介绍了公司的H1人形
    的头像 发表于 02-25 11:26 1774次阅读

    宇树科技王:AI驱动机器人每日快速进化

    都在进化时,王给出了肯定的回答。他表示,现在由AI驱动的机器人每天进化速度非常快,远远超出了他的预期。这些机器人每天都在给他带来惊喜,让他对技术的未来发展充满了信心。 王
    的头像 发表于 02-19 10:13 1055次阅读

    模型数学能力或许一直都在关键在于如何唤醒它

    在追求人工智能极限的道路上,"更大即更强" 似乎已成为共识。特别是在数学推理这一被视为 AI 终极挑战的领域,业界普遍认为需要海量数据和复杂的强化学习才能获得突破。 然而,来自上海交通大学的最新研究
    的头像 发表于 02-17 17:44 940次阅读
    大<b class='flag-5'>模型</b>的<b class='flag-5'>数学</b>能力或许一直都在关键在于如何唤醒它

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编将探讨机器学习
    的头像 发表于 02-13 09:39 619次阅读

    数学专业转人工智能方向:考研/就业前景分析及大学四年学习路径全揭秘

    随着AI技术的不断进步,专业人才的需求也日益增长。数学作为AI的基石,为机器学习、深度学习、数据分析等提供了理论基础和工具,因此越来越多的数学
    的头像 发表于 02-07 11:14 1699次阅读
    <b class='flag-5'>数学</b>专业转人工智能方向:考研/就业前景分析及大学四年<b class='flag-5'>学习</b>路径全揭秘

    人工神经网络的原理和多种神经网络架构方法

    所拟合的数学模型的形式受到大脑中神经元的连接和行为的启发,最初是为了研究大脑功能而设计的。然而,数据科学中常用的神经网络作为大脑模型已经过时,现在它们只是能够在某些应用中提供最先进性能的机器
    的头像 发表于 01-09 10:24 2243次阅读
    人工神经网络的原理和多种神经网络架构方法

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    近年来,人工智能领域的大模型技术在多个方向上取得了突破性的进展,特别是在机器人控制领域展现出了巨大的潜力。在“具身智能机器人大模型”部分,作者研究并探讨了大
    发表于 12-29 23:04

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    医疗领域,手术辅助机器人需要毫米级的精确控制,书中有介绍基于视觉伺服的实时控制算法,以及如何利用大模型优化手术路径规划。工业场景中,协作机器人面临的主要挑战是快速适应新工艺流程。具身智能通过在线
    发表于 12-24 15:03