0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MIT使用贝叶斯推理让计算机程序编写专门为数据分析设计的新程序

DPVg_AI_era 来源:lq 2019-01-21 08:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

MIT的研究人员使用贝叶斯推理,让计算机程序编写专门为数据分析设计的新程序。其目的是减轻那些本身不是人工智能专家的数据科学家的负担。

最近有个非常流行的话题:如何让普通人(普通人指既不是程序员,也不是IT管理员,更不是机器学习科学家的人群)更容易接近人工智能?

比较流行的一种方法是将所有的复杂性抽象到云计算操作中。

然而,本周MIT提出了另一种方法:让机器学习自己完成更多的工作,发明自己的程序,在时间序列分析等特定应用程序中处理数据。

这本身就是人工智能的一个热门领域,让机器建立模型,进而从数据中归纳出答案。

计算机程序设计自动化方法中,“第一个概率程序的贝叶斯合成”

研究人员描述了一种自动创建推断数据模式的程序的方法,这意味着数据科学家不再需要找出适合所研究数据的“模型”。

这项工作发表在计算机协会网站上的一篇论文中,题为《用于自动数据建模的贝叶斯合成概率程序》(Bayesian Synthesis of Probabilistic Programs for Automatic Data Modeling)。

其作者分别是MIT的Feras A. Saad、Marco F. Cusumano-Towner、Ulrich Schaechtle、Martin C. Rinard和Vikash K. Mansinghka。

Saad和他的同事们所要攻克的问题是:找到正确的程序来分析给定的数据集所需的所有工作。

正如他们在文章当中所述,要解决这个问题,将面临如下方面的困难:

用户需要手动选择模型或程序结构;

需要大量的建模专业知识;

建模能力有限;

如果用户没有探索足够广泛的模型或程序结构,可能会丢失数据的重要方面。

为了解决这个问题,他们打算让计算机做决定。

Saad和他的同事们继承了近年来“合成”计算机程序的传统,让一个程序生成另一个程序。

在这方面,有很多值得借鉴的例子,例如Google DeepMind科学家2014年为建立“神经图灵机”所做的努力。 该项目使用所谓的“循环神经网络”来发现简单的计算机算法,例如复制和粘贴文本。

作者的同事通过设计“概率”程序而不是经典的“确定性”程序来做区分。

这意味着在给定特定输入的情况下,程序不一定会产生可预测的输出。相反,程序的输出将反映输入它们的数据的噪声和不确定性。

为了实现这一点,作者使用了贝叶斯统计方法。他们对大量的计算机程序进行取样,并对每个程序的可能性进行评分,以此作为处理想要研究的数据的可能解决方案。

正如作者所说,在所有的计算机程序设计自动化方法中,他们的方法是“第一个概率程序的贝叶斯合成”。

“领域特定语言”构建的程序是关键

帮助研究人员实现这一壮举的是他们做出的一个关键选择:他们开始构建,或“合成”,不仅仅是任意一般类型的计算机程序,而是由“领域特定语言”构建的程序。

MIT的研究人员描述了他们的贝叶斯推理方法在特定领域的语言中搜索表达式的过程,以组合一组可以分析特定类型数据的算法。

DSL是在某种程度上可以匹配它们处理数据的语言。例如,有一些“数据建模”语言可以帮助表示数据中的关系。Yang就是这样一种数据建模语言的名称,用于计算机网络的建模。

通过将他们的方法限制在DSL上,作者适当缩小了计算机程序的“搜索空间”,从而提高了他们找到解决方案的几率,而不是像神经图灵机那样采用更通用的方法。

一旦贝叶斯推理过程装配了一些Winning Program,这些程序就能够对数据进行推理。

例如,作者描述了适合分析多年飞行里程的程序。这是一个时间序列分析问题,所谓的高斯统计过程是合适的。

因此,他们的贝叶斯推断综合了包含高斯过程操作的算法,以找到那些有可能拟合数据的算法组合。

与“卷积神经网络”等一些通用机器学习模型不同,这种方法的一大好处是,合成的程序在某种意义上是可以解释的,它们不是AI中令人恐惧的“黑匣子”。

这是因为程序是特定于领域的,所以它们的操作会“泄露”它们在数据中发现的内容。

正如作者所描述的,“领域特定语言中合成的程序提供了紧凑的数据模型,使定性属性在程序的表面语法中变得明显。”

同时,作者还展示了如何使这些DSL程序能够对新数据进行泛化。

他们使用一个解释器程序将单个算法转换成一种叫做Venture的东西,这是一种更加广泛和通用的概率编程语言。然后Venture就可以在更广泛的应用程序中对数据进行推断。

当然,这项工作有进一步的方向。研究人员特别指出,他们的工作在未来可能会纳入用户对数据应如何处理或分析的具体要求。

这意味着人类对数据的智能与机器技能的融合,或许是人与人工智能的理想结合。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50547

    浏览量

    267926
  • 机器学习
    +关注

    关注

    67

    文章

    8571

    浏览量

    137450
  • 数据分析
    +关注

    关注

    2

    文章

    1526

    浏览量

    36433

原文标题:MIT实现机器自动建模,数据分析分分钟搞定

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Neousys宸曜发布强固紧凑型边缘AI计算机,支持RTX GPU

    强固型嵌入式计算机厂商Neousys宸曜科技发布了一款紧凑的强固可靠型边缘AI计算机Nuvo-11160GC,专为严苛的工业和机器人应用而打造。Nuvo-11160GC搭载了英特尔®酷睿
    的头像 发表于 04-20 11:47 324次阅读
    Neousys宸曜发布强固紧凑型边缘AI<b class='flag-5'>计算机</b>,支持RTX GPU

    计算机专业408考研科目

    ”模型。 在这个阶段,不要急于背诵数据结构的代码或操作系统的算法,而是要理解计算机是如何“思考”的。你需要将数据结构视为信息的组织方式,将组成原理视为信息的物理载体,将操作系统视为资源的管理者,将网络视为
    发表于 04-11 16:44

    API数据分析:淘宝流量来源分析,渠道优化!

    ​ 在电商领域,流量来源分析是优化营销策略的核心。淘宝作为中国领先的电商平台,其流量数据可通过API(应用程序接口)高效获取和分析。本技术帖将逐步指导您如何利用淘宝API进行流量来源
    的头像 发表于 01-23 13:42 511次阅读
    API<b class='flag-5'>数据分析</b>:淘宝流量来源<b class='flag-5'>分析</b>,渠道优化!

    龙芯主板工控计算机拥有安全可信的核心

    工控计算机,是工业自动化和智能制造领域的核心设备,负责数据采集、处理、存储与传输,实现设备的监控与控制,确保生产线的稳定运行。在现代工业生产中,工控计算机的地位不可或缺,它如同智能制造的心脏,
    的头像 发表于 01-21 09:02 528次阅读

    经营数据分析可以通过哪些方式

    在数聚股份看来,提起经营数据分析,大家往往会联想到一些密密麻麻的数字表格,或是高级的数据建模手法,再或是华丽的数据报表。其实,“ 分析 ”本身是每个人都具备的能力,对于业务决策者而言,
    的头像 发表于 12-05 16:31 810次阅读

    上位机程序编写

    本文将讨论GPS/北斗定位模块作为接收机,将接收到的定位信息通过串口发送给计算机,再由计算机接收并解码获取相关信息。 在定位模块正确移植到DDR200T开发板的基础上,首先编写下位机程序
    发表于 10-28 06:40

    军用导航领域嵌入式计算机分析

    在导航系统中,嵌入式计算机的核心作用是实时处理多种传感器的数据,运行复杂的导航算法,最终计算出载体的精确位置、姿态、速度和时间信息。
    的头像 发表于 09-26 16:52 1369次阅读

    【作品合集】赛昉科技VisionFive 2单板计算机开发板测评

    VisionFive 2 上目标检测准备软件环境并运行 MobileNet-SSD 模型【VisionFive 2单板计算机试用体验】VisionFive 2复古游戏机改造 作者:TLLED【VisionFive 2
    发表于 09-04 09:08

    加固计算机是用来干什么的?

    加固计算机是一种专门复杂环境和特殊行业应用设计的高性能设备。它不仅具备常规电脑的数据处理和运算功能,更在结构设计、防护等级和硬件配置方面做了全面优化。例如,它的外壳通常采用镁铝合金或
    的头像 发表于 08-22 09:55 724次阅读

    工业计算机的重要性

    于管理用于产品检查、数据记录和数据分析的运动控制系统,以提高制造生产率。例如,汽车行业从工业边缘计算机中受益匪浅,这些计算机用于自动化制造汽车所涉及的各种过程。工业边
    的头像 发表于 07-28 16:07 839次阅读
    工业<b class='flag-5'>计算机</b>的重要性

    自动化计算机经过加固后有什么好处?

    让我们讨论一下部署坚固的自动化计算机的一些好处。1.温度范围宽自动化计算机经过工程设计,配备了支持宽温度范围的组件,使自动化计算解决方案能够在各种不同的极端环境中运行。自动化计算机能够
    的头像 发表于 07-21 16:44 844次阅读
    自动化<b class='flag-5'>计算机</b>经过加固后有什么好处?

    AI数据分析仪设计原理图:RapidIO信号接入 平板AI数据分析

    AI数据分析仪, 平板数据分析仪, 数据分析仪, AI边缘计算, 高带宽数据输入
    的头像 发表于 07-17 09:20 974次阅读
    AI<b class='flag-5'>数据分析</b>仪设计原理图:RapidIO信号接入 平板AI<b class='flag-5'>数据分析</b>仪

    自动化计算机的功能与用途

    工业自动化是指利用自动化计算机来控制工业环境中的流程、机器人和机械,以制造产品或其部件。工业自动化的目的是提高生产率、增加灵活性,并提升制造过程的质量。工业自动化在汽车制造中体现得最为明显,其中许多
    的头像 发表于 07-15 16:32 994次阅读
    自动化<b class='flag-5'>计算机</b>的功能与用途

    工业计算机与商用计算机的区别有哪些

    工业计算机是一种专为工厂和工业环境设计的计算系统,具有高可靠性和稳定性,能够应对恶劣环境下的自动化、制造和机器人操作。其特点包括无风扇散热技术、无电缆连接和防尘防水设计,使其在各种工业自动化场景中
    的头像 发表于 07-10 16:36 1011次阅读
    工业<b class='flag-5'>计算机</b>与商用<b class='flag-5'>计算机</b>的区别有哪些

    大模型推理显存和计算量估计方法研究

    方法。 一、引言 大模型推理是指在已知输入数据的情况下,通过深度学习模型进行预测或分类的过程。然而,大模型的推理过程对显存和计算资源的需求较高,这给实际应用带来了以下挑战: 显存不足:
    发表于 07-03 19:43