0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个从数据中估计参数的基础机器学习问题

5RJg_mcuworld 来源:未知 作者:李倩 2018-04-27 11:30 次阅读

假如你有一个硬币。你把它投掷 3 次,出现了 3 次正面。下一次投掷硬币正面朝上的概率是多少? 这是一个从数据中估计参数的基础机器学习问题。在这种情况下,我们要从数据 D 中估算出正面朝上 h 的概率。

最大似然估计

一种方法是找到能最大化观测数据的似然函数(即 P(D;h))的参数 h 的值。在这里,我们用「;」来表示 h 是一个关于概率分布 P 的参数,意味着参数 h 定义了分布 P,但是分布 P 只是说明了观测数据 D 成立的可能性有多大。

这是被称为「最大似然估计」的最常用的参数估计方法。通过该方法,我们估计出 h=1.0。

但是直觉告诉我们,这是不可能的。对于大多数的硬币来说,还是存在反面朝上的结果的可能性,因此我们通常希望得到像 h=0.5 这样的结果。

先验和后验

如何将这种直觉数学化地表述出来呢?我们可以定义一个观测数据和参数的联合概率:p(D, h) = p(D|h)p(h)。我们定义一个先验分布 p(h) 来表示在观测前关于 h 应该是什么值的直觉,以及在给定参数 h 的情况下的条件概率 p(D|h)。

如何利用现有的数据 D 估计参数 h 呢?我们需要得到后验分布 p(h|D),但是目前只有分布 P(D|h) 和 p(h)。这时候,你需要贝叶斯公式来帮忙!

贝叶斯公式:P(h|D)=P(D|h)*P(h)/P(D)

但是,这里的分母是一个问题:

一般来说,计算这个积分是不可能的。对于这个投硬币的例子来说,如果使用非常特殊的共轭先验分布,就可以绕过这个问题。

最大后验估计

但实际上,我们可以抛开归一化常数 P(D) 以更巧妙的方式讨论 p(h|D)。也就是说归一化常数不改变分布的相对大小,我们可以在不做积分的情况下找到模式:

这就是人们所熟知的最大后验估计(MAP)。有很多种方法可以算出变量 h 的确切值,例如:使用共轭梯度下降法。

贝叶斯参数估计

有了最大后验估计,可以通过先验分布来引入我们的直觉,并且忽略归一化积分,从而得到后验分布模式下的关于 h 的点估计。

但是如果我们试着用近似方法求积分呢?如果按通常的独立同分布假设,我们可以利用这个事实:未来可能出现的数据样本值 x 条件独立于给定参数 h 时的观测值 D。

这并非使用与后验概率 p(h|D) 模式相应的参数 h 的单一值来计算 P(x|h),而是一个更加「严格」的方法,它让我们考虑到所有可能的 h 的后验值。这种方法被称为贝叶斯参数估计。

注意,存在两个关于概率分布的重要任务:

推断:给定已知参数的联合分布,通过其它变量的边缘概率和条件概率估计一个变量子集上的概率分布。

参数估计:从数据中估计某个概率分布的未知参数

贝叶斯参数估计将这两项任务构造成了「同一枚硬币的两面」:

估计在一组变量上定义的概率分布的参数,就是推断一个由原始变量和参数构成的元分布。

当然,实际上要做到这一点,需要计算困难的积分,我们将不得不用类似于「马尔可夫链蒙特卡洛算法」或者变分推断等方法取近似。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8134

    浏览量

    130580
  • 贝叶斯公式
    +关注

    关注

    0

    文章

    3

    浏览量

    1694

原文标题:什么是最大似然估计、最大后验估计以及贝叶斯参数估计?

文章出处:【微信号:mcuworld,微信公众号:嵌入式资讯精选】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    如何实现机器人的自我学习

    人可以有自我学习的技能,而机器人只能被灌输既定的知识吗?如何实现机器人的自我学习?考虑罐子,
    发表于 03-04 10:34

    [转]物联网和机器学习究竟有哪些真实应用价值?

    相互之间的关系。  般来说,当你知道你想要实现的目标是什么,但你不知道实现这个目标需要哪些重要变量的时候,机器学习是非常有价值的,你给机器学习
    发表于 04-19 11:01

    【下载】《机器学习》+《机器学习实战》

    强化学习等.下载链接:[hide][/hide]2.机器学习实战简介:机器学习是人工智能研究领域中
    发表于 06-01 15:49

    基于深度学习技术的智能机器

    样接收很复杂的信息,然后智能的进行分类。比如谷歌的人工智能平台可以把各种猫的图片都识别出来,而不管是什么样的猫。机器之所以能够如此智能,主要原因是它像人样,也进行了学习,它拥有
    发表于 05-31 09:36

    人工智能和机器学习的前世今生

    的不同组成部分和它们之间的相互关系,可以使机器学习任务变得更加容易。机器学习算法有结构化的
    发表于 08-27 10:16

    25机器学习面试题,你都会吗?

    问题都没有给出明确的答案,但都有定的提示。读者也可以在留言中尝试。许多数据科学家主要是从个数据从业者的角度来研究机器
    发表于 09-29 09:39

    9月份最热门的机器学习开源项目TOP 5

    。github 链接:[https://github.com/diux-dev/imagenet18]Pypeline—创建并发数据管道在大部分的机器学习项目中,数据工程是
    发表于 10-10 13:39

    分享机器学习Demo,很受用

    TensorFlow入门:第一个机器学习Demo
    发表于 02-12 10:13

    如何选择机器学习的各种方法

    的这篇博客,讲述了如何选择机器学习的各种方法。 另外,Scikit-learn 也提供了幅清晰的路线图给大家选择:其实机器学习的基本算法都
    发表于 03-07 20:18

    50机器学习实用API干货

    服务,设置数据源并创建模型进行预测。Google Cloud Prediction:这个API提供了RESTful API来构建机器学习
    发表于 10-06 08:00

    机器学习参数的如何选择

    机器学习:超参数的选择,余弦距离vs欧式距离vs曼哈顿距离
    发表于 04-24 07:58

    什么是人工智能、机器学习、深度学习和自然语言处理?

    如下。深度学习种基于人工神经网络的机器学习,通过多层次的处理,逐步数据中提取更高层次的特征
    发表于 03-22 11:19

    什么是TinyML?微型机器学习

    的领域,它几乎渗透到我们与之互动的每一个数字事物,无论是社交媒体、手机、汽车,甚至是家用电器。尽管如此,仍然有许多机器学习想要去的地方,但是它们很难到达。这是因为许多最先进的
    发表于 04-12 10:20

    什么是机器学习? 机器学习基础入门

    的指导下,这个过程数据开始。也就是说,我们嵌入式系统产生的大量数据机器学习开发过程的第步是
    发表于 06-21 11:06

    ISM330DHCX可用的机器学习内核功能信息

    本文档旨在提供 ISM330DHCX 可用的机器学习内核功能信息。机器学习处理能力允许将些算
    发表于 09-08 07:53