0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

广义线性模型介绍

8g3K_AI_Thinker 来源:人工智能头条 2019-11-22 15:10 次阅读

本文介绍了广义线性模型,其中线性回归、logistic回归,softmax回归同属于广义线性模型。从指数分布家族推导出高斯分布、伯努利分布对应的指数分布家族形式,以最大化期望为目标推导出线性回归、logistic回归,softmax回归的目标函数,进一步强调模型的概率解释性。

广义线性模型

从线性回归,logistic回归,softmax回归,最大熵的概率解释来看,我们会发现线性回归是基于高斯分布+最大似然估计的结果,logistic回归是伯努利分布+对数最大似然估计的结果,softmax回归是多项分布+对数最大似然估计的结果,最大熵是基于期望+对数似然估计的结果。前三者可以从广义线性模型角度来看。

A、指数分布家族

指数分布家族是指可以表示为指数形式的概率分布,指数分布的形式如下:

其中是分布的自然参数,是充分统计量,通常. 当参数都固定的时候,就定义了一个以为参数的函数族。

实际上大多数的概率分布都属于指数分布家族,比如:

1)伯努利分布 0-1问题

2)二项分布,多项分布 多取值 多次试验

3)泊松分布 计数过程

4)伽马分布与指数分布

5)分布

6)Dirichlet分布

7)高斯分布

现在我们将高斯分布和伯努利分布用指数分布家族的形式表示:

高斯分布:


对应到指数分布家族有:


伯努利分布:


对应到指数分布家族有:

B、广义线性模型

在了解指数分布家族之后,我们再来看广义线性模型的形式定义与假设:

1)给定样本x与参数,样本分类y服从指数分布家族的某个分布。

2)给定一个x,我们目标函数为:

3)

三条假设,第一条是为了能在指数分布范围内讨论y的概率,第二条假设是为了使得预测值服从均值为实际值得一个分布,第三条假设是为了设计的决策函数(模型)是线性的。

由高斯分布的指数家族分布形式与广义线性模型的定义有线性回归的模型为:


同样由伯努利分布的指数家族分布形式与广义线性模型的定义有logistic回归的模型为(解释了为什么是sigmoid函数):


所以,在广义线性模型中,决策函数为线性函数是基于广义线性模型的第三条假设,而最终的模型是依赖于模型服从什么样的分布,比如 高斯分布,伯努利分布。

同样,我们应用logistic回归到softmax回归的一套定义,下面再来看多项分布对应的softmax回归:


其中是表示的概率,是一个指示函数,为真是取值为,否则为,采用softmax中向量化的定义。

对应到指数分布家族有:


由推出:

为了方便定义,由于多项分布所有值取值概率加和为1有:

所以有:

再由广义线性模型的第二条假设,同时将第三条线性假设带入有:

最后由最大似然估计有softmax的目标函数如下:

到此,广义线性模型解释线性回归,logistic回归,softmax回归基本算完,可以看出线性函数是基于广义线性模型的第三条假设,采用sigmoid函数是因为伯努利分布,而softmax回归是logistic回归高维推广。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 函数
    +关注

    关注

    3

    文章

    3860

    浏览量

    61303
  • 线性
    +关注

    关注

    0

    文章

    188

    浏览量

    24969
  • 模型
    +关注

    关注

    1

    文章

    2703

    浏览量

    47667

原文标题:【机器学习】知否?知否?广义线性模型

文章出处:【微信号:AI_Thinker,微信公众号:人工智能头条】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    MES深化应用五级成熟度模型介绍

    电子发烧友网站提供《MES深化应用五级成熟度模型介绍.docx》资料免费下载
    发表于 02-23 17:10 1次下载

    SPICE中的热模型介绍

    SPICE模型中的热模型是指用于模拟和预测电子元件在工作时的热行为特性的模型。这些模型通常与电路仿真软件一起使用,以便在设计阶段评估和优化电子系统的热性能。热
    的头像 发表于 02-06 11:28 379次阅读
    SPICE中的热<b class='flag-5'>模型</b><b class='flag-5'>介绍</b>

    大信号模型和小信号模型的区别

    大信号模型和小信号模型是电子工程和通信领域中常用的两种模型,它们在描述和分析电子电路或系统时具有不同的特点和应用范围。以下是关于大信号模型和小信号
    的头像 发表于 12-19 11:35 3053次阅读

    LabVIEW进行癌症预测模型研究

    )进行非线性数据分类。主成分分析(PCA)和线性判别分析(LDA)PCA和LDA用于降维,减少噪声,并保留数据的重要特征。在并行PCA-LDA-SVM模型中,先对原始数据同时进行PCA和LDA处理
    发表于 12-13 19:04

    求助,关于运放开环增益非线性的问题

    在数个sim中我用调味料模型进行了仿真,电路图如下: 图 2 开环增益非线性度的调味料模型仿真电路 对V3进行-10v -10v-10V直流扫描,得到探针1电压(Vx)、探针2电压(Vy
    发表于 11-21 08:24

    基于动力学模型的机器人介绍

    机器人具有高度非线性,强时变以及强耦合等动力学特性,为了提高机器人控制的性能,研究人员提出了基于模型的控制(Model Based Control)方法。 在机器人研究领域,多种常见的高性能机器人
    的头像 发表于 11-17 17:43 414次阅读

    基于车辆动力学模型的横向控制

    基于车辆运动学模型的方法忽略了车辆的动力学特性,因此在 车速过快 或者 曲率变化率过大 的情况下该算法无法满足车辆的稳定性控制要求。 这里介绍一种典型的基于车辆动力学模型的横向控制方法,包括: 车辆
    的头像 发表于 11-15 16:47 283次阅读
    基于车辆动力学<b class='flag-5'>模型</b>的横向控制

    介绍reactor的四种模型

    前言 本文将由浅入深的介绍reactor,深入浅出的封装epoll,一步步变成reactor模型,并在文末介绍reactor的四种模型。 reactor是什么? reactor是一种高
    的头像 发表于 11-08 15:29 483次阅读
    <b class='flag-5'>介绍</b>reactor的四种<b class='flag-5'>模型</b>

    线性回归模型的基础知识

    我准备使用scikit-learn给大家介绍一些模型的基础知识,今天就来讲讲 线性回归模型 。 1.准备 开始之前,你要确保Python和pip已经成功安装在电脑上,如果没有,可以访问
    的头像 发表于 10-31 10:54 226次阅读
    <b class='flag-5'>线性</b>回归<b class='flag-5'>模型</b>的基础知识

    AI大模型的开源算法介绍

    AI大模型的开源算法介绍 什么是开源?简单来说就是不收取任何费用,免费提供给用户的软件或应用程序。开源是主要用于软件的术语,除了免费用户还可以对开源软件的源代码进行更改,并根据自身的使用情况进行
    的头像 发表于 08-08 17:25 1369次阅读

    AI大模型和小模型是什么?AI大模型和小模型的区别

      随着人工智能的不断发展和应用,机器学习模型的大小越来越成为一个重要的问题。在机器学习中,我们通常将模型分为两类:大模型和小模型。本文将介绍
    发表于 08-08 16:55 5399次阅读

    广义线性模型#机器学习

    机器学习
    未来加油dz
    发布于 :2023年07月14日 16:24:07

    GLoRA:一种广义参数高效的微调方法

    了卓越的能力。   本文提出了 广义LoRA (GLoRA),一种通用参数高效微调任务的先进方法。增强低秩适应(LoRA), GLoRA 采用 广义提示模块优化 预训练模型权重并调整中间层激活函数,为不同的任务和数据集提供更大的
    的头像 发表于 06-27 16:53 447次阅读
    GLoRA:一种<b class='flag-5'>广义</b>参数高效的微调方法

    无线通信信号传输模型介绍

    信号散射体固定的和运动的)的反射引起。这类衰落称为“多径”衰落。   对在这样复杂环境中传播信号的变化进行精确特征描述,是一项非常艰巨的任务。下面介绍的各种模型,就是通过大量的实测数据,或者精确的电磁
    发表于 05-06 11:40

    Fluent中的多相流模型介绍

    Fluent 提供了 4 种多相流模型:VOF (Volume of Fluid)模型、Mixture (混合)模型、Eulerian (欧拉)模型和Wet Steam (湿蒸汽)
    的头像 发表于 05-02 18:15 1.2w次阅读
    Fluent中的多相流<b class='flag-5'>模型</b><b class='flag-5'>介绍</b>