0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么时候适合使用逐步回归?

MinitabUG 来源: MinitabUG 作者: MinitabUG 2023-02-06 13:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我发现了一个很有意思的例子,是关于识别某制造厂的主要能源使用来源。

什么时候适合使用逐步回归?

当您有许多变量并且想确认有用的预测变量子集时,逐步回归就是一种合适的分析方法。在 Minitab 中,标准的逐步回归程序每次都只添加和删除一个预测变量。当模型中未包含的所有变量的 p 值都大于指定的入选用 Alpha 值,且模型中所有变量的 p 值都小于或等于指定的删除用 Alpha 值时,Minitab 停止。

除了标准逐步法外,Minitab 还提供另两种逐步程序:

* 向前选择法:Minitab 以模型中没有任何预测变量开始,并为每个步骤添加最显著的变量。当模型中未包含的所有变量的 p 值都大于指定的入选用 Alpha 值,Minitab 将停止。

* 向后消元法:Minitab 以模型中包含所有预测变量开始,并删除每个步骤的最小显著项。当模型中包含的所有变量的 p 值都小于或等于指定的删除用 Alpha 值时,Minitab 将停止。

逐步回归示例

本示例使用逐步回归识别主要的能源使用来源。制造厂的分析师考虑了以下预测变量:生产产品总数、设备总运行时间、员工人数、平均室外温度、最低室外温度、最高室外温度、日照百分率以及设备平均寿命。但值得注意的是,当预测变量达到 100 个以上时,逐步回归会非常有用!

get?code=MjliNzliZTUxYWEwNjFkYjcxNTYxOGQ5Nzk0MTUwYzUsMTY3NTY2MTgxNzk5NQ==

他们的目的是将这些变量缩小到能源使用的主要预测变量列表中。为得到最终模型,在 Minitab 中选择统计 > 回归 > 逐步,并输入响应“能源”和上面的预测变量列表来完成对话框。

get?code=Y2M4NWYwYzRlNWEzYjRjYTMyMDIxN2Y2MTVmNzAzNWQsMTY3NTY2MTgxNzk5NQ==

他们的目的是将这些变量缩小到能源使用的主要预测变量列表中。为得到最终模型,在 Minitab 中选择统计 > 回归 > 逐步,并输入响应“能源”和上面的预测变量列表来完成对话框。

get?code=ZjAyNTg1YzliMDNkZmViZWFhNzYxMzgzZWEzMGZkZTMsMTY3NTY2MTgxNzk5NQ==

他们得到了下面的模型,该模型中包含了设备总运行时间、最高温度和设备平均寿命三个预测变量。Minitab 删除了其他变量,因为这些变量的 p 值大于入选用 Alpha 值。

get?code=ZjUyYzlhMTc2NjQzNDc0MjEzOTk2YmMyYTg1MTA1NTUsMTY3NTY2MTgxNzk5NQ==

为获得最终模型,分析师选择统计 > 回归 > 回归,并通过将“能源”作为响应,且三个显著变量作为预测变量来完成对话框。(要检查残差图,在对话框中选择图形,然后在残差图下,选择四合一。)

get?code=ZjMwMDM2MGZjNWQ0MjI2Y2M2ZjgxZjM4ZmJmODZjYmUsMTY3NTY2MTgxNzk5NQ==

get?code=Y2Q5N2Y3OWY4ODQ5NzQwYWY5N2ZjODRhYTZiYjlmYzEsMTY3NTY2MTgxNzk5Ng==

以下回归方程表明,随着设备总运行时间、最高温度和设备平均寿命的增加,能源使用也相应增加:

get?code=MDljNmY4NDNlYmQzMjM3NGNjMjg1OTE4MjgwNTc0YzYsMTY3NTY2MTgxNzk5Ng==

根据 T 统计值,设备总运行时间的影响最大,最高温度次之,然后是设备平均寿命。

get?code=ODYxYzhmZjBhZThlNThiMmRjNDlmNDI3ODE1ZTcwOGMsMTY3NTY2MTgxNzk5Ng==

通过分析,分析师可以得出这样的结论:由于大量使用空调,能源使用显著增高;而较新的设备看上去降低了能源使用。工厂可能想要在持续使用空调的高峰期限制设备的运行,并考虑在夏季来临前购置新设备。

P逐步回归的陷阱

虽然逐步回归能帮助我们了解很多,但也存在一些需要注意的潜在陷阱:

· 如果两个独立变量高度相关,那么即使他们都很重要,模型中可能只包含其中一个。

· 由于该程序可以拟合许多模型,因此可能只是偶然的选择了恰好拟合数据的模型。

· 对于给定数量的预测变量,逐步回归可能不会总是以具有最高 R2 值的模型结束。

· 自动程序无法考虑分析师可能掌握对数据的特殊知识。因此,所选的模型可能不是最实用的。

· 根据响应来绘制单个预测变量图通常具有误导性,因为图形没有考虑模型中的其他预测变量。

审核编辑黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 能源
    +关注

    关注

    3

    文章

    2246

    浏览量

    45807
  • Minitab
    +关注

    关注

    0

    文章

    214

    浏览量

    12417
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    快问快答:什么时候需要多通道气密性检测设备?选择几个通道合适

    当生产线的节拍越来越快,单通道气密性检测仪开始成为瓶颈时,多通道气密性检测设备就进入了您的视野。但问题是:什么时候需要多通道?选择几个通道?如何权衡成本与效率?精诚工科多通道气密性检测设备在扫地机
    的头像 发表于 09-08 11:31 401次阅读
    快问快答:<b class='flag-5'>什么时候</b>需要多通道气密性检测设备?选择几个通道合适

    硬件工程师什么时候嘴最硬?

    行业资讯
    扬兴科技
    发布于 :2025年08月29日 19:21:58

    施耐德电气如何推动AI在产业中的深度落地

    当大模型的讨论热潮逐步回归理性,企业关注焦点已转向AI如何真正落地,成为推动产业效率、绿色转型和商业模式重塑的关键变量。
    的头像 发表于 08-25 15:29 698次阅读

    光缆什么时候开始应用

    光缆的应用始于20世纪70年代末至80年代初,具体发展历程如下: 一、技术突破奠定基础(1970-1977年) 1970年:美国康宁公司成功研制出第一根低损耗石英光纤,损耗低于20dB/km,首次验证了光纤通信的可行性。 1972年:康宁公司通过化学气相沉积法(CVD)将光纤损耗降至4dB/km,光纤进入实用化阶段。 1976年:美国贝尔实验室开通世界上第一个光纤数字通信线路(波长850nm,多模光纤),标志着光纤通信从实验走向实用。 1977年:全球首个商用光纤通信系统在美国亚特
    的头像 发表于 07-31 09:38 675次阅读
    光缆<b class='flag-5'>什么时候</b>开始应用

    wifi8什么时候出?wifi8是什么意思?wifi8解读

    (OBSS:overlapping basic service sets ) 的场景中,也可将95%的数据包延迟减少 25%,并将 MAC 协议数据单元 (MPDU:MAC Protocol Data Unit) 丢失率减少 25%;  降低AP功耗并改善点对点通信 wifi8什么时候出?w
    的头像 发表于 06-10 15:25 2710次阅读

    物联网开发提速秘籍:LuatIO可视化GPIO工具,效率翻倍!

    个GPIO,这38个GPIO又可以复用为各种各样的功能,如上表所示。 比如PIN66: 什么时候用作I2C0_SDA? 什么时候用作I2C1_SDA? 什么时候用作GPIO19? 什么时候
    的头像 发表于 06-09 15:54 470次阅读
    物联网开发提速秘籍:LuatIO可视化GPIO工具,效率翻倍!

    LuatIO:一键可视化,让GPIO配置成为物联网开发的“丝滑体验”!

    38个GPIO,这38个GPIO又可以复用为各种各样的功能,如上表所示。 比如PIN66: 什么时候用作I2C0_SDA? 什么时候用作I2C1_SDA? 什么时候用作GPIO19? 什么时候
    的头像 发表于 06-04 16:28 504次阅读
    LuatIO:一键可视化,让GPIO配置成为物联网开发的“丝滑体验”!

    将DMACB寄存器中的RC位设置为1来在DMA传输结束时重新加载计数器,什么时候将需要重新加载的值存储在FM3中?

    我尝试通过将 DMACB 寄存器中的 RC 位设置为 1 来在 DMA 传输结束时重新加载计数器。 什么时候将需要重新加载的值存储在 FM3 中? - 当我将 1 写入 EM 位时是否如此
    发表于 04-30 07:33

    为什么adc芯片不写输入时钟范围,实际使用中应该怎么给?什么时候与处理器同源?

    为什么adc芯片不写输入时钟范围,实际使用中应该怎么给?什么时候与处理器同源?
    发表于 04-15 06:10

    DLPC6401什么时候可以只用Nand Flash或者EEPROM单独对DLP进行配置?

    DLPC6401什么时候可以只用Nand Flash或者EEPROM单独对DLP进行配置?
    发表于 02-28 07:47

    ADS1204 CLKSEL置1时,如何采集数据?怎么知道什么时候是最高位?什么时候是最低位?

    当CLKSEL置1时,如何采集数据?意思是怎么知道什么时候是最高位?什么时候是最低位?
    发表于 02-06 06:51

    ADS1115的Config Register在什么时候配置比较好?

    请问一下大家: 1、ADS1115的Config Register 在什么时候配置比较好,因为我需要采集双通道AD 2、写入的时候是不是要先写ADDR,然后Pointer Reg指向Config
    发表于 01-10 10:30

    基于移动自回归的时序扩散预测模型

    在人工智能领域,目前有很多工作采用自回归方法来模拟或是替代扩散模型,其中视觉自回归建模(Visual AutoRegressive modeling,简称 VAR)就是其中的典型代表,该工作利用自
    的头像 发表于 01-03 14:05 1646次阅读
    基于移动自<b class='flag-5'>回归</b>的时序扩散预测模型

    OpenAI宣布API恢复运行,ChatGPT正在逐步回归

    近日,OpenAI官方发布了一则重要更新说明,宣布其API系统现已全面恢复运行,同时确认ChatGPT服务正在逐步恢复中。这一消息对于众多依赖OpenAI服务的用户来说,无疑是一个好消息。 早些时候
    的头像 发表于 12-28 14:41 1124次阅读

    请问AFE4400读取的数据什么时候才会出现0?

    我目前用的是AFE4400,读取的是红光、红外光和去环境红光,我想知道读取的数据什么时候才会出现0?随着光照增强,是不是接受到的数据会变得更大?我读取数据的时候,完全屏蔽掉接收端能够读到0,但是在没有完全屏蔽掉的时候也会出现一
    发表于 12-20 10:03