0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何及何时重新调校ML

倩倩 来源:读芯术 2020-07-17 10:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

古希腊哲学家赫拉克利特说:“唯一不变的就是变化”。时间拥有着我们无法撼动的强大力量,无论是观念、社会还是人类本身,都会随着时间的推移而发生巨大的变化。

往日比较先进的事物会被当今所淘汰,如今新颖的想法也可能在接下来几年被遗忘。了解变化对企业来说至关重要。

15年前,如果一家手机制造公司没有搭上研发智能手机的列车,还有可能生存下来吗?它们几乎都已经从市场上消失了。拥有功能简单的移动手机是曾经的常态,然而人们的需求迅速转向了智能手机,未能适应变化的公司付出了代价。

数据分析,逐渐开始获得了世界的支配权,机器学习模型成为了促成公司决策的主要力量。这些模型和所有商业策略一样,需要随时间推移而不断调校,技术上来说是由于“模型漂移”。

什么是“模型漂移”

虽然大多数课程、文章和帖子都定义了机器学习的生命周期——从收集数据开始,到在不同环境中部署机器学习模型结束,但人们往往会忘记机器学习生命周期中一个十分重要的特性,那就是模型漂移。

本质上来说,目标变量与自变量之间的关系随时间而变化。模型漂移使模型无法保持稳定,预期也会逐渐出现越来越多的错误。

我们试着从简单的线性回归这一技术角度来理解这一情况。线性回归中,我们简单地映射自变量x_i来预测目标变量y:

y = α + β_1*x_1 + β_2*x_2+ β_3*x_3 + …

其中,α是截距,β_i对应于变量x_i的系数。

通常会假设这一映射是静态的,即我们假设系数β_i(和截距α)不随时间而变化,且控制目标变量y预测的关系对未来的数据也合理有效。

然而,这一假设在所有情况下都不成立。企业的盈利很大程度上依赖于这样的模型,一旦假设不成立,就会对企业构成严重的威胁。

这些模型可能代表了未来发展中的情况,所以之后一定是站不住脚的。由于基本条件的变化,预测会随着时间失去准确性。

漂移的种类

模型漂移可以分为两大类:

第一类是“概念漂移”,一旦目标变量本身的统计特性发生变化,就会发生这种情况。显然,如果试图预测变量的重要意义改变了,模型就不能有效适用于这个定义了。

第二类也是最常见的一类是“数据漂移”,预测的统计特性改变时发生。同样,如果基础变量在改变,模型就会失效。

一个经典的例子就是季节性导致的数据模式变化。夏季有用的商业模型到冬季就可能失效了。假期里航班需求大大增加,而淡季里只能勉强维持客座率。再如人们偏好的改变,就像开头提到的智能手机。

如何解决?

优秀的解决方案就是不断修改模型。模型里开始出现漂移后,可基于以往经验来进行预估。这样一来,模型能够得到积极的重建以降低漂移带来的风险。

如果数据随着时间不断变化,权衡数据是一个不错的选择。基于近期交易来决定特定参数的金融模型能够增加一些特性,如赋予近期交易更多权重而减少对过往交易的关注。这不仅保证了模型的稳健性,而且也有助于避免出现与漂移相关的潜在问题。

应对模型漂移更复杂的一个方法就是对变化本身进行建模。开发的第一个模型必须保持静态并作为基线。现在,由于近期数据行为的改变,可以建立新的模型来纠正对这个基线模型的预测。

应多久重新调校一次模型?

我们已经知道了比较常见的解决方法是持续重新调校模型,接下来的问题就是,需要多久重新调校一次呢?这需要具体问题具体分析。

有时,问题会自己出现。虽然等待问题出现不是最简便的方法,但是对新建的模型来说这是唯一的选择,因为无法从过往的经验知晓问题会如何出现。当问题浮出水面,就可以研究问题并进行修改,以应对日后会出现的相关问题。

有时,数据与模型中处理的实体相关,遵循季节性模式。这种情况下,应随季节变化来重新调校模型。随着节假日支出增加,信贷贷款机构需要特殊的模型来应对模式中突然出现的此类变化。

然而,检测漂移的优秀方法是持续的监测。与模型稳定性有关的度量需要在连续的时间间隔内进行监测。间隔时间可以是一周、一个月或一个季度,取决于不同的领域和业务。

监测可以是由人工操控或交给自动脚本。若突发异常情况,自动脚本要能够触发警报并发送通知。

变化是永恒存在的,只有做好准备接受变化并监测变化的公司才会取得成功,这一点需谨记。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136233
  • 数据分析
    +关注

    关注

    2

    文章

    1506

    浏览量

    35942
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    X0115ML SCR晶闸管技术解析:高灵敏度门极触发与紧凑型设计的完美融合

    STMicroelectronics X0115ML 0.8A SCR(硅控制整流器)晶闸管具有高度敏感的触发电平,因此非常适合用于栅极电流受限的应用。X0115ML具有600V高阻断电压和750V浪涌峰值电压,非常适合用于接地故障断路器 (GFCI) 和电弧故障断路器
    的头像 发表于 10-29 14:16 247次阅读
    X0115<b class='flag-5'>ML</b> SCR晶闸管技术解析:高灵敏度门极触发与紧凑型设计的完美融合

    ML307‑Y硬件设计规范(2)——接口与电平

    本篇聚焦工程师在 ML307‑Y 量产中最容易忽略、但最影响稳定性的细节,提供一份可执行的 Checklist 与常见坑速查。 总体思路 ML307‑Y 逻辑电平为 1.8V 域;USB 为高速差分
    的头像 发表于 10-17 14:01 369次阅读

    at_device 包 ml307长时间运行有内存泄漏问题怎么解决?

    使用 at_device 包中的 ml307 包长时间运行有大量内存泄漏问题,大概涨了20K,求助解决。
    发表于 09-24 07:41

    AT_DEVICE支持ML307吗?

    这个到底支不支持ML305 ML307,图形界面有 ,但是保存配置后并没有这个文件,如果没有就在介绍上删掉吧,浪费一天时间加这个东西
    发表于 09-11 07:42

    4G网络AT模块:ml307A 总是连接失败,为什么?

    使用 AT client 连接 ml307A 4G网络,在多个地方使用网络,然后就经常出现连接失败或关闭失败: [E/at.skt.ml307] ml307 device(ml
    发表于 09-11 07:05

    如何利用NuMicro® M55M1 ML MCU进行面部标志检测应用?

    如何利用NuMicro® M55M1 ML MCU进行面部标志检测应用?
    发表于 09-05 06:59

    何时使用 GPIO 中断和外部中断?

    何时使用 GPIO 中断和外部中断?
    发表于 08-26 07:27

    如何使 ML56-TK 驱动程序适应 Linux 内核?

    如何使 ML56-TK 驱动程序适应 Linux 内核
    发表于 08-20 07:57

    人机交互优化:聚徽分享工业全贴合触摸屏灵敏度调校的5个实用参数

    一、引言 工业全贴合触摸屏在智能制造、户外作业、医疗设备等场景中,需应对复杂环境(如戴手套操作、油污污染、极端温度)的挑战。传统触控调校方法易导致误触或响应延迟,影响操作效率。本文聚焦灵敏度调校
    的头像 发表于 06-23 11:38 1937次阅读

    AI和ML如何重塑电子制造业

    随着工业4.0的到来,人工智能(AI)和机器学习(ML)不仅仅是流行词,它们正在重塑制造业。这场科技的浪潮,特别在电子制造领域,带来了令人惊叹的突破和机遇。在以数据驱动决策,以人为本理念的推动下,先进的制造技术使电子制造业正变得更加高效和灵活,开启了全新的未来。
    的头像 发表于 04-17 14:49 809次阅读

    关于ML4842输出PWM波形失真问题?

    如示波器波形所示,ML4842芯片11脚PWM输出波形失真是什么原因造成,原理图上的PWM输出管已经拆除,实际原理图与图上原理图有区别,ML4842电压VCC独立供电
    发表于 04-09 14:52

    Raspberry Pi Pico 2 上实现:实时机器学习(ML)音频噪音抑制功能

    Arm公司的首席软件工程师SandeepMistry为我们展示了一种全新的巧妙方法:在RaspberryPiPico2上如何将音频噪音抑制应用于麦克风输入。机器学习(ML)技术彻底改变了许多软件应用
    的头像 发表于 03-25 09:46 946次阅读
    Raspberry Pi Pico 2 上实现:实时机器学习(<b class='flag-5'>ML</b>)音频噪音抑制功能

    何时选择OSPF作为路由协议

    在构建网络时,选择合适的路由协议对于确保网络的高效性和稳定性至关重要。OSPF(开放最短路径优先)是一种广泛使用的内部网关协议,特别适合于大型、复杂或多路径的网络环境。本文将探讨何时选择OSPF作为路由协议,并分析其优势和其他路由协议的对比。
    的头像 发表于 03-18 09:14 892次阅读
    <b class='flag-5'>何时</b>选择OSPF作为路由协议

    SPEC ML基准测试新增模算效率指标

    近日,国际标准性能评估组织SPEC宣布了AI基准测试SPEC ML的最新进展。此次更新标志着SPEC ML基准测试在面向不同AI负载下的软硬件系统性能评估方面取得了重要突破,成功构建了性能、扩展性
    的头像 发表于 01-15 14:28 762次阅读

    Silicon Labs携手Eta Compute简化边缘ML开发

    Silicon Labs(芯科科技)与 Eta Compute近期共同宣布建立合作伙伴关系,将支持产品开发人员将机器学习(ML)高级功能无缝集成到其边缘ML嵌入式产品中,以添加多样应用价值。
    的头像 发表于 12-12 10:26 1069次阅读