0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何及何时重新调校ML

倩倩 来源:读芯术 2020-07-17 10:34 次阅读

古希腊哲学家赫拉克利特说:“唯一不变的就是变化”。时间拥有着我们无法撼动的强大力量,无论是观念、社会还是人类本身,都会随着时间的推移而发生巨大的变化。

往日比较先进的事物会被当今所淘汰,如今新颖的想法也可能在接下来几年被遗忘。了解变化对企业来说至关重要。

15年前,如果一家手机制造公司没有搭上研发智能手机的列车,还有可能生存下来吗?它们几乎都已经从市场上消失了。拥有功能简单的移动手机是曾经的常态,然而人们的需求迅速转向了智能手机,未能适应变化的公司付出了代价。

数据分析,逐渐开始获得了世界的支配权,机器学习模型成为了促成公司决策的主要力量。这些模型和所有商业策略一样,需要随时间推移而不断调校,技术上来说是由于“模型漂移”。

什么是“模型漂移”

虽然大多数课程、文章和帖子都定义了机器学习的生命周期——从收集数据开始,到在不同环境中部署机器学习模型结束,但人们往往会忘记机器学习生命周期中一个十分重要的特性,那就是模型漂移。

本质上来说,目标变量与自变量之间的关系随时间而变化。模型漂移使模型无法保持稳定,预期也会逐渐出现越来越多的错误。

我们试着从简单的线性回归这一技术角度来理解这一情况。线性回归中,我们简单地映射自变量x_i来预测目标变量y:

y = α + β_1*x_1 + β_2*x_2+ β_3*x_3 + …

其中,α是截距,β_i对应于变量x_i的系数。

通常会假设这一映射是静态的,即我们假设系数β_i(和截距α)不随时间而变化,且控制目标变量y预测的关系对未来的数据也合理有效。

然而,这一假设在所有情况下都不成立。企业的盈利很大程度上依赖于这样的模型,一旦假设不成立,就会对企业构成严重的威胁。

这些模型可能代表了未来发展中的情况,所以之后一定是站不住脚的。由于基本条件的变化,预测会随着时间失去准确性。

漂移的种类

模型漂移可以分为两大类:

第一类是“概念漂移”,一旦目标变量本身的统计特性发生变化,就会发生这种情况。显然,如果试图预测变量的重要意义改变了,模型就不能有效适用于这个定义了。

第二类也是最常见的一类是“数据漂移”,预测的统计特性改变时发生。同样,如果基础变量在改变,模型就会失效。

一个经典的例子就是季节性导致的数据模式变化。夏季有用的商业模型到冬季就可能失效了。假期里航班需求大大增加,而淡季里只能勉强维持客座率。再如人们偏好的改变,就像开头提到的智能手机。

如何解决?

优秀的解决方案就是不断修改模型。模型里开始出现漂移后,可基于以往经验来进行预估。这样一来,模型能够得到积极的重建以降低漂移带来的风险。

如果数据随着时间不断变化,权衡数据是一个不错的选择。基于近期交易来决定特定参数的金融模型能够增加一些特性,如赋予近期交易更多权重而减少对过往交易的关注。这不仅保证了模型的稳健性,而且也有助于避免出现与漂移相关的潜在问题。

应对模型漂移更复杂的一个方法就是对变化本身进行建模。开发的第一个模型必须保持静态并作为基线。现在,由于近期数据行为的改变,可以建立新的模型来纠正对这个基线模型的预测。

应多久重新调校一次模型?

我们已经知道了比较常见的解决方法是持续重新调校模型,接下来的问题就是,需要多久重新调校一次呢?这需要具体问题具体分析。

有时,问题会自己出现。虽然等待问题出现不是最简便的方法,但是对新建的模型来说这是唯一的选择,因为无法从过往的经验知晓问题会如何出现。当问题浮出水面,就可以研究问题并进行修改,以应对日后会出现的相关问题。

有时,数据与模型中处理的实体相关,遵循季节性模式。这种情况下,应随季节变化来重新调校模型。随着节假日支出增加,信贷贷款机构需要特殊的模型来应对模式中突然出现的此类变化。

然而,检测漂移的优秀方法是持续的监测。与模型稳定性有关的度量需要在连续的时间间隔内进行监测。间隔时间可以是一周、一个月或一个季度,取决于不同的领域和业务。

监测可以是由人工操控或交给自动脚本。若突发异常情况,自动脚本要能够触发警报并发送通知。

变化是永恒存在的,只有做好准备接受变化并监测变化的公司才会取得成功,这一点需谨记。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8173

    浏览量

    130887
  • 数据分析
    +关注

    关注

    2

    文章

    1362

    浏览量

    33778
收藏 人收藏

    评论

    相关推荐

    小米王腾: 友商“应试”调校需反思,Redmi将整顿中端市场

    王腾随后再次发表文章表示,Redmi在调整中坚决避免“应试”式调校,不迎合媒体需求的固件,不使用降低图像质量、亮度以及控制温度等所谓的“小聪明”,而是致力于提升产品体验与性能。
    的头像 发表于 03-14 14:28 345次阅读

    压力变送器如何进行调校呢?

    压力变送器如何进行调校呢? 压力变送器是一种用于测量和传输压力信号的设备,广泛应用于工业控制系统中。调校压力变送器是为了保证其测量结果的准确性和稳定性,本文将详细介绍压力变送器的调校步骤及注意事项
    的头像 发表于 02-04 15:27 2008次阅读

    模拟信号调理(OPAMP)外设的增益和失调校

    电子发烧友网站提供《模拟信号调理(OPAMP)外设的增益和失调校准.pdf》资料免费下载
    发表于 09-19 16:02 3次下载
    模拟信号调理(OPAMP)外设的增益和失<b class='flag-5'>调校</b>准

    Vivado ML版中基于ML的路由拥塞和延迟估计

    电子发烧友网站提供《Vivado ML版中基于ML的路由拥塞和延迟估计.pdf》资料免费下载
    发表于 09-14 11:41 0次下载
    Vivado <b class='flag-5'>ML</b>版中基于<b class='flag-5'>ML</b>的路由拥塞和延迟估计

    FM33LG0xx系列RTCB调校AN

    FM33LG0xx系列 RTCB调校AN
    发表于 08-28 14:44 0次下载

    Apple机器学习和视觉生态系统更新:Core ML、Create ML和VisionKit

    苹果工程师 Ben Levine 解释说,第一个有关 Core ML(运行在 iOS 设备上的机器学习框架)的改进是更快的推理引擎,不需要重新编译模型或修改任何相关代码就可以获得这种提速。Levine 没有提供与速度提升相关的数据,他说具体将取决于实际的模型和硬件。
    的头像 发表于 07-29 14:52 774次阅读

    汽车底盘调校基本要求

    底盘调校基本要求如下: ①试验车辆的准备及检查:轮胎气压与定位参数达到设计状态,整车姿态与 设计目标一致、整车状态良好; ②试验场地:普通公路、高速公路、蛇形路面、坏路路面、山区路面、操控 跑道
    的头像 发表于 07-22 17:21 1319次阅读
    汽车底盘<b class='flag-5'>调校</b>基本要求

    底盘调校主要方法有哪些

    底盘调校主要方法 一直以来各汽车企业把底盘调校作为看家本领,其技术的复杂性及难度在整车性能开发过程中不言而喻。汽车性能一般用动力性、燃油经济性、制动性、操纵稳定性、平顺性和通过性等评价指标来评价
    的头像 发表于 07-22 17:18 1702次阅读
    底盘<b class='flag-5'>调校</b>主要方法有哪些

    汽车底盘调校是什么意思

    下面让我们抽丝剥茧,看看什么是底盘调校? 发动机被人们比作汽车的心脏,底盘就可看作是汽车的骨骼,它涉及动力传动系统、行驶系统(主要包括车架、悬架、车轮)、转向系统和制动系统,底盘技术的好坏直接影响
    的头像 发表于 07-22 17:12 1418次阅读

    V850E2/ML4 Target Board QB-V850E2ML4-TB 用户手册

    V850E2/ML4 Target Board QB-V850E2ML4-TB 用户手册
    发表于 07-13 20:15 0次下载
    V850E2/<b class='flag-5'>ML</b>4 Target Board QB-V850E2<b class='flag-5'>ML</b>4-TB 用户手册

    开发和部署ML模型介绍

    实践中的机器学习: ML 工作流
    的头像 发表于 07-05 16:30 586次阅读
    开发和部署<b class='flag-5'>ML</b>模型介绍

    如何部署ML模型到Google云平台

    实践中的机器学习:在 Google 云平台上部署 ML 模型
    的头像 发表于 07-05 16:30 452次阅读
    如何部署<b class='flag-5'>ML</b>模型到Google云平台

    HS300x-ML1 数据表

    HS300x-ML1 数据表
    发表于 07-03 20:01 0次下载
    HS300x-<b class='flag-5'>ML</b>1 数据表

    ML51PC0AE做的485通讯,使用过程无法通讯怎么解决?

    大家好,我用新塘ML51PC0AE做的485通讯,在客户使用过程无法通讯,反回后硬件都没有坏,程序重新烧写一下就好了,什么问题,求指点
    发表于 06-28 07:39

    Tiny ML唤醒词检测开源分享

    电子发烧友网站提供《Tiny ML唤醒词检测开源分享.zip》资料免费下载
    发表于 06-16 11:35 0次下载
    Tiny <b class='flag-5'>ML</b>唤醒词检测开源分享