0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动机器学习简述

电子设计 来源: 电子设计 作者: 电子设计 2020-12-26 10:56 次阅读

转载本文需注明出处:微信公众号EAWorld,违者必究。

目录:

一、为什么需要自动机器学习

二、超参数优化 Hyper-parameter Optimization

三、元学习 Meta Learning

四、神经网络架构搜索 Neural Architecture Search

五、自动化特征工程

六、其它自动机器学习工具集

一、为什么需要自动机器学习

对于机器学习的新用户而言,使用机器学习算法的一个主要的障碍就是算法的性能受许多的设计决策影响。随着深度学习的流行,工程师需要选择相应的神经网络架构,训练过程,正则化方法,超参数等等,所有的这些都对算法的性能有很大的影响。于是深度学习工程师也被戏称为调参工程师。

自动机器学习(AutoML)的目标就是使用自动化的数据驱动方式来做出上述的决策。用户只要提供数据,自动机器学习系统自动的决定最佳的方案。领域专家不再需要苦恼于学习各种机器学习的算法。

自动机器学习不光包括大家熟知的算法选择,超参数优化,和神经网络架构搜索,还覆盖机器学习工作流的每一步:

自动准备数据

自动特征选择

自动选择算法

超参数优化

自动流水线/工作流构建

神经网络架构搜索

自动模型选择和集成学习

二、超参数优化

Hyper-parameter Optimization

学习器模型中一般有两类参数,一类是可以从数据中学习估计得到,还有一类参数时无法从数据中估计,只能靠人的经验进行设计指定,后者成为超参数。比如,支持向量机里面的C Kernal Gamma;朴素贝叶斯里面的alpha等。

超参数优化有很多方法:

最常见的类型是黑盒优化 (black-box function optimization)。所谓黑盒优化,就是将决策网络当作是一个黑盒来进行优化,仅关心输入和输出,而忽略其内部机制。决策网络通常是可以参数化的,这时候我们进行优化首先要考虑的是收敛性。

以下的几类方法都是属于黑盒优化:

网格搜索 (grid search)

Grid search大家都应该比较熟悉,是一种通过遍历给定的参数组合来优化模型表现的方法。网格搜索的问题是很容易发生维度灾难,优点是很容易并行。

随机搜索 (random search)

随机搜索是利用随机数求极小点而求得函数近似的最优解的方法。

很多时候,随机搜索比网格搜索效果要更好,但是我们可以从上图看出,它们都不能保证找到最优解。

贝叶斯优化

贝叶斯优化是一种迭代的优化算法,包含两个主要的元素,输入数据假设的模型和一个采集函数用来来决定下一步要评估哪一个点。每一步迭代,都使用所有的观测数据fit模型,然后利用激活函数预测模型的概率分布,决定如何利用参数点,权衡是Explaoration还是Exploitation。相对于其它的黑盒优化算法,激活函数的计算量要少很多,这也是为什么贝叶斯优化被认为是更好的超参数调优的算法。

黑盒优化的一些工具:

hyperopt

hyperopt 是一个Python库,可以用来寻找实数,离散值,条件维度等搜索空间的最佳值

Google Vizier

Google的内部的机器学习系统 Google Vizier能够利用迁移学习等技术自动优化其他机器学习系统的超参数

advisor

Google Vizier的开源实现

katib

基于Kubernetes的超参数优化工具

由于优化目标具有不连续、不可导等数学性质,所以一些搜索和非梯度优化算法被用来求解该问题,包括我们上面提到的这些黑盒算法。此类算法通过采样和对采样的评价进行搜索,往往需要大量对采样的评价才能获得比较好的结果。然而,在自动机器学习任务中评价往往通过 k 折交叉验证获得,在大数据集的机器学习任务上,获得一个评价的时间代价巨大。这也影响了优化算法在自动机器学习问题上的效果。所以一些减少评价代价的方法被提出来,其中多保真度优化(multi-fidelity methods)就是其中的一种。这里的技术包括:基于学习曲线来决定是否要提前终止训练,探索-利用困境(exploration exploitation)的多臂老虎机算法 (Multi-armed bandit)等等。

另外还有一些研究是基于梯度下降的优化。

超参数优化面临许多挑战:

对于大规模的模型或者复杂的机器学习流水线而言,需要评估的空间规模非常大

配置空间很复杂

无法或者很难利用损失函数的梯度变化

训练集合的规模太小

很容易过拟合

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    206

    文章

    27045

    浏览量

    201426
  • 机器学习
    +关注

    关注

    66

    文章

    8128

    浏览量

    130571
收藏 人收藏

    评论

    相关推荐

    自动机器人激光焊接机主要用于哪些行业

    编辑:镭拓激光全自动机器人激光焊接技术应用于多个行业中发挥着越来越重要的作用,为制造业的升级转型提供了有力支持。随着技术的不断进步,其应用领域还将进一步扩大,以下是一些主要应用领域:汽车制造业
    的头像 发表于 03-19 11:08 147次阅读
    全<b class='flag-5'>自动机器</b>人激光焊接机主要用于哪些行业

    传感器推动机器自动

    电子发烧友网站提供《传感器推动机器自动化.pdf》资料免费下载
    发表于 11-27 10:55 0次下载
    传感器推<b class='flag-5'>动机器</b><b class='flag-5'>自动</b>化

    NNI:自动帮你做机器学习调参的神器

    NNI 自动机器学习调参,是微软开源的又一个神器,它能帮助你找到最好的神经网络架构或超参数,支持 各种训练环境 。 它常用的 使用场景 如下: 想要在自己的代码、模型中试验 不同的机器学习
    的头像 发表于 10-30 10:28 1797次阅读
    NNI:<b class='flag-5'>自动</b>帮你做<b class='flag-5'>机器</b><b class='flag-5'>学习</b>调参的神器

    机器学习有哪些算法?机器学习分类算法有哪些?机器学习预判有哪些算法?

    机器学习有哪些算法?机器学习分类算法有哪些?机器学习预判有哪些算法?
    的头像 发表于 08-17 16:30 1404次阅读

    机器学习theta是什么?机器学习tpe是什么?

    解一下theta。在机器学习中,theta通常表示模型的参数。在回归问题中,theta可能表示线性回归的斜率和截距;在分类问题中,theta可能表示多项式模型的各项系数。这些参数通常是通过训练数据自动
    的头像 发表于 08-17 16:30 1231次阅读

    机器学习是什么意思?机器学习属于什么分支?机器学习有什么用处?

    机器学习是什么意思?机器学习属于什么分支?机器学习是什么有什么用处?
    的头像 发表于 08-17 16:30 1278次阅读

    机器学习算法总结 机器学习算法是什么 机器学习算法优缺点

    机器学习算法总结 机器学习算法是什么?机器学习算法优缺点?
    的头像 发表于 08-17 16:11 1091次阅读

    机器学习算法汇总 机器学习算法分类 机器学习算法模型

    是解决具体问题的一系列步骤,机器学习的算法被设计用于从大量的数据中自动学习并不断改进自身的性能。本文将为大家介绍机器
    的头像 发表于 08-17 16:11 729次阅读

    机器学习和深度学习的区别

    的区别。 1. 机器学习 机器学习是指通过数据使机器能够自动地学习和改进性能的算法。
    的头像 发表于 08-17 16:11 3394次阅读

    机器视觉和机器人的关系 机器视觉+机器人的结合应用

    机器视觉和自动化的进步,正在帮助制造企业更好地利用自主移动机器人、深度学习等技术的发展,改善其物流和仓储运营。
    发表于 07-21 09:22 556次阅读

    什么是LangChain?深入地了解一下LangChain

    在日常生活中,我们通常致力于构建端到端的应用程序。有许多自动机器学习平台和持续集成/持续交付(CI/CD)流水线可用于自动化我们的机器学习
    的头像 发表于 07-14 09:50 1.6w次阅读
    什么是LangChain?深入地了解一下LangChain

    【科普】干货!带你从0了解移动机器人(四) ——移动机器人导航技术

    动机器人导航是指移动机器人确定自己在地图参考系中的位置后,自动规划出通往地图参考系中某个目标位置路径并沿着该路径到达目标位置点的能力,是移动机器人行动能力的关键。
    的头像 发表于 06-20 17:09 1140次阅读
    【科普】干货!带你从0了解移<b class='flag-5'>动机器</b>人(四) ——移<b class='flag-5'>动机器</b>人导航技术

    基于Arduino和OLED元胞自动机

    电子发烧友网站提供《基于Arduino和OLED元胞自动机.zip》资料免费下载
    发表于 06-20 11:02 0次下载
    基于Arduino和OLED元胞<b class='flag-5'>自动机</b>

    自动驾驶中的机器学习

    近年来,自动驾驶技术技术的发展速度非常快。预计达到完全自动驾驶L5的程度是指日可待的。自动驾驶的核心技术主要是人工智能中的机器学习与深 度
    发表于 06-06 10:06 0次下载
    <b class='flag-5'>自动</b>驾驶中的<b class='flag-5'>机器</b><b class='flag-5'>学习</b>

    在main函数中运行的自动机

    然后我们试图将他们组装起来,因为一开始实现的都是零件(子函数)部分,本文主要介绍在main函数中运行的自动机
    的头像 发表于 05-23 11:18 458次阅读
    在main函数中运行的<b class='flag-5'>自动机</b>