0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动机器学习简述

电子设计 来源: 电子设计 作者: 电子设计 2020-12-26 10:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

转载本文需注明出处:微信公众号EAWorld,违者必究。

目录:

一、为什么需要自动机器学习

二、超参数优化 Hyper-parameter Optimization

三、元学习 Meta Learning

四、神经网络架构搜索 Neural Architecture Search

五、自动化特征工程

六、其它自动机器学习工具集

一、为什么需要自动机器学习

对于机器学习的新用户而言,使用机器学习算法的一个主要的障碍就是算法的性能受许多的设计决策影响。随着深度学习的流行,工程师需要选择相应的神经网络架构,训练过程,正则化方法,超参数等等,所有的这些都对算法的性能有很大的影响。于是深度学习工程师也被戏称为调参工程师。

自动机器学习(AutoML)的目标就是使用自动化的数据驱动方式来做出上述的决策。用户只要提供数据,自动机器学习系统自动的决定最佳的方案。领域专家不再需要苦恼于学习各种机器学习的算法。

自动机器学习不光包括大家熟知的算法选择,超参数优化,和神经网络架构搜索,还覆盖机器学习工作流的每一步:

自动准备数据

自动特征选择

自动选择算法

超参数优化

自动流水线/工作流构建

神经网络架构搜索

自动模型选择和集成学习

二、超参数优化

Hyper-parameter Optimization

学习器模型中一般有两类参数,一类是可以从数据中学习估计得到,还有一类参数时无法从数据中估计,只能靠人的经验进行设计指定,后者成为超参数。比如,支持向量机里面的C Kernal Gamma;朴素贝叶斯里面的alpha等。

超参数优化有很多方法:

最常见的类型是黑盒优化 (black-box function optimization)。所谓黑盒优化,就是将决策网络当作是一个黑盒来进行优化,仅关心输入和输出,而忽略其内部机制。决策网络通常是可以参数化的,这时候我们进行优化首先要考虑的是收敛性。

以下的几类方法都是属于黑盒优化:

网格搜索 (grid search)

Grid search大家都应该比较熟悉,是一种通过遍历给定的参数组合来优化模型表现的方法。网格搜索的问题是很容易发生维度灾难,优点是很容易并行。

随机搜索 (random search)

随机搜索是利用随机数求极小点而求得函数近似的最优解的方法。

很多时候,随机搜索比网格搜索效果要更好,但是我们可以从上图看出,它们都不能保证找到最优解。

贝叶斯优化

贝叶斯优化是一种迭代的优化算法,包含两个主要的元素,输入数据假设的模型和一个采集函数用来来决定下一步要评估哪一个点。每一步迭代,都使用所有的观测数据fit模型,然后利用激活函数预测模型的概率分布,决定如何利用参数点,权衡是Explaoration还是Exploitation。相对于其它的黑盒优化算法,激活函数的计算量要少很多,这也是为什么贝叶斯优化被认为是更好的超参数调优的算法。

黑盒优化的一些工具:

hyperopt

hyperopt 是一个Python库,可以用来寻找实数,离散值,条件维度等搜索空间的最佳值

Google Vizier

Google的内部的机器学习系统 Google Vizier能够利用迁移学习等技术自动优化其他机器学习系统的超参数

advisor

Google Vizier的开源实现

katib

基于Kubernetes的超参数优化工具

由于优化目标具有不连续、不可导等数学性质,所以一些搜索和非梯度优化算法被用来求解该问题,包括我们上面提到的这些黑盒算法。此类算法通过采样和对采样的评价进行搜索,往往需要大量对采样的评价才能获得比较好的结果。然而,在自动机器学习任务中评价往往通过 k 折交叉验证获得,在大数据集的机器学习任务上,获得一个评价的时间代价巨大。这也影响了优化算法在自动机器学习问题上的效果。所以一些减少评价代价的方法被提出来,其中多保真度优化(multi-fidelity methods)就是其中的一种。这里的技术包括:基于学习曲线来决定是否要提前终止训练,探索-利用困境(exploration exploitation)的多臂老虎机算法 (Multi-armed bandit)等等。

另外还有一些研究是基于梯度下降的优化。

超参数优化面临许多挑战:

对于大规模的模型或者复杂的机器学习流水线而言,需要评估的空间规模非常大

配置空间很复杂

无法或者很难利用损失函数的梯度变化

训练集合的规模太小

很容易过拟合

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30580

    浏览量

    219558
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136233
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    恩智浦自主移动机器人设计要点

    长期以来,自动机器人一直被视为科幻小说中的概念,而如今这一技术已成为现实,并正在大规模部署。在机器人技术领域,自主移动机器人 (AMR) 是发展最快的创新技术之一。
    的头像 发表于 09-03 15:01 3733次阅读
    恩智浦自主移<b class='flag-5'>动机器</b>人设计要点

    富唯智能复合机器人力控技术:重新定义精准自动

    在工业自动化和智能医疗快速发展的今天,富唯智能凭借先进的复合机器人力控技术,推出了新一代复合机器人解决方案。该方案深度融合协作机器人、自主移动机器
    的头像 发表于 08-26 16:54 563次阅读

    舵机原理简述!

    舵机原理简述 舵机是一种高精度的位置伺服执行机构,广泛应用于机器人关节、无人机舵面控制、航模操控等场景,其核心功能是通过接收控制信号,精确驱动输出轴旋转到指定角度并保持稳定。以下从结构组成、控制
    的头像 发表于 08-22 10:57 1099次阅读

    恩智浦eIQ Time Series Studio简介

    Time Series Studio是恩智浦推出的免费端到端工具包,为微控制器和应用处理器提供时间序列AI的自动机器学习 (AutoML)。
    的头像 发表于 07-02 14:59 1313次阅读

    瑞芯微 RK3568/3588:为移动机器人注入智慧动力引擎

    动机器人,正从科幻想象快步走入现实生活。它们依据应用场景与功能,主要分为三大类: 工业移动机器人: 如AGV(自动导引车)、AMR(自主移动机器人),专注于物流搬运与产线协同,提升效
    的头像 发表于 06-17 16:51 812次阅读

    轮式移动机器人电机驱动系统的研究与开发

    【摘 要】以嵌入式运动控制体系为基础,以移动机器人为研究对象,结合三轮结构轮式移动机器人,对二轮差速驱动转向自主移动机器人运动学和动力学空间模型进行了分析和计算,研究和设计了自主移动机器
    发表于 06-11 14:30

    贸泽电子开售ADI边缘计算平台,助力自动机器人机器视觉

    的AD-GMSL2ETH-SL边缘计算平台。 AD-GMSL2ETH-SL是一款先进的单板计算机(SBC),专为自动机器人、车辆等应用中的机器视觉和实时传感器融合而设计。该平台支持从八个千兆多媒体串行链路(GMSL
    的头像 发表于 02-17 09:54 802次阅读

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编将探讨机器学习模型市场的未来发展。
    的头像 发表于 02-13 09:39 619次阅读

    动机器人核心科技解码:导航、感知与掌控力的深度剖析

    富唯智能移动机器人的核心技术主要包括导航、感知与控制。这些技术共同决定了移动机器人在不同环境中的自主行动能力和工作效率。
    的头像 发表于 01-02 16:01 809次阅读

    传统机器学习方法和应用指导

    在上一篇文章中,我们介绍了机器学习的关键概念术语。在本文中,我们会介绍传统机器学习的基础知识和多种算法特征,供各位老师选择。 01 传统机器
    的头像 发表于 12-30 09:16 1981次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    自主移动机器人设计指南

    自主移动机器人(AMR)是一种复杂的系统,与自动驾驶汽车有许多共同之处--它们需要感知、电机驱动、电源转换、照明和电池管理。也许最大的挑战是将这些子系统整合到一个最终产品中--由于需要集成来自不同供应商的不同子系统,这一挑战变得更加困难。
    的头像 发表于 12-29 11:45 1187次阅读
    自主移<b class='flag-5'>动机器</b>人设计指南

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 699次阅读

    动机器人的技术突破和未来展望

    动机器人已经成为现代社会不可或缺的一部分,在各个领域发挥着越来越重要的作用。在这个过程中,富唯智能机器人以其卓越的技术突破,引领着移动机器人领域的发展潮流。
    的头像 发表于 12-13 17:57 926次阅读
    移<b class='flag-5'>动机器</b>人的技术突破和未来展望

    恩智浦eIQ Time Series Studio 工具使用全攻略

      基本介绍 eIQ Time Series Studio(简称eIQ TSS)是恩智浦半导体推出的一款专为嵌入式微控制器设计的基于时间序列的AI和机器学习开发套件。它集成了自动机器学习
    的头像 发表于 12-12 09:37 2552次阅读
    恩智浦eIQ Time Series Studio 工具使用全攻略