0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解析关于机器学习的八个核心

ml8z_IV_Technol 作者:工程师之余 2018-10-21 09:12 次阅读

机器学习是大数据、人工智能的核心,是从事这个领域的必经之路。但是懂得算法还远远不能体现机器学习的价值所在。如果你是开发者,方便的机器学习,为你涉入该领域提供了便捷。不过,能够确定一套高商业价值的模型,你需要很长的积淀。总结八个机器学习的核心能力以供把控方向。

1、问题模型化能力

机器学习的最终目的是实现某种问题的利益最大化,所有实际问题最终都会转化为一个数据科学的优化问题,那么就需要你有较好的行业背景认识。尽管海量数据会大量缩小你对行业熟知知识的要求,但数据往往不全是海量的,且熟悉的行业背景知识可大大提高效率。

2、复杂数据结构化能力

喂入算法是数据是设计好的,结构化了的数据,但实际数据往往有各种来源,如图像数据、文本数据、空间、事件序列。..故而合理的结构化数据的能力是很有必要的。

3、数据量、数据结构与数据合理预处理的能力

1)数据量VS异常值

所谓异常值,即不是缺失值,也不是错误值,同样是真实情况的表现,之所以觉得一个数据异常,是因为我们能够用到的数据量不够大,无法准确地代表整个此类数据的分布。故当数据量足够大时,异常值不再异常,且提升了数据的覆盖面,如个性化推荐

2)数据平衡VS采样

如果数据分布均衡,应尽可能避免采样;因为上下采样都有其不利影响,上采样不得当,使得数据中存在大量相同的数据,会导致模型过拟合;下采样则必然减少数据信息量。

数据不平衡时,常见的处理方式有:

简单粗暴地复制小样本数量的样本——容易过拟合;

调整权重——其效果基本近似于上一种;

随机森林,使每棵树训练时的样本均衡;

观察导致样本不均衡的因素,或可在该因素下先分类,再分别训练模型。

4、理解特征、并可以有效转换特征的能力

海量数据特征中,必然有很多特征存在相关性,常常通过降维有效合并相关数据,这样,在防止了过拟合的同时,也缓解了计算机的负担;

有时特征经过转换后,预测效果更佳。如连续变量离散化、重新划分离散区间。..。

也可对特征重要性排序,绘制特征数量增加与模型预测结果的关系曲线。

5、选择适当算法的能力

1) 算法不是越复杂越好的,记住:同样的数据下,当所有模型拟合效果相近时,复杂度越小的算法,带来不必要的麻烦越小,可解释性也相对更高。

2) 在相同算法下,训练的效果会随着数据的增加而增加,但超过一定程度后,训练效果将趋于稳定,此时应该考虑更换复杂度较高的算法。

可以参考下图为数据选择合理的算法。

6、优化损失函数的能力

当数据分布不均、或需要为某个类别增加权重时,就需要调整损失函数的权值参数,或增加惩罚项。如通过在特定的错误类型上,增加更多的惩罚来解释它们的权重

7、模型训练与模型融合的能力

想要训练出一个好的模型参数也不简单,最好对算法参数有较深的理解。可以使用栅格搜索(GridSearchCV)辅助调参,但真正得到的好的参数,还需要与你长期的经验相结合。

有时单一的模型不能很好的拟合数据,此时可以将多个模型融合做训练,常见的模型融合有Boosting、Bagging两种。典型的如Adaboost、随机森林

8、区分经验误差与泛化误差

训练集上的效果不能代表实际效果,要得到好的实际预测效果,及减小泛化误差。交叉验证可以实现这一目的,不过最好还要准备一套测试数据来验证。通俗理解:交叉验证是高考前的各种模考,而最终测试数据的结果就是高考结果。

此外可以使用正则化来减小泛化误差。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43766

    浏览量

    230559
  • 大数据
    +关注

    关注

    64

    文章

    8641

    浏览量

    136578

原文标题:机器学习的八个核心能力

文章出处:【微信号:IV_Technology,微信公众号:智车科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    USB的八个问题和答案

    本帖最后由 eehome 于 2013-1-5 09:45 编辑 USB的八个问题和答案
    发表于 07-27 10:57

    想用LABVIEW吧八个通道数据流分开,请问有什么好方案吗?

    想用LABVIEW吧八个通道数据流分开,请问有什么好方案吗?
    发表于 02-11 10:38

    24L01八个引脚的怎么识别

    24L01八个引脚的怎么识别?????????????
    发表于 02-17 15:38

    labview八个项目

    下面的资料会丝毫不缺的给大家发到邮箱资料一:资料二:下面的八个项目都会给大家带上的我们的工具包,全部支持我们的2012版软件下面的例程都会给大家带上的需要的话 qq:271604202
    发表于 03-17 14:48

    排阻可不可以直接用八个电阻代替啊

    排阻可不可以直接用八个电阻代替啊
    发表于 10-11 14:57

    verilog串并转换,串行输入八个12位的数据,请问如何将这八个12位的数据并行输出?

    串行输入八个12位的数据,请问如何将这八个12位的数据并行输出?
    发表于 04-01 12:41

    机器学习实践指南——案例应用解析

    机器学习实践指南——案例应用解析
    发表于 04-13 16:40

    如何实现用八个数码管实现二进制转换?

    我能问问如何实现用八个数码管实现二进制转换?我在学习汇编,用汇编语言可以吗?谢谢
    发表于 01-17 11:49

    请问用八个N型MOS管控制两线四线电机是怎么工作的

    关于使用TMC5160芯片控制两相四线步进电机运动,用八个N型MOS管去控制电流流向,那么这几个MOS管是怎么工作的,为什么可以做到一端高侧MOS管导通,低侧MOS管截止呢?
    发表于 01-22 11:20

    如何选择合适的机器视觉照明?牢记这八个小技巧

    是第一要考虑的部分。一设计良好的照明系统不仅会带来更好的性能,节约时间,而且从长远来看能节约成本。下面来分享选择最合适机器视觉照明的八个小技巧,它们是:(1) 检测材料缺损请使用亮度高的光;(2
    发表于 06-04 08:30

    八个IO口控制16led显示

    这个是旋转led顶部灯显示程序,因为stm32f103c8t6引脚基本都被占据,所以只有八个io口可以用于控制顶部16led,显示程序已打包。
    发表于 12-09 14:01

    STM32F429的USART应用之八个串口FIFO实现

    STM32F429的USART应用之八个串口FIFO实现,第24章 STM32F429的USART应用之八个串口FIFO实现本章节为大家讲解STM32F429的8串口的FIFO驱动实现,后面
    发表于 08-10 06:25

    STM32三线控制八个发光二极管的方法

    STM32三线控制八个发光二极管是典型的IO扩展应用,思路和学习51单片机时一致,下面直接上图和代码!简述:1.74HC595D这里使用的5V供电,和STM32间通过MOS管做电平转换处理
    发表于 12-07 07:56

    八个智能家居的设计资料,错过绝对后悔

    八个智能家居的设计资料,错过绝对后悔
    发表于 12-23 07:36

    使用八个微型OLED显示器构建一滚动消息显示器

    描述Circoled - 八个微型 OLED 显示器排成一圈这个项目肯定要疯了!我使用其中八个微型 OLED 显示器构建了一滚动消息显示器,这些显示器围绕 PCB 排列并由 ESP32 Pico
    发表于 07-15 06:41