0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开发有效的机器学习你应该知道这6个经验教训

汽车玩家 来源:电子创新网 作者:James Warner 2020-01-28 09:36 次阅读

机器人技术、智能家电、智能零售店、自动驾驶汽车技术等的推动下,我们正步入一个新时期。机器学习是所有这些新时代技术进步的前沿。在不久的将来,自动化机器的发展将使得机器与人类智能相当甚至超过人类智能。机器学习无疑是下一个“大”事件。而且,人们相信,未来的大多数技术都将与之挂钩。

为什么机器学习这么重要?

机器学习非常重要,因为它有助于预测人类无法预测的行为和模式。机器学习有无数非常有用的实际应用。通过机器学习,有可能管理以前令人困惑的场景。在理解了具有高效泛化能力的机器学习模型之后,可以使用它做出相应的重要决策。机器学习使个人能够根据大量场景做出决策。显然,现在还不能编写出能够用于所有新场景的代码。

人工智能能够执行各种需要学习和判断的活动。从自动驾驶汽车、投资银行、许多医疗相关功能到招聘,人工智能已经被用于完成不同领域的各种任务。

6 个关于机器学习的革命性教训

机器学习算法能够简单地从场景中泛化,得到执行必要任务的方法。这样更切实可行和而且具有成本效益,然而,手工编程并不那么具有成本效益和可行性。“可用数据”数量的增加肯定会导致出现更多的与获取数据相关的问题。因此,机器学习是未来,因为它将广泛应用于计算机和其他领域。尽管如此,开发有效的机器学习应用需要大量的“黑魔法”,这在手册中很难找到。

以下是关于机器学习最有价值的 6 个经验教训:

1. 泛化是核心

机器学习最基本的特征之一是,算法必须从训练的数据中泛化出该领域中所有不可见场景的完整领域,以便在使用模型时能够做出正确的推断。这个泛化的过程需要我们用来训练模型的数据有一个我们希望算法去学习的,像样的和可靠的映射。数据的质量越好,表达能力越高,模型就越容易理解从输入到输出的未知的和基本的“真实”映射。泛化是指从某种精确的东西转向某种广泛的东西。

机器学习算法是从历史场景中自动简化的技术。它们有能力在更大的数据量和更快的速度上进行泛化。

所有机器学习初学者最常犯的错误就是对训练数据进行测试,然后看起来像是成功了。如果在新数据上尝试所得到分类器,它通常不会比随机猜测更好。所以,如果你想要开发一个分类器,一定要留一些数据做测试。同时,用你的分类器对测试数据进行测试。

2. 学习=表示+评估+优化

机器学习算法分为 3 个部分,表示、评估和优化

表示:数据需要以合适的算法形式输入。对于文本分类,可以从全文输入中提取特征,并将其变为 bag-of-words 的表示形式。相反,选择一种表示方法与选择它可能学习的分类器集是同义词。这个集合称为学习者的假设空间。

评估:这是一个帮助我们理解我们正在做什么的度量。需要一个评估过程来区分好分类器和不好的分类器。如果你可以给测试集预测出一个数字,例如测试集的大小为 n,在这里,你可以计算平均绝对误差,甚至可以选择使用均方根误差。

优化:它是指寻找方法来选择不同的技术来优化它的过程。例如,我们可以简单地尝试假设空间中的每一个假设。我们也可能选择使用更智能的技术来尝试最有利的假设。同时,当我们进行优化时,我们可以利用评价函数来了解这个特定的假设是否成立。如果评价函数有多个最优值,则优化技术允许用户了解更多关于所创建分类器的信息。首先,初学者应该从现成的优化器开始,然后再转向定制设计的优化器。

3. 只有数据是不够的!

泛化是主要目的,但主要关注的是,无论数量多少,仅有数据是不够的。但是,幸运的是,我们想掌握的功能并不是从所有可计算的功能中统一得出的!即使是最一般的假设(包括平滑度,具有类似类的相似示样本,不充分的依存关系或受限制的复杂度)也足以正常运行,这是使机器学习如此强大的主要原因之一。基本上,所有初学者都联合了解大数据来制作应用程序。

4. 小心过拟合

如果数据不充分,不能完全训练好一个分类器,我们可能最终得到的是只在训练集上有用的分类器。这个问题被称为 overfitting,它被认为是 ML 的一个麻烦事。发现自己的模型过拟合了是有用的,但并不能解决这个问题。你得想办法摆脱它。幸运的是,你有很多选择去尝试。交叉验证有助于防止过拟合。训练更多的数据,正则化,删除特征,早期停止,集成是一些其他的防止过拟合的方法。

5. 特征工程是成功的关键

特征工程是利用数据的核心领域知识来开发使机器学习算法更好工作的特征的技术。如果处理得当,它可以通过从原始数据中开发特征来增强算法的预测能力。这些特征简化了整个机器学习过程。利用几个独立的特征,很好地与类相关,然后让学习变得容易。

6. 准确性&简单性是不一样的

奥卡姆剃刀(Occam’s razor)精辟地指出,实体的增加不应超出要求。这意味着两个分类器有相似的训练误差,两个分类器中较简单的可能有最低的测试误差。每一个机器学习项目都应该以你希望回答的业务问题为目标。你应该从制定分析的主要成功原则开始。

应用 Occam’s razor 并选择最容易解释、阐明、部署和管理的模型是构建强大的机器学习程序的关键步骤。建议选择最简单的、足够精确的模型,但是,要确保你深入了解这个问题,以了解“足够精确”在实践中意味着什么。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    206

    文章

    27052

    浏览量

    201435
  • 人工智能
    +关注

    关注

    1776

    文章

    43899

    浏览量

    230645
  • 机器学习
    +关注

    关注

    66

    文章

    8134

    浏览量

    130580
收藏 人收藏

    评论

    相关推荐

    工程师13年编码、测试和调试经验大汇总

    最近,我回顾了我所有的194个条目(从13岁开始),看看有什么经验教训是我可以学习的。下面是我总结的最重要的经验教训,包括编码,测试和调试三个方面。
    发表于 07-17 22:41 1949次阅读

    转: 13年棘手Bug调试总结18条教训

    有什么经验教训是我可以学习的。下面是我总结的最重要的经验教训,包括编码,测试和调试三方面。编码下面这些都是我经历过的会导致难点bug的问题:1.事件顺序。在处理事件时,提出下列问题会
    发表于 07-11 18:07

    生物识别可穿戴产品开发有什么经验教训

    设想一下,您正在参加一计划会议。团队刚刚提出了一些非常棒的想法,他们为新的可穿戴设备设计了一种光学心率传感器,您可以将其添加到您的产品线中。他们都向您求助:我们应该与谁合作开发传感器系统? 突然间您意识到你并不完全确定从哪里着
    发表于 08-06 07:27

    求大神分享单片机从业的经验教训学习历程?

    求大神分享单片机从业的经验教训学习历程?
    发表于 09-18 09:16

    珠海炬力与SigmaTel达成和解的经验教训

    珠海炬力与SigmaTel达成和解的经验教训:珠海炬力是我国一家领先的集成电路设计公司,成立以来坚持以市场为导向,坚持自主创新。因此在公司发展,市场开拓等等方面成绩斐然,
    发表于 12-24 10:58 4次下载

    借鉴开发人员累计的经验教训构建更出色的嵌入式系统

    随着嵌入式系统不断普及,我们可以从积累的开发知识中获得巨大优势,构建更出色的系统。 工程师一刻也没忘记交付能同时满足质量、时间安排和预算目标的项目的需求。一个事半功倍的方法 就是借鉴嵌入式系统开发人员社区多年来累计的经验教训
    发表于 11-16 20:44 965次阅读
    借鉴<b class='flag-5'>开发</b>人员累计的<b class='flag-5'>经验教训</b>构建更出色的嵌入式系统

    工程师跨度13年、回顾194个bug总结的18条编码、测试和调试经验教训

    工程师跨度13年、回顾194个bug总结的18条编码、测试和调试经验教训
    发表于 02-27 16:50 926次阅读

    PCB layout之USB差分走线布线经验教训

    PCB layout之USB差分走线布线经验教训。USB是一种快速、双向、同步传输、廉价、方便使用的可热拔插的串行接口。由于数据传输快,接口方便,支持热插拔等优点使USB设备得到广泛应用。目前
    的头像 发表于 03-01 08:35 7.4w次阅读

    google机器学习团队开发机器学习系统Seti的一些经验教训

    system》的博客,作者应该是google机器学习团队的成员,列举了他们在开发一个可伸缩的大型机器
    发表于 06-01 09:25 1539次阅读

    企业如何从智能家居中吸取经验教训

    这是一个机会众多的领域,越来越多的设备制造商正在尝试利用这一领域,并且具有无限可能性——尤其是那些能够从智能家居中吸取经验教训的企业。
    的头像 发表于 11-19 14:17 2661次阅读

    AI和机器学习历程经验教训总结

    我最近有幸与几位AI /机器学习专家一起参加了小组讨论。 有很多伟大的问题,但大多数与如何在大型组织中最有效地建立AI /机器学习(AI /
    的头像 发表于 05-03 18:06 1941次阅读

    写在最前:单片机从业的经验教训和历程。

    单片机从业的经验教训和历程写在开始为什么写这些怎么学习的有什么教训经验**1如果你的学校还在用汇编教学单片机,那么请放弃教学课程混个及格就行,然后开始自学**。**2光看不练,看也白
    发表于 11-15 13:36 7次下载
    写在最前:单片机从业的<b class='flag-5'>经验教训</b>和历程。

    NASA的经验教训文件中的一些电气工程事故

    在航天器完成之前,美国宇航局的经验教训档案中的一个条目详细介绍了一名工程师在下班后在没有适当测试协议的情况下对麦哲伦动力控制单元进行测试。如果没有质量保证概述或测试程序,就会出现错误并在设备上施加反向电压。
    的头像 发表于 10-20 14:29 665次阅读

    从50多个生物识别可穿戴产品开发周期得到的十大经验教训

    从50多个生物识别可穿戴产品开发周期得到的十大经验教训
    发表于 11-01 08:26 0次下载
    从50多个生物识别可穿戴产品<b class='flag-5'>开发</b>周期得到的十大<b class='flag-5'>经验教训</b>

    嵌入式微控制器应用中的无线(OTA)更新:设计权衡与经验教训

    电子发烧友网站提供《嵌入式微控制器应用中的无线(OTA)更新:设计权衡与经验教训.pdf》资料免费下载
    发表于 11-23 16:01 0次下载
    嵌入式微控制器应用中的无线(OTA)更新:设计权衡与<b class='flag-5'>经验教训</b>