0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

详细阐述机器学习及基本概念

电子工程师 来源:网络整理 作者:工程师姚远香 2018-07-07 09:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

机器学习导论》第1章绪论,本章详细地讨论一些应用领域的例子,以进一步深入了解机器学习的类型和用途。本节为大家介绍什么是机器学习。

什么是机器学习

随着计算机技术的发展,我们现在已经拥有存储和处理海量数据以及通过计算机网络从远程站点访问数据的能力。目前大多数的数据存取设备都是数字设备,记录的数据也很可靠。以一家连锁超市为例,它拥有遍布全国各地的数百家分店,并且在为数百万顾客提供数千种商品的零售服务。销售点的终端设备记录每笔交易的详细资料,包括日期、顾客识别码、购买商品和数量、消费总额等。这是典型的每日几个G字节的数据。只有分析这些数据,并且将它转换为可以利用的信息时,这些存储的数据才能变得有用,例如做预测。

1我们不能确切地知道哪些人比较倾向于购买哪种特定的商品,也不知道应该向喜欢读海明威作品的人推荐哪位作者。如果我们知道,我们就不需要任何数据分析;我们只管供货并记录下编码就可以了。但是,正因为我们不知道,所以才只能收集数据,并期望从数据中提取这些问题或相似问题的答案。

Glühwein是一种温热、有点甜味、加香料的葡萄酒。圣诞节期间,在欧洲很受欢迎。--译者注我们确信存在某种过程,可以解释我们所观测到的数据。尽管我们不清楚数据产生过程(例如顾客行为)的细节,但是,我们知道数据产生不是完全随机的。人们并不是去超市随机购买商品。当人们买啤酒时,也会买薯片;夏天买冰淇淋,而冬天则为Glühwein?买香料。数据中存在确定的模式。

我们也许不能够完全识别该过程,但是我们相信,我们能够构造一个好的并且有用的近似(good and useful approximation)。尽管这样的近似还不可能解释一切,但其仍然可以解释数据的某些部分。我们相信,尽管识别全部过程也许是不可能的,但是我们仍然能够发现某些模式或规律。这正是机器学习的定位。这些模式可以帮助我们理解该过程,或者我们可以使用这些模式进行预测:假定将来,至少是不远的将来,情况不会与收集样本数据时有很大的不同,则未来的预测也将有望是正确的。

机器学习方法在大型数据库中的应用称为数据挖掘(data mining)。类似的情况如大量的金属氧化物以及原料从矿山中开采出来,处理后产生少量非常珍贵的物质。同样地,在数据挖掘中,需要处理大量的数据以构建简单有用的模型,例如具有高精度的预测模型。数据挖掘的应用领域非常广泛:除零售业以外,在金融业,银行分析他们的历史数据,构建用于信用分析、诈骗检测、股票市场等方面的应用模型;在制造业,学习模型可以用于优化、控制以及故障检测等;在医学领域,学习程序可以用于医疗诊断等;在电信领域,通话模式的分析可用于网络优化和提高服务质量;在科学研究领域,比如物理学、天文学以及生物学的大量数据只有用计算机才可能得到足够快的分析。万维网(World Wide Web)是巨大的,并且在不断地增长,因此在万维网上检索相关信息不可能依靠人工完成。

然而,机器学习不仅仅是数据库方面的问题,它也是人工智能的组成部分。为了智能化,处于变化环境中的系统必须具备学习的能力。如果系统能够学习并且适应这些变化,那么系统的设计者就不必预见所有的情况,并为它们提供解决方案了。

机器学习还可以帮助我们解决视觉、语音识别以及机器人方面的许多问题。以人脸识别问题为例:我们做这件事毫不费力;即使姿势、光线、发型等不同,我们每天还是可以通过看真实的面孔或其照片来认出我们的家人和朋友。但是我们做这件事是下意识的,而且无法解释我们是如何做的。因为我们不能够解释我们所具备的这种技能,我们也就不可能编写相应的计算机程序。但是我们知道,脸部图像并非只是像素点的随机组合;人脸是有结构的、对称的。脸上有眼睛、鼻子和嘴巴,并且它们都位于脸的特定部位。每个人的脸都有各自的眼睛、鼻子和嘴巴的特定组合模式。通过分析一个人脸部图像的多个样本,学习程序可以捕捉到那个人特有的模式,然后在所给的图像中检测这种模式,从而进行辨认。这就是模式识别(pattern recognition)的一个例子。

机器学习使用实例数据或过去的经验训练计算机,以优化某种性能标准。我们有依赖于某些参数的模型,而学习就是执行计算机程序,利用训练数据或以往经验来优化该模型的参数的。模型可以是预测性的(predictive),用于未来的预测,或者是描述性的(descriptive),用于从数据中获取知识,也可以二者兼备。

机器学习在构建数学模型时利用了统计学理论,因为其核心任务就是从样本中推理。计算机科学的角色是双重的:第一,在训练时,我们需要求解优化问题以及存储和处理通常所面对的海量数据的高效算法。第二,一旦学习得到了一个模型,它的表示和用于推理的算法解也必须是高效的。在特定的应用中,学习或推理算法的效率,即它的空间复杂度和时间复杂度,可能与其预测精确度同样重要。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3993

    浏览量

    67725
  • 人脸识别
    +关注

    关注

    77

    文章

    4117

    浏览量

    87745
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136223
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    TVS二极管的基本概念和主要作用

    芝识课堂的全新内容又和大家见面啦!从本期开始,我们将用四节课为大家系统介绍一位在电路设计中默默奉献的“无名英雄”——TVS二极管。我们会从它的基本概念、工作原理,聊到如何为电路挑选合适的型号、布局
    的头像 发表于 11-28 09:27 3645次阅读
    TVS二极管的<b class='flag-5'>基本概念</b>和主要作用

    学习物联网怎么入门?

    联网的基本概念和技术是学习物联网的重要第一步。物联网是指互联网上的物品相互连接,通过网络实现信息交流和共享的一种技术。学习物联网需要了解物联网的基本概念,如物联网的架构、物联网的协议、
    发表于 10-14 10:34

    【「Yocto项目实战教程:高效定制嵌入式Linux系统」阅读体验】+基础概念学习理解

    是 Yocto 项目的核心部分之一,书中对元数据的概念、文件、语法以及菜谱和层的相关内容进行了详细阐述。通过学习这部分内容,我了解到元数据在 Yocto 项目中的重要性,它定义了构建系
    发表于 08-04 22:29

    ARM入门学习方法分享

    。 以下是一些入门学习方法的分享: 一、 理解基本概念:首先,了解ARM是什么以及它的基本概念是很重要的。ARM(Advanced RISC Machines)指的是一种精简指令集计算机(RISC
    发表于 07-23 10:21

    电压波动与闪变的基本概念

    如果您是电力系统工程师、电气设备维护人员或者相关专业的学生,应该注意到了有关电能质量的国家标准GB/T 12326-2008是有关电压波动和闪变的,那这两个参数的考核意义是什么?国家标准规定这两个参数如何计算、测量和考核?这篇文章带您全面了解电压波动和闪变的基本概念、重要性以及国家标准的规定。
    的头像 发表于 07-22 14:10 2115次阅读
    电压波动与闪变的<b class='flag-5'>基本概念</b>

    群延迟的基本概念和仿真实例分析

    在高速数字通信和射频系统中,信号从发送端到接收端的传输过程中会遇到各种失真和畸变。群延迟(Group Delay)作为描述系统相位线性度的重要参数,直接影响着信号保真度和系统性能。本文将深入浅出地介绍群延迟的基本概念、应用场景,并通过仿真示例展示其在实际工程中的重要性。
    的头像 发表于 07-08 15:14 1209次阅读
    群延迟的<b class='flag-5'>基本概念</b>和仿真实例分析

    机器学习异常检测实战:用Isolation Forest快速构建无标签异常检测系统

    本文转自:DeepHubIMBA无监督异常检测作为机器学习领域的重要分支,专门用于在缺乏标记数据的环境中识别异常事件。本文深入探讨异常检测技术的理论基础与实践应用,通过IsolationForest
    的头像 发表于 06-24 11:40 1195次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>异常检测实战:用Isolation Forest快速构建无标签异常检测系统

    第十三章 通讯的基本概念

    本章介绍通讯基本概念,包括串行/并行、全双工/半双工/单工、同步/异步通讯,还提及通讯速率中比特率与波特率的概念
    的头像 发表于 05-22 17:29 1747次阅读
    第十三章 通讯的<b class='flag-5'>基本概念</b>

    进群免费领FPGA学习资料!数字信号处理、傅里叶变换与FPGA开发等

    ~ 01、数字信号处理的FPGA实现 旨在讲解前端数字信号处理算法的高效实现。首先概述了当前的FPGA技术、器件以及用于设计最先进DSP系统的工具。阐述了计算机算法的概念、理论、FIR和IIR滤波器
    发表于 04-07 16:41

    BP神经网络与深度学习的关系

    BP神经网络与深度学习之间存在着密切的关系,以下是对它们之间关系的介绍: 一、BP神经网络的基本概念 BP神经网络,即反向传播神经网络(Backpropagation Neural Network
    的头像 发表于 02-12 15:15 1338次阅读

    人工智能和机器学习以及Edge AI的概念与应用

    与人工智能相关各种技术的概念介绍,以及先进的Edge AI(边缘人工智能)的最新发展与相关应用。 人工智能和机器学习是现代科技的核心技术 人工智能(AI)和机器
    的头像 发表于 01-25 17:37 1573次阅读
    人工智能和<b class='flag-5'>机器</b><b class='flag-5'>学习</b>以及Edge AI的<b class='flag-5'>概念</b>与应用

    传统机器学习方法和应用指导

    在上一篇文章中,我们介绍了机器学习的关键概念术语。在本文中,我们会介绍传统机器学习的基础知识和多种算法特征,供各位老师选择。 01 传统
    的头像 发表于 12-30 09:16 1968次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 696次阅读

    了解虚拟电厂的基本概念

    虚拟电厂的基本概念: 虚拟电厂是一种基于现代信息技术和能源互联网的能源管理模式,它将分散的、可再生能源和储能设备通过虚拟化技术进行集成和管理,形成一个具有集中调度、统一运营和优化控制的虚拟化电力系统
    的头像 发表于 12-24 17:12 2054次阅读
    了解虚拟电厂的<b class='flag-5'>基本概念</b>

    傅立叶变换的基本概念 傅立叶变换在信号处理中的应用

    傅里叶变换的基本概念 傅里叶变换是一种数学变换,它能够将满足一定条件的某个函数表示成三角函数(正弦和/或余弦函数)或者它们的积分的线性组合。这种变换在不同的研究领域有多种变体形式,如连续傅里叶变换
    的头像 发表于 12-06 16:48 2324次阅读