0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习之分类分析与聚类分析

RG15206629988 来源:行业学习与研究 2023-03-27 14:13 次阅读

数据挖掘中应用较多的技术机器学习

机器学习主流算法包括三种:关联分析、分类分析、聚类分析。本文主要介绍分类分析、聚类分析。

481f9f02-cb8c-11ed-bfe3-dac502259ad0.png

图片来源:来自网络

一、分类分析

(1)分类分析概念 分类分析是指算法通过学习得出“某种分类依据”,该分类依据可以判断一个新事物的类别(含个人理解)。

(2)分类分析过程 分类分析包括两个过程:

1)通过大量样本的训练,使算法可以建立准确率超过某值的分类依据。

2)算法根据分类依据对新事物分类。

(3)分类分析过程与学生学习过程对比

1)学生本身具有学习能力,但不会做某一类型的题。这类似于机器学习算法具有学习能力,但不会对某一事物进行分类。

2)学生在学习过程中需要做大量习题,而且还需要根据标准答案确定每道题的正误,学生在该过程逐步调整其知识体系。这类似于机器学习算法需要通过大量样本的训练,机器学习的每个样本均包含输入和输出,机器学习可以通过将样本输入其建立模型得出的输出与样本输出(样本输出类似标准答案)进行对比,判断其建立模型的准确性,不断调整其建立的模型。

3)当学生掌握所学的知识后,其就具备了在考试中解答新的同类型问题的能力。这类似于机器学习算法通过其建立的模型对新事物分类。

(4)分类分析算法

常见的分类分析算法包括:决策树、K近邻法(kNN)、朴素贝叶斯、感知机、支持向量机(SVM)。

更高级的分类分析方法包括:逻辑斯谛回归(Logistic回归)、贝叶斯网络、神经网路等。

二、聚类分析

(1)聚类分析概念

聚类分析是将一群物理对象划分成相似的对象集合的过程。在聚类分析中,各个聚类内的数据对象是相似的,不同聚类间的对象是相异的。

489c49da-cb8c-11ed-bfe3-dac502259ad0.png

图片来源:来自网络

(2)聚类分析与分类分析对比

与分类分析类似,聚类分析的目的也是将样本划分至不同的子集。两者不同的是:分类分析需要大量样本训练,分类分析的算法在学习过程中需被告知每个样本的类别;聚类分析不需要训练样本,聚类分析的算法学习的数据是没有指导信息的数据,聚类分析的算法通过其内部机制对样本进行划分,将“它”认为同类的数据进行聚类。

(3)聚类分析与日常事物分类方式对比 聚类分析的分类方式使其对事物的分类方式可能有别于日常生活中对事物的划分。

例如,日常生活中如果对香蕉、草莓、木块分类,人们可能更容易将香蕉和草莓划分为水果一类,将木块划分为另外的类别;但聚类分析算法可能将香蕉和木块划分为一类,将草莓划分为另外的类别,分类依据是香蕉和木块都是黄色的。

48bf5010-cb8c-11ed-bfe3-dac502259ad0.jpg

图片来源:来自网络

(4)聚类分析方法

聚类分析的常用方法包括:K-means算法、K中心点算法、层次聚类算法等。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SVM
    SVM
    +关注

    关注

    0

    文章

    154

    浏览量

    32187
  • 机器学习
    +关注

    关注

    66

    文章

    8126

    浏览量

    130571
  • 神经网路
    +关注

    关注

    0

    文章

    8

    浏览量

    2602

原文标题:大数据相关介绍(25)——机器学习之分类分析、聚类分析

文章出处:【微信号:行业学习与研究,微信公众号:行业学习与研究】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    机器学习模型类型分类

     机器学习按照模型类型分为监督学习模型、无监督学习模型两大类。 1. 有监督学习 有监督学习通常
    的头像 发表于 09-05 11:45 1354次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>模型类型<b class='flag-5'>分类</b>

    机器学习的定义、分类及应用

    机器学习(Machine Learning)是一种人工智能的技术,它是一种让计算机通过对大量数据进行分析学习,从而可以自动进行预测和决策的技术。其核心思想是利用算法和统计学的方法来让
    发表于 08-22 17:39 3077次阅读

    机器学习有哪些算法?机器学习分类算法有哪些?机器学习预判有哪些算法?

    机器学习有哪些算法?机器学习分类算法有哪些?机器学习
    的头像 发表于 08-17 16:30 1404次阅读

    机器学习theta是什么?机器学习tpe是什么?

    解一下theta。在机器学习中,theta通常表示模型的参数。在回归问题中,theta可能表示线性回归的斜率和截距;在分类问题中,theta可能表示多项式模型的各项系数。这些参数通常是通过训练数据自动
    的头像 发表于 08-17 16:30 1231次阅读

    机器学习算法总结 机器学习算法是什么 机器学习算法优缺点

    机器学习算法总结 机器学习算法是什么?机器学习算法优缺点?
    的头像 发表于 08-17 16:11 1090次阅读

    机器学习算法汇总 机器学习算法分类 机器学习算法模型

    机器学习算法汇总 机器学习算法分类 机器学习算法模型
    的头像 发表于 08-17 16:11 729次阅读

    python机器学习概述

    是一种非常流行的编程语言,因为它具有非常强大的数据分析和科学计算库。Python可以被用来完成一系列的任务,包括机器学习、数据分析、图像处理、自然语言处理和深度
    的头像 发表于 08-17 16:11 768次阅读

    机器学习可以分为哪几类?机器学习技术有哪些?

    对自然语言、图像、声音、视频等数据进行分析分类、预测的重要方法之一。在日常生活和工作中,我们可以看到机器学习广泛应用于推荐系统、搜索引擎、语音识别、自然语言处理、计算机视觉、医学诊断
    的头像 发表于 08-17 16:11 4392次阅读

    机器学习和深度学习的区别

      机器学习是一种方法,利用算法来让机器可以自我学习和适应,而且不需要明确地编程。在许多应用中,需要机器使用历史数据训练模型,然后使用该模型
    发表于 08-02 17:36 388次阅读

    使用 RAPIDS RAFT 进行机器学习和数据分析的可重用计算模式

    使用 RAPIDS RAFT 进行机器学习和数据分析的可重用计算模式
    的头像 发表于 07-05 16:30 325次阅读
    使用 RAPIDS RAFT 进行<b class='flag-5'>机器</b><b class='flag-5'>学习</b>和数据<b class='flag-5'>分析</b>的可重用计算模式

    机器学习之新功能对象分类

    电子发烧友网站提供《机器学习之新功能对象分类.zip》资料免费下载
    发表于 06-19 15:45 0次下载
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>之新功能对象<b class='flag-5'>分类</b>

    使用Azure和机器学习进行传感器数据分析

    电子发烧友网站提供《使用Azure和机器学习进行传感器数据分析.zip》资料免费下载
    发表于 06-16 10:57 1次下载
    使用Azure和<b class='flag-5'>机器</b><b class='flag-5'>学习</b>进行传感器数据<b class='flag-5'>分析</b>

    PyTorch教程4.6之分类中的泛化

    电子发烧友网站提供《PyTorch教程4.6之分类中的泛化.pdf》资料免费下载
    发表于 06-05 15:39 0次下载
    PyTorch教程4.6<b class='flag-5'>之分类</b>中的泛化

    聚类分析中的机器学习与统计方法综述(二)

    次聚类是基因表达数据分析中应用最广泛的聚类方法。层次聚类在数据点之间构建层次结构,它根据层次树中的分支定义不同的类群。许多单细胞转录组数据的聚类算法都是基于层次聚类或将层次聚类作为分析的步骤之一。
    的头像 发表于 05-24 10:45 556次阅读
    <b class='flag-5'>聚类分析</b>中的<b class='flag-5'>机器</b><b class='flag-5'>学习</b>与统计方法综述(二)

    聚类分析中的机器学习与统计方法综述(一)

    单细胞转录组测序(scRNA-seq)技术能够对细胞群中的每一个细胞进行大规模的全转录组分析
    的头像 发表于 05-19 10:03 549次阅读
    <b class='flag-5'>聚类分析</b>中的<b class='flag-5'>机器</b><b class='flag-5'>学习</b>与统计方法综述(一)