0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

了解数据挖掘的概念和特点

如意 来源:百家号 作者:看数据说事儿 2020-06-29 17:31 次阅读

数据挖掘源自《从数据库中发现知识》(缩写为KDD)。它首次出现在1989年8月在底特律举行的第十一届国际联合人工智能会议上。为了统一理解,FayyadPiatetsky-Shapiro和Smyth在权威文章集《知识发现与数据进展》中给出了KDD和数据挖掘的最新定义。从中总结了1996年该领域的进展,并予以区分:

KDD的定义是:KDD是从数据中识别有效,新颖,潜在有用且最终可以理解的模式的过程。

数据挖掘的定义是:数据挖掘是KDD中的一步,它使用特定算法在可接受的计算效率限制内生成特定模式。

数据挖掘技术的特点

1.基于大量数据:不是说无法挖掘小数据量。实际上,大多数数据挖掘算法都可以在较小的数据量上运行并获得结果。但是,一方面,过小的数据量可以通过手动分析来总结,另一方面,小数据量通常不能反映现实世界的一般特征。

2.非平凡性:所谓非平凡的意思是指所挖掘的知识是不简单的。一定不能与著名体育评论员所说的相似:“经过我的计算,直到比赛结束我才发现了一个有趣的现象。本届世界杯的进球数和失球数都是相同的。非常巧合!”这种知识。这似乎没有必要,但是许多不了解业务知识的数据挖掘新手经常会犯此错误。

3.隐含性:数据挖掘是发现数据深处的知识,而不是直接出现在数据表面的信息。常用的BI工具(例如亿信BI和豌豆BI)完全可以让用户找到此信息。

4.新奇性:挖掘的知识以前应该是未知的,否则仅是为了验证业务专家的经验。只有新知识才能帮助公司获得进一步的洞察力。

5.价值性:挖掘的结果必须为企业带来直接或间接的利益。有人说数据挖掘只是“杀龙技术”。它看起来牛气哄哄,但没有用。这只是一个错误的想法。不可否认的是,在某些数据挖掘项目中,由于缺乏明确的业务目标,或者由于数据质量不足,或者由于人们抵制不断变化的业务流程,又或者由于挖掘人员缺乏经验,都会导致结果不佳甚至根本没有效果。但是,大量成功的案例也证明了数据挖掘确实可以成为提高效率的武器。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43871

    浏览量

    230627
  • 数据挖掘
    +关注

    关注

    1

    文章

    405

    浏览量

    24038
收藏 人收藏

    评论

    相关推荐

    深入理解数据备份的关键原则:应用一致性与崩溃一致性的区别

    深入理解数据备份的关键原则:应用一致性与崩溃一致性的区别 在数字化时代,数据备份成为了企业信息安全的核心环节。但在备份过程中,两个关键概念——应用一致性和崩溃一致性,常常被误解或混淆。本文旨在阐明
    的头像 发表于 03-11 11:29 223次阅读
    深入理<b class='flag-5'>解数据</b>备份的关键原则:应用一致性与崩溃一致性的区别

    机器学习与数据挖掘方法和应用

    机器学习与数据挖掘方法和应用(经典)
    发表于 09-26 07:56

    关于数据挖掘的十种算法原理讲解

    数据挖掘主要分为三类:分类算法、聚类算法和相关规则,基本涵盖了当前商业市场对算法的所有需求。这三类包含了许多经典算法。市面上很多关于数据挖掘算法的介绍都是深奥难懂的。今天我就用我的理解
    的头像 发表于 09-18 15:00 663次阅读
    关于<b class='flag-5'>数据</b><b class='flag-5'>挖掘</b>的十种算法原理讲解

    一文弄懂数据挖掘的十大算法,数据挖掘算法原理讲解

    数据挖掘主要分为三类:分类算法、聚类算法和相关规则,基本涵盖了当前商业市场对算法的所有需求。这三类包含了许多经典算法。市面上很多关于数据挖掘算法的介绍都是深奥难懂的。今天我就用我的理解
    的头像 发表于 09-14 15:56 534次阅读
    一文弄懂<b class='flag-5'>数据</b><b class='flag-5'>挖掘</b>的十大算法,<b class='flag-5'>数据</b><b class='flag-5'>挖掘</b>算法原理讲解

    机器学习与数据挖掘的区别 机器学习与数据挖掘的关系

    或视为同一概念。在这篇文章中,我们将讨论机器学习和数据挖掘之间的区别以及它们之间的关系。 机器学习和数据挖掘的区别 机器学习和
    的头像 发表于 08-17 16:30 1535次阅读

    数据挖掘和机器学习之间的关系

    数据挖掘和机器学习之间的关系 数据挖掘和机器学习是两个非常相关的领域,但是在很多情况下它们被误解为是同一种东西。事实上,数据
    的头像 发表于 08-17 16:29 2333次阅读

    数据挖掘和机器学习有什么关系

    数据挖掘和机器学习有什么关系 数据挖掘和机器学习是两个不同的概念,但它们有一些重要的相似之处。这篇文章将详细介绍
    的头像 发表于 08-17 16:29 2073次阅读

    数据挖掘十大算法

    数据挖掘十大算法 数据挖掘是目前最热门的技术和概念之一。数据
    的头像 发表于 08-17 16:29 1850次阅读

    python数据挖掘案例

    python数据挖掘案例 Python数据挖掘在各个领域中应用非常广泛。它可以帮助我们从大量的数据挖掘
    的头像 发表于 08-17 16:29 854次阅读

    python数据挖掘与机器学习

    python数据挖掘与机器学习 Python是一个非常流行的编程语言,被广泛用于数据挖掘和机器学习领域。在本篇文章中,我们将探讨Python在数据
    的头像 发表于 08-17 16:29 889次阅读

    机器学习与数据挖掘的对比与区别

    。 机器学习和数据挖掘是一对相互关联的领域。它们都是理解数据、建立模型和提取知识的工具,但目标和方法有所不同。在这篇文章中,我们将比较机器学习与数据
    的头像 发表于 08-17 16:11 1161次阅读

    数据挖掘的流程 数据挖掘分类算法

      分类是用于识别什么样的事务属于哪一类的方法,可用于分类的算法有决策树、bayes分类、神经网络、支持向量机等等。  数据挖掘的一般流程  第一步,建立模型,确定数据表中哪些列是要用于输入
    发表于 07-18 17:00 0次下载

    数据挖掘定义及方法 数据挖掘在微电子领域的应用

    制造中的数据挖掘流程示意图,并用主成分分析法分析产生异常的原因,最后得出合理的结论。  数据挖掘及相关技术  1、数据
    发表于 07-18 15:43 0次下载

    数据仓库基本概念(1)#数据挖掘

    数据
    学习硬声知识
    发布于 :2023年07月06日 16:18:57

    小松启动中型液压挖掘概念车的实证实验

    2023年5月,株式会社小松制作所 (以下简称“小松”) 启动了一款以氢燃料电池作为动力的中型液压挖掘概念车的实证实验(PoC)。
    的头像 发表于 05-23 09:05 664次阅读