0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

了解数据挖掘的概念和特点

如意 来源:百家号 作者:看数据说事儿 2020-06-29 17:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

数据挖掘源自《从数据库中发现知识》(缩写为KDD)。它首次出现在1989年8月在底特律举行的第十一届国际联合人工智能会议上。为了统一理解,FayyadPiatetsky-Shapiro和Smyth在权威文章集《知识发现与数据进展》中给出了KDD和数据挖掘的最新定义。从中总结了1996年该领域的进展,并予以区分:

KDD的定义是:KDD是从数据中识别有效,新颖,潜在有用且最终可以理解的模式的过程。

数据挖掘的定义是:数据挖掘是KDD中的一步,它使用特定算法在可接受的计算效率限制内生成特定模式。

数据挖掘技术的特点

1.基于大量数据:不是说无法挖掘小数据量。实际上,大多数数据挖掘算法都可以在较小的数据量上运行并获得结果。但是,一方面,过小的数据量可以通过手动分析来总结,另一方面,小数据量通常不能反映现实世界的一般特征。

2.非平凡性:所谓非平凡的意思是指所挖掘的知识是不简单的。一定不能与著名体育评论员所说的相似:“经过我的计算,直到比赛结束我才发现了一个有趣的现象。本届世界杯的进球数和失球数都是相同的。非常巧合!”这种知识。这似乎没有必要,但是许多不了解业务知识的数据挖掘新手经常会犯此错误。

3.隐含性:数据挖掘是发现数据深处的知识,而不是直接出现在数据表面的信息。常用的BI工具(例如亿信BI和豌豆BI)完全可以让用户找到此信息。

4.新奇性:挖掘的知识以前应该是未知的,否则仅是为了验证业务专家的经验。只有新知识才能帮助公司获得进一步的洞察力。

5.价值性:挖掘的结果必须为企业带来直接或间接的利益。有人说数据挖掘只是“杀龙技术”。它看起来牛气哄哄,但没有用。这只是一个错误的想法。不可否认的是,在某些数据挖掘项目中,由于缺乏明确的业务目标,或者由于数据质量不足,或者由于人们抵制不断变化的业务流程,又或者由于挖掘人员缺乏经验,都会导致结果不佳甚至根本没有效果。但是,大量成功的案例也证明了数据挖掘确实可以成为提高效率的武器。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1820

    文章

    50325

    浏览量

    266967
  • 数据挖掘
    +关注

    关注

    1

    文章

    406

    浏览量

    25123
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    生成式AI赋能工程师挖掘非结构化数据价值

    您是否知道,生成式 AI(GenAI)可以帮助工程师在几秒钟内诊断汽车故障,甚至在设备出现问题之前预测潜在失效?GenAI 正在通过加速数据分析和算法开发,让这些场景从设想走向现实,使工程师能够充分发挥专业知识,挖掘可执行的洞察。
    的头像 发表于 02-28 10:24 610次阅读

    一文了解数据存储演变之路

    开工大吉,启新赋能!数据存储格局正持续快速迭代发展,这背后离不开企业与个人不断增长的数据量驱动。其演变核心在于,从传统存储模式逐步迭代升级,转向更先进、灵活且可扩展的存储解决方案,精准适配现代数字企业及职场多元场景的核心需求。
    的头像 发表于 02-27 13:51 604次阅读
    一文<b class='flag-5'>了解数据</b>存储演变之路

    1分钟带你了解数据中心供电架构 #电子元器件 #数据中心 #供电架构

    数据中心
    沛城芯动力
    发布于 :2026年02月03日 15:39:04

    【「芯片设计基石——EDA产业全景与未来展望」阅读体验】--EDA了解与发展概况

    客户粘性巩固寡头地位。另外这三家公司非常注重EDA生态系统建设,这种生态系统建设有助于吸引更多的用户和合作伙伴,形成良性发展的态势。 通过学习,对EDA专业技术概念、设计流程、工具有了进一步认识。对行业EDA发展情况有了整体全局的了解,非常收益,也可以从中获得一些启示。
    发表于 01-19 21:45

    进程概念和特征

    程序及其数据在处理机上顺序执行时所发生的活动。   进程是具有独立功能的程序在一个数据集合上运行的过程,它是系统进行资源分配和调度的一个独立单位。   在引入进程实体的概念后,我们可以把传统操作系统中
    发表于 01-15 06:39

    CW32 UART的数据帧结构有哪些特点

    请问 CW32 UART 的数据帧结构有哪些特点
    发表于 12-15 06:58

    奥松电子协办第二届智能计算与数据挖掘国际学术会议

    2025年10月24日至26日,第二届智能计算与数据挖掘国际学术会议(ICDM 2025)在中国广州隆重举行。本次会议由广州航海学院、汕头大学、广东省数智科技研究会联合主办,广州奥松电子股份有限公司作为协办单位之一,携手多家产业机构,共同推动智能计算与
    的头像 发表于 11-03 14:18 745次阅读

    【产品介绍】Altair HyperStudy拓扑优化软件

    挖掘功能的自动化流程,可智能、高效地探索任何系统模型的设计空间。在考虑多物理场约束的同时,引导用户了解数据趋势,进行权衡研究并优化设计性能和可靠性。直观的用户界面
    的头像 发表于 09-19 17:03 717次阅读
    【产品介绍】Altair HyperStudy拓扑优化软件

    ALM(应用生命周期管理)解析:一文了解概念、关键阶段及Perforce ALM工具推荐

    什么是ALM(应用生命周期管理)?它远不止是SDLC!一文了解概念、关键阶段以及如何借助Perforce ALM这类工具,实现端到端的可追溯性、加速发布并保障合规性。
    的头像 发表于 09-19 11:03 2140次阅读
    ALM(应用生命周期管理)解析:一文<b class='flag-5'>了解</b>其<b class='flag-5'>概念</b>、关键阶段及Perforce ALM工具推荐

    XKCON祥控输煤皮带智能机器人巡检系统对监测数据进行挖掘分析

    XKCON祥控输煤皮带智能机器人巡检系统通过智能机器人在皮带运行过程中对皮带的运行状态和环境状况进行实时检测,在应用过程中,不但提升了巡视周期频次,还通过大数据分析和深度学习算法,对监测数据进行挖掘分析,及时发现设备缺陷故障,为
    的头像 发表于 09-15 11:22 783次阅读
    XKCON祥控输煤皮带智能机器人巡检系统对监测<b class='flag-5'>数据</b>进行<b class='flag-5'>挖掘</b>分析

    入行嵌入式应该怎么准备?

    是至关重要的,因此,掌握C/C++编程技巧是入行嵌入式的基础。 二、硬件基础知识了解基本的电子电路和数字逻辑是嵌入式系统开发的基础。你需要了解数字电路、模拟电路、传感器和执行器的工作原理。此外,对于处理器
    发表于 08-06 10:34

    用树莓派挖掘5种顶级加密货币!

    加密货币是用于在线交易的数字货币。挖掘这些货币通常需要专门的硬件,如ASIC矿机或高性能GPU。然而,有些加密货币仍可用树莓派来挖掘。在本文中,我将为您介绍可在树莓派上挖掘的最佳加密货币。适合用树莓
    的头像 发表于 07-21 16:34 1814次阅读
    用树莓派<b class='flag-5'>挖掘</b>5种顶级加密货币!

    全面了解串行通信

    串行通信是一种数据传输方式,它将数据按 逐位顺序 (bit by bit)在一条传输线上发送和接收,与并行通信(同时传输多位数据)形成对比。以下是其核心概念、工作原理、
    的头像 发表于 07-19 14:13 2129次阅读

    解数据瓶颈:智能汽车合成数据架构与应用实践

    智能汽车感知系统面临数据困境,如结构复杂、成本高昂、覆盖受限、合规性与隐私风险突出。合成数据作为新型数据生成方式,以高度可配置性、自动化、可复现为特点,有望解决这些问题。
    的头像 发表于 07-15 11:48 766次阅读
    破<b class='flag-5'>解数据</b>瓶颈:智能汽车合成<b class='flag-5'>数据</b>架构与应用实践

    物联网感知数据挖掘:赋能万物智联的核心引擎

    背后,数据挖掘与分析技术正成为解锁设备潜能、驱动产业变革的关键钥匙。 一、从数据到洞察:六大核心价值维度 1. 价值转化器:解锁设备数据的商业密码 工业传感器产生的振动频谱、智能电表的
    的头像 发表于 06-17 16:22 773次阅读