0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

了解数据挖掘的概念和特点

如意 来源:百家号 作者:看数据说事儿 2020-06-29 17:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

数据挖掘源自《从数据库中发现知识》(缩写为KDD)。它首次出现在1989年8月在底特律举行的第十一届国际联合人工智能会议上。为了统一理解,FayyadPiatetsky-Shapiro和Smyth在权威文章集《知识发现与数据进展》中给出了KDD和数据挖掘的最新定义。从中总结了1996年该领域的进展,并予以区分:

KDD的定义是:KDD是从数据中识别有效,新颖,潜在有用且最终可以理解的模式的过程。

数据挖掘的定义是:数据挖掘是KDD中的一步,它使用特定算法在可接受的计算效率限制内生成特定模式。

数据挖掘技术的特点

1.基于大量数据:不是说无法挖掘小数据量。实际上,大多数数据挖掘算法都可以在较小的数据量上运行并获得结果。但是,一方面,过小的数据量可以通过手动分析来总结,另一方面,小数据量通常不能反映现实世界的一般特征。

2.非平凡性:所谓非平凡的意思是指所挖掘的知识是不简单的。一定不能与著名体育评论员所说的相似:“经过我的计算,直到比赛结束我才发现了一个有趣的现象。本届世界杯的进球数和失球数都是相同的。非常巧合!”这种知识。这似乎没有必要,但是许多不了解业务知识的数据挖掘新手经常会犯此错误。

3.隐含性:数据挖掘是发现数据深处的知识,而不是直接出现在数据表面的信息。常用的BI工具(例如亿信BI和豌豆BI)完全可以让用户找到此信息。

4.新奇性:挖掘的知识以前应该是未知的,否则仅是为了验证业务专家的经验。只有新知识才能帮助公司获得进一步的洞察力。

5.价值性:挖掘的结果必须为企业带来直接或间接的利益。有人说数据挖掘只是“杀龙技术”。它看起来牛气哄哄,但没有用。这只是一个错误的想法。不可否认的是,在某些数据挖掘项目中,由于缺乏明确的业务目标,或者由于数据质量不足,或者由于人们抵制不断变化的业务流程,又或者由于挖掘人员缺乏经验,都会导致结果不佳甚至根本没有效果。但是,大量成功的案例也证明了数据挖掘确实可以成为提高效率的武器。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261480
  • 数据挖掘
    +关注

    关注

    1

    文章

    406

    浏览量

    24969
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    奥松电子协办第二届智能计算与数据挖掘国际学术会议

    2025年10月24日至26日,第二届智能计算与数据挖掘国际学术会议(ICDM 2025)在中国广州隆重举行。本次会议由广州航海学院、汕头大学、广东省数智科技研究会联合主办,广州奥松电子股份有限公司作为协办单位之一,携手多家产业机构,共同推动智能计算与
    的头像 发表于 11-03 14:18 397次阅读

    【产品介绍】Altair HyperStudy拓扑优化软件

    挖掘功能的自动化流程,可智能、高效地探索任何系统模型的设计空间。在考虑多物理场约束的同时,引导用户了解数据趋势,进行权衡研究并优化设计性能和可靠性。直观的用户界面
    的头像 发表于 09-19 17:03 317次阅读
    【产品介绍】Altair HyperStudy拓扑优化软件

    ALM(应用生命周期管理)解析:一文了解概念、关键阶段及Perforce ALM工具推荐

    什么是ALM(应用生命周期管理)?它远不止是SDLC!一文了解概念、关键阶段以及如何借助Perforce ALM这类工具,实现端到端的可追溯性、加速发布并保障合规性。
    的头像 发表于 09-19 11:03 1249次阅读
    ALM(应用生命周期管理)解析:一文<b class='flag-5'>了解</b>其<b class='flag-5'>概念</b>、关键阶段及Perforce ALM工具推荐

    XKCON祥控输煤皮带智能机器人巡检系统对监测数据进行挖掘分析

    XKCON祥控输煤皮带智能机器人巡检系统通过智能机器人在皮带运行过程中对皮带的运行状态和环境状况进行实时检测,在应用过程中,不但提升了巡视周期频次,还通过大数据分析和深度学习算法,对监测数据进行挖掘分析,及时发现设备缺陷故障,为
    的头像 发表于 09-15 11:22 406次阅读
    XKCON祥控输煤皮带智能机器人巡检系统对监测<b class='flag-5'>数据</b>进行<b class='flag-5'>挖掘</b>分析

    入行嵌入式应该怎么准备?

    是至关重要的,因此,掌握C/C++编程技巧是入行嵌入式的基础。 二、硬件基础知识了解基本的电子电路和数字逻辑是嵌入式系统开发的基础。你需要了解数字电路、模拟电路、传感器和执行器的工作原理。此外,对于处理器
    发表于 08-06 10:34

    用树莓派挖掘5种顶级加密货币!

    加密货币是用于在线交易的数字货币。挖掘这些货币通常需要专门的硬件,如ASIC矿机或高性能GPU。然而,有些加密货币仍可用树莓派来挖掘。在本文中,我将为您介绍可在树莓派上挖掘的最佳加密货币。适合用树莓
    的头像 发表于 07-21 16:34 927次阅读
    用树莓派<b class='flag-5'>挖掘</b>5种顶级加密货币!

    全面了解串行通信

    串行通信是一种数据传输方式,它将数据按 逐位顺序 (bit by bit)在一条传输线上发送和接收,与并行通信(同时传输多位数据)形成对比。以下是其核心概念、工作原理、
    的头像 发表于 07-19 14:13 1148次阅读

    解数据瓶颈:智能汽车合成数据架构与应用实践

    智能汽车感知系统面临数据困境,如结构复杂、成本高昂、覆盖受限、合规性与隐私风险突出。合成数据作为新型数据生成方式,以高度可配置性、自动化、可复现为特点,有望解决这些问题。
    的头像 发表于 07-15 11:48 482次阅读
    破<b class='flag-5'>解数据</b>瓶颈:智能汽车合成<b class='flag-5'>数据</b>架构与应用实践

    高度定制可扩展!Qorvo企业级PMIC破解数据中心断电数据安全难题

    芯片解决方案来到深圳MemoryS 2025存储峰会上,全方位呈现其在连接、保护和电源管理等方面的卓越成果。   为了更深入的了解此次Qorvo断电保护PMIC芯片有哪些特点,电子发烧友网采访到了Qorvo高级销售经理张鲲。据了解
    的头像 发表于 03-20 00:16 1833次阅读
    高度定制可扩展!Qorvo企业级PMIC破<b class='flag-5'>解数据</b>中心断电<b class='flag-5'>数据</b>安全难题

    三一挖掘机一键启动开关易坏的原因及更换注意事项

    三一挖掘机一键启动开关易坏的原因虽然三一挖掘机的一键启动系统设计旨在提高便利性和安全性,但在实际使用中,可能会出现一些问题导致开关易坏。这些问题可能包括:频繁使用:挖掘机在施工过程中频繁启动和关闭
    发表于 03-12 09:29

    数据I/O模块的概念特点以及作用

      本文简单介绍了数据I/O模块的概念特点以及作用。 一、数据 I/O 模块是什么 1. 承接内外数据交互的“桥梁”
    的头像 发表于 01-21 11:10 1564次阅读

    硬件处理模块的概念特点和在系统中的位置

    本文介绍了硬件处理模块的概念特点和在系统中的位置。 一、硬件处理模块的基本概念 专注于特定功能  硬件处理模块可以理解为在芯片内部专门“定制”出来的一块逻辑电路,用于完成某类固定的计算或操作。它不
    的头像 发表于 01-20 13:52 1261次阅读
    硬件处理模块的<b class='flag-5'>概念</b>、<b class='flag-5'>特点</b>和在系统中的位置

    了解虚拟电厂的基本概念

    虚拟电厂的基本概念: 虚拟电厂是一种基于现代信息技术和能源互联网的能源管理模式,它将分散的、可再生能源和储能设备通过虚拟化技术进行集成和管理,形成一个具有集中调度、统一运营和优化控制的虚拟化电力系统
    的头像 发表于 12-24 17:12 2059次阅读
    <b class='flag-5'>了解</b>虚拟电厂的基本<b class='flag-5'>概念</b>

    什么是大屏数据可视化?特点有哪些?

    介绍: 特点 直观易懂:大屏数据可视化通过图表、图形和其他可视化元素,将复杂的数据转化为直观易懂的形式,使得用户无需深入挖掘数据细节即可快速
    的头像 发表于 12-16 16:59 1001次阅读

    DAC81408的建立时间为12uS,如何理解数据手册中的12uS建立时间这个参数呢?

    中建立时间曲线,±20V输出,如果按照数据手册中4V/uS爬升速率计算,0到20V跳变时间为5uS,从以上两图页可以看出,信号在5uS内达到设定值20V,该时间也小于建立时间典型值12uS。 请问如何理解数据手册中的12uS建立时间这个参数呢
    发表于 12-09 08:33