0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据挖掘的四类方法

工程师 来源:网络整理 作者:h1654155205.5246 2019-04-10 16:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

数据挖掘的四类方法

1、神经网络方法

由于神经网络本身具有良好的鲁棒性、自组织适应性、自行处理性、分布存储和高度容错等特性,非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注和使用。典型的神经网络模型主要分3大类:以感知机、BP反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的神经网络模型;以Hopfield的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以ART模型、Koholon模型为代表的,用于聚类的自组织映射方法。神经网络方法的缺点是“黑箱”性,人们难以从网络中理解学习和决策过程。

2、遗传算法

遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法,是一种遗传仿生的全局优化方法。遗传算法具有的隐含并行性、易于和其它模型结合等性质使得它在数据挖掘中被加以应用。遗传算法的数据挖掘工具,利用该工具对两个飞机失事的真实数据库进行了数据挖掘实验,结果表明遗传算法是进行数据挖掘的有效方法之一。遗传算法的应用还体现在与神经网络、粗集等技术的结合上。利用遗传算法优化神经网络结构,在不增加错误率的前提下,删除多余的连接和隐层数据单元;用遗传算法和BP算法结合训练神经网络,然后从网络提取规则等。但遗传算法的算法较为之复杂,敛于局部极小的较早敛入问题尚未解决。

3、决策树方法

决策树是一种常用于预测模型的算法,它通过将大量数据有目的分类,从中找到一些有价值的和潜在的信息。它的优点是描述简单,分类速度快,适合于对大规模的数据处理。最有影响和最早的决策树方法是ID3算法。它的主要问题是:ID3是非递增学习算法;ID3决策树是单变量决策树,复杂概念的表达困难;同性间的相互关系不够强调;抗噪音性差。针对上述问题,出现了许多较好较为改进算法的ID4递增式学习算法和IBLE算法等。

4、粗集方法

粗集方法专注于研究不精确、不确定知识的数学工具。粗集方法有几个优点,不需要再提供额外信息;加强简化输入信息的表达空间;算法较为简单,容易操作操作。粗集处理的对象是类似于二维关系的信息表。目前成熟的关系数据库管理系统和新发展起来的数据仓库管理系统,为粗集的数据挖掘奠定了坚实的基础。但粗集的数学基础是集合论,难以直接处理连续性问题的属性。而现实信息表中连续属性是普遍存在的。因此连续属性的离散化是制约粗集理论实用化的难点重点。现在国际上已经研制出来了一些基于粗集的工具应用软件,例如加拿大KDD-R软件和美国的LERS软件等。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据挖掘
    +关注

    关注

    1

    文章

    406

    浏览量

    25123
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工厂设备数据没法远程采集怎么解决?

    核心成因可归纳为四类: 1. 协议不兼容 :工厂生产线多为分期升级改造,不同时期、不同品牌的设备采用的通信 协议存在差异,无统一数据输出标准,无法直接对接远程采集系统。   2. 传输距离受限 :大型厂区、电力、矿业等领域的
    的头像 发表于 04-23 09:38 156次阅读
    工厂设备<b class='flag-5'>数据</b>没法远程采集怎么解决?

    光伏可装置数据质量治理:监测数据清洗、校验与修复全流程方法

    ”全流程处理,为可装置提供高质量数据支撑,构建“数据采集-治理-应用-迭代”的闭环体系。本文详解各环节核心方法、适配场景及与可装置的协同
    的头像 发表于 04-16 15:54 882次阅读
    光伏<b class='flag-5'>四</b>可装置<b class='flag-5'>数据</b>质量治理:监测<b class='flag-5'>数据</b>清洗、校验与修复全流程<b class='flag-5'>方法</b>

    1MW光伏项目“可”装置数据采集设备具体配置详解

    1MW工商业分布式光伏项目多采用组串式逆变器方案,适配厂房屋顶、园区空地等场景,其“可”(可观、可测、可调、可控)能力的落地,核心依赖数据采集设备构建全链路感知体系。此类设备需满足GB/T
    的头像 发表于 03-23 13:58 778次阅读
    1MW光伏项目“<b class='flag-5'>四</b>可”装置<b class='flag-5'>数据</b>采集<b class='flag-5'>类</b>设备具体配置详解

    生成式AI赋能工程师挖掘非结构化数据价值

    您是否知道,生成式 AI(GenAI)可以帮助工程师在几秒钟内诊断汽车故障,甚至在设备出现问题之前预测潜在失效?GenAI 正在通过加速数据分析和算法开发,让这些场景从设想走向现实,使工程师能够充分发挥专业知识,挖掘可执行的洞察。
    的头像 发表于 02-28 10:24 596次阅读

    如何分辨五网线

    分辨五与六网线的方法如下: 外皮标识 五网线外皮标注“CAT5”,六网线标注“CAT6”。这是最直观的区分方式,标识直接表明网线的类
    的头像 发表于 01-28 10:21 1989次阅读

    1688品API:蓝海市场发现,新机会挖掘

    市场机会。本文将逐步介绍如何利用1688品API实现蓝海市场发现和新机会挖掘,包括API使用、数据处理及代码实现,确保内容真实可靠。 1. 什么是1688品API? 1688品
    的头像 发表于 01-23 13:39 1469次阅读
    1688品<b class='flag-5'>类</b>API:蓝海市场发现,新机会<b class='flag-5'>挖掘</b>!

    国内重点工业物联网平台四类厂商分类及选型指南

    的“必选项”! ​ 平台分类 厂商类型 核心优势 核心短板 专业独立厂商 技术能力强,平台适应性广,工业模型/数据/协议积累深厚,适配性与通用性突出,可满足多场景需求 无明显短板,相对更侧重技术研发,品牌营销力度弱于大厂与运营
    的头像 发表于 01-13 15:44 293次阅读
    国内重点工业物联网平台<b class='flag-5'>四类</b>厂商分类及选型指南

    奥松电子协办第二届智能计算与数据挖掘国际学术会议

    2025年10月24日至26日,第二届智能计算与数据挖掘国际学术会议(ICDM 2025)在中国广州隆重举行。本次会议由广州航海学院、汕头大学、广东省数智科技研究会联合主办,广州奥松电子股份有限公司作为协办单位之一,携手多家产业机构,共同推动智能计算与
    的头像 发表于 11-03 14:18 738次阅读

    E203添加浮点数方法:译码和派遣模块设计

    是哪一条指令。在译码这部分,就需要根据指令输出disp_i_fpu,disp_i_fpu_rs1en,disp_i_fpu_rs1idx,disp_i_fpu_rs1fpu 这四类信息。这四类信息只能参照
    发表于 10-24 13:54

    基于点探针和扩展电阻模型的接触电阻率快速表征方法

    广泛应用受限于所需的3D模拟数据拟合过程。本文通过引入结合Xfilm埃利探针方阻仪与扩展电阻模型(SRM)的方法快速准确的提取ρc。点探针法基础/Xfilm
    的头像 发表于 09-29 13:45 1169次阅读
    基于<b class='flag-5'>四</b>点探针和扩展电阻模型的接触电阻率快速表征<b class='flag-5'>方法</b>

    条码扫码设备的使用方法

    使用方法,能让其充分发挥价值,为各行业的规范化管理提供有力支撑。一、条码扫码设备的主要类型不同场景对条码扫码设备的需求存在差异,目前主流类型可分为四类,适配不同工作
    的头像 发表于 09-17 16:15 1153次阅读
    条码扫码设备的使用<b class='flag-5'>方法</b>

    对数字通信线缆是六线吗

    对数字通信线缆不一定是六线,但六线通常采用对线芯结构。以下是对两者的详细分析: 对数字通信线缆
    的头像 发表于 08-20 10:39 791次阅读

    Texas Instruments TPS23881B1EVM-024子卡数据手册

    Texas Instruments TPS23881B1EVM-024子卡设计用于评估具有自主模式的对、四类、八通道以太网供电(POE)PSE TPS23881B。该子卡为Texas Instruments TPS23881B器件提供了评估和参考电路,适用于大功率PSE
    的头像 发表于 07-30 09:50 860次阅读
    Texas Instruments TPS23881B1EVM-024子卡<b class='flag-5'>数据</b>手册

    用树莓派挖掘5种顶级加密货币!

    加密货币是用于在线交易的数字货币。挖掘这些货币通常需要专门的硬件,如ASIC矿机或高性能GPU。然而,有些加密货币仍可用树莓派来挖掘。在本文中,我将为您介绍可在树莓派上挖掘的最佳加密货币。适合用树莓
    的头像 发表于 07-21 16:34 1798次阅读
    用树莓派<b class='flag-5'>挖掘</b>5种顶级加密货币!

    Analog Devices / Maxim Integrated MAX98363 SoundWire® D放大器数据手册

    时间设置(用于声音线数据输出PHY)。新型引脚分配为用户提供一种实施高性价比晶圆级封装 (WLP) 的方法,无需昂贵的焊盘内通孔。
    的头像 发表于 06-16 16:19 1086次阅读
    Analog Devices / Maxim Integrated MAX98363 SoundWire® D<b class='flag-5'>类</b>放大器<b class='flag-5'>数据</b>手册