0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据的高级分析算法有哪些

h1654155282.3538 来源:科技世界杂谈 作者:科技世界杂谈 2021-01-17 10:37 次阅读

当涉及大数据和高级分析的话题时,热闹非凡。顶级分析公司就这些概念所采取的措施可以为数字时代的企业带来革命性的变化进行了广泛的撰写。世界各地的《财富》 500强公司都在大数据和高级分析方面进行了大量投资,并从中受益匪浅。问题在于,许多公司也希望取得令人难以置信的成果,但不确定确切的起点。

高级分析通常始于单个用例。这包括应用新的数据转换和分析方法来发现数据中以前未知的趋势和模式。当将此新信息应用于业务流程和操作规范时,它就有可能改变您的业务。

为了从数据中获取更大的价值,请使用以下五类算法

线性回归

线性回归是高级分析的最基本算法之一。这也使其成为使用最广泛的之一。人们可以轻松地查看其工作方式以及输入数据与输出数据的关系。

线性回归使用两组连续定量度量之间的关系。第一组称为预测变量或自变量。另一个是响应或因变量。线性回归的目标是以公式的形式识别关系,该公式根据自变量描述因变量。一旦这种关系被量化,就可以为自变量的任何实例预测因变量。

时间是最常用的自变量之一。无论您的自变量是收入,成本,客户,使用或生产力,如果您可以定义其与时间的关系,那么可以使用线性回归预测值。

 逻辑回归

Logistic回归听起来与线性回归相似,但实际上专注于涉及分类而不是定量预测的问题。在这里,输出变量值是离散且有限的,而不是连续的,并且具有无限值,就像线性回归一样。

逻辑回归的目标是对输入变量的实例是否适合类别进行分类。Logistic回归的输出值为0到1之间的值。结果接近1表示输入变量更清楚地适合类别。结果接近0表示输入变量可能不适合该类别。

Logistic回归通常用于回答明确定义的是或否问题。客户会再次购买吗?买家信用值得吗?潜在客户会成为客户吗?预测这些问题的答案会在业务流程中产生一系列动作,从而有助于增加未来的收入。

分类和回归树

分类树和回归树使用决策来对数据进行分类。每个决定都是基于与输入变量之一有关的问题。有了每个问题和相应的答案,数据实例就变得更接近以特定方式进行分类了。这组问题和答案以及随后的数据划分创建了一个树状结构。每行问题的末尾都有一个类别。这称为分类树的叶节点。

这些分类树可能变得非常大和复杂。控制复杂性的一种方法是通过修剪树或有意删除问题级别以在精确匹配和抽象之间取得平衡。对于输入值的所有实例(在训练中已知的值和在训练中未知的值)都适用的模型至关重要。要防止此模型过度拟合,就需要在精确拟合和抽象之间达到微妙的平衡。

分类树和回归树的一种变体称为随机森林。随机森林不是构建具有多个逻辑分支的单个树,而是由许多小的树和简单树组成的顶点,每个树都评估数据实例并确定分类。一旦所有这些简单的树完成了其数据评估,该过程将合并单个结果,以基于较小类别的组合来创建类别的最终预测。这通常称为合奏方法。这些随机森林通常在平衡精确匹配和抽象方面做得很好,并且已在许多业务案例中成功实现。

与侧重于是或否分类的逻辑回归相反,分类和回归树可用于预测多值分类。它们也更容易可视化并查看引导算法进行特定分类的确定路径。

 K最近邻法‬(KNN)

K最近邻法‬也是一种分类算法。它被称为“懒惰学习者”,因为该过程的培训阶段非常有限。学习过程由存储的训练数据集组成。在评估新实例时,将评估到训练集中每个数据点的距离,并且基于新数据实例与训练实例的接近程度,就该数据实例属于哪个类别达成共识。

根据训练集的大小和范围,此算法在计算上可能会很昂贵。由于必须将每个新实例与训练数据集的所有实例进行比较并得出距离,因此该过程每次运行都可以使用许多计算资源。

该分类算法允许对数据进行多值分类。另外,嘈杂的训练数据倾向于使分类倾斜。 通常选择K近邻,因为它易于使用,易于训练并且易于解释结果。当您尝试查找相似的项目时,它通常在搜索应用程序中使用。

K均值聚类

K-均值聚类专注于创建相关属性组。这些组称为群集。一旦创建了这些集群,就可以针对它们评估其他实例,以查看它们最适合的位置。

此技术通常用作数据探索的一部分。首先,分析人员指定群集的数量。K-means群集过程基于在称为“质心”的公共集线器周围找到具有相似性的数据点,将数据分解为该数量的群集。这些群集与类别不同,因为它们最初没有业务意义。它们只是输入变量的紧密相关实例。一旦识别并分析了这些集群,就可以将它们转换为类别,并提供具有业务意义的名称。

经常使用K均值聚类是因为它易于使用和解释,并且速度很快。要注意的一个方面是k均值聚类对异常值极为敏感。这些离群值会极大地改变这些聚类的性质和定义,并最终改变分析结果。

#智能制造#, 这些是高级分析计划中使用的一些最受欢迎的算法。每种方法都有优缺点,并且可以有效地利用各种方法来产生业务价值。实施这些算法的最终目标是进一步优化数据,使结果信息可以应用于业务决策。正是此过程为下游流程提供了更精细和更高价值的数据,这对于公司真正利用其数据的价值并实现其所需的结果至关重要。
责任编辑人:CC

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 分析算法
    +关注

    关注

    0

    文章

    5

    浏览量

    6744
  • 大数据
    +关注

    关注

    64

    文章

    8641

    浏览量

    136578
收藏 人收藏

    评论

    相关推荐

    Get职场新知识:做分析,用大数据分析工具

    工具值得推荐? 那就得是奥威BI大数据分析工具。主要原因三: 1、奥威BI方案,开箱即用,立得百张BI报表,大量节省BI报表开发时间,一步到位完成销售、财务、库存、采购、应收、生产六大主题。 2
    发表于 12-05 09:36

    电梯物联网大数据平台是什么意思?

    电梯物联网大数据化平台是将电梯的使用时间和管理中的各项数据进行采集,整合及利用大数据分析能力和计算机视觉技术、结合关联分析、空间分析和多维
    的头像 发表于 11-23 11:01 368次阅读

    2023年人社部“数智化关键技术的发展与应用”高级研修班暨大数据融合分析与应用山西省重点实验室2023年第

    2023年人社部“数智化关键技术的发展与应用”高级研修班暨大数据融合分析与应用山西省重点实验室2023年第二次学术会议(四)
    的头像 发表于 08-16 21:20 446次阅读
    2023年人社部“数智化关键技术的发展与应用”<b class='flag-5'>高级</b>研修班暨<b class='flag-5'>大数据</b>融合<b class='flag-5'>分析</b>与应用山西省重点实验室2023年第

    分析,更适合分析大数据

    根据以往的经验,当数据量多到一定程度就容易导致系统卡顿、崩溃。这种现象给企业级数据分析造成了极大的困扰。随着业务发展扩大和分析需求精细化,企业需要一套能秒分析
    的头像 发表于 08-03 16:56 208次阅读

    大数据未来的前景怎么样?

    随着科技的迅猛发展和互联网的普及,大数据已成为当今社会中不可或缺的重要资源。大数据是指庞大而复杂的数据集合,这些数据通过高级计算技术进行处理和分析
    的头像 发表于 07-28 15:03 1956次阅读

    算法(2)#大数据分析

    大数据
    学习硬声知识
    发布于 :2023年07月13日 18:33:44

    算法(1)#大数据分析

    大数据
    学习硬声知识
    发布于 :2023年07月13日 18:32:58

    机器学习的模型与算法(2)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月13日 18:30:05

    机器学习的模型与算法(1)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月13日 18:29:21

    Apriori算法(2)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月11日 17:35:50

    Apriori算法(1)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月11日 17:35:25

    电商数据分析攻略,让你轻松搞定数据分析

    在当今的数字经济时代,运用大数据分析来促进业务增长已然成为一种普遍行为,拥有一套系统化的数据分析方案尤为重要。奥威BI电商数据分析方案是一种基于数据挖掘和机器学习技术的解决方案,以丰富
    发表于 06-27 09:22

    浅谈大数据分析技术在军事应用

    大数据分析技术的发展历史可追溯至20世纪初。从那时起,大数据在军事领域的应用便逐渐显现。
    的头像 发表于 05-23 12:44 2342次阅读

    什么是大数据分析

    大数据分析行业是最近这几年比较火,比较高薪的行业了,很多人都想分一杯羹,经常同学问我什么是大数据分析?什么是python?这些能学到什么技能?以后能学到什么知识?有太多的疑问,小编今天就简单写出来
    的头像 发表于 05-19 11:47 869次阅读

    大数据是什么 大数据存储的概念 大数据应用场景有哪些

    大数据的成功管理取决于几个方面,例如数据的收集、存储、处理、分析和可视化。在大数据的处理过程中,各种技术和算法也被不断地应用于解决各种问题。
    发表于 05-03 09:23 2793次阅读