0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据分析和数据挖掘的区别是什么?

人工智能与大数据技术 来源:木东居士 2020-09-24 13:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

0x00 前言

问题

数据分析和数据挖掘的区别是什么?是否只能选一个方向深耕?

话题整理者:橘子,本科学的是金融和商业分析,目前是数据和运筹优化方向研究生,定位有点迷茫,日常在业务和技术的边缘反复横跳,希望能和大家共同学习和进步,一起用数据创造更多的价值。

问题描述

数据分析和数据挖掘是数据从业者非常关注的两个岗位。这两个岗位到底有哪些区别?常听人说数据分析偏业务、偏前台,而数据挖掘偏技术,偏后台。所以要早点选定一个方向进行深耕才行?

希望大家从这岗位设定的目的、高端人才的核心竞争力、技能树、职业发展路径和天花板、未来的趋势等角度谈一谈这两个岗位的区别。

0x01 讨论内容

讨论1

我觉得偏业务方向的数据分析师最好,数据挖掘做出来的成果期望不会很高的,在职业晋升方面懂业务的优势更大。

讨论2

其实都是大数据的分析工作,我们这边数据分析偏运营或者数据库的搭建清洗和业务分析,挖掘偏向于数据仓储 架构,长期业务分析,不知道和各位老哥的理解有什么不一样的。

讨论3

广义的数据分析本身就是包涵数据挖掘。

数据分析:注重分析过程,

数据挖掘:关注挖掘结果。

两者目标不一致,前者是基础,后者是升华。

讨论4

我以前以为数据分析只是业务excel sql boy,但是现在看在北京上海等地从事数分的,他们的工作也需要应用数据挖掘里面的模型,也会涉及特征提取,机器学习的内容;总之感觉从事数挖的偏技术更靠谱,数分这个岗位鱼龙混杂 感觉现在培训班把数分炒火了啥岗位都往数分转,但是这个岗位后面的深坑谁都说不准。

0x02 居士的解答

首先整体说一下两个岗位的现状,在大部分公司里面,数据挖掘和数据分析并没有特别明显的差别,甚至很多公司压根就没有数据挖掘这个通道。一般大家讨论数据挖掘和数据分析的区别的时候,更倾向于将数据挖掘定位为会用很多机器学习算法的岗位,数据分析定位为大部分时候都在写sql和玩excel,最多了解一些统计学的岗位,因此很多小伙伴在聊这个问题的时候也会认为:数据挖掘的技术含量更高,更有钱途。

然后,在各个厂子里面是怎么划分数据分析和数据挖掘呢,举几个例子给大家做参考:

厂A:数据挖掘和数据分析做同样的事情,没什么区别,写Sql,开发报表,跑数据~

厂B:数据挖掘做推荐、广告这类偏算法相关的岗位,数据分析做报表、数据周报、数据清洗的工作

厂C:没有数据挖掘岗位,只有数据分析岗和算法工程师岗,算法工程师偏向于算法的工程实现,比如推荐算法和广告算法的线上工程化。其他不管用不用得到机器学习算法,都是数据分析。

最后,居士从几个角度分享一下对这个问题的理解:

从技能要求的角度

数据分析:一般这些技能就够完成工作:Excel、Sql、Python

数据挖掘:在数据分析的基础上,可能会要求Java or C++这类语言来做线上工程化化的工作

从知识要求的角度

数据分析:统计学+少量的机器学习

数据分析:统计学+大量的机器学习

从实际工作的角度

再次说明一点,大部分公司的数据挖掘挖掘岗和数据分析岗可能没什么区别,下面只是一种划分方式。简单来讲,如果是理想一些的情况,数据挖掘是不需要做报表之类的工作的,然后会做更多线上工程化的工作。

数据分析:

初级:报表、提数、周报月报

中级:描述现象类数据分析报告

高级:解释现象类、预测类数据分析报告

再高一些:上限很高

数据挖掘:

初级:数据分析报告 or 线上数据流的开发

中级:线上算法工程化

高级:感觉方向稍微有点广,有的是深度学习领域做的很深,有的是广告或者推荐方向做的很深。

0xFF 附一组统计数据对比

上面的内容从道与术上分析了数据分析与数据挖掘的区别,现在我们通过近日北京地区两个岗位的招聘信息统计做一个验证。

数据来源:国内知名互联网招聘网站,分别搜索北京地区“数据分析”、“数据挖掘”所得的招聘信息结果,得到数据分析与数据挖掘招聘信息各400+条。

岗位名称

1

搜索“数据分析“相关岗位,绝大部分都是叫做“数据分析师”,38.16%直接叫做数据分析师,20%左右的“高级数据分析师”(或“资深数据分析师”、“数据分析专家“),其余还有大数据分析师、BI数据工程师、金融数据分析师等头衔。

而搜索“数据挖掘”相关岗位,绝大部分是”算法工程师“,21.41%直接叫做算法工程师,其余绝大部分也都是各个领域的算法工程师,数量排名靠前的有:4.47%机器学习算法工程师,3.29%NLP算法工程师,2.82%深度学习算法工程师,以及图像、推荐、计算机视觉等类别等。”数据挖掘工程师“头衔只占2.12%

公司规模

2

比较两个岗位所在公司的公司规模,发现两个岗位当前在中型公司中的需求量无明显差异,但在小型和大型公司中的需求有较大的差异。

数据分析岗当前在大公司的招聘需求较大,有42.75%的招聘信息来自2000人以上的大型公司;只有约13%等招聘信息来自于50人以下的小公司。

而数据挖掘相关岗位相反,在招的岗位中,来自于2000人以上大型公司的只有26.12%,而来自50人以下小型公司的却占了33%。

岗位技能要求

3

比较两个岗位的技能要求,可以发现两者所需的能力有比较大的区别:

数据分析相关岗位:业务、SQL、统计学、用户理解、数学、R、沟通、行业、Python、数据处理、增长思维等;

数据挖掘相关岗位:算法、机器学习、推荐、计算机、数学、模型、自然语言、开发、技术、数据挖掘等。

学历要求

4

85.51%的岗位对于数据分析的学历要求是本科,而数据挖掘的相关岗位中,55.04%的岗位要求本科,近40%要求硕士学历。数据挖掘比数据分析的学历要求更高。

不同工作年限的薪资下限

5

最后我们来比较一下两个岗位的薪资水平。为减少招聘信息中可能存在的薪资注水的影响,我们采用薪酬预估的下限进行计算,并用中位数表示各个工作年限月薪的平均水平。

可以看出,随着工作年限的积累,两个岗位的薪资都稳步提升,但数据挖掘相关岗位的薪酬普遍还是高于数据分析。

这个差距在不同年限也有区别,总体上数挖相关岗比数分薪酬高35%左右,但在应届毕业生和3-5年工作经验两个年限上拉开了56%的差距;在要求5-10年工作经验资深员工的岗位上,两岗薪资差距又明显缩小,体现了高端人才的价值。

10年以上工作年限的由于样本中缺乏数挖在这个年限下的招聘数据,暂时无法比较,但从数据分析最后一飞冲天的数据来看,数分岗位的上限真的很高。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据挖掘
    +关注

    关注

    1

    文章

    406

    浏览量

    25123
  • 数据分析
    +关注

    关注

    2

    文章

    1523

    浏览量

    36358

原文标题:数据分析和数据挖掘的区别是什么? (附真实招聘数据对比报告)

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    利用数据API构建实时数据分析与可视化报表系统

    API(涵盖销售统计、用户画像、流量分析等)进行高效的数据整合、分析,并实现 自定义报表生成 和 实时数据可视化 ,为商业决策提供强大支持。 一、
    的头像 发表于 04-02 15:56 166次阅读
    利用<b class='flag-5'>数据</b>API构建实时<b class='flag-5'>数据分析</b>与可视化报表系统

    多项目监测管理平台 在线监测数据分析

    数据分析
    稳控自动化
    发布于 :2026年03月16日 14:37:33

    API数据分析:淘宝流量来源分析,渠道优化!

    优化渠道策略。我们将使用Python作为工具,结合数据分析和统计方法,确保过程真实可靠。 1. 理解淘宝流量来源 淘宝流量主要来自多个渠道,包括: 直接访问 :用户直接输入淘宝网址或从收藏夹访问。 搜索引擎 :如百度或淘宝内搜索,贡献
    的头像 发表于 01-23 13:42 376次阅读
    API<b class='flag-5'>数据分析</b>:淘宝流量来源<b class='flag-5'>分析</b>,渠道优化!

    利用拼多多用户API进行粉丝数据分析,有效提升用户粘性

    ​ 在电商运营中,理解并维系核心用户群体至关重要。拼多多开放平台提供的用户API,特别是与粉丝数据相关的接口,为商家深入分析粉丝行为、精准运营、提升用户粘性提供了强大的数据支持。本文将
    的头像 发表于 12-30 10:38 367次阅读
    利用拼多多用户API进行粉丝<b class='flag-5'>数据分析</b>,有效提升用户粘性

    淘宝数据分析API:用户行为洞察,精准营销决策!

    ​ 在竞争激烈的电商领域,数据已成为驱动增长的核心引擎。淘宝作为国内领先的电商平台,其开放的数据分析API为商家提供了强大的工具,能够深入挖掘用户行为,并基于这些洞察做出更精准、更有效的营销决策
    的头像 发表于 12-25 14:12 407次阅读
    淘宝<b class='flag-5'>数据分析</b>API:用户行为洞察,精准营销决策!

    经营数据分析可以通过哪些方式

    在数聚股份看来,提起经营数据分析,大家往往会联想到一些密密麻麻的数字表格,或是高级的数据建模手法,再或是华丽的数据报表。其实,“ 分析 ”本身是每个人都具备的能力,对于业务决策者而言,
    的头像 发表于 12-05 16:31 731次阅读

    广立微DE-G零断档重构智能数据分析

    近日,数据分析领域被一则消息推上风口浪尖:一家老牌软件巨头将撤出中国。在此背景下,其旗下以灵活著称的数据分析软件,在中国市场的未来将面临极大的不确定性。
    的头像 发表于 11-07 10:39 800次阅读

    【产品介绍】Altair RapidMiner数据分析与人工智能平台

    AltairRapidMiner赋能组织解锁数据洞察,运用数据分析和先进的人工智能自动化,提供可扩展的面向未来的解决方案。Altair数据分析和人工智能平台包括数据准备、
    的头像 发表于 09-18 17:56 1030次阅读
    【产品介绍】Altair RapidMiner<b class='flag-5'>数据分析</b>与人工智能平台

    XKCON祥控输煤皮带智能机器人巡检系统对监测数据进行挖掘分析

    XKCON祥控输煤皮带智能机器人巡检系统通过智能机器人在皮带运行过程中对皮带的运行状态和环境状况进行实时检测,在应用过程中,不但提升了巡视周期频次,还通过大数据分析和深度学习算法,对监测数据进行挖掘
    的头像 发表于 09-15 11:22 769次阅读
    XKCON祥控输煤皮带智能机器人巡检系统对监测<b class='flag-5'>数据</b>进行<b class='flag-5'>挖掘</b><b class='flag-5'>分析</b>

    普迪飞 Exensio®数据分析平台 | Test Operations解锁半导体测试新纪元

    TestOperations是Exensio数据分析平台的四个主要模块之一。T-Ops模块旨在帮助集成器件制造商(IDM)、无晶圆厂半导体公司(Fabless)和外包半导体(产品)封测厂(OSAT
    的头像 发表于 08-19 13:53 1653次阅读
    普迪飞 Exensio®<b class='flag-5'>数据分析</b>平台 | Test Operations解锁半导体测试新纪元

    如何通过数据分析识别设备故障模式?

    通过数据分析识别设备故障模式,本质是从声振温等多维数据中提取故障特征,建立 “数据特征 - 故障类型” 的映射关系,核心可通过特征提取、模式匹配、趋势分析三步实现,精准定位故障根源与发
    的头像 发表于 08-19 11:14 1109次阅读
    如何通过<b class='flag-5'>数据分析</b>识别设备故障模式?

    构建自定义电商数据分析API

      在电商业务中,数据是驱动决策的核心。随着数据量的增长,企业需要实时、灵活的分析工具来监控销售、用户行为和库存等指标。一个自定义电商数据分析API(应用程序接口)可以自动化
    的头像 发表于 07-17 14:44 724次阅读
    构建自定义电商<b class='flag-5'>数据分析</b>API

    AI数据分析仪设计原理图:RapidIO信号接入 平板AI数据分析

    AI数据分析仪, 平板数据分析仪, 数据分析仪, AI边缘计算, 高带宽数据输入
    的头像 发表于 07-17 09:20 865次阅读
    AI<b class='flag-5'>数据分析</b>仪设计原理图:RapidIO信号接入 平板AI<b class='flag-5'>数据分析</b>仪

    如何使用协议分析仪进行数据分析与可视化

    使用协议分析仪进行数据分析与可视化,需结合数据捕获、协议解码、统计分析及可视化工具,将原始数据转化为可解读的图表和报告。以下是详细步骤及关键
    发表于 07-16 14:16

    数据中心和通信网络有什么区别

    的集中化服务。 服务对象:主要面向企业、云服务提供商、政府机构等,支撑其业务系统、应用程序和数据分析需求。 典型应用:云计算、大数据分析、人工智能训练、企业IT系统托管等。 通信网络 核心功能:实现不同设备、系统或用
    的头像 发表于 06-12 09:57 1135次阅读
    <b class='flag-5'>数据</b>中心和通信网络有什么<b class='flag-5'>区别</b>