0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据科学整个行业的真实现状

DPVg_AI_era 来源:lq 2019-09-01 07:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

开发者自述没有被聘为数据科学家,所以钻研出当前数据科学整个行业的真实现状。他发现实际上高学历非常重要,而计算机、工程学、数学和统计都是非常主流的学科。他认为与其专注于数据科学家所需要的技能,不如专注于实际上能做什么。Kaggle大师有用,但没那么有用。

你知道数据科学家这个行业,最热的话题是什么吗?如何快速的赚到热钱。

你可能刚刚听说数据科学家这个职业,或者已经从事该行业多年。每当提及“数据科学”这个词的时候,可能总会有一份荣耀在心里面。毕竟这是一个听起来就很高科技的职业,自我介绍的时候会有人投来羡慕的目光。

但数据科学家的竞争正在变得越来越激烈,而数据科学家心中的那份情怀似乎也在逐渐的淡化。取而代之的是焦虑在不断的滋长,而我们却无能为力。

一方面,越来越多的人想入行数据科学家,希望获取名声和利益;另一方面,企业在数据科学家这个岗位上开始有些摇摆,很多公司甚至错误的将数据标注等工作当做是数据科学家。

上述情况,并没有随着人工智能的发展而有所改善。最近。一位名叫Hanif Samad的新加坡的统计学家、软件工程师、数据科学家在找工作的时候有些碰壁,让他开始对数据科学整个行业的现状进行反思。

他发现,在数据科学家最集中的平台Towards Data Science上,有关数据科学最热的文章是《数据科学家如何跟股东相处》,其他的像《如何成为一名数据工程师》、《批量梯度下降与随机梯度下降》、《多类文本分类》、《加速R-CNN》这类特别细分的技巧类文章非常热门。

因为Samad只有一段短暂的数据科学经历,在实际面试的过程中他才意识到,平时看到那些教导你如何成为数据科学家的成功学文章,以及那些技巧类文章,毫无用武之地。空有一身屠龙技,却面临无龙可屠的局面,典型的Daniel Kahneman口中“可用性启发式的受害者”。

所以Samad开始钻研一个问题:那些真正在从事数据科学的人,到底在做什么?到底数据科学这个行业,真正的现状是什么?

作为一名统计学家和数据科学家,Samad通过爬取LinkedIn上的数据,对目前的数据科学行业进行了一次摸底。在分析了近1000个数据科学家档案后,结果还真让他发现了一些很少有人提及的内幕。

发现1:研究生学位是标配

73%目前就业的数据科学家拥有研究生学位。其中硕士学位较多占44%;剩下博士学位29%,学士学位占到了21%。除了全日制大学毕业外,也有部分数据科学家拥有的是MOOC学位或培训班的函授学位,共占总数的6%。

计算机科学与工程、以及业务分析是主流

计算机科学,数学和统计学以及工程学科三位一体的共同概念构成了数据科学事业的基石,这在一定程度上得到了数据的证实。

目前看来,就学科而论,计算机科学胜过所有其他学科,拥有绝对的主导地位,占所有研究学科的14%。

但如果把工程学统一看做是一个类别的话,因为其包括了化学,电气和电子学,以及所谓的知识工程等不同学科,这些学科加起来,累计占学科总数的22%。

平时我们都以为,数据科学需要很强的数学和统计学的功底。但实际上,把数学和统计学所有学科包括应用数学,数学物理学,统计学和应用概率都算上,也只占研究学科的12%左右。

但最让人惊讶的其实是业务分析和其他分析学科,总体占了15%,比数学和统计学都高!

其他排名靠前的领域包括物理学(3.5%)和信息技术(2.2%)。

招聘数据科学家倾向于有一定经验

虽然很多应届毕业生确实也在竞争数据科学家的岗位,然而样本中数据科学家填写的工作经验大多是4-6年。

大多数数据科学家的岗位都是新设置的

76%的数据科学家入行不足两年,而其中42%工作经验不足一年。这表明虽然大多数数据科学的职位空缺都是相对较新的,但是填补空缺的人已经在就业市场上待了一段时间。

一半的数据科学家角色来自非技术公司

虽然资金充足,成熟的技术公司(如谷歌或亚马逊)倾向于成为数据科学家聘用的理想场所,但值得注意的是,该样本中近一半(49%)的数据科学家来自非技术公司:金融和保险(11%),咨询(9%),政府(5%),制造业(5%)和学术界(2.4%)的公司和机构。

在技术类别中,具有良好代表性的行业包括运输(8%),企业(8%,包括IBM,SAP和Microsoft),电子商务(5%) 和财务(5%)。

有一大类技术公司作者将其标记为AI&ML(6.5%),包括DataRobot等公司,以及Amaris.AI等新产品。

结论

以上,有没有打破你之前对数据科学家这个行业的印象呢?我们可以看到,数据科学家对学位的要求较高,学科方面则是计算机科学,工程,数学或分析专业更吃香。最好是已经有4-6年工作经验的雇员。

值得注意的是,虽然我们看到有6%的人来自MOOC和培训机构等非传统认证的机构,但显然拥有研究生学位才是最保险的。

数据科学正在快速发展,许多最重要的算法和技术将不被传统的学术课程所涵盖。所以除了学位,你还需要一些职业技能之外的能力。

最后,不要被焦虑蒙蔽了双眼。你可能并不需要学习那么多的数据科学技巧,但你应该好好想想,你做这件事情的目的是什么?想要得到的是什么?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1819

    文章

    50290

    浏览量

    266826
  • 亚马逊
    +关注

    关注

    8

    文章

    2735

    浏览量

    85880
  • 数据科学
    +关注

    关注

    0

    文章

    168

    浏览量

    10826

原文标题:面试碰壁却让我看清数据科学行业现状

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ASPICE 的能力等级划分&行业普及现状(三)

    。 ASPICE 的行业普及现状 (一)版本迭代:4.0 已全面替代 3.1,成为行业主流 ASPICE 4.0 版本于 2023 年 12 月正式发布,经过 2024 年的过渡期与评估师体系培训升级,自
    发表于 04-07 10:28

    从手工到自动:焊球剪切测试的技术演进与科学原理

    精度大幅提升:更高的定位精度和测量精度,满足日益精细化的测试需求 当前,先进的焊球剪切测试仪已具备半自动操作能力,通过与计算机连接实现数据的深度分析和报告生成,为工艺优化提供了可靠的数据支持。在
    发表于 12-31 09:12

    攻击逃逸测试:深度验证网络安全设备的真实防护能力

    的测试,能够发现设备在特定协议实现、异常流量处理、边界条件判断等方面存在的脆弱点。 量化评估体系建立:通过识别率、误报/漏报率、性能损耗等关键指标,为设备优化提供数据支撑。这些指标不仅反映了设备的当
    发表于 11-17 16:17

    电源行业用胶方案:破解行业核心痛点,实现精密防护与长效运行

    在电源设备可靠性研究中,防护材料的失效已成为影响产品生命周期的重要因子。行业数据显示,在高温、高湿、强振动工况下,超过60%的电源故障与防护材料性能不足直接相关。电源作为电子系统的核心动力来源,其用
    的头像 发表于 11-13 16:03 858次阅读
    电源<b class='flag-5'>行业</b>用胶方案:破解<b class='flag-5'>行业</b>核心痛点,<b class='flag-5'>实现</b>精密防护与长效运行

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保护科学

    使用便宜的开源计算模块实时检测海洋哺乳动物,以实现主动管理解决方案。 []() (浮标照片和视频版权归于 Cetaware ) 公司规模 :1-10名员工 公司行业: 环境科学与服务 网址
    发表于 10-27 09:18

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    灵感的过程中发挥关键作用。五、用AI实现诺贝尔奖级别的科学发现 这想法这能够大胆的。 1、AI科学家的构建 全自主科学实验室需要哪些部分: ①自动实验设备 ②流程管理系统 ③
    发表于 09-17 11:45

    2025嵌入式行业现状如何?

    2025嵌入式行业现状如何? 一、市场规模与增长趋势1.1 全球市场概况总体规模:2025年全球嵌入式系统市场规模预计突破1.2万亿美元,相当于每天诞生3个“光谷”级产业集群。 驱动因素:物联网
    发表于 08-25 11:34

    通过 BOD 或 nReset 重置时,GPIO 是否处于高实现状态?

    正如标题所说,我正在使用 ML51 来控制外部 MOS 组件,GPIO 类型在复位条件下非常重要。GPIO 是否处于高实现状态?
    发表于 08-25 07:04

    铝电解电容的行业发展现状与未来趋势展望

    、智能化转型的关键阶段。本文将结合最新行业动态与技术突破,系统梳理铝电解电容的发展现状,并对其未来趋势进行前瞻性分析。 ### 一、行业发展现状:高端化转型与竞争格局重塑 1. **市
    的头像 发表于 08-07 16:18 2452次阅读

    中科曙光亮相第十届科学数据大会

    近日,第十届(2025)科学数据大会开幕,集中展示中国科学院自动化所、高能物理研究所、国家天文台等依托曙光AI解决方案形成的技术、科研、行业应用创新成果,助力多学科智能化提速。
    的头像 发表于 08-06 18:12 2592次阅读

    磁性元件行业专利现状探讨

    及合作模式上面临的现状与亟待解决的挑战。 图片来源:普晶电子 磁性元件行业有哪些供货方式 如果按照磁性元件供应商数量划分,可以分为独家供货、多家供货和主供应商+备选供应商等供货方式。 独家供货(Single Sourcing) 指客户只选择一
    的头像 发表于 07-16 14:01 844次阅读

    物联网仿真实训教学平台:以网关为核,重塑教育新范式

    物联网仿真实训教学平台应运而生,通过虚拟仿真技术构建真实场景,结合网关的核心功能,为教育行业开辟了一条高效、安全、灵活的实践之路。
    的头像 发表于 07-04 09:21 833次阅读

    施耐德电气助力生命科学行业数字化转型

    2025,生命科学行业的数字化转型趋势在何处?企业正面临哪些转型难点?
    的头像 发表于 07-02 09:53 845次阅读

    防雷工程与防雷检测:多行业实践与科学执行指南

    雷电灾害作为全球性自然灾害,其瞬间释放的巨大能量对建筑、设备乃至人员安全构成严重威胁。不同行业因其结构、设备敏感度及运行环境的差异,对防雷接地工程与检测的要求也呈现显著区别,科学、系统的防雷设计
    的头像 发表于 06-10 16:17 1100次阅读
    防雷工程与防雷检测:多<b class='flag-5'>行业</b>实践与<b class='flag-5'>科学</b>执行指南

    什么是边缘盒子?一文讲透边缘计算设备在不同行业真实应用

    随着工业物联网、AI、5G的发展,数据量呈爆炸式增长。但你有没有想过,我们生成的数据,真的都要发回云端处理吗?其实不一定。特别是在一些对响应时间、网络带宽、数据隐私要求高的行业里,边缘
    的头像 发表于 06-09 14:48 3441次阅读
    什么是边缘盒子?一文讲透边缘计算设备在不同<b class='flag-5'>行业</b>的<b class='flag-5'>真实</b>应用