0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

想要从事数据科学,5种类型项目需要掌握

电子工程师 来源:网络整理 作者:工程师飞燕 2018-07-01 10:05 次阅读

一年一度的秋招已经打响了发令枪,从去年的薪酬排行来看,算法工程师和数据分析等工作排在前列,很多相关专业的学生一直在自学一些网络上的公开课并阅读一些专业书籍,比如“西瓜书”、“花书”等,如果你现在仍然什么也没有准备的话,然而还想从事数据科学领域这个似乎令人望而生畏的工作话,现在就要抓紧补补相关的知识了。在这里要提示一点,自我完善的知识不要局限于数据分析相关的知识,还要额外补充下相关领域的知识。另外,简历上展示个人技能的最佳方式是使用技能组合的形式,这样能让雇主相信你可以使用你已经学习的技能。为了展示这些技能,以下是你应该着重补充的5种数据科学项目组合类型:

1.数据清理

数据科学家预计在一个新项目的清理数据处理上花费多达80%的时间,这对于团队来说是一个巨大的代价。如果你可以证明你在数据清理方面经验丰富,那么你将立即变得更有价值。练习这项能力的方法是创建一个数据清理项目,找到一些混乱的数据集并开始进行清理。

如果你使用Python语言进行编程,那么Pandas是一个很好用的库,如果你使用R语言编程,那么你可以使用dplyr数据包。你实践的数据清洗项目应该确保展示以下技能:

导入数据

加入多个数据集

检测缺失值

检测异常

输入缺失的值

数据质量保证

2.探索性数据分析

数据科学的另一个重要方面是探索性数据分析(EDA),这是一个生成问题并用可视化方法对其进行调查的过程。 EDA允许分析人员从数据中得出结论来推动业务影响,它可能包括基于客户细分的有趣洞察,或基于季节效应的销售趋势。通常你可以通过探索性数据分析来得到一些有趣的发现。

用于探索性分析的一些有用的Python库有Pandas和Matplotlib。对于R用户而言,ggplot2软件包将会很有用。你实践的EDA项目应该显示以下技能:

能够制定相关的调查问题

识别趋势

识别变量之间的协变

使用可视化有效地传达结果(散点图,直方图,饼图等)

3.交互式数据可视化

交互式数据可视化包括诸如仪表板之类的工具,这些工具对于数据科学团队以及更多面向业务的最终用户都是很有用的。仪表盘允许数据科学团队进行协作并共同绘制见解。更重要的是,它们为面向商业的客户提供了交互式工具,这些人专注于战略目标而不是技术细节。数据科学项目的交付成果往往以仪表板的形式出现。

对于Python用户而言,Bokeh和Plotly库是非常适合用来创建仪表板的。而对于R用户,可以使用RStudio的Shiny软件包。你实践的仪表板项目应该强调这些重要技能:

包括与客户需求相关的指标

创建有用的功能逻辑布局(易于扫描的“F模式”)

创建最佳刷新率

生成报告或其他自动操作

4.机器学习

机器学习项目是数据科学产品组合的另一个重要组成部分。现在,在开始进行一些深度学习项目之前,请保持耐心。不要一开始就构建复杂的机器学习模型,而要坚持从基础知识开始学起。线性回归和逻辑回归是很好的开始,这些模型更容易解释并能清晰地与上层管理人员沟通。此外,我还建议专注于具有业务影响的项目,例如预测客户流失,欺诈检测或贷款违约等,这些比预测花型更实用。

想要从事数据科学,5种类型项目需要掌握

如果你是Python用户,请使用Scikit-Learn学习库。而对于R用户,请使用Caret软件包。你实践的机器学习项目应该传达以下技能:

选择使用某个具体机器学习模型的原因

将数据分成训练/测试集(k-fold交叉验证)以避免过度拟合

选择正确的评估指标(AUC、adj-R ^ 2、混淆矩阵等)

特征工程和选择

超参数调整

5.沟通

沟通是数据科学的一个重要方面,对于工科人员而言这点尤其欠缺。能够有效地传达结果是区分优秀的数据科学家与伟大的数据科学家的重要衡量标准之一。无论你的模型多么华丽,如果你不能向队友或顾客解释它,你都不会得到他们的支持,就如同对牛弹琴一般。幻灯片和Notebook都是很好的沟通工具,可以将你的机器学习项目按照项目过程以PPT的形式展示,也可以使用Jupyter Notebook或RMarkdown文件进行沟通。

想要从事数据科学,5种类型项目需要掌握

确保了解你的目标受众是谁,向高管呈现的内容与向机器学习专家呈现的内容二者是完全不同的。确保具备这些技能:

了解目标受众

提供相关的可视化

幻灯片不要写太多的内容

确保演示文稿流畅

将结果与业务影响联系起来(降低成本,增加收入)

确保在Jupyter笔记本或RMarkdown文件中记录自己的项目。然后,也可以使用Github 免费将这些Markdown文件转换为静态网站。这是向潜在雇主展示个人技能组合的好方法,即GitHub主页或CSDN博客等。

最后,在求职的道路上请保持积极的态度,作为应届生,不要被一次次面试、笔试所扰乱心态,请保持继续补充知识、练习项目并参加一些竞赛等。不要慌张,秋招过去,还有春招,春招过去还有社招,只要你一直努力提升自己,相信最终会有好的结果等着你,希望你能够快乐求职,并且在数据科学领域工作顺心。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6509

    浏览量

    87557
  • 机器学习
    +关注

    关注

    66

    文章

    8095

    浏览量

    130519
  • 数据分析
    +关注

    关注

    2

    文章

    1349

    浏览量

    33729
收藏 人收藏

    评论

    相关推荐

    从事技术销售,需要用什么来武装自己?

    本人通信工程大三苦逼屌丝一枚,不想把青春在放在读书上,想要从事工作。目前将自己的路线定在技术销售这一方向,想要在剩下的两年时间里好好的学习学习将来能找个好工作。目前学完了c,51单片机。所以现在
    发表于 11-03 12:22

    想要从事单片机行业!

    本人应届生,即将开始就业···个人非常喜欢单片机,想要从事单片机软硬件设计的工作,不怕远离家乡,只要有机会自己就会努力的。因地处偏远,所以只能网上向内地投简历了,希望能有机会实现自己的工程师梦!
    发表于 10-19 23:47

    AD布线,哪种类型的走线需要地线隔离

    AD布线,哪种类型的走线需要地线隔离
    发表于 12-19 10:56

    5月份Github上最热门的数据科学和机器学习项目榜单概述

    5月份Github上最热门的数据科学和机器学习项目
    发表于 07-29 06:57

    怎么判断模拟技术的3种类型放大器?

    我们在学习和生活中都会用到许多三极管放大电路,但是也许好多人都傻傻分不清放大器的类型,比如笔者就是这样的人,怎么判断模拟技术的3种类型放大器?这个问题曾经一直困扰着笔者。 
    发表于 08-08 07:49

    种类型的功率MOSFET概述

    范围对应着三不同驱动电压类型的功率MOSFET,下面就来认识这三种类型的功率MOSFET。1、功率MOSFET驱动电压类型1.1 通用驱动的功率MOSFET功率MOSFET的栅极氧化
    发表于 08-08 21:40

    掌握数据类型

    掌握数据类型
    发表于 11-24 16:41

    Windows -编程-数据类型

    驱动开发外包请记住,Rust 是一静态类型语言,这意味着它必须在编译时知道所有变量的类型。编译器通常可以根据值以及我们如何使用它来推断我们想要使用的
    发表于 08-24 14:30

    种类型的轴承数据

    参见相关说明,或者参见其他帖子。然后下载其中某一个类别的某一个故障数据文件后,文件类型是.mat格式,可以使用MATLAB打开,打开后发现里面又区分了三种类型数据,如上图,这里不太清
    发表于 09-08 06:32

    WEBRTC有哪几种类型

    WEBRTC三种类型(Mesh、MCU 和 SFU)的多方通信架构WebRTC 本身提供的是 1 对 1 的通信模型,在 STUN/TURN 的辅助下,如果能实现 NAT 穿越,那么两个浏览器是可以
    发表于 11-01 06:34

    想要从事嵌入式开发需要掌握哪些技能呢?

    嵌入式开发可以说是当下有前途的IT应用领域,小到电子词典、手机,大到航空航天设备都是典型的嵌入式系统,因此,通过嵌入式技术人才的职业发展空间是非常大的。新手怎么学习嵌入式开发,想要从事嵌入式开发需要
    发表于 11-08 09:18

    编译的三种类型是什么?

    编译的三种类型是什么?ARM_Linux制作嵌入式远程调试工具
    发表于 12-24 06:42

    嵌入式软件工程师需要掌握哪些专业技能?

    嵌入式软件工程师做什么?需要掌握哪些专业技能?嵌入式软件工程师在企业中主要从事嵌入式软件开发工作,工作中会涉及应用层以及底层软件开发和设计工作。嵌入式软件工程师需要精通嵌入式Linux
    发表于 12-24 08:19

    WEBRTC有哪几种类型

    WEBRTC三种类型(Mesh、MCU 和 SFU)的多方通信架构WebRTC 本身提供的是 1 对 1 的通信模型,在 STUN/TURN 的辅助下,如果能实现 NAT 穿越,那么两个浏览器是可以
    发表于 02-14 06:36

    人工智能需要哪些知识

    人工智能需要哪些知识 随着人工智能的发展和普及,越来越多的人开始关注这一领域。但是,想要从事人工智能相关的工作,不仅需要具备一定的技术水平,还需要
    的头像 发表于 08-12 17:27 608次阅读