0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2019年,你还想做数据科学家吗?

DPVg_AI_era 来源:lq 2019-02-24 10:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能的火爆带动了对数据科学家的大量需求。看到急缺的岗位和高薪,谁能不动心呢?可是你确定想好要成为一名数据科学家了吗?你知道成为一名DS,需要具备什么技能吗?那就请准备好,下面我们要开车了!

你可能已经从媒体铺天盖地的报道中,了解到数据科学家这个抬头非常火。

根据UiPath数据显示,2018年12113个岗位争夺AI人才,数据科学家需求量排名第二。

于是很多人萌生了入行、或者转行做数据科学家的念头。那么接着就带来一个问题:如何成为一名数据科学家呢?

接下来,由《Getting Started with SQL》(O’Reilly)和《Learning RxJava》(Packt) 二书的作者、美国西南航空的企业顾问Thomas Nield,献上这份《2019年数据科学家成长指南》。

废话不多说,马上进入战斗。

Round 1:不考证完全没问题。当然考了也可以

不要把工作后宝贵的时间,浪费在考证上。「数据科学」不过是「商业分析」的一个分支,而且通常学校的知识总是和当前的科技前沿脱节。如果真的想学建议去Coursera或者可汗学院自学。

当然,证书多了终归是好事嘛。如果你非要去学校考证,建议考物理或者运筹学的研究生。我了解到很多一流的数据科学家,基本都是这俩专业毕业的。

花个几年时间研究生毕业后,明天就会更好?反正有个数据科学初创公司的创始人说:

博士学历不重要;硕士学历无可无不可;学士毕业必须有,因为用人单位最低要求就是大学毕业。

https://towardsdatascience.com/do-you-need-a-graduate-degree-for-data-science-8e3d0ef39253

Round 2:成为一个数据科学家真的需要了解这么多领域吗?

这是一张6年前的图,里面甚至连TensorFlow都没有。

而且我觉得,数据科学发展到现在,已经非常碎片化和细分化了。根本没必要搞的这么复杂。

Round 3:我应该学哪门语言呢?需要从Linux入手吗?

数据科学家是一个跨平台物种,操作系统不重要。

语言的话,Scala早就过气了,R解决数学问题非常爽,Python才是万能的。一条Python在手,数据科学跟我走。

不过需要了解一些库,类似Pandas用来处理数据帧,matplotlib用来创建图表。

Round 4:学会Python很关键!学不会也没关系

Python学起来超简单。不过,你可能也不用非得学会Python。

作为人类,要善用工具。数据科学不止眼前的脚本和机器学习,还有远方的数据可视化。这个时候显然Tableau更好用,也更美观。

Tableau

不过涉及到数据清洗、管理、转换、加载等,就需要用到Alteryx了,鼠标拖拽就能搞定。

新智元点评:所以买个Tableau就可以称为数据科学家了?

从淘宝买个激活码岂不是要变成二手科学家?

Round 5:明明靠Excel和PPT就能搞定,为什么非要学Python呢?

首先,能为你的简历增加光环。

其次,之前也说过,Python简直万能。通过Jupyter notebook逐步完成每个数据分析阶段,让每一步都可视化,就像你正在创建一个可以与他人分享的故事。

划重点:毕竟,沟通和讲故事才是数据科学的重要组成部分。

数据科学和软件工程很大程度可以划等号。不同之处在于,数据科学必须有数据,软件工程就不一定了。

Wiki网页是一个非常好的数据来源,抓取网页并使用Beautiful Soup解析他们,就得到了大量非结构化文本数据。

Round 6:懂NoSQL行,不懂也没事

非机构化数据才能激发我们的想象力,结构化数据只能固化我们的逻辑能力。

如今像谷歌Facebook这样的大厂,拥有大量的非机构化数据,他们就像裁判一样,「数据科学」的定义权掌握在他们手里。剩下我们这些运动员,只好用无聊的SQL咯。

利用非结构化数据,大厂可以通过挖掘用户内容、邮件、故事,用于广告或者其他途径。

而我们也可以利用非结构化数据,对社交媒体上的帖子进行,做一些NLP应用比如聊天机器人

NoSQL更擅长存储这类数据。但是对于数据科学家来说,NoSQL也不是必须要掌握的,除非做数据工程师。而且现在Apache Kafka比NoSQL更火,所以你也知道该学什么了。

有的人可能不知道,数据科学家分为两种角色。数据工程师使用生产系统并帮助使数据和模型可用;而数据科学家则负责机器学习以及数学建模。

这个时候,利用朴素贝叶斯算法,就可以去预测文本的分类。我打算建议从具有均值和标准差的正态分布开始。也许用z分数和线性回归计算一些概率或两个。

Round 7:学会线性代数很重要。不会的话……也行吧

传统智慧认为线性代数是许多数据科学的基石,因此掌握线性代数很重要。将矩阵相乘和相加(称为点积),将一直伴随着你。

听起来很无聊对吧,但这就是机器学习在做的事情。当你进行线性回归或构建自己的神经网络时,你将使用随机权重值进行大量矩阵乘法和缩放。

不过实际上,你可能也不需要学习线性代数,因为有像TensorFlow和 scikit-learn这样的框架和库,帮你解决掉最枯燥乏味的线代部分。

呃,实际上,也别用TensorFlow,用Keras。

Round 8:棒。总之都能用Excel实现,所以会用Excel就可以被称为数据科学家了?

机器学习通常在做两个任务:回归,或者分类。但技术上来说,分类就是回归。

决策树、神经网络、支持向量机、逻辑回归、线性回归都执行某种形式的曲线拟合。

所以,我们也可以不负责任的说:机器学习只是回归。神经网络实际上只是具有一些非线性函数的多层回归。图像识别也是回归。

Round 9:为什么大家现在不怎么谈论算法了?

因为这些优化问题已经在很长一段时间内得到了令人满意的解决,而且这些方法在很早以前也没太多人讨论。

运筹学已经提供了许多机器学习使用的优化算法。同时也为常见“AI”问题提供了许多解决方案。

AI炒作重新点燃了机器学习及其解决的问题类型:图像识别,自然语言处理,图像生成等。

机器学习,深度学习…今天被炒作的任何东西,通常都不能解决离散优化问题,人们尝试过,但效果非常不理想。

所以有人说深度学习是否已经达到了极限,AI寒冬又双来了。

Round 10:AI玩游戏已经超神,接下来会取代人类工作吗?

首先我们要明确一点。人们已经找到了一些巧妙的回归应用,例如计算围棋和象棋最优移动(离散优化也可以做),或自动驾驶的汽车计算转向的方向。

但是,回归只能将这么多的应用组合起来,完成单一任务。

现在我们好好思考一下,你会担心职业星际争霸选手威胁到你的工作吗?你觉得打星际,和你打Excel之间,有多少重叠的交集呢?

如果你连人类星际选手都不怕,你为什么还怕一个回归呢?AI玩星际再强,它也只会玩星际。

Round 11:一句话解释什么是数据科学家,让你爷爷也能听懂

数据科学的界限正在模糊。它可以是任何东西,也可以什么都不是。成为数据科学家你需要掌握很多东西,但就算没掌握也不会致命。

天哪❗️

不过幸好,这个世界上还是有人能说明白到底什么是数据科学和数据科学家的。一句话解释数据科学家:

数据科学家是比软件工程师更懂统计、比统计学家更懂软件工程的一个人。

Round 12:已疯

所以,2019年,你还想做数据科学家吗?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    88

    文章

    11628

    浏览量

    218015
  • 人工智能
    +关注

    关注

    1813

    文章

    49752

    浏览量

    261630
  • 数据科学
    +关注

    关注

    0

    文章

    168

    浏览量

    10751

原文标题:数据科学家成长指南:从入门到被逼疯

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中兴通讯崔丽受邀出席2025腾冲科学家论坛

    近日,“2025腾冲科学家论坛”在云南启幕。本届论坛以“科学·AI改变世界”为主题,汇聚包括诺贝尔奖、图灵奖、菲尔兹奖得主在内的国际顶尖科学家,以及百余位两院院士、高校校长、科技精英与产业领袖,共话
    的头像 发表于 12-09 11:36 245次阅读

    昊衡科技:第四届飞行器健康管理技术国际高端论坛暨青年科学家论坛圆满落幕

    202511月21日,第四届飞行器健康管理技术国际高端论坛暨青年科学家论坛在厦门国际会展酒店(会展二路199号)圆满落下帷幕。深度交流本届论坛上,国产光学测量与传感仪器制造商——武汉昊衡科技,展示
    的头像 发表于 11-21 17:59 199次阅读
    昊衡科技:第四届飞行器健康管理技术国际高端论坛暨青年<b class='flag-5'>科学家</b>论坛圆满落幕

    科学家利用微波激光照射钻石,制造出时间准晶体

    科学家利用微波激光照射钻石,制造出时间准晶体。 美国华盛顿大学、麻省理工学院和哈佛大学科学家携手,成功在钻石上“雕刻”出一种全新的物质形态:时间准晶体。这项突破有望为量子计算、精确计时等领域带来
    的头像 发表于 11-19 07:35 59次阅读
    <b class='flag-5'>科学家</b>利用微波激光照射钻石,制造出时间准晶体

    第四届飞行器健康管理技术国际高端论坛暨青年科学家论坛:昊衡科技,欢迎您来!

    大会介绍第四届飞行器健康管理技术国际高端论坛暨青年科学家论坛将于202511月19-21日在中国厦门举行。会议由厦门大学和江南大学联合主办,围绕飞行器健康管理与智能运维,以“数字时代、智领运维
    的头像 发表于 11-14 17:36 2807次阅读
    第四届飞行器健康管理技术国际高端论坛暨青年<b class='flag-5'>科学家</b>论坛:昊衡科技,欢迎您来!

    国际类脑计算科学家Yulia Sandamirskaya教授加盟时识科技

    近日,国际类脑计算与神经形态机器人领域知名科学家Yulia Sandamirskaya 教授,作为科学家顾问正式加入时识科技(SynSense)。
    的头像 发表于 10-13 13:50 456次阅读

    科技感拉满!鲸启智能机器人与无人机联动,闪耀服务世界青年科学家论坛

    9 月 20 日,以 “青年,世界科学的未来” 为主题的世界青年科学家论坛(南京)在江北新区启幕。20 余位诺贝尔奖得主、海内外院士,超百位国际国内青年科学家及产业代表齐聚,围绕前沿科技展
    的头像 发表于 10-11 16:54 129次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范式了,与实验
    发表于 09-17 11:45

    复星医药使用亚马逊云科技生成式AI技术赋能医疗撰写场景 助力科学家效率跃升

    进程。通过“临床试验报告一致性检查”和“研发文献翻译”两大功能,复星医药可解放科学家生产力,使其专注于创新药研发的核心工作。在亚马逊云科技的加持下,“临床试验报告一致性检查”可覆盖研究人员90%的撰写场景,工作效率提升70%;而在“研发文
    发表于 07-14 14:16 1051次阅读

    地物光谱仪如何帮助科学家研究植被和土壤?

    在遥感、生态、农业等研究领域,科学家们常常会提到一个工具: 地物光谱仪 。它看起来像一台“测光的枪”,却能揭示土壤和植被的“隐藏信息”。那么,地物光谱仪到底是怎么工作的?它又是如何在科学研究中
    的头像 发表于 05-20 15:46 409次阅读
    地物光谱仪如何帮助<b class='flag-5'>科学家</b>研究植被和土壤?

    云天励飞董事长陈宁当选深圳市青年科学家协会第十届会长

      20253月29日,深圳市青年科学家协会十届一次会员大会在深圳市青少年活动中心南厅隆重举行。百余位青年才俊齐聚一堂,共同见证协会换届选举,共话科技创新未来。共青团深圳市委员会书记胡火明出席了
    的头像 发表于 03-31 19:15 1112次阅读
    云天励飞董事长陈宁当选深圳市青年<b class='flag-5'>科学家</b>协会第十届会长

    我国科学家制备出可控手性石墨烯卷

    日前,我国科学家开发了一种名为“石蜡辅助浸入法”的新技术,成功让二维材料“卷起来”,制备出具有可控手性的石墨烯卷,为未来量子计算和自旋电子器件的发展奠定了坚实基础。 由天津大学教授胡文平、雷圣宾、李
    的头像 发表于 02-26 11:17 755次阅读

    NVIDIA RAPIDS cuDF如何赋能AI加速数据科学

    随着 AI 正帮助各行各业推动创新和提高效率,基于海量的高质量数据来训练各种模型是充分发挥 AI 应用潜力的必经之路,正因如此,数据科学家们面临着日益增长的工作负载需求,迫切需求寻找高效趁手的工具以应对挑战。
    的头像 发表于 01-24 09:26 1056次阅读

    深开鸿亮相“小小科学家”品牌发布暨科学探索研学营开营活动

    为在青少年中营造学科学、爱科学、用科学的浓厚氛围,1月14日,由市委组织部、市委教育工委、团市委共同主办的“小小科学家”品牌发布暨科学探索研
    的头像 发表于 01-15 21:17 840次阅读
    深开鸿亮相“小小<b class='flag-5'>科学家</b>”品牌发布暨<b class='flag-5'>科学</b>探索研学营开营活动

    AI 推动未来科学 晶泰科技共襄未来科学大奖周

    科学家,探讨学科交叉与学术创新,倾力打造兼具权威性、专业性和国际影响力的科学盛会。 未来科学大奖由未来论坛于 2016 创设,被誉为"中国诺贝尔奖"。未来论坛是当前中国极具声望的民
    的头像 发表于 12-18 09:58 651次阅读
    AI 推动未来<b class='flag-5'>科学</b> 晶泰科技共襄未来<b class='flag-5'>科学</b>大奖周

    西湖大学:科学家+AI,科研新范式的样本

    研究,创新科研新范式。这一点在西湖大学的科研项目中已得到体现。 成立于2018的西湖大学是由施一公院士领衔创办的、聚焦前沿科学研究的研究型大学,该校鼓励科学家们探索AI与各学科交叉融合,为科研创新提速。为此,西湖大学在浪潮信息
    的头像 发表于 12-12 15:59 852次阅读
    西湖大学:<b class='flag-5'>科学家</b>+AI,科研新范式的样本