0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

申请数据科学家职位的经验分享

zhKF_jqr_AI 来源:未知 作者:李倩 2018-11-10 09:24 次阅读

编者按:SharpestMinds联合创始人Jeremie Harris分享了申请数据科学家职位的经验。

我仍然记得我兄弟决定卖出他的比特币的时刻。那是2017年,当时我们在星巴克。我们碰到了一个发传单的中年妇女。传单开头用黑体印着“比特币:通向提前退休的道路”。

当时我挺好奇的,就问了她对加密货币市场的看法,结果发现她对比特币以外的其他加密货币几乎一无所知。以太坊?“从来没听说过。”莱特币?“那是廉价版的比特币,是吧?”

从经验上说,如果毫无头绪的中年妇女都在当地的星巴克向你宣传最新的技术趋势,你大概正接近不实宣传的高峰,或者“泡沫”。

当然这算不上什么新发现。每个人都同意,投资的时候如果你做的和其他所有人都一样,那你不太可能得到多少回报。很奇怪的一点是,人们没能在投资自身上应用同一推理。

假设你想要应聘数据科学家职位。如果你做的全是标准的“我想要成为一位数据科学家”事情,那么这就意味着你不应该期望得到梦想的工作。目前市场已经充斥了初级水平的人员,因此,处于中位数水平的新手数据科学家不太可能得到太多认同。所以,你如果想要避免中位数的结果,为什么要做中位数的事?

问题在于,大多数人开始他们的数据科学之旅时不是这么想的。我在SharpestMinds工作的时候和数百名新手数据科学家聊过,其中大约80%的人告诉我的都差不多:

首先,他们学一些基础(Python + sklearn + Pandas,也许还学点别的,比如SQL)

接着,他们参加了千篇一律的MOOC课程

他们读了一些工作描述,担心不符合条件

也许去参加另一门MOOC,也许开始申请工作

没有收到任何回音(或者,最好的情况下,参加了一些面试,全搞砸了)

变得很沮丧,考虑是不是去读个硕士,或者再申请一些工作

到了抉择的时刻了:该不该重复第2-7步直到发生了不同的事情?

如果这符合你的情况,那么很可能你也处在一个自我提升的泡沫中:你正在做所有其他人都在做的事,但期望得到不同的结果。你需要做一件事:停下来。

如果你期望超出平均水平的结果,那么你不能做平均水平的事情。但是,想要避免平均水平的事,你需要知道什么是平均水平的事。

这里是一些例子:如果你需要参加一个MOOC课程学习一些基础,那很好。但不要陷入MOOC螺旋:MOOC,从定义上来说,基本上都是为平均水平的人设计的。所以你并不会因为上了多门MOOC就成为一个突出的人。类似地,如果你的GitHub上有4到5个Jupyter notebook,内容都是乏味的sklearn/Pandas/seaborn/Keras技术栈,不要再做一个新的了。

总的规则是:如果有一件事看起来是明显的下一步,因为所有其他人都这么做,这是一件很好的不去做的事。相反,你需要找到其他人不做的事,并且尽快去做。

那是些什么样的事情?根据我的经历,我想到5件:

复现论文。如果你是深度学习爱好者,这一点尤其重要。人们不做这事,因为这比获取一个数据集,然后使用简单的人工神经网络或XGBoost进行千篇一律的分类要难。在arXiv上找一篇和你的领域相关的最有趣的论文(最近的论文最理想),阅读它,理解它。接着,复现它,可能是在一个新的数据集上复现。写篇博客总结这次复现。

不要呆在舒适区。如果你开始一个新项目,最好学习一些新框架/库/工具。如果你正创建第6个Jupyter notebook,开头是df = pd.read_csv(filename),结尾是f1 = f1_score(y_true, y_pred),是时候改变你的策略了。

学习枯燥的东西。其他人不做这事,因为没人喜欢枯燥的东西。但是,学习正确的Git流程,如何使用Docker,如何使用Flask搭建一个应用,如何部署模型至AWS或Google Cloud,这些都是公司很盼望申请人具备的技能,但大多数申请人低估了这些技能的重要性。

做头疼的事情。1) 争取在当地的数据科学聚会上讲篇论文。或者,最起码,参加当地的数据科学聚会。2) 给LinkedIn上的人发冷消息。试着首先提供一些价值(“我刚发现了你网站上的一个笔误”)。不要直接向他们请求一份工作。你的请求越具体越好(“我希望你能给我的博客文章一点反馈”)。你正试图建立关系,拓展你的网络,那需要耐心。3) 参加会议和组织。4) 创办一个学习小组。

做看起来疯狂的事情。每个人都用UCI仓库,或者使用某个股票数据集(没劲)来创建他们的项目。别这么做。学习如何使用一个网页抓取库,或者某个被低估的API创建自己的定制数据集。数据很难获取,公司常常需要依靠工程师收集数据。你的目标是成为那种痴迷数据科学的疯子,如果工作需要,会自己创建该死的数据集。

这些策略都是一种在雇主每天面对的噪声中突出自己的方法。它们都不是银弹,但它们是在数据科学工作市场上得到更多认同,成为更能干的数据科学家的万无一失的方法。

最后,记住,培养自己的技能是对自身的投资。那意味着适用于投资的经济学原则同样适用于此:如果你想要突出的结果,那么你需要做突出的事情。

如果你对如何优化自己的机器学习或数据科学轨迹存有疑问,我很乐意和你聊聊。在Twitter上给我(jeremiecharris)发DM :)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 深度学习
    +关注

    关注

    73

    文章

    5232

    浏览量

    119889
  • 数据科学
    +关注

    关注

    0

    文章

    163

    浏览量

    9981

原文标题:想当数据科学家,可别随大流!

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA首席科学家Bill Dally:深度学习硬件趋势

    Bill Dally于2009年1月加入NVIDIA担任首席科学家,此前在斯坦福大学任职12年,担任计算机科学系主任。Dally及其斯坦福团队开发了系统架构、网络架构、信号传输、路由和同步技术,在今天的大多数大型并行计算机中都可以找到。
    的头像 发表于 02-25 16:16 348次阅读
    NVIDIA首席<b class='flag-5'>科学家</b>Bill Dally:深度学习硬件趋势

    康奈尔大学科学家研制出5分钟快速充电锂电池

    锂离子电池如今广泛应用于电动汽车及智能手机领域。其优点包括轻巧、抗震、环保,但充电时间较长及承受大功率电涌的能力不足。随着最新研究成果发布,科学家找到了一种独特的铟阳极材料,与锂离子电池内的阴极材料实现良好配合。
    的头像 发表于 01-26 09:57 285次阅读
    康奈尔大学<b class='flag-5'>科学家</b>研制出5分钟快速充电锂电池

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 196次阅读

    飞腾首席科学家窦强荣获 “国家卓越工程师” 称号

         飞腾首席科学家窦强荣获 “国家卓越工程师” 称号 1月19日上午,首届 “国家工程师奖” 表彰大会在北京人民大会堂隆重举行。81 名个人被授予 “国家卓越工程师” 称号,50 个团队被授予
    的头像 发表于 01-19 19:22 1073次阅读
    飞腾首席<b class='flag-5'>科学家</b>窦强荣获 “国家卓越工程师” 称号

    Open AI首席科学家:ChatGPT可能已经有了意识,AI将万世不朽

    我是来和OpenAI的联合创始人兼首席科学家Sutskever会面的,他的公司位于旧金山传教区一条不起眼的街道上,办公楼没有任何标志,我想听听他一手打造的这项颠覆世界的技术的下一步计划。我还想知道他的下一步计划,尤其是,为什么建立他公司的下一代旗舰生成模型不再是他的工作重点。
    的头像 发表于 11-02 15:58 462次阅读

    科学家制造出迄今为止分辨率最高的超透镜

    一个由中国和英国科学家组成的团队制造了迄今为止分辨率最高的光学成像透镜。 19世纪以来,医生们一直认为,光学显微镜存在一个分辨率极限,超出这个极限就无法清楚地看到物体。当物体小于200纳米,比如
    的头像 发表于 09-01 06:28 424次阅读

    NVIDIA 首席科学家 Bill Dally 将在 Hot Chips 大会发表主题演讲

    这位著名计算机科学家将分享来自 NVIDIA Research 最新研究成果,这些研究正在推动加速计算和 AI 的进步。 Bill Dally 是全球最知名的计算机科学家之一,也是 NVIDIA
    的头像 发表于 08-22 19:20 383次阅读

    华为辟谣3.2万名科学家移籍

    华为辟谣3.2万名科学家移籍 对于近期网络传言的华为3.2万名科学家移籍华为方面表示,造谣者毫无根据、无中生有。 华为辟谣3.2万名科学家移籍以及其他的一些网络传言,比如“华为孟晚舟宣布23万亿
    的头像 发表于 08-22 16:51 994次阅读
    华为辟谣3.2万名<b class='flag-5'>科学家</b>移籍

    科学家呼吁开展气候合作

    三位研究人员介绍了建立地球数字孪生的计划,该计划旨在帮助人们了解全球变暖的影响并做出应对。 三位顶尖科学家正在帮助带领计算史上最雄心勃勃的项目之一:打造地球的 数字孪生 。 Peter Bauer
    的头像 发表于 07-06 20:10 288次阅读
    <b class='flag-5'>科学家</b>呼吁开展气候合作

    踏歌智行创始人、首席科学家余贵珍教授登榜“2023科创家”

    “一群跨越了科学与商业边界的人”这是科创媒体36氪对科创企业家的定义。近日, 踏歌智行创始人、首席科学家余贵珍教授从全赛道中脱颖而出, 登榜首届“2023科创家”榜单。此次共有15位教授荣登榜单
    的头像 发表于 06-16 19:15 2336次阅读
    踏歌智行创始人、首席<b class='flag-5'>科学家</b>余贵珍教授登榜“2023科创家”

    “第二十一届中国科学家论坛”圆满落幕,科兰(Clan)斩获两项荣誉大奖

    2023年4月27日,第二十一届中国科学家论坛暨第六届中国企业首席科学家论坛在首都北京圆满落下帷幕。各领域专家学者及科技界、企业界、媒体界领域代表通过为期两天的深入交流、行业研讨和成果分享,再掀行业
    的头像 发表于 05-05 10:09 357次阅读

    聚众之谋 如此“科兰” 如此精彩——科兰通讯参加第二十一届中国科学家论坛

    “汇奇智、展品牌、促发展”。4月27日,科兰通讯技术(北京)有限公司受邀出席第二十一届中国科学家论坛,Clan销售副总蒋燕作为重量级嘉宾和现代通讯行业的优秀企业代表围绕“后疫情时代科技赋能,与产业
    的头像 发表于 05-04 11:31 1247次阅读
    聚众之谋 如此“科兰” 如此精彩——科兰通讯参加第二十一届中国<b class='flag-5'>科学家</b>论坛

    科学向新,共创未来--科兰通讯受邀参加第二十一届中国科学家论坛

    万物复苏、芳芽吐蕊,最美人间四月天。值此美好时节,第二十一届中国科学家论坛如约而至,将和我国各领域顶尖专家学者、高新企业倾情相约。 该论坛创办于2002年,是由著名科学家、时任全国人大常委会副委员长
    的头像 发表于 05-04 11:11 288次阅读

    科学家用银线团搭建「纳米线网络」,触电就像大脑一样运作

    这也是如今不少AI科学家们梦寐以求的特性。最近,来自悉尼大学和日本国家材料科学研究所的科学家们在自然通讯上发表论文,试着通过使用纳米线网络(NWN)来模拟人类大脑在受到电激时的反应,实验效果还不错。
    的头像 发表于 05-04 09:30 426次阅读
    <b class='flag-5'>科学家</b>用银线团搭建「纳米线网络」,触电就像大脑一样运作

    获双项荣誉:中科智云受邀出席第二十一届中国科学家论坛

    上海2023年5月1日 /美通社/ -- 第二十一届中国科学家论坛于2023年4月27-28日在北京正式召开。本届论坛以"中国式现代化与科学技术体系化创新"为主题,来自全国各地的科学家、院士、教授
    的头像 发表于 05-02 21:38 482次阅读