0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

采访资深数据科学家:成为数据科学家应具有的品质

如意 来源:百家号 作者:读芯术 2020-06-30 11:28 次阅读

作为一门逐渐成熟的新兴领域,与数据科学相关的很多领域开始变得备受青睐,比如数据工程,数据分析以及机器学习深度学习。数据科学家们必须带着具有科学性、创造性和研究性的思维,从各路数据集中提取有用信息,以解决客户面临的潜在挑战。

生活会不断衍生出数据,涉及零售、交通、金融和医疗健康领域。触手可及的各类计算产品人工智能的飞速发展将一群通过获取、分析和利用原始数据的数据科学家们推到了聚光灯下。

2016年,数据科学家们选出了在北美洲最受欢迎的50种工作,这份榜单是参考收入潜力、工作满意度以及在Glassdoor招聘网站上的需求量等各项指标得出的结果。

所以成为一名数据科学家应具备哪些品质呢?

为了搞清楚这个问题,我采访了Ben Chu,他是路孚特实验室的一名资深数据科学家。Chu有人工智能领域的背景,擅长处理语言、语义和图表,并且在新加坡的路孚特实验室有着两年的工作经验。

1.保持好奇

Chu在访谈的一开始就提到,数据科学家应该像调查员一样思考。你要时刻保持好奇,永远都想知道“为什么?”“就好像自己是一个侦探,通过这些数据拼凑细节以寻找新的线索。”

在金融界,数据科学家们从一系列数据集中提取信息,以供客户参考并帮助制定决策。数据科学家们会把目光锁定在客户想要解决的问题上面,然后从他们获得的数据中抽丝剥茧,得出线索。

通过和Chu的交谈,我领悟到了抓重点的重要性,调查背景也是很重要的。如果不能解决潜在问题,即使是再完美的分析也无助于此。有时候你需要转回来,尝试新的方法,重新思考问题。核心在于要保持好奇,爱上提问。

2.有创造力

数据科学并不仅仅指一种科学的方法,这个称号其实会误导大家。你不一定要有科研背景,但必须有创新性思维——另一种思维是解决问题的关键。

“我经常在两种思维之间来回切换,是通过科学性思维还是创造性思维来探索更多的新的不同的解决方式。有逻辑的、科学的思考对于结论产出的帮助是必不可少的,但具备创造性思维也同样重要:我也将成功和失败的案例视为观察新模式的线索。”

3.学习如何编码

你需要扎实的编码技能,才能预处理不同的数据源,并且能够使用各种数据处理技术,来解决棘手或不完整的数据。你得能够创建一个机器学习管道,这要求你知道如何构建模型,如何使用工具和框架来评估和分析其性能。

与大多数数据科学家一样,Chu使用Python,因为里面有许多很赞的包可用于操作和建模数据。事实上,GalasWalk在2017的上半年为数据科学家提供了10000份招聘信息,发现Python、R和SQL这三种特殊技能是数据科学中大多数职位空缺的根本原因。

Ben Chu的团队依赖于开源的机器学习软件包,如Tensorflow、Pytorch和BERT。

“我们主要将Confluence用作文档工具;MLFlow、Amazon Sagemaker、Scikit Learn、Tensorflow、PyTorch和BERT用于机器学习;Apache Spark用于在大型数据集上构建快速数据管道;Athena用作处理后数据的存储数据库。我们还使用Superset连接数据,轻松构建仪表板以输出图表,使其更直观。”

4.科学思考

数据科学家们会运用不同的工具来管理流程、数据、进行注释和编码。“我必须十分努力,时刻衡量并追踪自己的进度,这样才有机会开展复盘工作,尝试新的方向,不断比对结果。”

“重要的是要时刻秉持科学的原则,在分析时参考相应的数据,实验和文献,以便随时调整结论。我需要把这些资料整理好,所以我会用Notion作为初步保存所有笔记、论文和可视化的基本工具。

Chu强调,不仅要保留目前的调查记录,还要保留以前所有调查结果的记录。“这就像是一本数据科学日志。每当遇到类似的情况时,我都会把值得参考的要点保存好,下次再遇到问题时可以有指导。”

5.担心“冒名顶替综合征”,大可不必

Chu现在是路孚特实验室的资深数据科学家,但他年少时曾想成为一名音乐家,并且对语言特别着迷。“对于我在自然语言处理领域的工作,这需要我对语言学有较深的了解,特别是语义学和语言的细微差别。”

他解释说,一个数据科学团队需要一系列技能——他和他的同事拥有从不同背景发展而来的重叠技能。

“你需要的技能将取决于工作领域。比如我需要对金融领域有很好的了解,数据分析目前应用于防诈骗领域,通过建立异常检测方法来检测交易数据中不符合规范的欺诈‘行为’”。

“像我这样的数据科学家需要懂得如何处理各种孤立的金融数据。关键是要建立各种数据之间的联系,如果不知道它们之间的联系的话,就无法建立一个成功的模式。”

做一名计算机科学家或数学家并不是进入数据科学领域的必要条件。没有人精通所有领域。你可能有法律、经济或科学背景。这些背景决定了你的思考方式。如果能灵活运用各种知识并将其系统化,那么在使用工具、框架和数据集时,就能够熟悉这些工具、框架和数据集的细节。

如何开始

对于那些热衷于数据科学技能的人,Chu提供了一些实用的技巧,这些技巧很容易学会。你可以寻找研究社区,参加网络研讨会,并在网上寻找找到培训课程。一旦可以进行当面交流,Chu建议你在数据科学领域活跃起来。

“参加会议和编程马拉松,这将帮助你研究建立一个强大的网络,让你有机会说出自己的想法,启发研究和回答疑问”。

数据科学是一个全新的领域,而且还在处于不断成熟阶段。随着机器学习和深度学习工程师的出现,数据科学家、数据工程师和数据分析员等各种不同的职位也出现了,也许你会发现自己更适合或者更喜欢另一个职位呢。

一切都在不断变化之中,永葆好奇心和创造力,继续探索吧!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编程
    +关注

    关注

    88

    文章

    3438

    浏览量

    92321
  • 数据分析
    +关注

    关注

    2

    文章

    1349

    浏览量

    33728
  • 数据科学
    +关注

    关注

    0

    文章

    163

    浏览量

    9979
收藏 人收藏

    评论

    相关推荐

    NVIDIA首席科学家Bill Dally:深度学习硬件趋势

    Bill Dally于2009年1月加入NVIDIA担任首席科学家,此前在斯坦福大学任职12年,担任计算机科学系主任。Dally及其斯坦福团队开发了系统架构、网络架构、信号传输、路由和同步技术,在今天的大多数大型并行计算机中都可以找到。
    的头像 发表于 02-25 16:16 342次阅读
    NVIDIA首席<b class='flag-5'>科学家</b>Bill Dally:深度学习硬件趋势

    康奈尔大学科学家研制出5分钟快速充电锂电池

    锂离子电池如今广泛应用于电动汽车及智能手机领域。其优点包括轻巧、抗震、环保,但充电时间较长及承受大功率电涌的能力不足。随着最新研究成果发布,科学家找到了一种独特的铟阳极材料,与锂离子电池内的阴极材料实现良好配合。
    的头像 发表于 01-26 09:57 279次阅读
    康奈尔大学<b class='flag-5'>科学家</b>研制出5分钟快速充电锂电池

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 189次阅读

    飞腾首席科学家窦强荣获 “国家卓越工程师” 称号

         飞腾首席科学家窦强荣获 “国家卓越工程师” 称号 1月19日上午,首届 “国家工程师奖” 表彰大会在北京人民大会堂隆重举行。81 名个人被授予 “国家卓越工程师” 称号,50 个团队被授予
    的头像 发表于 01-19 19:22 1067次阅读
    飞腾首席<b class='flag-5'>科学家</b>窦强荣获 “国家卓越工程师” 称号

    Open AI首席科学家:ChatGPT可能已经有了意识,AI将万世不朽

    我是来和OpenAI的联合创始人兼首席科学家Sutskever会面的,他的公司位于旧金山传教区一条不起眼的街道上,办公楼没有任何标志,我想听听他一手打造的这项颠覆世界的技术的下一步计划。我还想知道他的下一步计划,尤其是,为什么建立他公司的下一代旗舰生成模型不再是他的工作重点。
    的头像 发表于 11-02 15:58 454次阅读

    科学家制造出迄今为止分辨率最高的超透镜

    一个由中国和英国科学家组成的团队制造了迄今为止分辨率最高的光学成像透镜。 19世纪以来,医生们一直认为,光学显微镜存在一个分辨率极限,超出这个极限就无法清楚地看到物体。当物体小于200纳米,比如
    的头像 发表于 09-01 06:28 418次阅读

    NVIDIA 首席科学家 Bill Dally 将在 Hot Chips 大会发表主题演讲

    这位著名计算机科学家将分享来自 NVIDIA Research 最新研究成果,这些研究正在推动加速计算和 AI 的进步。 Bill Dally 是全球最知名的计算机科学家之一,也是 NVIDIA
    的头像 发表于 08-22 19:20 377次阅读

    华为辟谣3.2万名科学家移籍

    华为辟谣3.2万名科学家移籍 对于近期网络传言的华为3.2万名科学家移籍华为方面表示,造谣者毫无根据、无中生有。 华为辟谣3.2万名科学家移籍以及其他的一些网络传言,比如“华为孟晚舟宣布23万亿
    的头像 发表于 08-22 16:51 991次阅读
    华为辟谣3.2万名<b class='flag-5'>科学家</b>移籍

    科学家呼吁开展气候合作

    三位研究人员介绍了建立地球数字孪生的计划,该计划旨在帮助人们了解全球变暖的影响并做出应对。 三位顶尖科学家正在帮助带领计算史上最雄心勃勃的项目之一:打造地球的 数字孪生 。 Peter Bauer
    的头像 发表于 07-06 20:10 286次阅读
    <b class='flag-5'>科学家</b>呼吁开展气候合作

    踏歌智行创始人、首席科学家余贵珍教授登榜“2023科创家”

    “一群跨越了科学与商业边界的人”这是科创媒体36氪对科创企业家的定义。近日, 踏歌智行创始人、首席科学家余贵珍教授从全赛道中脱颖而出, 登榜首届“2023科创家”榜单。此次共有15位教授荣登榜单
    的头像 发表于 06-16 19:15 2246次阅读
    踏歌智行创始人、首席<b class='flag-5'>科学家</b>余贵珍教授登榜“2023科创家”

    “第二十一届中国科学家论坛”圆满落幕,科兰(Clan)斩获两项荣誉大奖

    2023年4月27日,第二十一届中国科学家论坛暨第六届中国企业首席科学家论坛在首都北京圆满落下帷幕。各领域专家学者及科技界、企业界、媒体界领域代表通过为期两天的深入交流、行业研讨和成果分享,再掀行业
    的头像 发表于 05-05 10:09 357次阅读

    聚众之谋 如此“科兰” 如此精彩——科兰通讯参加第二十一届中国科学家论坛

    协同高质量发展”的发展主题在首都北京与众院士及各领域资深专家学者进行广泛交流。 中国科学家论坛主席,中国管理科学研究院商学院院长陈贵,第十二届全国政协副主席马培华致欢迎辞。论坛中,国家有关领导人、相关部委领导、
    的头像 发表于 05-04 11:31 1240次阅读
    聚众之谋 如此“科兰” 如此精彩——科兰通讯参加第二十一届中国<b class='flag-5'>科学家</b>论坛

    科学向新,共创未来--科兰通讯受邀参加第二十一届中国科学家论坛

    万物复苏、芳芽吐蕊,最美人间四月天。值此美好时节,第二十一届中国科学家论坛如约而至,将和我国各领域顶尖专家学者、高新企业倾情相约。 该论坛创办于2002年,是由著名科学家、时任全国人大常委会副委员长
    的头像 发表于 05-04 11:11 287次阅读

    科学家用银线团搭建「纳米线网络」,触电就像大脑一样运作

    这也是如今不少AI科学家们梦寐以求的特性。最近,来自悉尼大学和日本国家材料科学研究所的科学家们在自然通讯上发表论文,试着通过使用纳米线网络(NWN)来模拟人类大脑在受到电激时的反应,实验效果还不错。
    的头像 发表于 05-04 09:30 415次阅读
    <b class='flag-5'>科学家</b>用银线团搭建「纳米线网络」,触电就像大脑一样运作

    获双项荣誉:中科智云受邀出席第二十一届中国科学家论坛

    上海2023年5月1日 /美通社/ -- 第二十一届中国科学家论坛于2023年4月27-28日在北京正式召开。本届论坛以"中国式现代化与科学技术体系化创新"为主题,来自全国各地的科学家、院士、教授
    的头像 发表于 05-02 21:38 479次阅读