0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

采访资深数据科学家:成为数据科学家应具有的品质

如意 来源:百家号 作者:读芯术 2020-06-30 11:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为一门逐渐成熟的新兴领域,与数据科学相关的很多领域开始变得备受青睐,比如数据工程,数据分析以及机器学习深度学习。数据科学家们必须带着具有科学性、创造性和研究性的思维,从各路数据集中提取有用信息,以解决客户面临的潜在挑战。

生活会不断衍生出数据,涉及零售、交通、金融和医疗健康领域。触手可及的各类计算产品和人工智能的飞速发展将一群通过获取、分析和利用原始数据的数据科学家们推到了聚光灯下。

2016年,数据科学家们选出了在北美洲最受欢迎的50种工作,这份榜单是参考收入潜力、工作满意度以及在Glassdoor招聘网站上的需求量等各项指标得出的结果。

所以成为一名数据科学家应具备哪些品质呢?

为了搞清楚这个问题,我采访了Ben Chu,他是路孚特实验室的一名资深数据科学家。Chu有人工智能领域的背景,擅长处理语言、语义和图表,并且在新加坡的路孚特实验室有着两年的工作经验。

1.保持好奇

Chu在访谈的一开始就提到,数据科学家应该像调查员一样思考。你要时刻保持好奇,永远都想知道“为什么?”“就好像自己是一个侦探,通过这些数据拼凑细节以寻找新的线索。”

在金融界,数据科学家们从一系列数据集中提取信息,以供客户参考并帮助制定决策。数据科学家们会把目光锁定在客户想要解决的问题上面,然后从他们获得的数据中抽丝剥茧,得出线索。

通过和Chu的交谈,我领悟到了抓重点的重要性,调查背景也是很重要的。如果不能解决潜在问题,即使是再完美的分析也无助于此。有时候你需要转回来,尝试新的方法,重新思考问题。核心在于要保持好奇,爱上提问。

2.有创造力

数据科学并不仅仅指一种科学的方法,这个称号其实会误导大家。你不一定要有科研背景,但必须有创新性思维——另一种思维是解决问题的关键。

“我经常在两种思维之间来回切换,是通过科学性思维还是创造性思维来探索更多的新的不同的解决方式。有逻辑的、科学的思考对于结论产出的帮助是必不可少的,但具备创造性思维也同样重要:我也将成功和失败的案例视为观察新模式的线索。”

3.学习如何编码

你需要扎实的编码技能,才能预处理不同的数据源,并且能够使用各种数据处理技术,来解决棘手或不完整的数据。你得能够创建一个机器学习管道,这要求你知道如何构建模型,如何使用工具和框架来评估和分析其性能。

与大多数数据科学家一样,Chu使用Python,因为里面有许多很赞的包可用于操作和建模数据。事实上,GalasWalk在2017的上半年为数据科学家提供了10000份招聘信息,发现Python、R和SQL这三种特殊技能是数据科学中大多数职位空缺的根本原因。

Ben Chu的团队依赖于开源的机器学习软件包,如Tensorflow、Pytorch和BERT。

“我们主要将Confluence用作文档工具;MLFlow、Amazon Sagemaker、Scikit Learn、Tensorflow、PyTorch和BERT用于机器学习;Apache Spark用于在大型数据集上构建快速数据管道;Athena用作处理后数据的存储数据库。我们还使用Superset连接数据,轻松构建仪表板以输出图表,使其更直观。”

4.科学思考

数据科学家们会运用不同的工具来管理流程、数据、进行注释和编码。“我必须十分努力,时刻衡量并追踪自己的进度,这样才有机会开展复盘工作,尝试新的方向,不断比对结果。”

“重要的是要时刻秉持科学的原则,在分析时参考相应的数据,实验和文献,以便随时调整结论。我需要把这些资料整理好,所以我会用Notion作为初步保存所有笔记、论文和可视化的基本工具。

Chu强调,不仅要保留目前的调查记录,还要保留以前所有调查结果的记录。“这就像是一本数据科学日志。每当遇到类似的情况时,我都会把值得参考的要点保存好,下次再遇到问题时可以有指导。”

5.担心“冒名顶替综合征”,大可不必

Chu现在是路孚特实验室的资深数据科学家,但他年少时曾想成为一名音乐家,并且对语言特别着迷。“对于我在自然语言处理领域的工作,这需要我对语言学有较深的了解,特别是语义学和语言的细微差别。”

他解释说,一个数据科学团队需要一系列技能——他和他的同事拥有从不同背景发展而来的重叠技能。

“你需要的技能将取决于工作领域。比如我需要对金融领域有很好的了解,数据分析目前应用于防诈骗领域,通过建立异常检测方法来检测交易数据中不符合规范的欺诈‘行为’”。

“像我这样的数据科学家需要懂得如何处理各种孤立的金融数据。关键是要建立各种数据之间的联系,如果不知道它们之间的联系的话,就无法建立一个成功的模式。”

做一名计算机科学家或数学家并不是进入数据科学领域的必要条件。没有人精通所有领域。你可能有法律、经济或科学背景。这些背景决定了你的思考方式。如果能灵活运用各种知识并将其系统化,那么在使用工具、框架和数据集时,就能够熟悉这些工具、框架和数据集的细节。

如何开始

对于那些热衷于数据科学技能的人,Chu提供了一些实用的技巧,这些技巧很容易学会。你可以寻找研究社区,参加网络研讨会,并在网上寻找找到培训课程。一旦可以进行当面交流,Chu建议你在数据科学领域活跃起来。

“参加会议和编程马拉松,这将帮助你研究建立一个强大的网络,让你有机会说出自己的想法,启发研究和回答疑问”。

数据科学是一个全新的领域,而且还在处于不断成熟阶段。随着机器学习和深度学习工程师的出现,数据科学家、数据工程师和数据分析员等各种不同的职位也出现了,也许你会发现自己更适合或者更喜欢另一个职位呢。

一切都在不断变化之中,永葆好奇心和创造力,继续探索吧!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编程
    +关注

    关注

    90

    文章

    3708

    浏览量

    96765
  • 数据分析
    +关注

    关注

    2

    文章

    1507

    浏览量

    35942
  • 数据科学
    +关注

    关注

    0

    文章

    168

    浏览量

    10749
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    昊衡科技:第四届飞行器健康管理技术国际高端论坛暨青年科学家论坛圆满落幕

    2025年11月21日,第四届飞行器健康管理技术国际高端论坛暨青年科学家论坛在厦门国际会展酒店(会展二路199号)圆满落下帷幕。深度交流本届论坛上,国产光学测量与传感仪器制造商——武汉昊衡科技,展示
    的头像 发表于 11-21 17:59 192次阅读
    昊衡科技:第四届飞行器健康管理技术国际高端论坛暨青年<b class='flag-5'>科学家</b>论坛圆满落幕

    技术感知世界!昊衡科技在第四届飞行器健康管理技术国际高端论坛暨青年科学家论坛等您!

    今日是第四届飞行器健康管理技术国际高端论坛暨青年科学家论坛在厦门国际会展酒店(会展二路199号)的会议日,现场学术氛围持续高涨。武汉昊衡科技作为国产先进光学测量与传感测量仪器制造商,此次携两款创新
    的头像 发表于 11-20 17:15 1430次阅读
    技术感知世界!昊衡科技在第四届飞行器健康管理技术国际高端论坛暨青年<b class='flag-5'>科学家</b>论坛等您!

    科学家利用微波激光照射钻石,制造出时间准晶体

    科学家利用微波激光照射钻石,制造出时间准晶体。 美国华盛顿大学、麻省理工学院和哈佛大学科学家携手,成功在钻石上“雕刻”出一种全新的物质形态:时间准晶体。这项突破有望为量子计算、精确计时等领域带来
    的头像 发表于 11-19 07:35 49次阅读
    <b class='flag-5'>科学家</b>利用微波激光照射钻石,制造出时间准晶体

    第四届飞行器健康管理技术国际高端论坛暨青年科学家论坛:昊衡科技,欢迎您来!

    大会介绍第四届飞行器健康管理技术国际高端论坛暨青年科学家论坛将于2025年11月19-21日在中国厦门举行。会议由厦门大学和江南大学联合主办,围绕飞行器健康管理与智能运维,以“数字时代、智领运维
    的头像 发表于 11-14 17:36 2804次阅读
    第四届飞行器健康管理技术国际高端论坛暨青年<b class='flag-5'>科学家</b>论坛:昊衡科技,欢迎您来!

    国际类脑计算科学家Yulia Sandamirskaya教授加盟时识科技

    近日,国际类脑计算与神经形态机器人领域知名科学家Yulia Sandamirskaya 教授,作为科学家顾问正式加入时识科技(SynSense)。
    的头像 发表于 10-13 13:50 448次阅读

    科技感拉满!鲸启智能机器人与无人机联动,闪耀服务世界青年科学家论坛

    9 月 20 日,以 “青年,世界科学的未来” 为主题的世界青年科学家论坛(南京)在江北新区启幕。20 余位诺贝尔奖得主、海内外院士,超百位国际国内青年科学家及产业代表齐聚,围绕前沿科技展
    的头像 发表于 10-11 16:54 127次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范式了,与实验
    发表于 09-17 11:45

    复星医药使用亚马逊云科技生成式AI技术赋能医疗撰写场景 助力科学家效率跃升

    进程。通过“临床试验报告一致性检查”和“研发文献翻译”两大功能,复星医药可解放科学家生产力,使其专注于创新药研发的核心工作。在亚马逊云科技的加持下,“临床试验报告一致性检查”可覆盖研究人员90%的撰写场景,工作效率提升70%;而在“研发文
    发表于 07-14 14:16 1051次阅读

    地物光谱仪如何帮助科学家研究植被和土壤?

    在遥感、生态、农业等研究领域,科学家们常常会提到一个工具: 地物光谱仪 。它看起来像一台“测光的枪”,却能揭示土壤和植被的“隐藏信息”。那么,地物光谱仪到底是怎么工作的?它又是如何在科学研究中
    的头像 发表于 05-20 15:46 408次阅读
    地物光谱仪如何帮助<b class='flag-5'>科学家</b>研究植被和土壤?

    云天励飞董事长陈宁当选深圳市青年科学家协会第十届会长

      2025年3月29日,深圳市青年科学家协会十届一次会员大会在深圳市青少年活动中心南厅隆重举行。百余位青年才俊齐聚一堂,共同见证协会换届选举,共话科技创新未来。共青团深圳市委员会书记胡火明出席了
    的头像 发表于 03-31 19:15 1110次阅读
    云天励飞董事长陈宁当选深圳市青年<b class='flag-5'>科学家</b>协会第十届会长

    我国科学家制备出可控手性石墨烯卷

    日前,我国科学家开发了一种名为“石蜡辅助浸入法”的新技术,成功让二维材料“卷起来”,制备出具有可控手性的石墨烯卷,为未来量子计算和自旋电子器件的发展奠定了坚实基础。 由天津大学教授胡文平、雷圣宾、李
    的头像 发表于 02-26 11:17 753次阅读

    NVIDIA RAPIDS cuDF如何赋能AI加速数据科学

    随着 AI 正帮助各行各业推动创新和提高效率,基于海量的高质量数据来训练各种模型是充分发挥 AI 应用潜力的必经之路,正因如此,数据科学家们面临着日益增长的工作负载需求,迫切需求寻找高效趁手的工具以应对挑战。
    的头像 发表于 01-24 09:26 1051次阅读

    深开鸿亮相“小小科学家”品牌发布暨科学探索研学营开营活动

    为在青少年中营造学科学、爱科学、用科学的浓厚氛围,1月14日,由市委组织部、市委教育工委、团市委共同主办的“小小科学家”品牌发布暨科学探索研
    的头像 发表于 01-15 21:17 834次阅读
    深开鸿亮相“小小<b class='flag-5'>科学家</b>”品牌发布暨<b class='flag-5'>科学</b>探索研学营开营活动

    AI 推动未来科学 晶泰科技共襄未来科学大奖周

    科学家,探讨学科交叉与学术创新,倾力打造兼具权威性、专业性和国际影响力的科学盛会。 未来科学大奖由未来论坛于 2016 年创设,被誉为"中国诺贝尔奖"。未来论坛是当前中国极具声望的民间科学
    的头像 发表于 12-18 09:58 649次阅读
    AI 推动未来<b class='flag-5'>科学</b> 晶泰科技共襄未来<b class='flag-5'>科学</b>大奖周

    西湖大学:科学家+AI,科研新范式的样本

    研究,创新科研新范式。这一点在西湖大学的科研项目中已得到体现。 成立于2018年的西湖大学是由施一公院士领衔创办的、聚焦前沿科学研究的研究型大学,该校鼓励科学家们探索AI与各学科交叉融合,为科研创新提速。为此,西湖大学在浪潮信息等企业助力下打造
    的头像 发表于 12-12 15:59 850次阅读
    西湖大学:<b class='flag-5'>科学家</b>+AI,科研新范式的样本