0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌大脑高级研究科学家:机器学习六年读博经历中的经验与教训

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2021-01-18 17:31 次阅读

机器学习读博是什么体验?期间遇到的挫折与挑战又要如何应对? 在ML领域小有名气的青年科学家Maithra Raghu总结了自己在六年读博经历中所汲取的经验与教训,希望能够对正在/将要攻读机器学习博士学位的学生有所帮助。 Maithra Raghu于2020年从康奈尔大学毕业,获得CS博士学位。在Maithra读博的六年里,机器学习领域的研究参与人员越来越多(2014年NeurIPS的投稿者大约是两千人,2020年已达到两万人),而Maithra本人也在机器学习领域取得了重大进步。 Maithra曾在2019年当选“福布斯30位30岁以下科学精英排行榜”,2018年被评为“MIT EECS Rising Stars”,主要研究领域为深度学习与医疗的结合。目前,Maithra Raghu在谷歌大脑担任高级研究科学家。 个人主页:https://maithraraghu.com/

1

读博前的期望

对于许多选择读博(尤其是本科毕业后直接读博)的人来说,博士生涯并不能被称得上愉快,但Maithra认为,博士学习就像一段“旅行”。一般来说,完成ML博士学习需要5到6年,在这个学习过程中,你不仅可以学习到ML领域的研究技巧与知识,还可以根据自己的兴趣决定你所想要研究的问题,探索ML不同子领域的魅力,更能接收到学术界/产业界/政策/非营利组织的不同研究成果等。

不断变化的个人喜好将影响你在读博期间决定从事的研究工作,甚至影响你之后所选择的博士后职业道路。不过,尤其是在博士学习刚开始时,个人研究兴趣如何演变是很难预测的。就Maithra个人而言,在刚开始读博时,她认为自己是要进入工业界的,读博期间又考虑从事学术研究,读博后期却又坚决地拒绝了学术界的offer,决定留在工业界做研究。因此,她认为,读博可以一步一步来,最重要的是充分利用读博期间的学习/研究/社交经验,而不是实现某项预期目标。目标也许会变,但没必要纠结,免得给自己带来不必要的压力。


2

读博期间的普遍挑战

攻读博士学位(尤其是ML博士)能够为个人带来巨大的收获,使你有机会为基础科学理解与重大的技术应用做出贡献。但是,读博所需的时长,以及读博期间的各种不确定性,使读博充满挑战。Maithra的读博生涯也是坎坷不断,常常感到孤独、受挫,或因为急于求成而把自己压垮。这些现象在读博群体中十分常见。作为过来人,Maithra分享了自己的一些经验与策略:

研究陷入僵局时读博时的一个普遍挑战是:某个项目或研究过程受阻,陷入僵局,无法继续进行下去。 如果你很努力地推进某个项目,但没有取得任何进展,那么你可以尝试:

资料整理:搜集所有实验结果、数学方法、随手记录研究动机的笔记等等,并花点时间将这些信息汇集起来,尝试写一篇文章。这个过程可以帮助你了解目前研究所处的位置,以及当下研究状态与研究目标的差距在哪里。

中心点:如果是项目的某个部分无法正常运作,那么是否可以重新确定研究问题(也许是从相关工作中汲取灵感),以使研究更容易进行呢?

建立联系:当前项目所关注的领域与其他研究领域之间是否存在联系?可以在这个研究项目中探索这种联系吗?这既可以帮助推进研究,也可以使项目与其他领域产生更广泛的联系。

获得论文反馈:从研究同行、合作者和朋友那里获得关于项目论文的反馈也可能会有所帮助。他们也许能够提供新的观点或改进建议。

参加Workshop:把论文提交到Workshop也有用。这个方法也能帮助整合所有研究结果,并获得有用的反馈。(Maithra提到,她从机器学习会议上的workshop中获得了许多收益,因为她可以讨论/获取有关当前方向的反馈,并见到同一领域的其他研究人员。)

及时止损:有时候,一个项目在刚开始时前景很好,但很难正常运行,项目本身对重新建立框架,或与其他领域建立联系都具有挑战性。在这张情况下,最好的方法也许是迅速中止项目,转到其他研究。如果之前的项目已经取得部分成果,可以针对这些成果撰文并进行分享,取得合作者的同意与最终反馈,将论文发表为arXiv预引文或Workshop论文。

如果你不是被某个特定的项目困扰,而是对研究过程感到不知所措,那么可能是因为你觉得研究成熟度,尤其是自己的研究水平,很难衡量。在读博中途,Maithra开始从事医疗应用的研究,但在了解这个领域与撰写论文上的进展都很慢。为此,她感到很迷茫、沮丧。后来,她重新读了一遍她在博士初始阶段所完成的文章,发现她对论文结果的深度与背景的了解与之前的情况截然不同。

衡量研究成熟度的几个关键指标,如了解研究结果背后更广泛的背景,在不同领域之间建立联系,迅速定位你所研究的子领域的重要成果等等,并无法迅速转化为有形的产出(如形成更多论文)。但是,这些指标对成为具有丰富研究视野的独立研究人员至关重要,这也是博士生涯的主要研究目标。而且,如果你一直阅读论文,了解你的研究领域并亲自决定你的研究方向,包括教学/指导学生等,那么你是很有可能在这些方面取得重要进步的。

与时俱进感到费力时

机器学习是一个充满活力、节奏快的领域,很容易被大量新论文、新预印论文、新博客文章、新实现、新框架等等淹没。 如何掌握机器学习领域的最新动态呢?Maithra的策略如下:

1、掌握能够快速查找相关论文的参考链接:比如订阅arXiv上的stat.ML cs.LG邮件列表,arXiv-sanity,推特,或者是reddit / MachineLearning,paperswithcode和 Semantic Scholar/ Google Scholar等。

2、做一个论文阅读清单:列出你所发现的有趣的、但暂时没有时间阅读的论文,等有时间再回去阅读。

3、制定一个论文阅读策略:如果一篇论文与你正在积极研究的方向非常接近,那就详细阅读;如果相关度不大,那就读一下摘要,截取几张重要的照片。

4、偶尔读一下其他领域的论文(可能一年一次),看看其他领域正在研究的内容。 还有两个比较有帮助的点是记住:(1)每个人都会对论文发表的概率感到着急;(2)许多论文也许都是基于一个相同的基本思想,只要掌握这一个思想,就能跟上整个领域的发展。

感到孤独时读博期间的另一个共同挑战是与孤独作斗争。Maithra谈到,在攻读博士学位的前几年,有些项目要求她将精力集中在非常狭窄的某些问题上,这些问题也非常耗费精力,并且看起来似乎永远也完成不了。在这些时期,你会感到与其他研究人员和领域完全割裂。 广泛而言,这种情况在博士早期比较常见,因为那时你正开始学习如何从头到尾进行一个研究项目,但与此同时,你与其他研究人员/领域的联系却很少。与研究领域/社交群体保持联系,可以确保你不会感到被孤立。

你可以:(1)与高年级的学生/博士后建立合作;(2)从导师/实验室/其他同僚等方面获得你所取得的工作进步的反馈;(3)积极参与其他社交圈,无论是参会,指导学生还是组织workshop等。

3

3个有用技能

在讨论了读博期间面临的一些常见挑战以及解决这些挑战的方法后,下文将介绍一些有利于取得研究进展的注意事项。 Maithra发现,在读博期间,个人身上的三个技能非常有用:主动性、专注力和毅力。 与本科学习相比,Maithra发现,读博期间的一个明显不同点是博士生需要采取主动行动。所谓主动,可以是阅读重要的相关论文,对不同方法的可行性进行快速的初步研究,与进行相关研究的同行交谈 ,还可以是参加会议,并成为会议的积极活跃分子。由于博士学位的完成时间不确定,所以论文的生产力在很大程度上是取决于你学习和进行研究的主动性。

此外,Maithra认为,在开始新的研究方向时,专注力非常重要,能够帮助你精读相关工作,提取关键信息,从最初的有限探索中快速学习,并确定项目的主要研究方向。 另一方面,毅力也很重要:一篇论文在提交前、提交后,或者回复同行评审、论文被拒时,通常都需要进行大量的编辑/资料添加。大量的论文编辑工作,尤其是在为二次提交做准备、同时又进行新的研究项目时,你很难有修改与编辑的动力。但同行评审过程的灵活性,又往往意味着论文值得你坚持修改与写作。

4

记录文献阅读和研究思路

Maithra在整个读博期间,一直更新着两个文档。一个是第一年开始更新,另一个是第三年开始更新。 第一个记录了她阅读过的论文,每次Maithra阅读了新论文后,都会将其添加到文档中,并简要写下自己的收获,该文档篇幅已经超过50页。另一个文档则跟踪研究思路,每当她有一个新想法时,都会记下来。Maithra认为,这有助于了解研究方向并突出关键主题。

5

社区的重要性

Maithra花了不少时间才意识到社区的重要性,从根本上说,研究是一项社区活动。做学术研究通常要解决异常困难的问题,研究的进步取决于你和他人的互相学习,这是探索研究方向时要牢记的关键因素。

Maithra认为,我们应该注意以下几个问题:社区关注的研究主题是什么,为什么?存在哪些盲区?有能自然提出的研究课题吗?花时间与社区中的同行讨论这些问题,对于提出符合趋势的研究问题至关重要。 而且,如果确定了该领域的新研究方向,则围绕该方向建立社区通常会很有用。要实现这一点,可以发起协作,发布关键的开放性问题,并组织研讨会。 Maithra分享道,博士生涯刚开始,她就对了解现代深度学习系统所展现的关键经验现象感兴趣。但是,在这个主题上开展工作非常困难。 这个领域正在迅速发展,使任何类型的研究分析都充满了不确定性,并且极大地增加了围绕该主题建立新社区的挑战。 因此,Maithra的第一篇深度学习分析论文十分难产,极大考验了她的毅力。但是在这之后,她感受到的是更加强烈的研究兴趣。 6

发展研究视野

前面提到,在刚开始攻读博士学位时,最好步步为营,专注于经验,而不是特定的目标。但从研究成熟度的角度来看,攻读博士学位其实需要一个特定的目标:成为具有丰富的(清晰的)研究视野的独立研究人员。 在当前的机器学习研究社区中,随着大量论文的涌现,人们很容易感到需要不断发表新论文的压力。 但是,尽管论文写作是一项重要技能,Maithra认为研究成熟度的关键标准,是能够对所在领域有渊博的知识和基于知识之上的深刻观点,这些观点有助于通过研究视野(与主题相关的总体观点)来确定关键的研究问题。拥有广阔、完整的研究视野会极大地激发人们的研究积极性。

那么如何发展研究视野呢?Maithra认为,首先,如果没有几年的研究经验就很难形成完整的研究视野。 在博士的头几年里,Maithra埋头阅读论文和听大牛的演讲,并为无法提出有趣的研究问题而感到沮丧。之后的几年里,她阅读过的论文、从事过的项目、参加过的研讨会大大提高了这方面的能力。当然,这是永无止境的过程。 更具体来说,它始于探索,Maithra的前几个项目为她提供了不同的曝光机会,并帮助她理解了自己感兴趣的主题。

之后,她研究一些自然提出的后续项目,并引发了有关应用程序/部署的一些相关问题。在研究具体项目的过程中,会不断提出新的问题,并持续加深自己对研究主题的理解,同时有可能引出新的研究课题。当然,不要忘记请教导师,导师在你的研究主题上已经有了很广阔的研究视野。 最后,Maithra强调,多年的经验确实产生了复合效应。之后从事研究项目时,提炼论文中的主要观点会更加容易,并能启发下一个研究课题,这些研究方向最终合并形成一个更广阔的视野。

总结

总而言之,攻读博士学位也许是一段非常有意义的经历。不妨将读博视为一段旅程,有起有落,个人研究发现和研究观点在不断演变。希望这篇文章对旅途中跋涉的其他人有所帮助!

原文链接:https://maithraraghu.com/blog/2020/Reflections_on_my_Machine_Learning_PhD_Journey/

责任编辑:xj

原文标题:谷歌大脑高级研究科学家:我的六年机器学习博士生涯总结

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5849

    浏览量

    103246
  • 机器学习
    +关注

    关注

    66

    文章

    8112

    浏览量

    130545
  • 深度学习
    +关注

    关注

    73

    文章

    5235

    浏览量

    119893

原文标题:谷歌大脑高级研究科学家:我的六年机器学习博士生涯总结

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA首席科学家Bill Dally:深度学习硬件趋势

    Bill Dally于2009年1月加入NVIDIA担任首席科学家,此前在斯坦福大学任职12年,担任计算机科学系主任。Dally及其斯坦福团队开发了系统架构、网络架构、信号传输、路由和同步技术,在今天的大多数大型并行计算机中都可以找到。
    的头像 发表于 02-25 16:16 355次阅读
    NVIDIA首席<b class='flag-5'>科学家</b>Bill Dally:深度<b class='flag-5'>学习</b>硬件趋势

    TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成

    独家获悉,谷歌高级科学家、卡内基梅隆大学(CMU)计算机学院兼职教授蒋路,已经加入TikTok。
    的头像 发表于 02-22 13:36 212次阅读
    TikTok引入前<b class='flag-5'>谷歌</b>VideoPoet负责人蒋路,发力AI视频生成

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 197次阅读

    飞腾首席科学家窦强荣获 “国家卓越工程师” 称号

         飞腾首席科学家窦强荣获 “国家卓越工程师” 称号 1月19日上午,首届 “国家工程师奖” 表彰大会在北京人民大会堂隆重举行。81 名个人被授予 “国家卓越工程师” 称号,50 个团队被授予
    的头像 发表于 01-19 19:22 1074次阅读
    飞腾首席<b class='flag-5'>科学家</b>窦强荣获 “国家卓越工程师” 称号

    中国联通研究院副院长、首席科学家唐雄燕一行莅临中科驭数交流合作

    12月7日,中国联通研究院副院长、首席科学家唐雄燕莅临中科驭数参观调研, 中国联通研究院未来研究部总监曹畅、高级专家杨文聪陪同考察, 与中科
    的头像 发表于 12-08 18:40 302次阅读
    中国联通<b class='flag-5'>研究</b>院副院长、首席<b class='flag-5'>科学家</b>唐雄燕一行莅临中科驭数交流合作

    马斯克:正在研发视觉芯片 可帮助失明者重见光明

    Neuralink是马斯克于2016年与多名科学家共同成立的脑科学公司,主要研究主体是通过可插入大脑的装置“实现大脑
    的头像 发表于 11-12 15:30 608次阅读

    机器学习的基本流程和十大算法

    为了进行机器学习和数据挖掘任务,数据科学家们提出了各种模型,在众多的数据挖掘模型中,国际权威的学术组织 ICDM(the IEEE International Conference on Data Mining)评选出了十大经典
    发表于 10-31 11:30 632次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>的基本流程和十大算法

    NVIDIA 首席科学家 Bill Dally 将在 Hot Chips 大会发表主题演讲

    这位著名计算机科学家将分享来自 NVIDIA Research 最新研究成果,这些研究正在推动加速计算和 AI 的进步。 Bill Dally 是全球最知名的计算机科学家之一,也是 N
    的头像 发表于 08-22 19:20 384次阅读

    华为辟谣3.2万名科学家移籍

    华为辟谣3.2万名科学家移籍 对于近期网络传言的华为3.2万名科学家移籍华为方面表示,造谣者毫无根据、无中生有。 华为辟谣3.2万名科学家移籍以及其他的一些网络传言,比如“华为孟晚舟宣布23万亿
    的头像 发表于 08-22 16:51 999次阅读
    华为辟谣3.2万名<b class='flag-5'>科学家</b>移籍

    科学家呼吁开展气候合作

    三位研究人员介绍了建立地球数字孪生的计划,该计划旨在帮助人们了解全球变暖的影响并做出应对。 三位顶尖科学家正在帮助带领计算史上最雄心勃勃的项目之一:打造地球的 数字孪生 。 Peter Bauer
    的头像 发表于 07-06 20:10 289次阅读
    <b class='flag-5'>科学家</b>呼吁开展气候合作

    踏歌智行创始人、首席科学家余贵珍教授登榜“2023科创家”

    “一群跨越了科学与商业边界的人”这是科创媒体36氪对科创企业家的定义。近日, 踏歌智行创始人、首席科学家余贵珍教授从全赛道中脱颖而出, 登榜首届“2023科创家”榜单。此次共有15位教授荣登榜单
    的头像 发表于 06-16 19:15 2352次阅读
    踏歌智行创始人、首席<b class='flag-5'>科学家</b>余贵珍教授登榜“2023科创家”

    20个必知的自动化机器学习库(Python)

    为了进行部署,企业需要有一个经验丰富的数据科学家团队,他们期望高薪。即使企业确实拥有优秀的团队,通常也需要更多的经验而不是AI知识来决定哪种模型最适合企业。机器
    的头像 发表于 05-26 15:04 685次阅读
    20个必知的自动化<b class='flag-5'>机器</b><b class='flag-5'>学习</b>库(Python)

    高效理解机器学习

    效地学习机器学习。原文:MachineLearninginThreeSteps:HowtoEfficientlyLearnIt[1]当有志于成为数据科学家学习
    的头像 发表于 05-08 10:24 354次阅读
    高效理解<b class='flag-5'>机器</b><b class='flag-5'>学习</b>

    科学家用银线团搭建「纳米线网络」,触电就像大脑一样运作

    这也是如今不少AI科学家们梦寐以求的特性。最近,来自悉尼大学和日本国家材料科学研究所的科学家们在自然通讯上发表论文,试着通过使用纳米线网络(NWN)来模拟人类大脑在受到电激时的反应,实
    的头像 发表于 05-04 09:30 427次阅读
    <b class='flag-5'>科学家</b>用银线团搭建「纳米线网络」,触电就像<b class='flag-5'>大脑</b>一样运作

    获双项荣誉:中科智云受邀出席第二十一届中国科学家论坛

    、科技工作者、企业家等上千人齐聚一堂,探讨企业科技创新成果等热点话题。全球性创新型人工智能科技公司-中科智云受邀出席,并在此次大会中获组委会授予双项荣誉。 第二十一届中国科学家论坛现场 中国科学家论坛创办于2002年,由中国未来研究
    的头像 发表于 05-02 21:38 482次阅读