0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ML从业者如何阅读研究论文

星星科技指导员 来源:NVIDIA 作者:Richmond Alake 2022-04-08 14:22 次阅读

数据科学家或机器学习专家有必要阅读研究论文吗?

简而言之,答案是肯定的。如果你没有正式的学术背景,或者只获得了机器学习领域的本科学位,也不要担心。

对于没有广泛教育背景的个人来说,阅读学术研究论文可能会有威胁。然而,缺乏学术阅读经验不应妨碍数据科学家利用 machine learning 和 AI development 的宝贵信息和知识来源。

这篇文章为任何技能水平的数据科学家提供了一个实践教程,他们可以阅读 NeurIPS 、 JMLR 、 ICML ,以及 等学术期刊上发表的研究论文。

在全神贯注于如何阅读研究论文之前,学习如何阅读研究论文的第一阶段包括选择相关主题和研究论文。

步骤 1 :确定一个主题

机器学习和数据科学领域拥有大量可以研究的学科领域。但这并不一定意味着在机器学习中处理每个主题是最好的选择。

虽然建议入门级实践者进行泛化,但我猜当涉及到长期机器学习时,职业前景、实践者和行业兴趣通常会转向专业化。

确定一个适合的主题可能很难,但很好。不过,经验法则是选择一个 ML 领域,你要么对获得专业职位感兴趣,要么已经有经验。

深度学习 是我的兴趣之一,我是一名计算机视觉工程师,在应用程序中使用深度学习模型专业地解决 computer vision 问题。因此,我对姿势估计、动作分类和手势识别等主题感兴趣。

基于角色,以下是 ML / DS 职业和相关主题要考虑的例子。

poYBAGJP1LuAEILsAAZw-fjMYSg294.png

图 1 :机器学习和数据科学角色及相关主题。作者创造的形象 。

对于本文,我将选择姿势估计这一主题进行探索,并选择相关的研究论文进行研究。

第二步:寻找研究论文

在阅读与机器学习相关的研究论文、数据集、代码和其他相关材料时,最优秀的工具之一是 PapersWithCode 。

我们使用 PapersWithCode 网站上的搜索引擎来获取所选主题“姿势估计”的相关研究论文和内容下图显示了它是如何完成的。

搜索结果页面包含对搜索主题的简短说明,然后是相关数据集、模型、论文和代码的表格。在不深入太多细节的情况下,本用例感兴趣的领域是“最伟大的代码论文”。本节包含与任务或主题相关的论文。出于本文的目的,我将选择 DensePose :野外密集的人类姿势估计 。

第 3 步:第一步(获得背景和理解)

在这一点上,我们选择了一篇研究论文进行研究,并准备从其内容中提取任何有价值的经验教训和发现。

很自然,你的第一个冲动就是开始写笔记,从头到尾地阅读文档,也许在其间休息一下。然而,为研究论文的内容提供一个上下文是阅读它的一种更实际的方式。标题、摘要和结论是理解任何研究论文的三个关键部分。

您所选论文的第一关的目标是实现以下目标:

确保论文是相关的。

通过学习论文的内容、方法和发现,了解论文的背景。

认识作者的目标、方法和成就。

标题

标题是作者和读者之间信息共享的第一点。因此,研究论文的标题是直接的,并且以一种不会留下歧义的方式组成。

研究论文的标题是最能说明问题的方面,因为它表明了研究与你的工作的相关性。标题的重要性在于对论文的内容有一个简要的了解。

在这种情况下,标题是“ DensePose :野外密集的人类姿势估计”这提供了一个工作的广泛概述,并意味着它将研究如何在高活动水平和真实情况下提供姿势估计。

摘要

摘要部分给出了论文的摘要。这是一个简短的部分,包含 300-500 字,简单地告诉你这篇论文是关于什么的。摘要是一篇简短的文章,概述了文章的内容、研究人员的目标、方法和技巧。

在阅读机器学习研究论文摘要时,您通常会遇到提到的数据集、方法、算法和其他术语。与文章内容相关的关键字提供上下文。在这一点上记笔记和跟踪所有关键字可能会有所帮助。

对于论文“ DensePose :野外密集的人类姿势估计 ”,我在摘要中确定了以下关键词:姿势估计、 COCO 数据集、 CNN 、基于区域的模型、实时。

总结

在你第一次通过考试时,从上到下阅读论文时会感到疲劳是很常见的,尤其是对于没有高级学术经验的数据科学家和从业者来说。虽然在长时间的研究之后,从论文的后面部分提取信息可能看起来很乏味,但结论部分通常很短。因此,建议阅读第一遍的结论部分。

结论部分简要概述了该作品的作者和/或贡献、成就以及对未来发展和局限性的承诺。

在阅读研究论文的主要内容之前,先阅读结论部分,看看研究者的贡献、问题领域和结果是否符合你的需要。

遵循这一简单的第一步可以充分理解和概述研究论文的范围和目标,以及内容的背景。你可以用激光注意力再次浏览,从内容中获得更详细的信息。

第 4 步:第二关(内容熟悉)

内容熟悉是一个与初始步骤相关的过程。阅读本文研究论文的系统方法。熟悉过程是一个步骤,包括研究论文的引言部分和图表。

如前所述,不需要直接深入研究论文的核心,因为知识适应可以在以后的过程中更轻松、更全面地检查研究。

介绍

研究论文的导论部分旨在概述研究工作的目标。该目标提及并解释了问题领域、研究范围、先前的研究工作和方法。

使用相似或不同的方法,在这一领域找到与过去研究工作相似的地方是很正常的。其他论文的引用提供了问题领域的范围和广度,为读者拓宽了探索领域。在这一点上,合并步骤 3 中概述的程序就足够了。

导言部分提供的另一个好处是提供了接触和理解研究论文内容所需的必要知识。

图表

研究论文中的说明性材料确保读者能够理解支持问题定义或所提出方法解释的因素。通常,研究论文中使用表格来提供与类似方法相比的新技术定量性能的信息。

pYYBAGJP1MeAGCEpAAKUy7hAX5Y138.png

poYBAGJP1M-Ae-0PAAKUWSdFUtc043.png

图 4 : 显示 DensePose 与其他单人姿势估计解决方案比较的图像。

一般来说,数据和性能的可视化表示可以帮助您直观地理解论文的上下文。在前面提到的密集姿势论文中,使用插图描述了作者姿势估计和创建方法的性能。全面了解生成和注释数据样本所涉及的步骤。

在深度学习领域,经常会发现描述人工神经网络结构的拓扑图。这再次为任何读者创造了直观的理解。通过插图和数字,读者可以自己解释信息,并获得更全面的观点,而不必对结果有任何先入为主的概念。

pYYBAGJP1NqAeY9SAAXEvreEEII334.png

图 5 : 显示 DensePose 交叉级联架构的图像。

第五步:第三遍(深度阅读)

论文的第三遍与第二遍相似,尽管它涵盖了正文的大部分。关于这个过程最重要的一点是,你要避免任何复杂的算术或技术公式,这对你来说可能是困难的。在此过程中,您还可以跳过任何您不理解或不熟悉的单词和定义。应注意这些不熟悉的术语、算法或技术,以便稍后返回。

在本课程中,你的主要目标是对论文内容有一个广泛的了解。接近论文,从摘要到结论再开始,但一定要在各部分之间进行中间休息。此外,建议有一个记事本,在记事本中记录所有重要的见解和收获,以及不熟悉的术语和概念。

Pomodoro 技术是管理深度阅读或学习时间的有效方法。简单地说, Pomodoro 技术将一天分成几部分工作,然后是短暂的休息。

对我有效的是 50 / 15 分割,也就是说, 50 分钟的学习和 15 分钟的休息时间。我倾向于在延长 30 分钟的休息时间之前,连续执行两次分割。如果您不熟悉这种时间管理技巧,请采用相对简单的划分,如 25 / 5 ,并根据您的注意力和时间容量调整时间划分。

第六步:第四关(最后一关)

最后一关通常涉及到发挥你的智力和学习能力,因为它涉及到在前一关中提到的不熟悉的术语、术语、概念和算法。这一关的重点是使用外部材料来理解论文中记录的不熟悉的方面。

对不熟悉的主题进行深入研究没有规定的时间长度,有时甚至需要几天或几周的时间。最终成功通过的关键因素是为进一步勘探找到合适的油源。

不幸的是,互联网上没有一个来源能提供你所需要的丰富信息。尽管如此,有多个来源,如果协调使用并适当使用,可以填补知识空白。下面是其中的一些资源。

机器学习子系统

深度学习子系统

PapersWithCode

顶级会议搜索为 NIPS 、 ICML 、 ICLR

Research Gate

机器学习苹果

研究论文的参考部分提到了技术和算法。因此,当前的论文要么从中汲取灵感,要么以之为基础,这就是为什么参考部分是一个有用的来源,可用于您的深度阅读课程。

步骤 7 :摘要(可选)

在近十年的与技术相关的学科和角色的学术和专业研究中,通过重述所探索的主题,确保所学到的任何新信息保留在我的长期记忆中的最有效方法。通过用我自己的语言重写新信息,无论是书面的还是打字的,我都能够以一种可理解和令人难忘的方式强化提出的观点。

更进一步,可以通过博客平台和社交媒体宣传学习成果和笔记。试图向广大读者解释新探索的概念,假设读者不习惯该主题或主题,则需要理解主题的内在细节。

结论

毫无疑问,为新手数据科学家和 ML 实践者阅读研究论文是令人畏惧和具有挑战性的;即使是经验丰富的实践者也发现很难一次成功地消化研究论文的内容。

数据科学专业的性质是非常实用和涉及的。这意味着,数据科学领域与人工智能密切相关,人工智能仍然是一个发展中的领域,因此,它的从业者必须具备学术思维。

总而言之,以下是阅读研究论文应遵循的所有步骤:

确定一个主题。

寻找相关研究论文

阅读标题、摘要和结论,对研究工作目标和成果有一个模糊的理解。

通过深入介绍,熟悉内容;包括对文中给出的图形和图表的探索。

在自上而下阅读论文的过程中,利用深度阅读课程来消化论文的主要内容。

使用外部资源探索不熟悉的术语、术语、概念和方法。

用你自己的话总结基本的要点、定义和算法。

关于作者

Richmond Alake 是一名机器学习和计算机视觉工程师,他与多家初创公司和公司合作,整合深度学习模型,以解决商业应用中的计算机视觉任务。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8124

    浏览量

    130568
  • 深度学习
    +关注

    关注

    73

    文章

    5239

    浏览量

    119910
收藏 人收藏

    评论

    相关推荐

    为什么说每个CAN从业者都该有台USBCAN呢?

    首先,USBCAN是CAN总线调试的常用工具。它作为CAN总线分析仪或CAN接口卡,能够帮助工程师在测试CAN总线通讯时有效地分析总线上的数据。
    的头像 发表于 04-15 11:07 115次阅读

    赛恩领动携手恩智浦凭借创新4D成像雷达荣获欧洲科技大奖!

    日前,赛恩领动携手恩智浦凭借行业领先的4D成像雷达荣获备受全球自动驾驶从业者瞩目的2024 Tech.AD Europe成像雷达与感知大奖。
    的头像 发表于 03-15 09:16 243次阅读

    【换道赛车:新能源汽车的中国道路 | 阅读体验】新能源汽车值得买吗?未来又会如何发展

    的未来将走向何方等宏观性问题。而这些不仅关系消费者的切身利益,也为许多身处其中而又不能窥见全貌的从业者指明方向,虽然新能源汽车未来的发展道路仍然是机遇与挑战并存,但只要我们坚守本心,立足于自身,那么创建出一条属于我们自己的新能源汽车赛道,并非天方夜谭。
    发表于 03-08 17:33

    【RISC-V开放架构设计之道|阅读体验】一本别出心裁的RISC-V架构之书(第一章)

    的计算机体系架构专 别出心裁地按照RISC-V模块化的指令来组织内容 对比x86、ARM 和MIPS 的设计,通过对比分析,突显RISC-V 的优势 可以作为从业者随时翻阅的案头参考书 开头的蒙娜丽莎像让
    发表于 01-24 19:06

    对OSI七层模型的误解

    如果你是一个网络从业者,一定学习过 OSI 7 层模型,长期以来,这一直作为我们理解和解决网络问题的基石存在。
    的头像 发表于 12-14 15:02 342次阅读
    对OSI七层模型的误解

    基于STM32的LF RFID阅读研究

    电子发烧友网站提供《基于STM32的LF RFID阅读研究.pdf》资料免费下载
    发表于 10-23 10:00 0次下载
    基于STM32的LF RFID<b class='flag-5'>阅读</b>器<b class='flag-5'>研究</b>

    手机市场或迎复苏,芯片测试与封测供应链积极应对

    半导体封测供应链传出从10月开始,手机系统大厂终于开始有明显的库存回补动作,锁定如联发科等一线手机SoC从业者的「旧款芯片」备货。
    的头像 发表于 10-16 18:17 633次阅读

    基于STM32的RFID手持式阅读器的研究与设计

    电子发烧友网站提供《基于STM32的RFID手持式阅读器的研究与设计.pdf》资料免费下载
    发表于 10-08 09:59 0次下载
    基于STM32的RFID手持式<b class='flag-5'>阅读</b>器的<b class='flag-5'>研究</b>与设计

    分析一个工作中常用的带有放大功能的高精度的串联稳压型电路

    在我们电子从业者日常工作中,电源电路的设计非常非常多,一个稳定可靠的电源电路对于整个电子电路的作用是至关重要的。
    的头像 发表于 09-26 15:49 580次阅读
    分析一个工作中常用的带有放大功能的高精度的串联稳压型电路

    #硬声创作季 电路板维修从业者必备的三本书

    电路维修
    jf_27932003
    发布于 :2023年07月20日 20:40:40

    一款想替代并超越burpsuite的网络安全单兵工具

    Burpsuite几乎成为全球WEB安全从业者必装的安全测试工具,然而十余年来尚无一个可替代的解决方案。破解版被投毒风险高、商业版太贵、插件难写、依赖java等等问题逐渐显露。我们团队基于yak顺手
    的头像 发表于 07-05 10:04 777次阅读
    一款想替代并超越burpsuite的网络安全单兵工具

    作为 IT 从业者,我为什么推荐华为云 ERP 上云解决方案

    作为 IT 从业者,我深知 ERP 系统对于企业运营的重要性。它能够帮助企业实现信息化管理,提升运营效率,支持业务发展。然而,市面上有许多 ERP 产品,每种产品都有其优缺点。在选择 ERP 产品
    的头像 发表于 07-03 19:38 296次阅读

    浅聊丨从业多年,华为云 Web 及移动 App 上云服务如今看来仍是第一梯队的选择

    在数字化时代,云计算已经成为企业发展的重要驱动力。作为深漂多年的 IT 从业者,我深知选择一个合适的云服务平台对企业的重要性。因为业务比较多接触华为,经过深入研究和实践,有一说一,确实觉得华为
    的头像 发表于 07-03 19:31 246次阅读

    作为IT从业者,为什么我推荐华为云ECS?

    作为一名IT从业者,我经常会被问到关于云计算的问题。在这里,我想分享一下我的看法,并向大家推荐华为云ECS。 首先,让我们来了解一下什么是弹性云服务器。弹性云服务器(Elastic Cloud
    的头像 发表于 06-24 00:26 374次阅读

    初学者如何选择Java和嵌入式?

    看到这个问题下的答主几乎清一色吹Java,劝退嵌入式,作为一名Java从业者,我觉得大可不必!
    的头像 发表于 06-02 10:14 477次阅读