0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ML从业者如何阅读研究论文

星星科技指导员 来源:NVIDIA 作者:Richmond Alake 2022-04-08 14:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

数据科学家或机器学习专家有必要阅读研究论文吗?

简而言之,答案是肯定的。如果你没有正式的学术背景,或者只获得了机器学习领域的本科学位,也不要担心。

对于没有广泛教育背景的个人来说,阅读学术研究论文可能会有威胁。然而,缺乏学术阅读经验不应妨碍数据科学家利用 machine learning 和 AI development 的宝贵信息和知识来源。

这篇文章为任何技能水平的数据科学家提供了一个实践教程,他们可以阅读 NeurIPS 、 JMLR 、 ICML ,以及 等学术期刊上发表的研究论文。

在全神贯注于如何阅读研究论文之前,学习如何阅读研究论文的第一阶段包括选择相关主题和研究论文。

步骤 1 :确定一个主题

机器学习和数据科学领域拥有大量可以研究的学科领域。但这并不一定意味着在机器学习中处理每个主题是最好的选择。

虽然建议入门级实践者进行泛化,但我猜当涉及到长期机器学习时,职业前景、实践者和行业兴趣通常会转向专业化。

确定一个适合的主题可能很难,但很好。不过,经验法则是选择一个 ML 领域,你要么对获得专业职位感兴趣,要么已经有经验。

深度学习 是我的兴趣之一,我是一名计算机视觉工程师,在应用程序中使用深度学习模型专业地解决 computer vision 问题。因此,我对姿势估计、动作分类和手势识别等主题感兴趣。

基于角色,以下是 ML / DS 职业和相关主题要考虑的例子。

poYBAGJP1LuAEILsAAZw-fjMYSg294.png

图 1 :机器学习和数据科学角色及相关主题。作者创造的形象 。

对于本文,我将选择姿势估计这一主题进行探索,并选择相关的研究论文进行研究。

第二步:寻找研究论文

在阅读与机器学习相关的研究论文、数据集、代码和其他相关材料时,最优秀的工具之一是 PapersWithCode 。

我们使用 PapersWithCode 网站上的搜索引擎来获取所选主题“姿势估计”的相关研究论文和内容下图显示了它是如何完成的。

搜索结果页面包含对搜索主题的简短说明,然后是相关数据集、模型、论文和代码的表格。在不深入太多细节的情况下,本用例感兴趣的领域是“最伟大的代码论文”。本节包含与任务或主题相关的论文。出于本文的目的,我将选择 DensePose :野外密集的人类姿势估计 。

第 3 步:第一步(获得背景和理解)

在这一点上,我们选择了一篇研究论文进行研究,并准备从其内容中提取任何有价值的经验教训和发现。

很自然,你的第一个冲动就是开始写笔记,从头到尾地阅读文档,也许在其间休息一下。然而,为研究论文的内容提供一个上下文是阅读它的一种更实际的方式。标题、摘要和结论是理解任何研究论文的三个关键部分。

您所选论文的第一关的目标是实现以下目标:

确保论文是相关的。

通过学习论文的内容、方法和发现,了解论文的背景。

认识作者的目标、方法和成就。

标题

标题是作者和读者之间信息共享的第一点。因此,研究论文的标题是直接的,并且以一种不会留下歧义的方式组成。

研究论文的标题是最能说明问题的方面,因为它表明了研究与你的工作的相关性。标题的重要性在于对论文的内容有一个简要的了解。

在这种情况下,标题是“ DensePose :野外密集的人类姿势估计”这提供了一个工作的广泛概述,并意味着它将研究如何在高活动水平和真实情况下提供姿势估计。

摘要

摘要部分给出了论文的摘要。这是一个简短的部分,包含 300-500 字,简单地告诉你这篇论文是关于什么的。摘要是一篇简短的文章,概述了文章的内容、研究人员的目标、方法和技巧。

在阅读机器学习研究论文摘要时,您通常会遇到提到的数据集、方法、算法和其他术语。与文章内容相关的关键字提供上下文。在这一点上记笔记和跟踪所有关键字可能会有所帮助。

对于论文“ DensePose :野外密集的人类姿势估计 ”,我在摘要中确定了以下关键词:姿势估计、 COCO 数据集、 CNN 、基于区域的模型、实时。

总结

在你第一次通过考试时,从上到下阅读论文时会感到疲劳是很常见的,尤其是对于没有高级学术经验的数据科学家和从业者来说。虽然在长时间的研究之后,从论文的后面部分提取信息可能看起来很乏味,但结论部分通常很短。因此,建议阅读第一遍的结论部分。

结论部分简要概述了该作品的作者和/或贡献、成就以及对未来发展和局限性的承诺。

在阅读研究论文的主要内容之前,先阅读结论部分,看看研究者的贡献、问题领域和结果是否符合你的需要。

遵循这一简单的第一步可以充分理解和概述研究论文的范围和目标,以及内容的背景。你可以用激光注意力再次浏览,从内容中获得更详细的信息。

第 4 步:第二关(内容熟悉)

内容熟悉是一个与初始步骤相关的过程。阅读本文研究论文的系统方法。熟悉过程是一个步骤,包括研究论文的引言部分和图表。

如前所述,不需要直接深入研究论文的核心,因为知识适应可以在以后的过程中更轻松、更全面地检查研究。

介绍

研究论文的导论部分旨在概述研究工作的目标。该目标提及并解释了问题领域、研究范围、先前的研究工作和方法。

使用相似或不同的方法,在这一领域找到与过去研究工作相似的地方是很正常的。其他论文的引用提供了问题领域的范围和广度,为读者拓宽了探索领域。在这一点上,合并步骤 3 中概述的程序就足够了。

导言部分提供的另一个好处是提供了接触和理解研究论文内容所需的必要知识。

图表

研究论文中的说明性材料确保读者能够理解支持问题定义或所提出方法解释的因素。通常,研究论文中使用表格来提供与类似方法相比的新技术定量性能的信息。

pYYBAGJP1MeAGCEpAAKUy7hAX5Y138.png

poYBAGJP1M-Ae-0PAAKUWSdFUtc043.png

图 4 : 显示 DensePose 与其他单人姿势估计解决方案比较的图像。

一般来说,数据和性能的可视化表示可以帮助您直观地理解论文的上下文。在前面提到的密集姿势论文中,使用插图描述了作者姿势估计和创建方法的性能。全面了解生成和注释数据样本所涉及的步骤。

在深度学习领域,经常会发现描述人工神经网络结构的拓扑图。这再次为任何读者创造了直观的理解。通过插图和数字,读者可以自己解释信息,并获得更全面的观点,而不必对结果有任何先入为主的概念。

pYYBAGJP1NqAeY9SAAXEvreEEII334.png

图 5 : 显示 DensePose 交叉级联架构的图像。

第五步:第三遍(深度阅读)

论文的第三遍与第二遍相似,尽管它涵盖了正文的大部分。关于这个过程最重要的一点是,你要避免任何复杂的算术或技术公式,这对你来说可能是困难的。在此过程中,您还可以跳过任何您不理解或不熟悉的单词和定义。应注意这些不熟悉的术语、算法或技术,以便稍后返回。

在本课程中,你的主要目标是对论文内容有一个广泛的了解。接近论文,从摘要到结论再开始,但一定要在各部分之间进行中间休息。此外,建议有一个记事本,在记事本中记录所有重要的见解和收获,以及不熟悉的术语和概念。

Pomodoro 技术是管理深度阅读或学习时间的有效方法。简单地说, Pomodoro 技术将一天分成几部分工作,然后是短暂的休息。

对我有效的是 50 / 15 分割,也就是说, 50 分钟的学习和 15 分钟的休息时间。我倾向于在延长 30 分钟的休息时间之前,连续执行两次分割。如果您不熟悉这种时间管理技巧,请采用相对简单的划分,如 25 / 5 ,并根据您的注意力和时间容量调整时间划分。

第六步:第四关(最后一关)

最后一关通常涉及到发挥你的智力和学习能力,因为它涉及到在前一关中提到的不熟悉的术语、术语、概念和算法。这一关的重点是使用外部材料来理解论文中记录的不熟悉的方面。

对不熟悉的主题进行深入研究没有规定的时间长度,有时甚至需要几天或几周的时间。最终成功通过的关键因素是为进一步勘探找到合适的油源。

不幸的是,互联网上没有一个来源能提供你所需要的丰富信息。尽管如此,有多个来源,如果协调使用并适当使用,可以填补知识空白。下面是其中的一些资源。

机器学习子系统

深度学习子系统

PapersWithCode

顶级会议搜索为 NIPS 、 ICML 、 ICLR

Research Gate

机器学习苹果

研究论文的参考部分提到了技术和算法。因此,当前的论文要么从中汲取灵感,要么以之为基础,这就是为什么参考部分是一个有用的来源,可用于您的深度阅读课程。

步骤 7 :摘要(可选)

在近十年的与技术相关的学科和角色的学术和专业研究中,通过重述所探索的主题,确保所学到的任何新信息保留在我的长期记忆中的最有效方法。通过用我自己的语言重写新信息,无论是书面的还是打字的,我都能够以一种可理解和令人难忘的方式强化提出的观点。

更进一步,可以通过博客平台和社交媒体宣传学习成果和笔记。试图向广大读者解释新探索的概念,假设读者不习惯该主题或主题,则需要理解主题的内在细节。

结论

毫无疑问,为新手数据科学家和 ML 实践者阅读研究论文是令人畏惧和具有挑战性的;即使是经验丰富的实践者也发现很难一次成功地消化研究论文的内容。

数据科学专业的性质是非常实用和涉及的。这意味着,数据科学领域与人工智能密切相关,人工智能仍然是一个发展中的领域,因此,它的从业者必须具备学术思维。

总而言之,以下是阅读研究论文应遵循的所有步骤:

确定一个主题。

寻找相关研究论文

阅读标题、摘要和结论,对研究工作目标和成果有一个模糊的理解。

通过深入介绍,熟悉内容;包括对文中给出的图形和图表的探索。

在自上而下阅读论文的过程中,利用深度阅读课程来消化论文的主要内容。

使用外部资源探索不熟悉的术语、术语、概念和方法。

用你自己的话总结基本的要点、定义和算法。

关于作者

Richmond Alake 是一名机器学习和计算机视觉工程师,他与多家初创公司和公司合作,整合深度学习模型,以解决商业应用中的计算机视觉任务。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136223
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123896
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    福田欧曼银河燃气车推动物流行业高价值运输

    在物流行业竞争加剧、运营成本高企的当下,降本增效成为从业者的核心诉求,燃气重卡凭借经济高效的特性,已成为干线运输领域的主流选择。
    的头像 发表于 11-21 14:49 358次阅读

    2025无线遥控开关产品:技术对比与应用方案解析

    本文将基于权威数据平台的研究,对无线遥控开关的技术特点、市场趋势、品牌厂商和应用方案进行深度解析,为行业从业者提供全面、客观的指导参考。
    的头像 发表于 11-14 10:40 98次阅读

    亿纬锂能分享锂电池40年从业者的心声

    11月10日,亿纬锂能董事长刘金成博士应邀出席中国化学会第二十三次全国电化学大会,发表《锂电池40年从业者的心声》主题报告。他以自己四十年的锂电池从业经历,回顾了中国锂电池从艰难起步到引领全球的发展之路,并分享了对于行业未来发展趋势的深刻洞见。
    的头像 发表于 11-11 14:05 344次阅读

    倾佳电子SiC碳化硅功率器件战略市场精通指南:从业者进阶之路

    倾佳电子SiC碳化硅功率器件战略市场精通指南:从业者进阶之路 倾佳电子(Changer Tech)是一家专注于功率半导体和新能源汽车连接器的分销商。主要服务于中国工业电源、电力电子设备和新能源
    的头像 发表于 10-09 17:47 558次阅读
    倾佳电子SiC碳化硅功率器件战略市场精通指南:<b class='flag-5'>从业者</b>进阶之路

    从电路板到创新领袖:电子技术人才的进阶之路

    持续攀升。本文将带您了解行业顶尖人才的成长轨迹,探索电子技术从业者的职业发展新路径。一、电子技术行业的新格局1. 技术变革催生新机遇当前电子技术领域呈现三大发展趋势:微型化与集成化:芯片工艺进入3nm
    发表于 08-22 15:18

    工业具身智能落地的关键要素是什么

    但具身智能的落地有个循序渐进的过程,高工机器人产业研究所(GGII)通过调研发现,当前阶段人形机器人真实出货的场景集中在科研教育、娱乐表演、展览等领域,但从业者的落地焦点正在转移,越来越多的企业正在深入攻坚更难的工业、医疗、家庭服务场景。
    的头像 发表于 08-12 14:59 1031次阅读

    使用NVIDIA Cosmos模型提高未来智能汽车安全性

    本文是洞悉 Omniverse 系列文章。“洞悉 Omniverse” 重点介绍开发者、3D 从业者与企业如何使用 OpenUSD 和 NVIDIA Omniverse 的最新进展深入改变他们的工作流。
    的头像 发表于 07-14 11:46 886次阅读

    网络安全从业者入门指南

    所有网络安全专业和各部门人员都有一个共同的总体目标,就是要降低网络风险。但是,对于工业、医疗保健、其他以网络化物理系统 (CPS) 为运营基础的关键基础设施领域的企业来说,这一目标正在逐步消失。原因之一是:简单地评估网络风险和确定其优先级,是首席信息安全官(CISO)及其团队长期以来管理 IT 环境中网络风险的方法。如果要进一步降低 CPS 环境的网络风险,就要抛弃许多传统的方法和解决方案。根据预估,关键基础设施领域 95% 的 CI
    发表于 06-20 15:56 1次下载

    《2025年汽车软件开发年度报告》——影响行业发展的核心挑战有哪些?

    【中文摘要】根据2024年全球汽车软件行业调查报告显示,"质量"连续两年成为从业者最关注的核心议题。与去年亚太地区主导该趋势不同,今年北美和非洲地区首次将质量列为首要关切。与此同时,随着AI/ML
    发表于 03-12 17:09 2次下载

    同行:我所认识的女性AI从业者

    技术的世界或许山高水远,但她的身边并非空无一人
    的头像 发表于 03-10 15:56 2107次阅读
    同行:我所认识的女性AI<b class='flag-5'>从业者</b>

    美报告:中国芯片研究论文全球领先

    据新华社报道,美国乔治敦大学“新兴技术观察项目(ETO)”3日在其网站发布一份报告说,2018年至2023年间,在全球发表的芯片设计和制造相关论文中,中国研究人员的论文数量远超其他国家,中国在高被
    的头像 发表于 03-05 14:32 1717次阅读

    助推数字化影视进程:影视从业者的得力助手

    “数”兴百业,提“智”增效。近年来,在人工智能技术迭代创新的赋能下,影视生产的外延和边界正不断拓展,影视生产制作模式正逐步向数字化、智能化转型,从“制造”走向“智造”。 数智化赋能影视未来 行业步入发展快车道 影视数智化创造全新体验,不仅是一场技术的革命,更是一次艺术的飞跃。以人工智能、大数据等前沿数字化技术,深度渗透产品创作、传播路径和审美体验,强化影视生产各要素的联系,为影视艺术的发展开辟了全新的可
    的头像 发表于 02-10 09:16 798次阅读

    《具身智能机器人系统》第10-13章阅读心得之具身智能机器人计算挑战

    考虑了时间戳对齐,还实现了空间坐标系的统一转换和语义层面的映射关系建立。这种端到端的数据管理方案,为解决异构数据融合问题提供了全新思路。 作为数据挖掘从业者,我看到了这些技术在数据处理领域的广阔
    发表于 01-04 01:15

    【「大话芯片制造」阅读体验】+内容概述,适读人群

    书后,对芯片制造的复杂性和精妙性有了全新的认识。 第一章,展示了半导体工厂的布局,选址与组织部门。我们可以知道半导体从业者自身的一个定位与分工。对半导体行业的特殊性,半导体从业者的生活环境,工作内容有一定
    发表于 12-21 16:32

    学嵌入式好找工作吗?

    ,也就意味着嵌入式相关岗位的需求量是持续且庞大的,不用担心短期内出现行业性的就业寒冬,能为从业者提供较为稳定的就业机会。 2.技术的不可替代性 嵌入式开发涉及到硬件和软件的深度融合,开发人员需要
    发表于 12-16 15:43