0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2018年下半年机器学习领域被密切关注的成果

电子工程师 来源:lq 2018-12-18 09:10 次阅读

本文的作者 Ross Taylor 和 Robert Stojnic 在今年一起启动了一个名为“Paper with Code”的项目,将 AI 领域的一些研究论文和论文开源代码结合展示,方便大家学习与研究。在推进这个项目的同时,通过分析网站的数据他们也有一些意外和有趣的收获,用更综合、全面的视野总结了下半年的发展现状与热点,哪些正在成为流行趋势、哪些被广泛使用。

在这篇文章中,作者为大家总结了 2018 年下半年机器学习领域被密切关注的成果,快来看看,这些你是不是都知道呢?

最流行的模型

BERT, vid2vid 和 graph_nets

10月,Google AI 团队提出了一种深度双向 Transformer 模型 (BERT),并发表了相关的论文。该模型在 11 个NLP 任务上取得了目前为止最佳的性能,Stanford Question Answering (SQuAD) 数据集也引起了学术界的强烈关注。随后,Google AI 进一步开源了项目代码,并在当月获得了最多 Stars 数量,可见其热门程度。

论文链接:https://arxiv.org/abs/1810.04805

GitHub 链接:https://github.com/google-research/bert

Nvidia 的 video-to-video synthesis 研究同样是下半年一大热点。该研究提出了一种新颖的生成模型 (GAN) 并在视频合成任务中取得惊人的效果。众所周知,GAN 是过去几年里最受欢迎的深度学习模型之一,该研究团队利用一种新颖的顺序生成器架构,以及一些前景和背景先验 (foreground-and-background priors) 等设计特征,解决了当前视频合成研究中时间不连贯的问题,进而提高了最终的性能。同样地,该项目代码也被 Nvidia 团队开源,并成为今年下半年第二大最受欢迎的项目。

论文链接:https://arxiv.org/abs/1808.06601

GitHub 链接:https://github.com/NVIDIA/vid2vid

同样值得关注的是,Google DeepMind 团队关于图网络 (graph_nets) 的最新研究。该研究得到广泛关注的原因是,因为它为解决结构化数据提供了一种新的方向。该开源项目是 2018 下半年排名第三位的受欢迎项目。

论文链接:https://arxiv.org/abs/1806.01261v3

GitHub 链接:https://github.com/deepmind/graph_nets

最受欢迎的项目

DeOldify、BERT 和 Fast R-CNNs

下面来介绍下半年最受欢迎的三个开源项目。

首先是 DeOldify。这是一项使用生成对抗网络 (GAN) 来修复黑白旧照片并为其重新上色的研究,在深度学习领域引发了极大的兴趣和关注。该项目的作者是 Jason Antic,他借鉴了几种 GAN 模型的实现,包括 self-attention GANs (SA-GANs)、progressively growing GANs (PG-GANs),来构建自己的模型,并采用两种时间跨度的原则,最终得到了有意思的结果。

GitHub 链接:

https://github.com/jantic/DeOldify

其次是 BERT 的 pytorch 实现,作者是 Junseong Kim。该项目的代码基于 The Annotated Transformer,代码风格简单易懂。

GitHub 链接:

https://github.com/codertimo/BERT-pytorch

最后一个项目是 Mask R-CNN 的 Keras/TensorFlow 实现,作者 Waleed Abdulla,这是今年下半年第三个热门 GitHub 项目。在结构上,Mask R-CNN 基于特征金字塔网络 (FPN) 和 ResNet101 为模型骨干,它可用于许多诸如 3D 建筑物重建,自动驾驶中的目标检测,检测地图中的建筑物类型等应用。

GitHub 链接:

https://github.com/matterport/Mask_RCNN

最活跃的领域

NLP 和 GANs

通过查看 GitHub 上 Top50 的开源实现,我们会发现当前最热门、最活跃的研究领域是自然语言处理 (NLP) 和生成对抗模型 (GANs)。在 GitHub 上,GANs 领域最受欢迎的开源项目有 vid2vid,DeOldify,CycleGAN 以及 faceswaps,而最热门的 NLP 开源项目包括 BERT,HanLP,jieba,AllenNLP 以及 fastText。

每7篇新论文中,只有一篇论文附有代码实现

希望研究者在发表论文的同时可以开源自己的代码实现。在过去 5 年的时间里,我们处理了60000 多篇机器学习领域的论文,在这些论文中,只有 12% 的论文开源了它们的代码,而过去 6 个月新发表的论文中,大约只有 15% (即每7篇新论文中只有1篇)附有代码实现。这些数字都告诉我们还有更多的工作要做,但是一切也正朝着正确的方向发展!

每 20 分钟就会出现一篇机器学习论文

从 7 月到现在,机器学习领域论文发表数量的增长率一直维持在每月 3.5% 左右,每年的增长率达到了 50%。这意味着,每月大约有 2200 篇新论文发表,按照这个趋势,预计明年将有近 30000 篇新论文发表。

为了更好描述这是怎样的一个趋势,我们绘制了曲线图与摩尔定律的趋势图进行比较。

最热门的两大深度学习框架

Tensorflow 和 PyTorch

以往每年大部分论文的代码都是基于 Tensorflow 框架实现的,但是,今年 PyTorch 的火热程度无法让人忽视,PyTorch 社区的活跃度非常高。其他的框架,诸如 MXNet,Torch 和 Caffe2 在整个深度学习社区的活跃度和使用率相对就有些低了。 Tensorflow 和 PyTorch 这两大框架都发生了很大的变化,TensorFlow 正朝着 eager execution 的方向发展,并集成了新的 Keras API,而 PyTorch 的改进旨在使用者能够更轻松地构建自己的深度学习模型。

展望

整个领域都开始强调论文的可复现性,虽然目前的数字显示,并不是都能做到,甚至我们还有一段路要走,但也正是如此,帮助大家明确了今后的工作的要求与方向。也希望出了研究人员外,有更多的人加入到开源社区中来。

此外,除了 Google 和 Facebook 这样的大型巨头公司外,独立的 ML 社区 (indie ML community) 也将有助于推动论文复现、代码开源等工作。如果,研究团队和开发社区能更加紧密的联系与合作,相信会产生更多有助于实际应用的机器学习工具,进而让整个领域更加发挥更大的潜力,全速前进。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GaN
    GaN
    +关注

    关注

    19

    文章

    1758

    浏览量

    67676
  • 机器学习
    +关注

    关注

    66

    文章

    8094

    浏览量

    130512
  • nlp
    nlp
    +关注

    关注

    1

    文章

    463

    浏览量

    21812

原文标题:2018热点总结:BERT最热,GANs最活跃,每20分钟就有一篇论文...

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    希尔电子功率半导体新项目厂房预计在今年下半年逐步投用

    3月5日,据“乐山发布”消息,四川乐山高新区希尔电子功率半导体新项目厂房预计在今年下半年逐步投用,届时企业将新增4个品类的生产线,全部投用后可实现年销售额10亿元。
    的头像 发表于 03-07 09:59 367次阅读

    三星:全新的可穿戴设备Galaxy Ring可能会在2024年下半年正式成形

    在上个月的Galaxy Unpacked上,三星表示全新的可穿戴设备Galaxy Ring可能会在2024年下半年正式成形。
    的头像 发表于 03-01 15:59 1561次阅读

    271亿韩元!丰源精密下半年将量产FMM,供三星、京东方、TCL华星

    WitDisplay消息,丰源精密(Poongwon Precision)宣布将在2022年科斯达克上市第一年通过FMM增加271亿韩元的销售额,并宣布将于今年下半年量产FMM,比原计划晚了2年。
    的头像 发表于 02-29 15:30 427次阅读

    全球PC代工巨头预计下半年AI PC市场回暖,重回增长轨道

    广达资深副总经理兼云达总经理杨麒令直言,目前PC供应链尚未完全恢复正常,预计下半年才能恢复繁荣。杨麒令强调,今年广达的大部分增长主要来自于AI服务器领域
    的头像 发表于 01-30 09:49 344次阅读

    2024年DRAM投片量:一季度微增,下半年剧增

    DRAM稼动率缓步改善,业界认为,整体DRAM投片量从2024年第1季将逐季提升,较2023年第4季小幅提升约5%左右,下半年投片量回升速度将明显加快。
    发表于 01-23 10:53 179次阅读

    苹果新款Mac Studio有望今年下半年推出

    据可靠消息源透露,苹果正在紧锣密鼓地研发一款全新的Mac Studio,预计将于2024年下半年正式发布。这一消息引起了业界和消费者的广泛关注
    的头像 发表于 01-08 15:03 495次阅读

    车用LED相关企业下半年营运有望升温

    受益于车用LED市场需求旺盛,多家产业链相关企业于近日表示,下半年营运有望升温。
    的头像 发表于 11-06 09:56 407次阅读

    分析师称华为Mate60Pro需求高于预期 下半年出货量将增加20%

    Mate 60 Pro的需求超过了预期,预计今年下半年的出货量将增加20%,达到600万台。而展望2024年,华为将推出新款高端P系列和Mate系列手机,预计零组件采购量将达到3000-4000万部。
    的头像 发表于 09-14 15:52 1934次阅读

    唯捷创芯:自研L-PAMiD产品预计下半年能够大规模出货

    最近唯捷创芯在接受机构调研时表示:“今年上半年公司自主开发的L-PAMiD产品大量投放,实现国内首次实现向头部品牌客户大量销售产品的企业今年下半年可以实现大规模出货的新一代L-PAMiD产品也正在开发和准备。
    的头像 发表于 09-12 14:55 493次阅读

    半年库存调整告歇,PCB下半年看温和复苏

    而在市场话题度最高的服务器族群部分,AI服务器在经过上半年的客户与板厂的合作开发之下,下半年营收贡献提升,以金像电来看,第三季AI服务器占比即可达服务器产品线双位数表现,健鼎也认为,AI服务器第四季会有贡献
    的头像 发表于 08-16 17:19 611次阅读

    瑞昱再获急单 下半年出货有望逐季回温

    法人指出,瑞昱最近成功地顾客订购电视soc紧急订单了,这也是几个月又一次的大客户紧急订单,客户的目标主要是针对消费者市场需求,下半年、瑞昱在今年3/4季度运营有望持续加热。
    的头像 发表于 08-02 11:47 521次阅读

    台积电产能利用率Q2触底反弹 下半年温和复苏

    台积电预计将在2023年下半年温和恢复,整体生产能力利用率将在2023年第二季度触底反弹。但由于顾客长期调整库存,存储芯片2023年第二、第三季度的业绩指南可能会变得保守。
    的头像 发表于 07-21 10:38 333次阅读

    下半年,IC设计业几家欢乐几家愁

    现阶段大多数IC设计公司上半年累计业绩都不如去年同期。有些业者第三季度营运看增,下半年表现有望优于上半年,但也有些业者表示,客户端仍谨慎下单,能见度仍明朗,还无法断言第三季度业绩是否比第二季度增长。
    的头像 发表于 07-09 14:42 519次阅读

    PC厂下半年或迎传统旺季?

    据钜亨网报道,全球景气去年下半年起下滑,笔电等消费性市场享受阶段红利后,需求出现滑落,导致终端库存水位高档
    的头像 发表于 06-27 17:26 495次阅读

    今日看点丨传台积电下半年或明年上半年再涨价 幅度3%起跳;鸿海扩大布局印度

    1. 传台积电下半年或明年上半年再涨价 幅度3% 起跳   据报道,IC设计公司表示,半导体需求旺盛情景已过,上下游急忙降价以求快速降低库存,只有台积电维持不变。近期再度传出台积电下半年或2024
    发表于 05-09 10:36 612次阅读