0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

11种深度学习框架影响力对比

罗欣 来源:Medium 作者:佚名 2018-10-15 11:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

编者按:Jeff Hale根据网上招聘、调研报告、网络搜索、论文、教程、GitHub等数据,评估了11种深度学习框架的影响力。

现在数据科学领域最热门的方向仍旧是深度学习。相应地,深度学习框架也处于飞速变革之中。现在最流行的框架,除Theano外,5年前都不存在。

我想搜集一些哪个框架更值得关注的证据,所以我搞了这个影响力评分。我使用了7个不同类别的11个数据源,以评估框架的使用量、兴趣、流行度。接着我对这些数据进行加权组合,得到了本文的结果。具体的代码可以在Kaggle Kernel上看到:discdiver/deep-learning-framework-power-scores-2018 2018年9月20日更新:应众多读者要求,我扩大了框架的评估范围,加入了Caffe、Deeplearning4J、Caffe2、Chainer。现在的评测包括了KDNuggets使用调研中所有报告使用率在1%以上的框架。

2018年9月21日更新:我改进了一些测度的方法。

不多啰嗦了,下面是深度学习框架的影响力评分:

毫无疑问,TensorFlow位居第一。不过我有一些意料之外的发现,详情见下。

框架

评测的所有框架都是开源的,除了其中一个框架外都提供了Python接口,有些框架提供了R或其他语言的接口。



TensorFlow是毫无争议的赢家。GitHub上最热,谷歌搜索最多,Medium文章、亚马逊书籍、ArXiv论文最多。使用TensorFlow的开发者最多,大多数网上招聘的工作描述中也提到了它。TensorFlow背后站着Google。


Keras拥有“为人类而不是机器设计的API”。几乎各项评估中,它都是第二流行的框架。Keras以TensorFlow、Theano或CNTK为底层引擎。如果你是深度学习的新手,建议从Keras开始。

总体而言,PyTorch是第三流行的框架,也是第二流行的独立框架。它比TensorFlow要年轻,流行度的增速十分迅猛。它也支持TensorFlow尚不支持的一些定制。PyTorch背后站着的是Facebook。

Caffe是第四流行的框架。它差不多快5岁了。相对而言,某些雇主还要求熟悉Caffe,一些学术论文也还用Caffe,但最近使用Caffe的人不多。

Theano是蒙特利尔大学2007年研发的,也是最古老的有显著影响力的Python深度学习框架。它的流行度降了一大截,主要开发者也宣布不会再发布加入新功能的大版本了。不过,目前仍有一些更新。Theano仍然是排名第五的框架。

亚马逊使用Apache孵化的MXNET。它是第六流行的深度学习库。

CNTK是微软的认知工具集。它让我想起了微软其他很多产品,试图和谷歌、Facebook提供的工具竞争,但没赢得多少使用。

Deeplearning4J,也称为DL4J,配套Java语言使用。它是唯一不提供Python接口的准流行框架。不过,你可以导入用Keras写的模型。这也是唯一一个两个不同的搜索项(Deeplearning4J和DL4J)偶尔返回不同结果的框架。我在每项测度中使用了较高的数字。由于这个框架的评分相当低,因此这并没有带来什么实质性的改变。

Caffe2是另一个Facebook开源产品。它基于Caffe构建,现在是PyTorch项目的一部分(同一GitHub仓库)。由于现在Caffe2没有自己的代码仓库,我使用了旧仓库的GitHub数据。

Chainer是由日本公司Preferred Networks开发的框架。它有一小批使用者。

FastAI基于PyTorch构建。它的API借鉴了Keras,只需很少的代码(比Keras还要少)就可以得到强力的结果。目前而言,FastAI属于前沿框架,目前正处于为预计2018年10月发布的1.0版本重写代码的阶段。FastAI的作者Jeremy Howard是Kaggle的主席。他曾经写过一篇Introducing Pytorch for fast.ai,讨论为何FastAI从使用Keras转向创建自己的框架。

现在还没有什么职位需要用这个框架,本身使用也不广泛。然而,由于FastAI的免费在线课程很流行,自然而然就有不少使用者。这个框架强大易用,因此可能会很快普及。

标准

我选择了以下7个类别来评估深度学习框架的流行度和关注度。

在线招聘描述

KDnuggets使用调研

谷歌搜索量

Medium文章

亚马逊数据

ArXiv论文

GitHub热度

数据采集自2018年9月16日至2018年9月21日,源数据可以通过谷歌试算表访问:https://docs.google.com/spreadsheets/d/1mYfHMZfuXGpZ0ggBVDot3SJMU-VsCsEGceEL8xd1QBo/edit?usp=sharing

我使用了Python的pandas库探索流行度,并使用plotly库进行可视化。如果你想要查看可交互的plotly图表,请访问我在文章开头提到过的Kaggle Kernel。

在线招聘描述

现在的工作市场上哪种深度学习库需求更高?我搜集了LinkedIn、Indeed、Simply Hired、Monster、Angel List的上的数据。

毫无疑问,TensorFlow是这方面的赢家。如果你想找一份深度学习的工作,可以学一下TensorFlow。

我通过“machine learning”(机器学习)加库名的方式搜索。比如,“machine learning TensorFlow”。我测试了若干搜索方法,这个方法可以得到相关性最高的结果。

之所以额外加上一个搜索词,是因为有些框架的名字可能有歧义,比如Caffe可能有多种含义。

使用量

KDnuggets是一个流行的数据科学网站。它在调研软件使用情况的时候提问:

你在过去12个月的真实项目上用了什么分析、大数据、数据科学、机器学习软件?

让人有点意外的是,Keras的使用量很高——差不多快赶上TensorFlow了。有意思,美国的雇主们热衷找具备TensorFlow技术的人,而Keras的使用率差不多一样高。

KDnuggets有好几年的数据。尽管我在分析中只使用了2018年的数据,我需要指出,2017年后,Caffe、Theano、MXNET、CNTK的使用量下降了。

谷歌搜索热度

最大搜索引擎上的网络搜索量是一项很好的评估流行度的指标。我查看了过去一年谷歌趋势的搜索历史。谷歌没有提供搜索量的绝对值,不过它提供了不同搜索项的对比图形。

Keras和TensorFlow的差距不大,PyTorch位居第三,其他框架的搜索量相对较低。

现在,让我们简单看下搜索量随时间的改变趋势,这能提供历史上下文。Google自带两年搜索趋势变化的图表。

红:TensorFlow;黄:Keras;蓝:PyTorch;绿:Caffe

过去一年里,TensorFlow的搜索量没什么显著增长,但Keras和PyTorch的搜索量增加了。谷歌趋势只允许同时比较五个搜索项,所以其他框架在另外的图表上比较——都没显示出什么明显的趋势,除了相对TensorFlow而言极低的搜索量。

发表

我纳入了多种发表类型。让我们先看下Medium文章。

Medium文章

Medium上有很多流行的数据科学文章和指南。


终于出现新赢家了,Keras超过了TensorFlow,而相比其他评估项,FastAI的表现很突出。

我猜想这可能是因为Keras和FastAI对初学者更友好。新的深度学习从业者对这两个框架的兴趣较大,而Medium上有大量教程。

我使用了谷歌的站内搜索,限定时间为12个月内,使用框架名加“learning”(学习)作为关键词——同样是为了避免“caffe”带来的歧义。相比其他关键词组合,这导致的搜索结果下降最少。

现在让我们看下亚马逊上有关这些框架的书籍数量。

亚马逊书籍

我在Amazon.com的图书 > 计算机技术分类下搜索每个深度学习框架的名称。

TensorFlow又获胜了。MXNET的书比期望的多,而Theano的书比期望的少。相对其流行度而言,PyTorch的书不多,这可能是因为这个框架比较年轻。注意这一测量偏向老框架,因为书的出版周期比较长。

ArXiv论文

机器学习方面的学术论文,最常发表在ArXiv上。我同样使用谷歌站内搜索,限定时间为12个月内。

TensorFlow还是第一。注意,相比学术论文而言,Keras在Meidum和亚马逊上要流行得多。PyTorch在这一类别排名第二,显示它在实现新想法方面的灵活性。Caffe的评分也相对较好。

GitHub热度

GitHub热度是另一项框架流行度的指标。我为收藏、分叉、关注、贡献者分别制作了图表,因为这些数据更适合分别呈现,而不是混在一起。

TensorFlow也是最流行的,有大量活跃用户。考虑到FastAI甚至还不满一岁,它在GitHub上的热度相当不错。有意思的是,相比另外三个测度,不同框架的贡献者数量总体而言比较接近。

收集、分析了所有数据后,是时候将它们整合成一个测度了。

影响力评分过程

我是这样得出影响力评分的:

将所有特征的尺度缩放至0到1

聚合在线招聘描述和GitHub热度的子类别

根据下图的权重对类别进行加权

如上图所示,在线招聘描述、KDnuggets一组,网络搜索、发表、GitHub热度一组,平分权重。这样划分看起来是最合适的,平衡了多种类别。

为了便于查看,各项加权评分乘以100

累加每个框架的各项评分以得到单一的影响力评分

下为各个类别的统计数据:

下为加权和聚合子类别后的各项评分:

这就得到了文章开头的图表:

100是最高可能得分,意味着在所有类别都是第一。TensorFlow几乎达到了100分,这并不令人意外,毕竟它在每个类别中都是第一(或者几乎是第一)。Keras毫无争议地位居第二。

我再重复一遍,如果你想要以可交互的方式查看图表,或者分叉Jupyter Notebook,请访问我开头提到的Kaggle Kernel。

未来

目前为止,TensorFlow的领先地位难以动摇。短期内,它应该会继续统治深度学习领域。不过,考虑到深度学习世界的飞速变革,长期来看,TensorFlow的领先可能发生变化。

时间会告诉我们,PyTorch是否能超越TensorFlow,就像React超越Angular一样。这两对框架还挺适合类比的。PyTorch和React都是由Facebook支撑的灵活度很高的框架,通常认为要比谷歌支撑的竞争者更容易使用。

FastAI能获取课程之外的用户吗?它有一大堆自带的学生用户,比Keras对初学者更友好的API。

你觉得未来会怎么样?请留言分享你的想法。

给学习者的建议

如果你掌握了Python、numpy、pandas、sklearn、matplotlib技能,考虑学习一个深度学习框架,我建议你从Keras开始。它的用户数量很大,也受到雇主的认可,Medium上也有很多文章可以参考,API也很容易使用。

如果你已经掌握了Keras,决定下一个要学习的框架不太容易。我建议你选择TensorFlow或者PyTorch,深入学习,以做出很棒的深度学习模型。

如果你想要熟练掌握需求量最大的框架,你应该选择TensorFlow。但研究人员很喜欢用PyTorch,因为它既易用又灵活。Quora上有一个关于选TensorFlow还是PyTorch的问题:https://www.quora.com/Should-I-go-for-TensorFlow-or-PyTorch

如果你具备了这些框架的经验,我建议你留意下FastAI。如果你想学习基础和高级的深度学习技能,可以看下FastAI的免费在线课程。FastAI 1.0许诺让你可以很容易地实现最新的深度学习策略,并快速迭代。

不管你选什么框架,我希望你现在对哪个深度学习框架需求最高,使用最多,文章最多有所了解。

本文来源:Medium

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123901
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    (第10系列)、YOLOv8-Tiny工业优化版(第9系列),满足产线端设备算限制,模型推理速度提升300%。 LabVIEW生态整合 作为工业自动化领域主流开发环境,LabVIEW与深度学习的集成
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战可(11大系列课程,共5000+分钟)

    领域主流开发环境,LabVIEW与深度学习的集成一直是行业痛点。课程提供独家开发的labview调用框架,实现从模型训练(Python)到部署(LabVIEW)的无缝衔接,已成功应用于DIP、AOI
    发表于 12-03 13:50

    云英谷科技入选2025中国半导体企业影响力百强

    11月14日,世界集成电路协会(WICA)主办的“2025全球半导体市场峰会”在上海成功召开。本次峰会发布了2026全球半导体市场趋势展望暨2025中国半导体企业影响力百强及集成电路新锐企业50强报告。云英谷科技股份有限公司荣登“2025中国半导体企业
    的头像 发表于 11-24 15:50 160次阅读

    知存科技荣登2025中国半导体企业影响力百强榜单

    11月14日,在上海举办的2025全球半导体市场峰会上,世界集成电路协会(WICA)重磅发布了《2026全球半导体市场趋势展望暨2025中国半导体企业影响力百强及集成电路新锐企业50强》。知存科技凭借在存算一体领域的技术深耕与行业赋能,荣登 “中国半导体企业
    的头像 发表于 11-20 17:01 520次阅读

    中兴通讯斩获ESG年度传播影响力先锋奖

    近日,在“2025零碳使命国际气候峰会暨绿色发展年度致敬典礼”上,中兴通讯凭借在环境、社会与公司治理(ESG)领域的卓越实践及全球传播影响力,荣获凤凰卫视“ESG年度传播影响力先锋”奖。这一殊荣不仅充分肯定了中兴通讯的可持续发展战略和传播成效,也彰显了公司通过传播推动全球
    的头像 发表于 10-29 15:10 441次阅读

    自动驾驶中Transformer大模型会取代深度学习吗?

    持续讨论。特别是在自动驾驶领域,部分厂商开始尝试将多模态大模型(MLLM)引入到感知、规划与决策系统,引发了“传统深度学习是否已过时”的激烈争论。然而,从技术原理、算成本、安全需求与实际落地路径等维度来看,Transforme
    的头像 发表于 08-13 09:15 3916次阅读
    自动驾驶中Transformer大模型会取代<b class='flag-5'>深度</b><b class='flag-5'>学习</b>吗?

    晶科能源入选2025年《财富》中国ESG影响力

    近日,全球领先的光伏企业晶科能源,凭借卓越的可持续发展理念、技术创新以及零碳解决方案等杰出贡献,从全球300余家企业中脱颖而出,继2024年之后,再次上榜2025年《财富》中国ESG影响力榜,彰显了晶科能源的ESG行业影响力及企业榜样力量。
    的头像 发表于 05-23 15:32 730次阅读

    奇瑞汽车入选2025年《财富》中国ESG影响力

    近日,在《财富》发布的“2025年中国ESG影响力榜”中,奇瑞汽车股份有限公司作为中国汽车制造行业的代表性企业,凭借自身ESG领域的卓越表现入榜,这也是奇瑞汽车连续第二年入榜《财富》中国ESG影响力榜。
    的头像 发表于 05-20 14:40 713次阅读

    海信入选2025年《财富》中国ESG影响力

    近日,2025年《财富》中国ESG影响力榜揭晓,凭借在改善环境、绿色科技、服务员工、支持社区上做出的卓越努力,海信集团连续4年入选该榜单。
    的头像 发表于 05-19 17:49 870次阅读

    大模型时代的深度学习框架

    作者:算魔方创始人/英特尔创新大使刘 在 CNN时代 ,AI模型的参数规模都在百万级别,仅需在单张消费类显卡上即可完成训练。例如,以业界知名的CNN模型: ResNet50 为例,模型参数
    的头像 发表于 04-25 11:43 654次阅读
    大模型时代的<b class='flag-5'>深度</b><b class='flag-5'>学习</b><b class='flag-5'>框架</b>

    嵌入式AI技术之深度学习:数据样本预处理过程中使用合适的特征变换对深度学习的意义

      作者:苏勇Andrew 使用神经网络实现机器学习,网络的每个层都将对输入的数据做一次抽象,多层神经网络构成深度学习框架,可以深度理解数
    的头像 发表于 04-02 18:21 1281次阅读

    2024施耐德电气“可持续影响力奖”重磅出炉

    2024施耐德电气“可持续影响力奖”,国家及区域评选结果重磅出炉!凭借在可持续发展领域的卓越表现,中国区遴选出13家获奖企业!
    的头像 发表于 03-10 11:32 897次阅读

    BP神经网络与深度学习的关系

    ),是一多层前馈神经网络,它通过反向传播算法进行训练。BP神经网络由输入层、一个或多个隐藏层和输出层组成,通过逐层递减的方式调整网络权重,目的是最小化网络的输出误差。 二、深度学习的定义与发展
    的头像 发表于 02-12 15:15 1340次阅读

    飞腾荣登CSDN 2024中国开发者影响力年度榜单

    近日,CSDN 2024中国开发者影响力年度榜单揭晓,飞腾信息技术有限公司(以下简称“飞腾”)凭借OurBMC开源社区的卓越贡献与深厚实力荣获年度“根技术企业”,由飞腾打造的创新产品OpenFDE凭借其创新性与广泛的应用前景,荣获“年度影响力产品-创新产品与解决方案”奖项
    的头像 发表于 01-23 10:00 851次阅读

    华宝新能荣获2024年IT影响中国“年度影响力企业奖”

    近日,2024年度IT影响中国评选结果正式揭晓,深圳市华宝新能源股份有限公司凭借其强大的品牌、卓越的技术创新能力以及在全球市场的广泛影响力,荣获“年度影响力企业奖”。
    的头像 发表于 12-26 09:36 881次阅读