0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习实用工具

倩倩 来源:AI课工场 2020-04-15 16:53 次阅读

最近小编学习了很久的机器学习算法,也正在积极的准备找一些机器学习项目来练练手,对于编程工程能力不突出的小编来说,选择困难症犯了。

每次想要真正开始撸项目的时候,到底使用怎样的工具去实现呢?是遵循网上强人的说法”不自己实现的算法都没有灵魂”,还是说秉持选择现有工具开发模型的一贯作风呢?

在目前阶段比较好的方式还是去选用已有的工具或者框架来协助开发。成熟的框架在算法优化和全面上普遍都比个人开发要好,并且使用现有框架和工具能够大大提高开发的效率,如果童鞋们还是想要了解算法开发和实现步骤,可以通过查看源码及官方文档进行了解。

小编今天就给有机器学习开发需求,并对开发的工具有选择困难症的童鞋来推荐一些开源的框架。(小声说,很多网上的工具推荐都是好几个工具并列,这根本没办法治愈选择困难症好嘛!并且推荐的一些工具需要掌握的程度也没有做一些介绍,都去详细了解也会浪费一些时间好嘛!)

数据处理、分析工具

SQL语言(重要指数)

SQL语言作为一种通用的数据库查询语言,它的作用和强大自不用小编过多吹捧,不夸张的说,熟练掌握SQL语言在变化比闪电还快的互联网行业5年内不愁找不到工作。SQL语言不仅在关系型数据库中应用成熟,并且在许多大数据场景中应用也非常广泛,如:Hive、SparkSQL、Kafka、Flink等。

Pandas(重要指数)

Pandas作为Python数据处理、分析三架马车(与Numpy和Scipy)之首,地位摆在那,自然功能也相应的非常突出。它提供了各种高级的工具用于进行数据分析。Pandas有许多内置的方法用于分组统计、合并数据、数据筛选、以及时间序列操作。所有的这些操作都有出色的性能表现。因此,使用Pandas通常用于数据挖掘任务。

Numpy(重要指数)

Numpy是公认的最受欢迎的Python数据分析、机器学习库之一,数组接口是Numpy最佳及最重要的功能。这个接口可以用于把图像、音频、以及其他二进制流数据表示为多维实数数组。Numpy同时也是许多高级类库的底层库。

Scipy(重要指数)

Scipy也是一个常用的Python数据分析库,SciPy库包含了优化器、线性代数、积分、插值、快速傅立叶变换、信号和图像处理、统计等子模块。

总结一下,如果童鞋熟练使用python并手上有一个机器学习的活

学习优先度:pandas》numpy》scipy》SQL

建议掌握程度:

pandas熟练掌握(因为它真的是你以后用得最多的东西)

numpy掌握少数内容(numpy数组和一些创建矩阵、随机数的一些方法),numpy通常适合被大神用来手写算法,童鞋们初级阶段暂可不必了解太深

scipy不太需要特殊掌握(用得着的时候临时去找api即可,比如一些微积分、傅里叶变换、图像处理的问题不太好处理,去找找scipy里的方法吧)

SQL熟练掌握(不解释了,但是在仅熟练Python并需要立即上手完成机器学习和数据挖掘任务时,掌握SQL可以延后,但需要熟练掌握!)

机器学习、深度学习

Sklearn(重要指数)

Sklearn被认为是最优秀的机器学习库甚至没有之一,是一个基于Numpy与SciPy的Python库。它包含了大量用于实现传统机器学习和数据挖掘任务的算法,比如数据降维、分类、回归、聚类、以及模型选择等。

TensorFlow(重要指数)

如果你正在使用Python来从事机器学习项目,那么你一定听说过它,最新版本2.0集合了pytorch的优点,支持动态运算图。也集成了keras,能够以最简便的方式搭建模型,可以说现在的Tensorflow在机器学习、深度学习领域简直无所不能。

Pytorch(重要指数)

优秀的深度学习框架。

Keras(重要指数-)

优秀的深度学习脚手架,可以让深度学习像搭积木那样搭建起来。

Theano(重要指数-)

优秀的深度学习框架。

总结一下,从小编对框架的描述篇幅可以看得出来:

学习优先度:Tensorflow 》》 sklearn 》 pytorch(未包含的建议先不学)

建议掌握程度:

Tensorflow熟练掌握(这是日后用得非常多的框架,学习起来有一定难度,但真的常用)

Sklearn掌握少数内容(sklearn需要熟练掌握其建模流程和规则,因为sklearn实在太规范了,它的学习较简单,但是真的经常会使用到,所以把sklearn当成权威字典随时去查,是小编比较建议的使用方式)

Pytorch可不掌握(框架精通一种即可,尤其tf2.0在支持动态图以后,pytorch的优势也没那么大了)

Keras 可不掌握(tf2.0已经集成了keras,掌握tf2.0直接可以使用)

Theano 可不掌握

整体而言总结一下,需要花时间多学习的工具有:pandas、tensorflow、SQL语言,SQL语言可以等有时间之后再集中学习,不需要花太多时间去学习。把工具当字典的有:sklearn、numpy、scipy,sklearn,需要掌握一些传统机器学习建模流程和规则可以去github上找一些示例看,总体而言使用较简单。其他的工具可以先放一放。小编说的够清楚啦,关上你的手机,赶紧开始学习起来吧。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据处理
    +关注

    关注

    0

    文章

    512

    浏览量

    28249
  • 机器学习
    +关注

    关注

    66

    文章

    8136

    浏览量

    130583
收藏 人收藏

    评论

    相关推荐

    配网故障定位:关键步骤与实用工具

    在现代电力系统中,配网故障定位是一个至关重要的环节。这不仅涉及到电力系统的稳定运行,也关系到电网安全和用户供电的可靠性。本文将深入探讨配网故障定位的主要步骤和实用工具,帮助大家更好地理解这个复杂
    的头像 发表于 01-03 09:38 153次阅读

    labview实用工具详解 配套程序

    https://github.com/kevinli5060/labviewToolExplain_DVD 链接重视这本书的程序,这本书很不错。有很多不错的实例
    发表于 11-16 13:05

    引线拉力测试仪:精准测量和保障安全的实用工具

    引线拉力测试仪:精准测量和保障安全的实用工具
    的头像 发表于 11-14 09:14 207次阅读
    引线拉力测试仪:精准测量和保障安全的<b class='flag-5'>实用工具</b>

    机器学习需要掌握的九种工具盘点

    机器学习是一个快速发展的领域,常用的包更新非常频繁。尽管开发人员做出了努力,但较新的版本通常与旧版本不兼容,这样给研究者带来很多麻烦。幸运的是,有工具可以解决这个问题!在这一方面,Mikhailiuk 推荐了两个
    发表于 10-24 16:12 205次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>需要掌握的九种<b class='flag-5'>工具</b>盘点

    SYNWIT MCU 时钟计算应用工具

    SYNWIT MCU 时钟计算应用工具
    的头像 发表于 10-17 15:20 267次阅读
    SYNWIT MCU 时钟计算应<b class='flag-5'>用工具</b>

    Boltons:超过230个的纯Python实用工具

    推荐另一个第三方库 -- Boltons ,和大多数第三方库不太一样,它并不是针对某一功能的工具库,而是将开发中那些重复性(经常使用)及复杂度较高(不容易编写)较高的代码剥离出来,并按照操作对象分门别类整合在一起的工具库。 Boltons 使用的是 BSD 许可证,到目前
    的头像 发表于 10-17 10:56 250次阅读
    Boltons:超过230个的纯Python<b class='flag-5'>实用工具</b>库

    单片机常用工具

    单片机常用工具
    发表于 10-13 06:16

    机器学习博士推荐需要掌握的九种工具盘点

    机器学习是一个快速发展的领域,常用的包更新非常频繁。尽管开发人员做出了努力,但较新的版本通常与旧版本不兼容,这样给研究者带来很多麻烦。幸运的是,有工具可以解决这个问题!在这一方面,Mikhailiuk 推荐了两个
    发表于 09-26 11:08 252次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>博士推荐需要掌握的九种<b class='flag-5'>工具</b>盘点

    Microchip(微芯)推出MPLAB机器学习开发工具

    机器学习(ML)正成为嵌入式设计人员开发或改进各种产品的标准要求。为满足这一需求,Microchip(微芯)近日推出了全新的MPLAB®机器学习开发
    的头像 发表于 09-12 18:26 574次阅读
    Microchip(微芯)推出MPLAB<b class='flag-5'>机器</b><b class='flag-5'>学习</b>开发<b class='flag-5'>工具</b>包

    Microchip 推出 MPLAB® 机器学习开发工具包,助力开发人员轻松将机器学习集成到 MCU 和 MPU中

    开发工具包,提供一套完整的集成工作流程来简化机器学习模型开发。这款软件工具包可用于Microchip的各类单片机 (MCU) 和微处理器 (MPU) 产品组合,助力开发人员快速高效地添
    的头像 发表于 09-11 15:55 344次阅读

    机器学习有哪些算法?机器学习分类算法有哪些?机器学习预判有哪些算法?

    机器学习有哪些算法?机器学习分类算法有哪些?机器学习预判有哪些算法?
    的头像 发表于 08-17 16:30 1410次阅读

    python数据挖掘与机器学习

    用的数据挖掘和机器学习工具。 一、数据挖掘 数据挖掘是指从大量数据中自动或半自动地发现潜在的关系、规律或模式的过程。Python中有许多数据挖掘工具可供使用,以下是其中一些常用的
    的头像 发表于 08-17 16:29 891次阅读

    RealView BREW链接器和实用程序的编译工具指南

    for BREW工具包由以下主要组件组成: ·命令行开发工具·实用程序·支持软件。 本书介绍了RVCT for BREW提供的ARM链接器、ARM链接和命令行实用工具。 有关提供有关ARM汇编器、编译器和支持软件的信息的RVC
    发表于 08-16 07:46

    使用Datree开源工具防止错误配置乱入k8s生产环境

    它是一个开源 CLI 实用工具,通过管理策略来防止 Kubernetes 工作负载和 SaaS 平台的错误配置。它验证您的 Kubernetes YAML 文件。
    的头像 发表于 07-17 11:51 400次阅读
    使用Datree开源<b class='flag-5'>工具</b>防止错误配置乱入k8s生产环境

    6个Linux 实用工具

    ,继续发现 Linux 为我们提供的更多精彩之处。 1、fold 首先,我们有一个非常有用的小工具,它可以帮助您将输入行按照特定的长度进行换行。您可以通过指定字节数或空格数来定义长度。使用 fold 工具,您可以快速处理具有不同长度的文件。 例如,假设
    的头像 发表于 05-30 09:18 1000次阅读
    6个Linux <b class='flag-5'>实用工具</b>