0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

介绍21种用于机器学习的开源工具

倩倩 来源:lq 作者:CSDN 2019-09-20 11:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

你肯定已经了解流行的开源工具,如R、Python、Jupyter笔记本等。但是,除了这些流行的工具之外还有一个世界——一个隐藏在机器学习工具下的地方。这些并不像他们的同行那样出色,但可以成为许多机器学习任务的救星。

在本文中,我们将介绍21种用于机器学习的开源工具。我强烈建议你花一些时间浏览我提到的每个类别。除了我们通常在课程和视频中学到的东西之外,还有很多需要学习的地方。

面向非程序员的开源机器学习工具

对于来自非编程和非技术背景的人来说,机器学习看起来很复杂。这是一个广阔的领域,我可以想象第一步可能会多么令人生畏。没有编程经验的人能否在机器学习中取得成功?

事实证明,你可以!这里有一些工具可以帮助你跨越鸿沟并进入著名的机器学习世界:

优步路德维希:路德维希允许我们训练和测试深度学习模型,而无需编写代码。您需要提供的只是一个包含数据的CSV文件,一个用作输入的列的列表,以及一个用作输出的列的列表——Ludwig将完成剩下的工作。

KNIME:KNIME允许您使用拖放界面创建整个数据科学工作流程。这种可视化实现整个模型工作流的方法非常直观,在处理复杂的问题陈述时非常有用。

Orange:您不必知道如何编码以便能够使用Orange挖掘数据,处理数据并获得洞察力。

有许多有趣的免费和开源软件可以提供很好的机器学习功能,而无需编写(大量)代码。

另一方面,你可以考虑一些开箱即用的付费服务,例如Google AutoML、Azure Studio、Deep Cognition和Data Robot。

用于模型部署的开源机器学习工具

部署机器学习模型是最容易被忽视但重要的任务之一,它几乎肯定会在采访中出现,所以你可能也很熟悉这个话题。

以下是一些框架,可以更轻松地将你的项目部署到现实世界的设备中。

MLFlow:MLFlow被设计用于使用任何机器学习库或算法,并管理整个生命周期,包括实验、重现性和机器学习模型的部署。

Apple的CoreML:CoreML是一个流行的框架,它可用于将机器学习模型集成到你的iOS / Apple Watch / Apple TV / MacOS应用程序中。关于CoreML的最好的部分是你不需要有关神经网络或机器学习的广泛知识,双赢!

TensorFlow Lite:TensorFlow Lite是一组工具,可帮助开发人员在移动设备(Android和iOS),嵌入式物联网设备上运行TensorFlow模型。

TensorFlow.JS - TensorFlow.JS可以成为你在网络上部署机器学习模型的首选。它是一个开源库,可让你在浏览器中构建和训练机器学习模型。

适用于大数据的开源机器学习工具

大数据是一个研究如何分析、系统地从数据集中提取信息,或者处理传统数据处理应用软件无法处理的太大或太复杂的数据集的领域。想象一下,每天处理数百万条推文进行情感分析。这是一项艰巨的任务,不是吗?

别担心!这里有一些工具可以帮助你处理大数据。

Hadoop:使用大数据最重要和最相关的工具之一是Hadoop项目。Hadoop是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。

Spark:Apache Spark被认为是Hadoop用于大数据应用程序的自然继承者。这个开源大数据工具的关键点在于它填补了Apache Hadoop在数据处理方面的空白。有趣的是,Spark可以处理批量数据和实时数据。

Neo4j:对于所有与数据相关的大问题,Hadoop可能不是明智的选择。例如,当你需要处理大量网络数据或图形相关问题(如社交网络或人口统计模式)时,图形数据库可能是最佳选择。

用于计算机视觉,NLP和音频的开源机器学习工具

“如果我们想要机器思考,我们需要教他们看。”——Fei-Fei Li博士的计算机视觉。

SimpleCV:如果你从事任何计算机视觉项目,必须使用OpenCV。但你有遇到过SimpleCV吗?SimpleCV可以访问几个高性能的计算机视觉库,如OpenCV——无需首先了解位深度、文件格式、色彩空间、缓冲区管理、特征值或矩阵与位图存储,这使计算机视觉变得简单。

Tesseract OCR:你是否使用过创意应用程序,通过使用智能手机的相机扫描文档或购物账单,或者仅仅通过给支票拍照就可以把钱存入银行账户?所有这些应用程序都称之为OCR或光学字符识别软件。Tesseract就是这样一种OCR引擎,能够识别100多种语言,也可以训练识别其他语言。

Detectron:Detectron是Facebook AI Research的软件系统,它实现了最先进的物体检测算法,包括Mask R-CNN。它是用Python编写的,由Caffe2深度学习框架提供支持。

StanfordNLP:StanfordNLP是一个Python自然语言分析包,关于这个库的最好的部分就是它支持超过70种人类语言!

BERT即服务:你们所有的NLP爱好者都会听说过BERT这一来自谷歌的突破性NLP架构,但你可能还没有遇到过这个非常有用的项目。Bert-as-a-service使用BERT作为句子编码器,并通过ZeroMQ将其作为服务托管,允许你仅用两行代码将句子映射到固定长度的表示形式。

Google Magenta:此库提供了用于处理源数据(主要是音乐和图像)的实用程序,使用此数据来训练机器学习模型,最后从这些模型生成新内容。

LibROSA:LibROSA是一个用于音乐和音频分析的Python包。它提供了创建音乐信息检索系统所需的构建块。当我们使用深度学习等语音到文本的应用程序时,它在音频信号预处理中被大量使用。

用于强化学习的开源工具

当谈到机器学习时,RL是最近的热门话题。强化学习(RL)的目标是培养能够与环境互动并解决复杂任务的智能代理,实现机器人自动驾驶汽车等领域的实际应用。以下是一些对RL最有用的培训环境:

谷歌研究足球:谷歌研究足球环境是一个新颖的RL环境,代理商的目标是掌握世界上最受欢迎的运动——足球。这种环境为你提供了大量的控制来训练RL代理。

OpenAI Gym:Gym是一个用于开发和比较强化学习算法的工具包。它支持教学代理从步行到玩乒乓球或弹球戏等游戏。在下面的gif图片中,你可以看到一个正在学习走路的机器人。

Unity ML代理:Unity机器学习代理工具包(ML-Agents)是一个开放源码Unity插件,可以将游戏和模拟作为培训智能代理的环境。通过一个简单易用的Python API,可以使用强化学习、模仿学习、神经进化或其他机器学习方法来训练agent。

Malmo项目:Malmo平台是一个基于Minecraft构建的复杂AI实验平台,旨在支持人工智能的基础研究,由Microsoft开发。

最后指出

正如上面的一组工具可以明显看出,当我们考虑数据科学和人工智能相关的项目时,开源是一条正确的道路。我可能只是触及了冰山一角,但是有许多工具可用于各种任务,使你作为数据科学家的生活更轻松,你只需要知道在哪里查找即可。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    67

    文章

    8564

    浏览量

    137215
  • tensorflow
    +关注

    关注

    13

    文章

    336

    浏览量

    62370
  • 开源工具
    +关注

    关注

    0

    文章

    27

    浏览量

    4787
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    开源项目BomberCat安全测试工具总体介绍

    硬件安全测试缺一款多技术融合的利器吗?今天带来一款开源安全测试工具, 集 NFC 与磁条两大主流卡片技术于一体,专为银行终端、门禁系统等设备的漏洞检测打造,支持卡片读写、模拟、磁条仿冒等核心功能。
    的头像 发表于 02-27 09:19 528次阅读
    <b class='flag-5'>开源</b>项目BomberCat安全测试<b class='flag-5'>工具</b>总体<b class='flag-5'>介绍</b>

    开源鸿蒙和开源欧拉成为开放原子开源基金会首批毕业项目

    11月21日,在2025开放原子开发者大会开幕式上,开放原子开源基金会宣布旗下开源鸿蒙(OpenHarmony)与开源欧拉(openEuler)成为首批毕业项目。
    的头像 发表于 11-25 17:22 979次阅读

    深开鸿捐赠M-Robots项目,以开源鸿蒙统一底座推动机器人产业协同

    2025年11月21日,在2025开放原子开发者大会开幕当天,大会举行了开源项目捐赠签约仪式。深开鸿正式将M-Robots项目捐赠给开放原子开源基金会,标志着这一推动机器人操作系统统一
    的头像 发表于 11-22 14:08 1320次阅读
    深开鸿捐赠M-Robots项目,以<b class='flag-5'>开源</b>鸿蒙统一底座推动<b class='flag-5'>机器</b>人产业协同

    开源鸿蒙驱动机器人与AI产业生态发展,M-Robots OS正式开源

    7月24日,2025开放原子开源生态大会——开源鸿蒙助力机器人与人工智能产业生态发展论坛在北京顺利举行,本次分论坛聚焦机器人和人工智能产业生态发展,探讨
    的头像 发表于 07-26 14:20 1374次阅读
    <b class='flag-5'>开源</b>鸿蒙驱动<b class='flag-5'>机器</b>人与AI产业生态发展,M-Robots OS正式<b class='flag-5'>开源</b>

    全国首个开源鸿蒙机器人操作系统 M-Robots OS 正式开源

    7月24日,在2025开放原子开源生态大会上,深开鸿CEO王成录博士宣布:M-Robots开源项目正式启动。该项目由开放原子开源基金会孵化、深开鸿牵头发起,旨在以开源共建的方式打造基于
    的头像 发表于 07-24 10:56 1204次阅读
    全国首个<b class='flag-5'>开源</b>鸿蒙<b class='flag-5'>机器</b>人操作系统 M-Robots OS 正式<b class='flag-5'>开源</b>

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 3091次阅读

    NVIDIA Isaac Lab可用环境与强化学习脚本使用指南

    Lab 是一个适用于机器人学习开源模块化框架,其模块化高保真仿真适用于各种训练环境,Isaac Lab 同时支持模仿学习(模仿人类)和强
    的头像 发表于 07-14 15:29 2619次阅读
    NVIDIA Isaac Lab可用环境与强化<b class='flag-5'>学习</b>脚本使用指南

    开源工具 Made with KiCad(131):BomberCat 安全测试工具

    “  BomberCat 是一个结合硬件开发与安全测试的开源工具,主要面向电子工程和网络安全领域。用于检测银行终端、门禁系统等设备的漏洞。 ” Made with KiCad 系列将支持新的展示方式
    的头像 发表于 06-19 11:18 8241次阅读
    <b class='flag-5'>开源</b><b class='flag-5'>工具</b> Made with KiCad(131):BomberCat 安全测试<b class='flag-5'>工具</b>

    开源电机驱动,免费直播学习!

    开源电机驱动,免费直播学习!
    的头像 发表于 06-13 10:07 2014次阅读
    <b class='flag-5'>开源</b>电机驱动,免费直播<b class='flag-5'>学习</b>!

    开源鸿蒙工程工具分论坛圆满举办

    近日,开源鸿蒙开发者大会2025(OHDC.2025)工程工具分论坛在深圳圆满举办。本次分论坛由开源鸿蒙IDE SIG组长、华为终端BG工程工具技术专家唐春担任出品人,主题为“
    的头像 发表于 06-05 15:35 1176次阅读

    恩智浦eIQ Time Series Studio工具使用教程之数据智能

    能够通过可视化界面将相应的数据标签(如电弧或无电弧)应用于当前数据图形的不同部分,从而对导入的原始数据进行分类。然后,该工具根据标签对原始数据进行细分,并创建用于训练机器
    的头像 发表于 06-05 10:10 1707次阅读
    恩智浦eIQ Time Series Studio<b class='flag-5'>工具</b>使用教程之数据智能

    NXP eIQ Time Series Studio 工具使用攻略(九)-数据标签

    其中"Data Labeling",数据标签工具使用户能够通过可视化界面将相应的数据标签(如电弧或无电弧)应用于当前数据图形的不同部分,从而对导入的原始数据进行分类。然后,该工具根据标签对原始数据进行细分,并创建
    的头像 发表于 05-22 09:51 1742次阅读
    NXP eIQ Time Series Studio <b class='flag-5'>工具</b>使用攻略(九)-数据标签

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    人部署,详细介绍了基于颜色阈值和深度学习的巡线方法。 二维码识别则广泛应用于机器人定位与任务触发,例如AGV(自动导引车)的路径规划。 深度学习
    发表于 05-03 19:41

    【「# ROS 2智能机器人开发实践」阅读体验】+内容初识

    21讲为底”,详细讲述了ROS基础理论的内容,同时还官方文档提供了Python/C++双语代码,非常详细完整 机器人设计篇(4-6章) 官方是以OriginBot开源套件为原型,涵盖URDF建模
    发表于 04-27 11:24

    大象机器人携手进迭时空推出 RISC-V 全栈开源六轴机械臂产品

    全球80多个国家和地区。 近日,大象机器人联合进迭时空推出全球首款RISC-V全栈开源六轴机器臂“myCobot 280 RISC-V”,为开发者打造全新的机器
    发表于 04-25 17:59