0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GitHub上25个最受欢迎的开源机器学习库

电子工程师 来源:未知 作者:李倩 2018-11-14 09:23 次阅读

在过去的几年里,机器学习为各行各业开创了新纪元,诞生了许多成功的案例: Facebook 的面部识别,Netflix 的智能电影推荐系统,PrimaAI 的图像风格转换,Siri 的语音识别,Google Allo 的自然语言处理,及其他很多开发中的项目。

除了这些案例以外,GitHub 上有大量托管的开源机器学习项目。我们挑选了最受大家欢迎的项目,这些项目涵盖 CV、NLP 及语音三大领域的 25 个开源项目,包括:如何让机器学习创作音乐、歌曲;如何为草图、灰度图像上色;图片风格转换;语音风格迁移;在 IOSAndroid 上进行面部检测与情感分类;提供游戏研究平台;最先进的物体检测算法的实现;无人机与汽车的模拟器;损毁图像的恢复工具、人体关键点检测等内容。希望大家能从中学到新的知识并得到启发。

TensorFlow

TensorFlow 是一个用于研究和生产的开源机器学习库。 TensorFlow 为初学者和专家提供了各种API,以便对桌面、移动终端、Web和云进行开发。

TensorFlow 由 Google Brain 团队开发,最初仅供 Google 内部使用。2015年11月 9 日,TensorFlow 在 Apache 2.0 开源许可下发布。最新版本的 TensorFlow 支持 Keras,它是一种用 Python 编写的高级神经网络 API,能够在 TensorFlow, CNTK 或 Theano 之上运行。Keras 也包含 Javascript 和 Swift 的接口

▌Scikit-learn

Scikit-learn 是基于 NumPy、SciPy 和 Matplotlib 的一款简单有效的数据挖掘和数据分析工具。 由于其简单和便捷的功能,它常与 TensorFlow 一起使用。

▌MXNet

除了 TensorFlow 、Keras 和 Scikit-learn 之外,Apache 的 MXNet 也是一款深度学习的框架工具。 它专为提高效率和灵活性而设计,允许混合使用符号和命令式编程,以最大限度地提高效率和生产力。

▌PyTorch

PyTorch 绝对是这个列表里一定要提到的一款应用,它在机器学习爱好者里享有很高的知名度。 PyTorch 基于 Torch ,并由 Facebook 作为其机器学习的框架发布。 PyTorch 是一个 Python 包,它提供两个高级功能:由强 GPU 支持的加速张量计算(如 NumPy ),其深度神经网络是建立在基于磁盘的 autograd 包上。

(来源:https://twitter.com/pytorch/status/966324198758006784)

▌magenta

Magenta 目前还在研究过程中,它致力于探索如何让机器学习参与艺术和音乐的创作。 它主要涉及创新开发深度学习和强化学习的算法以用于生成歌曲、图像、绘图和其他素材。 同时,Magenta 也是对于如何构建智能工具和界面的探索,它允许艺术家和音乐家使用这些模型扩展(而不是取代!)他们的创作路径。

它主要的库适配于 python ,除此之外也有 Javascript 的版本 — magenta.js 。 在艺术创作里,大部分人可能从未想过高级机器学习可以使用在这个领域,但 Megenta 向人们完美地展示了应用的可能性。点击这里观看这些令人惊叹的声音和绘图生成器的演示吧。

▌style2paints

该项目旨在为线稿着色。 AI 可以根据既定的颜色样式在草图上绘制、或在草图上创建绘制自己的颜色风格、亦或者将现有的风格转换至另一种风格。

有一些值得一看的新的功能,例如色彩锚和图像过渡。

▌Image-to-image translation in PyTorch

该项目有两个组成部分,CycleGAN 和 pix2pix 。基于 PyTorch ,它们可以实现用于未配对和成对的图像到图像转换。 乍看之下,它仿佛只是一种相当普通的风格转移解决方案,事实上,它跟其他应用不一样。比如它能将图片里普通的马转换为斑马或从实景照片转换为莫奈风格的画作。并且它的处理速度快到足以在实时视频上应用。

▌Deep voice conversion

列表上已经罗列了一些用于图像和视频的风格转换工具了,但是语音呢? 深度语音转换便是此功能的完美示例。

如果你可以模仿名人的声音或拥有著歌手一样歌喉,你会怎么干点什么? 深度语音转换的目的是将任意人的声音转换为特定的目标声音,也就是所谓的语音风格转移。项目开始时,我们目标将任意人的声音转换为著名的英国女演员 Kate Winslet 的声音。 我们使用了一个深度神经网络和由 Kate Winslet 朗读的2小时有声读物作为数据集来实现这一目标。

▌StarGAN in PyTorch

StarGAN 是这篇文章中提到的一个 PyTorch 应用:Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation。它可以将源图像转换成不同的发型、皮肤类型、年龄、性别和不同的情绪。

▌Face detection

面部检测听起来不太吸引人,因为我们可以在 iOS 和 Android 上使用 Core ML 或 ML Kit 轻松地完成这项工作。 但是随着深入了解,你会发现它不仅可以检测面部,还可以检测情绪和性别。

使用 Keras CNN 模型和 OpenCV 在 fer2013 / IMDB 数据集的进行实时人脸检测和情感/性别分类。

▌Deep universal probabilistic programming

Uber AI Labs 构建了这个深度概率编程库,用于简化其运输服务的预测和优化收益。 任何处理概率建模的人都会对这个库感兴趣。

机遇无处不在,从匹配乘客和驾驶员,建议最佳路线,找到最明智的搭配组合,甚至创造下一代智能车辆。 为了解决这些挑战,我们将最先进的人工智能(AI)技术与数据科学家、工程师和其他用户的丰富专业知识相结合。 我们正在探索一种工具优先的方法,使我们和其他人能够制作下一代AI解决方案。

▌ParlAI

作为 Facebook 研究项目的一部分,ParlAI 是一个用于在各种公开可用的对话数据集上训练和评估 AI 模型的框架。 ParlAI 是一个在为研究人员提供访问许多流行数据集的权限的同时,也可以共享和测试对话模型的统一框架。

▌Facets

Facets 一种可视化机器学习数据集的工具。

可视化由 Polymer Web 组件实现,由 Typescript 代码支持,可以轻松嵌入到 Jupyter 笔记本或网页中。

可视化的关键是跨多个数据集的异常检测和分布比较。 有趣的值(例如,大量的缺失数据,或跨多个数据集非常不同的特征分布)以红色突出显示。

▌ELF with AlphaGoZero

ELF 是 AlphaGoZero / AlphaZero 实现的游戏研究平台。 ELF 为游戏研究提供端到端解决方案。 它包括微型实时战略游戏环境,并发模拟,数千台机器的分布式培训,直观的 API ,基于 Web 的可视化以及由 PyTorch 提供支持的强化学习框架。

▌Detectron

Detectron 是 Facebook AI Research 的软件系统,它实现了最先进的物体检测算法,包括 Mask R-CNN 。 它是用 Python 编写的,由 Caffe2 深度学习框架提供支持。

▌Fast Style Transfer

使用 TensorFlow CNN 实现,这可能是图像样式传输的最佳示例之一,顾名思义,它的完成速度非常快。 该项目基于 Gatys 的艺术风格的神经算法, Johnson 对实时样式转换和超分辨率的感知损失以及 Ulyanov 的实例规范化的组合 。

▌Face recognition

此工具提供简单的面部识别 API 。 它可以找到面部特征,并猜出照片中的人物。

使用 dlib 最先进的面部识别功能构建而成,并通过深度学习构建。 该模型在 Wild 标记的 Labeled Faces 中具有 99.38% 的准确度。

这还提供了一个简单的 face_recognition 命令行工具,可以让您从命令行对图像文件夹进行人脸识别!

▌Deep photo style transfer

另一个十分好用的图片风格转换工具。 这篇文章里包含本应用的代码和研究论文: Deep Photo Style Transfer 。 它提供了简单的API来合并样式和源图像。 令人印象深刻的图像样式转移工具。

▌Fast Text

FastText 是一个有效学习单词意思和句子分类的库。

为了更好地了解这个项目,请转到他们的文本分类教程,该教程展示了如何在监督学习中使用该库。 文本分类的目标是将文档(例如电子邮件,帖子,文本消息,产品评论等)分配给一个或多个类别。

▌AirSim

AirSim 是一款基于 Unreal Engine 的无人机,汽车的模拟器。 它是开源的,跨平台的,它支持硬件在环,并支持市面上流行的飞行控制器(如 PX4 )用于物理和视觉逼真的模拟。 这是一个 Unreal 插件,可以简单地插入到你想要的任何 Unreal 的环境中。

▌Image restoration

机器学习可以做的比我们想象的要多。 Deep Image Prior 是基于神经网络的修复图像工具 – 并不是机器学习。

此工具可以恢复带有划痕、坏点和/或不需要的文本标记的损坏图像。

▌Open Pose

Open Pose 代表了第一个在单个图像上联合检测人体、手、面部和足部关键点(总共 135 个关键点)的实时多人系统。

▌PirateAT

PirateAI 在模拟环境(岛屿)中训练自主代理(海盗)。 这个仓库运行一个训练管道,在游戏(寻找宝藏)和模型训练课程( Keras + hyperopt )之间交替。

▌EmojiIntelligence

与此列表中的许多项目相比,这个项目相当简单,但它是学习神经网络如何工作的良好起点。 项目实现是在没有任何库的纯 Swift 中,并且很容易模仿。

▌Deep Exemplar-Based Colorization

它是第一个使用深度学习的基于样本的局部着色工具。 给定参考的彩色图像后,我们的卷积神经网络直接将灰度图像映射到输出彩色图像。 这是基于 Deep Exemplar-based Colorization 论文的实现。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 深度学习
    +关注

    关注

    73

    文章

    5234

    浏览量

    119893
  • tensorflow
    +关注

    关注

    13

    文章

    313

    浏览量

    60242
  • 自然语言处理

    关注

    1

    文章

    509

    浏览量

    13099

原文标题:GitHub上25个最受欢迎的开源机器学习库

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AMR智能仓储机器人为什么会越来越受欢迎?

    AMR智能仓储机器人之所以越来越受欢迎,主要是因为它们具有以下几个优势: 1.提高工作效率: AMR智能仓储机器人可以在仓库环境中自主导航和执行任务,无需人工干预。它们可以快速而准确地搬运货物、进行
    的头像 发表于 03-25 16:56 161次阅读

    Python夺冠!GitHub 2023年度编程语言排行榜

    2023 年,Python 仍然是使用 GitHub 的开发者中最受欢迎的选择之一,占据了几乎 18% 的份额,在所有编程语言中保持领先地位,连续第四年增长 0.5%,巩固了其作为最受欢迎语言的地位。
    的头像 发表于 12-18 14:51 1932次阅读
    Python夺冠!<b class='flag-5'>GitHub</b> 2023年度编程语言排行榜

    机器人技术中常用的路径规划算法的开源

    如何规划机器人的运动方式是机器人开发领域的一大课题,本文分享GitHub的一个机器人技术中常用的路径规划算法的开源库,并用动图直观演示运行过
    的头像 发表于 10-21 09:36 447次阅读
    <b class='flag-5'>机器</b>人技术中常用的路径规划算法的<b class='flag-5'>开源</b>库

    一个Github Star值多少钱?

    这里开源编排平台dagster[5]提供了一个检测思路 —— 他们使用一种被称为unsupervised clustering(无监督聚类)的机器学习技术。简单来讲,我们可以用一组行为特征来描述一个
    的头像 发表于 09-11 16:57 348次阅读
    一个<b class='flag-5'>Github</b> Star值多少钱?

    RISC-V走进高性能应用新阶段 数据中心或成为RISC-V下一个爆发点

    开源的RISC-V已成为中国业界最受欢迎的芯片架构。
    的头像 发表于 08-30 17:05 1260次阅读

    RISC-V 的未来在中国吗

    2023 年 RISC-V 中国峰会上,倪光南院士表示,“RISC-V 的未来在中国,而中国半导体芯片产业也需要 RISC-V,开源的 RISC-V 已成为中国业界最受欢迎的芯片架构”。大家怎么看呢?
    发表于 08-26 14:16

    如何获取和使用Github上的Vitis开放资源

    自从 Vitis 的发布,AMD 在 Github 上也开源了很多资源,方便开发者进行自己的设计,减少产品上市时间。所以我们来看一下如何获取和使用 Github 上的开放资源。
    的头像 发表于 08-23 09:41 579次阅读
    如何获取和使用<b class='flag-5'>Github</b>上的Vitis开放资源

    码垛机器人在生产中受欢迎的原因

    码垛机器人是一种对袋装、箱装、瓶装、灌装、桶装等各种包装的物料进行搬运及整齐有序摆放的工业机器人,主要用于食品、肥料、饮料、化工,建材,电子等行业。 码垛机器人之所以受欢迎,主要是因为
    的头像 发表于 08-15 10:25 171次阅读

    如何使用Arm CMSIS-DSP实现经典机器学习

    通常,当开发人员谈论机器学习(ML)时,他们指的是神经网络(nn)。 神经网络的巨大优势在于,你不需要成为一领域专家,而且可以迅速找到一可行的解决方案。神经网络的缺点是它们通常需要
    发表于 08-02 07:12

    2023年受欢迎8款编程语言排名:Python 第二

    根据DevJobsScanner发布的报告,2023年度(从2022年1月到2023年5月)需求量最大的编程语言数据显示,JavaScript、Python和Java仍然是职场上备受欢迎的编程语言。
    的头像 发表于 07-28 17:57 4534次阅读

    iMX8M Plus将机器学习添加到Yocto精简固件映像?

    我想知道conf/local.conf有什么必要的修改,以便添加机器学习和其他东西,以便在板上部署 AI 功能而不需要 bitbaking imx-image-full,请问?换句话说,我希望固件
    发表于 06-07 06:16

    倪光南院士:RISC-V是中国最受欢迎CPU架构,不受垄断制约

    “今天,RISC-V是中国CPU领域最受欢迎的架构,成为推动新一代信息技术发展的新引擎。”3月2日,由阿里巴巴旗下的平头哥半导体有限公司举办的首届玄铁RISC-V生态大会在上海举行,中国工程院院士倪
    发表于 05-28 08:45

    SD技术原理以及部分实现细节

    SD是CompVis、Stability AI和LAION等公司研发的一个文生图模型,它的模型和代码是开源的,而且训练数据LAION-5B也是开源的。SD在开源90天github仓库就
    的头像 发表于 05-15 17:25 1.2w次阅读
    SD技术原理以及部分实现细节

    如何从github获得的Bluebox存储

    我们已经尝试构建从 github 获得的 Bluebox 存储,但由于大量旧的 Codeaurora URI,早在 Yocto 的配方解析阶段就遇到了问题。似乎影响所有 BSP,无论转速如何(尝试
    发表于 05-06 06:23

    语音芯片排行榜,为何唯创知音WT588F语音芯片如此受欢迎

    随着智能家居、智能玩具、智能机器人等领域的快速发展,语音芯片逐渐成为智能硬件的重要组成部分。在众多语音芯片中,唯创知音WT588F语音芯片备受关注,成为市场上备受欢迎的产品。那么,WT588F语音芯片具备哪些功能,为何如此受欢迎
    的头像 发表于 04-28 10:48 694次阅读
    语音芯片排行榜,为何唯创知音WT588F语音芯片如此<b class='flag-5'>受欢迎</b>