0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Github上Star过千的PyTorch NLP相关项目都在这儿了!

DPVg_AI_era 来源:未知 作者:李倩 2018-07-11 09:35 次阅读

Github 上有许多成熟的 PyTorch NLP 代码和模型, 可以直接用于科研和工程中。本文介绍其中一下 Star 过千的时下热点项目。

AllenNLP 2504 Star

AllenNLP,是AI2公司家的开源项目,致力于成为 PyTorch 下 NLP 算法研究和实现的全能平台。AllenNLP 的设计理念是: 模块化和轻量级。它将 NLP中个各种需求进行了非常好的封装,包括:padding, masking 等等。特别的,AllenNLP 对实验非常友好,实验流程和参数有Json文件配置,并行、重现完全不是问题,而且每一步都有丰富的 log 记录你想记录的一切。

AllenNLP 自身实现了包括:命名实体识别、语义角色标注、阅读理解在内的多种常用算法。AllenNLP是由艾伦人工智能研究所(Allen Institute for Artificial Intelligence)与华盛顿大学(University of Washington)和其他机构的研究人员密切合作建立和维护的。

DrQA 2374 Star

https://github.com/facebookresearch/DrQA

DrQA 是 facebook 开源的开放式阅读理解智能问答算法。原论文发布在 ACL2016上, 名字是:Reading Wikipedia to Answer Open-Domain Questions

链接:

http://www.zhuanzhi.ai/paper/ec2483da392a7e054eeb0f0a58d3ddee。

DrQA是一个用于阅读理解的系统,适用于开放领域的问答。特别是,DrQA致力于解决大规模机器阅读理解。在这种情况下,算法在一个非常大的非结构化文档语料库中寻找问题的答案。因此,系统必须将文档检索(查找相关文档)与文本的机器理解(识别来自这些文档的答案)结合起来。

faieseq 1711 Star

https://github.com/pytorch/fairseq

fairseq是facebook 开源的一个序列建模工具包,而并不是单纯的某个模型的实现。

它允许研究人员和开发人员为机器翻译、自动摘要、语言模型和其他文本生成任务训练自定义模型。它提供了各种Seq2seq 的模型的实现,包括:

Convolutional Neural Networks (CNN)

Dauphin et al. (2017): Language Modeling with Gated Convolutional Networks

Gehring et al. (2017): Convolutional Sequence to Sequence Learning

NewEdunov et al. (2018): Classical Structured Prediction Losses for Sequence to Sequence Learning

NewFan et al. (2018): Hierarchical Neural Story Generation

Long Short-Term Memory (LSTM) networks

Luong et al. (2015): Effective Approaches to Attention-based Neural Machine Translation

Wiseman and Rush (2016): Sequence-to-Sequence Learning as Beam-Search Optimization

Transformer (self-attention) networks

Vaswani et al. (2017): Attention Is All You Need

NewOtt et al. (2018): Scaling Neural Machine Translation

OpenNMT-py 1558 Star

https://github.com/OpenNMT/OpenNMT-py

OpenNMT 全称是Open Source Neural Machine Translation in PyTorch(PyTorch 开源神经翻译模型), 致力于研究促进新idea 在神经翻译,自动摘要,看图说话,语言形态学和许多其他领域的发展。

作为自动翻译的平台型项目, OpenNMT 当然也支持各种文本数据预处理,包括各种 RNN 单元,各种 attention机制,花式日志,语音转文本,看图说话等等。

DeepNLP-models-Pytorch 1256 Star

https://github.com/DSKSD/DeepNLP-models-Pytorch

最后,给大家介绍的是DeepNLP-models in PyTorch。这个库,是韩国的Kim Sungdong同学,在看完 CS224的课后,用 PyTorch 将其中的模型都实现了一遍, 包括:

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43762

    浏览量

    230550
  • GitHub
    +关注

    关注

    3

    文章

    457

    浏览量

    15913
  • nlp
    nlp
    +关注

    关注

    1

    文章

    463

    浏览量

    21816
  • pytorch
    +关注

    关注

    2

    文章

    759

    浏览量

    12824

原文标题:GitHub获赞过千:PyTorch 自然语言处理项目Top 5

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    9月份最热门的机器学习开源项目TOP 5

    `论文和代码相信大家都曾为如何自己实现论文中的代码而苦恼,在互联网上搜索相关的代码可以说是非常的令人煎熬。在这个 repo 中,包含了数以百计的机器学习和深度学习研究论文及其代码。该 repo
    发表于 10-10 13:39

    目前常用的自然语言处理开源项目/开发包大汇总

    StackoverFlow-java or python for nlp相关问题&文章:(1)如何用 Python 中的 NLTK 对中文进行分析和处理? 这个问题下的回答也详说了其他的语音处理包(2)中文分词项目
    发表于 11-26 10:31

    分享几个在GitHub嵌入式相关的开源项目

    关注+星标公众号,不错过精彩内容来源 | 人人都是极客大家平时学习的资源可能来自不同地方,对于程序员来说,Github上高星的开源项目值得了解并学习。今天就给大家分享几个在GitHub上高...
    发表于 10-27 08:10

    大佬都在用的github开源代码库地址

    嵌入式开发有用的github的开源代码库 版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u011559046/article/details
    发表于 11-08 07:56

    在Ubuntu 18.04 for Arm运行的TensorFlow和PyTorch的Docker映像

    TensorFlow和PyTorch是两个最流行的机器学习框架。两者在 Arm 的使用都在增加,从像 Raspberry Pi 这样的小型系统到用于服务器和高性能计算 (HPC) 的大型系统。尽管
    发表于 10-14 14:25

    通过Cortex来非常方便的部署PyTorch模型

    ,Hugging Face 生成的广泛流行的自然语言处理(NLP)库,是建立在 PyTorch 的。Selene,生物前沿 ML 库,建在 PyTorch
    发表于 11-01 15:25

    RV-STAR开发板的DAC的基础用法

    /模拟转换器)。这期内容我们将通过一个用旋钮控制LED亮度的小实验带领大家了解RV-STAR开发板的DAC的基础用法。 系统环境 Windows 10-64bit 软件平台 NucleiStudio
    发表于 08-16 08:24

    NLP-Progress库NLP的最新数据集、论文和代码

    方向是自然语言处理的同学们有福啦,为了跟踪自然语言处理(NLP)的进展,有大量仁人志士在 Github 上维护了一个名为 NLP-Progress 的库。它记录了几乎所有NLP任务的
    的头像 发表于 11-17 09:21 2346次阅读

    GitHub五万星登顶 程序员命令行最全技巧宝典!

    最近两天,「The Art of Command Line(命令行的艺术)」这个开源项目雄踞了 GitHub TOP 榜,直接以 51,727 Star 登上榜首。
    的头像 发表于 06-06 14:02 2198次阅读

    10月份GitHub上最热门的Python开源项目上榜详情

    10月份GitHub上最热门的Python开源项目排行已经出炉啦,一起来看看上榜详情吧: 1 GHunt https://github.com/mxrch/GHunt Star 4.8
    的头像 发表于 11-05 15:29 1611次阅读

    GitHub 40K Star工程师求职记分享

      本文作者是牛客网知名大佬 CyC2018,在他的 GitHub 有一个高达 40K Star 的技术仓库(在所有仓库中排名前五十),可以说在开源项目方面是一骑绝尘的牛人。今天我们分享一下他的求职
    的头像 发表于 12-30 10:15 1602次阅读

    2020年11月Github上最热门的11个开源项目

    11月份GitHub上最热门的开源项目排行已经出炉啦,一起来看看上榜详情吧: 1 tinygrad https://github.com/geohot/tinygrad Star 29
    的头像 发表于 01-04 14:26 3292次阅读
    2020年11月<b class='flag-5'>Github</b>上最热门的11个开源<b class='flag-5'>项目</b>

    github上的pytorch学习资料详细说明

    本文档的主要内容详细介绍的是github上的pytorch学习资料详细说明。
    发表于 02-25 14:48 6次下载

    关于OCR 你想了解的可能都在这儿

    导读 OCR中的研究,工具和挑战,都在这儿了。 介绍 我喜欢OCR(光学字符识别)。对我来说,它代表了数据科学,尤其是计算机视觉的真正挑战。这是一个现实世界的问题,它有很多方法,包括计算机视觉
    的头像 发表于 04-26 13:43 6917次阅读
    关于OCR 你想了解的可能<b class='flag-5'>都在这儿</b>了

    一个Github Star值多少钱?

    这里开源编排平台dagster[5]提供了一个检测思路 —— 他们使用一种被称为unsupervised clustering(无监督聚类)的机器学习技术。简单来讲,我们可以用一组行为特征来描述一个Github账号,比如:
    的头像 发表于 09-11 16:57 347次阅读
    一个<b class='flag-5'>Github</b> <b class='flag-5'>Star</b>值多少钱?