0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软亚洲互联网工程院NLP团队重磅推出开源项目NeuronBlocks

DPVg_AI_era 来源:lq 2019-05-13 09:02 次阅读

近日,为了提高NLP深度学习模型过程中的效率,微软亚洲互联网工程院NLP团队重磅推出开源项目NeuronBlocks,使得上述复杂的任务像搭积木一样简单!

其实,构建NLP深度学习模型就是搭积木。

在构建自然语言理解深度学习模型过程中,研究人员或者工程师们经常需要在编程细节和代码调试上花费大量精力,而不是专注于模型架构设计与参数调整。

为了提升构建深度模型的效率,微软亚洲互联网工程院自然语言理解团队 (STCA NLP Group, Microsoft) 推出了开源项目NeuronBlocks——自然语言处理任务的模块化深度学习建模工具包。

论文地址:https://arxiv.org/abs/1904.09535

项目地址:https://github.com/Microsoft/NeuronBlocks

NeuronBlocks将常用的神经网络层封装为标准模块,通过配置简单的配置文件,就可以轻松构建复杂的深度神经网络模型。与此同时,工具包还提供了一系列针对常见NLP 任务的经典模型。NeuronBlocks能使工程师们在几秒钟内快速构建和训练各种自然语言处理模型。工具包的可扩展性很强,支持快速加入新的神经元模块用于新的网络模型的构建,最大程度地避免重复的代码工作。

目前工具包支持的任务包括:句子分类(二/多分类),文本匹配,序列标注,阅读理解,基于知识蒸馏的模型压缩,等等。

NeuronBlocks设计

NeuronBlocks是基于PyTorch的NLP深度学习建模工具包,可以帮助研究员或者工程师们快速构建自然语言理解任务的深度神经网络模型。该工具包的主要目标是将NLP深度神经网络模型构建的开发成本降到最低,包括模型训练阶段和推断阶段。NeuronBlocks整体框架如下图所示,包括Block Zoo和Model Zoo两个重要组件。

Block Zoo将常用的神经网络层抽象并封装为可重用的标准模块。这些模块将被用于构建各种针对不同自然语言理解任务的深度学习模型。工具包目前支持的标准神经网络模块包括:词嵌入、CNN、LSTM/GPU、Transformer和各种Attention等。

Model Zoo提供大量预构建好的深度神经网络模型,涵盖了常见的NLP任务。这些模型以JSON配置文件的形式呈现,用户可以通过简单修改Model Zoo中的示例模型配置,即可将其应用于自己的任务中。此外,工具包支持Linux和Windows操作系统CPU与GPU处理器、以及PAI等GPU调度平台。

快速开始

NeuronBlocks目前支持:Python 3.6, PyTorch 0.4.1,Linux/Windows,GPU/CPU。

1、获取源码:

gitclonehttps://github.com/Microsoft/NeuronBlocks

2、安装依赖包:

pipinstall-rrequirements.txtpipinstalltorch==0.4.1

3、运行示例模型:

#训练cdPROJECT_ROOTpythontrain.py--conf_path=model_zoo/demo/conf.json#测试pythontest.py--conf_path=model_zoo/demo/conf.json#预测pythonpredict.py--conf_path=model_zoo/demo/conf.json

NeuronBlocks工作流程

用户可以选择Model Zoo中的示例模型(JSON配置文件)开启模型训练,或者利用Block Zoo中的标准神经网络模块自由构建新的模型架构,就像玩乐高积木一样。

模型可视化工具

NeuronBlocks提供了一个模型可视化工具,可以快速绘制模型架构图,如下图所示。

NeuronBlocks优势

模型构建:用户只需要配置简单的JSON文件,就能够构建模型和调整参数,大大减少了模型实现的工作量;

模型分享:可以通过分享JSON配置文件来分享模型,使模型共享变得非常容易。对于不同的任务或模型,用户只需维护一个通用的源码库;

代码重用:可以在各任务与模型间共享神经网络模块,减少重复的编程工作;

平台灵活性:可以在Linux和Windows机器上运行,支持CPU和GPU,也支持像Open PAI这样的GPU管理平台;

模型可视化:提供了一个模型可视化工具,用于观察模型结构及检查JSON配置的正确性;

可扩展性:支持用户贡献新的神经网络模块或者新的模型。

当然,有兴趣的读者可以加入NeuronBlocks开源项目,一起贡献代码!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 深度学习
    +关注

    关注

    73

    文章

    5237

    浏览量

    119904
  • 自然语言处理

    关注

    1

    文章

    509

    浏览量

    13101
  • nlp
    nlp
    +关注

    关注

    1

    文章

    463

    浏览量

    21819

原文标题:【GitHub热门开源】构建NLP深度学习模型其实就是搭积木

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    工业互联网实训是什么?工业互联网实训包括哪些?

    工业互联网实训是一种针对工业互联网领域的培训课程,旨在帮助学员掌握工业互联网的基本概念、技术、应用和发展趋势。通过实训,学员可以了解工业互联网的体系架构、平台功能、应用场景和解决方案,
    的头像 发表于 01-17 17:00 288次阅读

    跨周期,创未来!华秋喜获中国产业互联网十周年-杰出企业

    ,未来也将推动中国经济的快速发展。 12月27日,由中国信息协会指导,B2B内参、产业互联网大视野、产业互联网创新研究联合主办的2023年中国产业互联网企业家年会暨产业
    发表于 01-04 11:57

    工业互联网中的标识解析技术

    工业互联网的核心是数据的价值发现问题,但由于历史原因,“信息孤岛”现象在企业内部、企业之间大量存在。标识解析技术是目前可见解决“信息孤岛”、完成工业大数据汇聚以及在此基础上形成信息融合理解的关键技术。分析了标识解析在工业互联网领域应用要解决的几个关键环节,并且给出了进行工
    发表于 09-19 06:07

    夯实元宇宙未来基建!赛思子母钟系统赋能「微软苏州」人工智能创新研发!

    微软亚洲互联网工程院苏州分院(下面简称“微软苏州”)于2013年落户苏州工业园区,从事互联网
    的头像 发表于 09-01 12:33 1518次阅读
    夯实元宇宙未来基建!赛思子母钟系统赋能「<b class='flag-5'>微软</b>苏州」人工智能创新研发!

    Node RED互联网RGB LED开源项目

    电子发烧友网站提供《Node RED互联网RGB LED开源项目.zip》资料免费下载
    发表于 07-12 11:05 0次下载
    Node RED<b class='flag-5'>互联网</b>RGB LED<b class='flag-5'>开源</b><b class='flag-5'>项目</b>

    互联网时钟(NTP)开源分享

    电子发烧友网站提供《互联网时钟(NTP)开源分享.zip》资料免费下载
    发表于 06-30 09:20 0次下载
    <b class='flag-5'>互联网</b>时钟(NTP)<b class='flag-5'>开源</b>分享

    粒子互联网按钮的西蒙游戏开源分享

    电子发烧友网站提供《粒子互联网按钮的西蒙游戏开源分享.zip》资料免费下载
    发表于 06-20 09:22 0次下载
    粒子<b class='flag-5'>互联网</b>按钮的西蒙游戏<b class='flag-5'>开源</b>分享

    如何将模块连接到互联网和Arduino板?

    我如何将模块连接到互联网和 Arduino 板
    发表于 06-12 06:12

    工业互联网 互联网区别 5g工业互联网是什么

    互联网的安全要求相对工业互联网较低。一般互联网上的信息流通采取的是“传输加密,存储明文”的方式,因为互联网上的信息基本上是非机密性的。但是在工业互联
    的头像 发表于 06-02 17:48 1902次阅读

    如何通过ESP8266共享互联网

    我正在尝试通过 OTA 上传代码。但我无法将所有 ESP8266 都连接到互联网,所以我选择 hc12 进行远程传输。但我对如何通过 ESP8266 共享互联网有疑问。 有任何可能通过 hc12 与 esp8266 共享互联网
    发表于 05-31 08:17

    在数字时钟项目中使用ESP8266,ISP失去互联网连接怎么解决?

    我在数字时钟项目中使用 ESP8266。我遇到的问题是我的 ISP 偶尔会断开互联网连接。该程序发现它仍然连接到 WiFi,但是当它尝试从互联网检索时间时,它会循环直到 ISP 重新建立互联网
    发表于 05-30 06:19

    中科发布“香山”与“傲来”两项开源处理器芯片

    可靠供应链管控平台和源码级自动化编译构建平台,形成基于OpenEuler的社区参考版本,并覆盖服务器、移动和物联网等全应用领域。相关核心关键技术已辐射至RISC-V开源社区与互联网企业,帮助社区和企业
    发表于 05-28 08:43

    如何将房间的窗户连接到互联网

    看看我是如何制作一个很棒的项目的,我将房间的窗户连接到互联网
    发表于 05-22 07:40

    Kindle无法连接到互联网怎么解决?

    其他所有事情,只是无法连接到互联网。这很糟糕,因为我想读一些新书。 我试过关闭飞行模式然后再打开,但没有用。(可能不会,但至少它证明问题不是飞行模式。) 我尝试通过按住电源按钮 20 秒来进行重置,但没有任何效果。 有人知道怎么修这个东西吗?
    发表于 05-15 08:37

    互联网如何实现上网?

    互联网
    YS YYDS
    发布于 :2023年04月30日 20:51:55