0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软亚洲互联网工程院NLP团队重磅推出开源项目NeuronBlocks

DPVg_AI_era 来源:lq 2019-05-13 09:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,为了提高NLP深度学习模型过程中的效率,微软亚洲互联网工程院NLP团队重磅推出开源项目NeuronBlocks,使得上述复杂的任务像搭积木一样简单!

其实,构建NLP深度学习模型就是搭积木。

在构建自然语言理解深度学习模型过程中,研究人员或者工程师们经常需要在编程细节和代码调试上花费大量精力,而不是专注于模型架构设计与参数调整。

为了提升构建深度模型的效率,微软亚洲互联网工程院自然语言理解团队 (STCA NLP Group, Microsoft) 推出了开源项目NeuronBlocks——自然语言处理任务的模块化深度学习建模工具包。

论文地址:https://arxiv.org/abs/1904.09535

项目地址:https://github.com/Microsoft/NeuronBlocks

NeuronBlocks将常用的神经网络层封装为标准模块,通过配置简单的配置文件,就可以轻松构建复杂的深度神经网络模型。与此同时,工具包还提供了一系列针对常见NLP 任务的经典模型。NeuronBlocks能使工程师们在几秒钟内快速构建和训练各种自然语言处理模型。工具包的可扩展性很强,支持快速加入新的神经元模块用于新的网络模型的构建,最大程度地避免重复的代码工作。

目前工具包支持的任务包括:句子分类(二/多分类),文本匹配,序列标注,阅读理解,基于知识蒸馏的模型压缩,等等。

NeuronBlocks设计

NeuronBlocks是基于PyTorch的NLP深度学习建模工具包,可以帮助研究员或者工程师们快速构建自然语言理解任务的深度神经网络模型。该工具包的主要目标是将NLP深度神经网络模型构建的开发成本降到最低,包括模型训练阶段和推断阶段。NeuronBlocks整体框架如下图所示,包括Block Zoo和Model Zoo两个重要组件。

Block Zoo将常用的神经网络层抽象并封装为可重用的标准模块。这些模块将被用于构建各种针对不同自然语言理解任务的深度学习模型。工具包目前支持的标准神经网络模块包括:词嵌入、CNN、LSTM/GPU、Transformer和各种Attention等。

Model Zoo提供大量预构建好的深度神经网络模型,涵盖了常见的NLP任务。这些模型以JSON配置文件的形式呈现,用户可以通过简单修改Model Zoo中的示例模型配置,即可将其应用于自己的任务中。此外,工具包支持Linux和Windows操作系统CPU与GPU处理器、以及PAI等GPU调度平台。

快速开始

NeuronBlocks目前支持:Python 3.6, PyTorch 0.4.1,Linux/Windows,GPU/CPU。

1、获取源码:

gitclonehttps://github.com/Microsoft/NeuronBlocks

2、安装依赖包:

pipinstall-rrequirements.txtpipinstalltorch==0.4.1

3、运行示例模型:

#训练cdPROJECT_ROOTpythontrain.py--conf_path=model_zoo/demo/conf.json#测试pythontest.py--conf_path=model_zoo/demo/conf.json#预测pythonpredict.py--conf_path=model_zoo/demo/conf.json

NeuronBlocks工作流程

用户可以选择Model Zoo中的示例模型(JSON配置文件)开启模型训练,或者利用Block Zoo中的标准神经网络模块自由构建新的模型架构,就像玩乐高积木一样。

模型可视化工具

NeuronBlocks提供了一个模型可视化工具,可以快速绘制模型架构图,如下图所示。

NeuronBlocks优势

模型构建:用户只需要配置简单的JSON文件,就能够构建模型和调整参数,大大减少了模型实现的工作量;

模型分享:可以通过分享JSON配置文件来分享模型,使模型共享变得非常容易。对于不同的任务或模型,用户只需维护一个通用的源码库;

代码重用:可以在各任务与模型间共享神经网络模块,减少重复的编程工作;

平台灵活性:可以在Linux和Windows机器上运行,支持CPU和GPU,也支持像Open PAI这样的GPU管理平台;

模型可视化:提供了一个模型可视化工具,用于观察模型结构及检查JSON配置的正确性;

可扩展性:支持用户贡献新的神经网络模块或者新的模型。

当然,有兴趣的读者可以加入NeuronBlocks开源项目,一起贡献代码!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123926
  • 自然语言处理

    关注

    1

    文章

    629

    浏览量

    14567
  • nlp
    nlp
    +关注

    关注

    1

    文章

    491

    浏览量

    23198

原文标题:【GitHub热门开源】构建NLP深度学习模型其实就是搭积木

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中国工程院院士倪光南亮相2025开放原子开发者大会

    11月21日,在2025开放原子开发者大会开幕式上,中国工程院院士倪光南作题为《开源RISC-V引领AI时代新浪潮》的主旨报告,全面阐述开源大模型和开源RISC-V在AI时代的战略地位
    的头像 发表于 11-25 17:57 1526次阅读

    比亚迪廉玉波当选中国工程院院士

    2025年11月21日,中国工程院公布了2025年院士增选结果。比亚迪集团首席科学家、汽车总工程师、汽车工程研究院长廉玉波当选中国工程院
    的头像 发表于 11-21 14:40 396次阅读

    工业互联网的重要价值

    工业互联网作为新一代信息通信技术与工业经济深度融合的新型基础设施、应用模式和工业生态,其重要价值体现在经济、产业、社会和技术四个层面,具体如下: 经济价值:驱动增长新引擎 创造显著经济效益 :工业
    的头像 发表于 11-20 09:51 192次阅读

    中科曙光亮相2025世界互联网大会乌镇峰会

    11月6日,2025世界互联网大会乌镇峰会期间,中科曙光正式发布全球首个单机柜级640卡超节点scaleX640,它基于全球领先的开放系统硬件架构打造,并首次在乌镇互联网之光博览会重磅亮相。
    的头像 发表于 11-07 15:49 310次阅读

    鲲云科技入选AII工业互联网应用案例

    重磅发布 “2023-2024 年工业互联网应用案例”,鲲云科技凭借 “基于可重构数据流AI芯片的智慧工地监管平台” 成功入选,成为推动工地安全监管数字化转型的标杆范例。
    的头像 发表于 06-16 17:12 1122次阅读

    中国工程院院士:我国距离传感器强国还有多远?

    【阅读原文】链接查看。     专家档案       尤政,国家卓越工程师团队带头人、中国工程院院士,现任华中科技大学校长,兼任
    的头像 发表于 04-25 16:38 493次阅读
    中国<b class='flag-5'>工程院</b>院士:我国距离传感器强国还有多远?

    IPv6是新质互联网时代,AI 赋能下的网络基石

    近日,在2025(第十五届)中国互联网产业年会上,中国工程院院士邬贺铨指出,未来10年是“数智(新质)互联网”阶段,互联网将在数字化、智能化方向持续迈进。他认为,IPv6相关发展与纯I
    的头像 发表于 03-04 09:24 1117次阅读
    IPv6是新质<b class='flag-5'>互联网</b>时代,AI 赋能下的网络基石

    鲲云科技与中国工业互联网研究成立AI+安全生产联合实验室

    在 2025 年 1 月 14 日举行的智算创新研究开业盛典上,鲲云科技与中国工业互联网研究(以下简称“工联”)正式宣布联合成立“AI+安全生产联合实验室”,工联
    的头像 发表于 01-14 18:01 1563次阅读

    互联网是什么意思

    互联网,通常称为云计算,是一种基于互联网的计算模式,它允许用户通过网络访问和使用远程服务器上的存储、管理和处理数据的资源。主机推荐小编为您整理发布云互联网的详细解释。
    的头像 发表于 01-07 09:50 1018次阅读