0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA助力微软将AI Transformer模型投入生产用途

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-03-28 09:43 次阅读

Microsoft 的目标是,通过结合使用 Azure 与 NVIDIA GPU 和 Triton 推理软件,率先将一系列强大的 AI Transformer 模型投入生产用途。

如果您的软件能唤起人们喜悦的泪水,您就是在传播欢乐。

Translator 是一项 Microsoft Azure 认知服务,通过应用一些规模庞大的 AI 模型来帮助更多人进行交流。

“有太多精彩的故事可以讲了!” Translator 开发经理 Vishal Chowdhary 表示。

比如,在 2010 年海地遭受 7.0 级地震后,在短短 5 天的冲刺期里为相关应用紧急添加海地克里奥尔语支持,进而为救援人员提供帮助。再比如,祖父母在使用这款软件,与讲着他们不懂的语言的远方孙辈进行第一次实时交流时,感动到哽咽。

雄心勃勃的目标

“我们的愿景是,让成千上万的开发者都已经在使用的这个 API,能打破不同语言、不同模式之间的阻碍。” Chowdhary 说。

考量全球现行的语言大约有 7000 种,这真的是个雄心勃勃的目标。

因此,团队采用了一种强大而复杂的工具,即是混合专家系统(MoE)AI 方法。

在推动自然语言处理快速发展进步的 Transformer 模型中,这是非常先进的一种。它具有 50 亿个参数,其规模比团队在生产过程中用于自然语言处理的最大模型大了 80 倍。

MoE 模型涉及到庞大的计算量,很难找到能将其投入生产环境中使用的用户。在初始测试中,基于 CPU 的服务器无法满足团队要在一秒钟内完成翻译一个文档的要求。

27 倍的提速

随后,该团队使用 NVIDIA Triton 推理服务器(本周 GTC 大会上宣布的 NVIDIA AI Enterprise 2.0 平台的其中一部分)在加速系统上进行了测试。

Chowdhary 说:“借助 NVIDIA GPU 和 Triton,我们得以实现这一目标,且非常高效。”

事实上,相较于未经优化的 GPU 运行时,该团队实现了高达 27 倍的提速。

“这让我们可以构建一个模型来执行不同的语言理解任务,例如汇总、生成文本和翻译等,而不必为每个任务开发单独的模型。” 负责监督测试的 Microsoft 首席研究员 Hanny Hassan Awadalla 表示。

Triton 如何提供帮助

Microsoft 的模型能将大型任务(如翻译多个文档)拆分为许多个小任务,在每个小任务中翻译几百个句子。Triton 的动态批处理功能将诸多此类请求整合起来,从而充分利用 GPU 的强大功能。

对于 Triton 使用 CPU、GPU 或其他加速器在各种模式下运行各种模型的能力,让该团队赞不绝口。

Chowdhary 的团队十多年来一直在开发大规模分布式系统。Chowdhary 表示:“这种解决方案周到地考虑了我的工作场景,提供了我想要的各种功能,就像是我给自己亲手定制的解决方案一样。

在幕后,有两个软件组件是 Triton 取得成功的关键。一个是 NVIDIA 扩展型 FasterTransformer,这是一个处理推理计算的软件层,可支持 MoE 模型。另一个是 CUTLASS,这是一个 NVIDIA 数学库,有助于高效实现模型。

在四周内提供已验证的原型

尽管测试十分复杂,但该团队通过与 NVIDIA 工程师合作并运用 Triton 的强大力量,在不到一个月的时间内就获得了可投入正常运转的端到端原型。

“在如此之短的时间内制作出一款达到可发布程度的产品,这样的效率实在令人印象深刻,对此我真的非常感激。” Awadalla 这样说道。

虽然这是该团队第一次使用 Triton,但 “我们使用它来发布 MoE 模型,不用花费太多力气就重新构建了运行时环境,现在我衷心希望在我们的长期托管系统中纳入这款解决方案。” Chowdhary 补充表示。

采取后续措施

加速后的服务将采用审慎的步骤实施,初期会用于少数几种主要语言的文档翻译。

Chowdhary 表示:“我们的最终目标是,让客户能在所有场景中通过透明的方式获享这些新模型的优点。”

这项工作是 Microsoft 的一项涉猎更广泛的计划的一部分。其目的是推动 Office 和 Teams 等众多产品的进步,帮助各类开发者与客户(从专注于打造一款应用的小型公司到财富 500 强企业)取得发展。

为了给这一计划铺平道路,Awadalla 的团队于去年 9 月发表了一项研究成果,介绍如何在 NVIDIA A100 Tensor Core GPU 上训练具有多达 2 千亿个参数的 MoE 模型。自那之后,该团队还在具有超过 3 千亿个参数的模型上使用 80G 版本的 A100 GPU,将性能提升了 8 倍。

Adawalla 表示:“为了更好地表示更多的语言,尤其是我们手头没有太多数据的语言,模型必定会越来越大。”

原文标题:GTC22 | 促进人际交流:微软使用 NVIDIA Triton 改善 Translator 翻译工具的 AI 质量和效率

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6237

    浏览量

    103076
  • NVIDIA
    +关注

    关注

    14

    文章

    4585

    浏览量

    101694
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4413

    浏览量

    126640
  • AI
    AI
    +关注

    关注

    87

    文章

    26410

    浏览量

    264018

原文标题:GTC22 | 促进人际交流:微软使用 NVIDIA Triton 改善 Translator 翻译工具的 AI 质量和效率

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    让pytorch模型更快速投入生产的方法

    大家好,非常感谢大家的加入。我是马克,在推理和PyTorch方面有着丰富的经验。今天我想和大家谈谈一种让你的模型快速投入生产的方法。训练模型的过程非常艰难,你需要花费大量时间和计算资源。但是推理
    的头像 发表于 01-19 10:38 204次阅读
    让pytorch<b class='flag-5'>模型</b>更快速<b class='flag-5'>投入生产</b>的方法

    Transformer模型部署在端侧,IPC SoC正在普惠AI

    电子发烧友网报道(文/黄晶晶)AI模型袭卷而来,而如何让终端产品插上AI的翅膀会是芯片厂商研发的方向和市场的机会。如今网络摄像机作为智慧城市、智能家居等应用的主流终端发展迅速,IPC SoC芯片
    的头像 发表于 12-08 13:50 491次阅读
    把<b class='flag-5'>Transformer</b>大<b class='flag-5'>模型</b>部署在端侧,IPC SoC正在普惠<b class='flag-5'>AI</b>

    NVIDIA 助力鹰瞳 Airdoc 眼科 AI模型建设与应用

    足的医疗健康需求,鹰瞳 Airdoc 开发了人工智能视网膜影像相关的丰富产品管线,已广泛应用于社区诊所、体检中心、保险公司、视光中心及药房等场所,为用户提供疾病辅助诊断及健康风险评估。 NVIDIA 助力眼科 AI 实现 高效大
    的头像 发表于 11-17 21:30 552次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>助力</b>鹰瞳 Airdoc 眼科 <b class='flag-5'>AI</b> 大<b class='flag-5'>模型</b>建设与应用

    NVIDIA微软 Ignite 2023 技术大会带来多项发布!

    随着微软 Ignite 2023 技术大会的召开,NVIDIA 带来了一系列发布和更新。这次发布涵盖了企业级生成式 AI、Omniverse 和 RTX 等重要内容。 微软首席执行官
    的头像 发表于 11-16 21:35 422次阅读
    <b class='flag-5'>NVIDIA</b> 在<b class='flag-5'>微软</b> Ignite 2023 技术大会带来多项发布!

    利用 NVIDIA Jetson 实现生成式 AI

    近日,NVIDIA 发布了 Jetson 生成式 AI 实验室(Jetson Generative AI Lab),使开发者能够通过 NVIDIA Jetson 边缘设备在现实世界中探
    的头像 发表于 11-07 21:25 480次阅读
    利用 <b class='flag-5'>NVIDIA</b> Jetson 实现生成式 <b class='flag-5'>AI</b>

    Infosys 与 NVIDIA 合作,助力全球企业利用生成式 AI 提高生产

    决方案来提高生产力。 本次扩大合作将把包含模型、工具、运行时的 NVIDIA AI Enterprise 生态系统和 GPU 系统集成至 Infosys
    的头像 发表于 09-21 19:35 256次阅读

    Infosys 与 NVIDIA 合作,助力全球企业利用生成式AI提高生产

    助力全球企业采用生成式AI应用和解决方案来提高生产力。   本次扩大合作将把包含模型、工具、运行时的NV
    发表于 09-21 10:21 159次阅读
    Infosys 与 <b class='flag-5'>NVIDIA</b> 合作,<b class='flag-5'>助力</b>全球企业利用生成式<b class='flag-5'>AI</b>提高<b class='flag-5'>生产</b>力

    NVIDIA AI Enterprise 4.0 推出,助力企业构建生产就绪的生成式 AI 为业务赋能

    时。NVIDIA 正在将专业知识投入到解决方案的开发过程中,助力企业实现这样的飞跃。 推出 NVIDIA AI Enterprise 4.0
    的头像 发表于 09-19 20:20 388次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Enterprise 4.0 推出,<b class='flag-5'>助力</b>企业构建<b class='flag-5'>生产</b>就绪的生成式 <b class='flag-5'>AI</b> 为业务赋能

    在线公开课 | NVIDIA AI 气象预报模型

    9 月 12 日 14 点,NVIDIA 联合智东西公开课策划推出 「NVIDIA AI 气象预测模型在线研讨会」 。研讨会邀请到 NVIDIA
    的头像 发表于 09-11 19:55 407次阅读
    在线公开课 | <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> 气象预报<b class='flag-5'>模型</b>

    SIGGRAPH 2023 | NVIDIA AI Workbench 助力全球企业加速采用自定义生成式 AI

    从 PC 和工作站到企业数据中心、公有云和 NVIDIA DGX 云,新推出的开发者套件在 NVIDIA AI 平台上引入了简化的模型优化与部署。 洛杉矶 — SIGGRAPH — 太
    的头像 发表于 08-09 19:10 282次阅读

    使用 Vision TransformerNVIDIA TAO,提高视觉 AI 应用的准确性和鲁棒性

    Transformer 架构应用于视觉数据的机器学习模型。相比基于 CNN 的同类模型具有一些优势,并能够并行处理大规模输入的数据。
    的头像 发表于 08-04 17:40 360次阅读
    使用 Vision <b class='flag-5'>Transformer</b> 和 <b class='flag-5'>NVIDIA</b> TAO,提高视觉 <b class='flag-5'>AI</b> 应用的准确性和鲁棒性

    使用 NVIDIA TAO Toolkit 5.0 体验最新的视觉 AI 模型开发工作流程

    ,在短时间内达到最先进的精度和生产级吞吐量。 NVIDIA 发布了 NVIDIA TAO 套件 5.0 ,带来了 AI 模型开发方面的突破性
    的头像 发表于 07-31 20:45 411次阅读
    使用 <b class='flag-5'>NVIDIA</b> TAO Toolkit 5.0 体验最新的视觉 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>开发工作流程

    NVIDIA AI 技术助力 vivo 文本预训练大模型性能提升

    vivo AI 团队与 NVIDIA 团队合作,通过算子优化,提升 vivo 文本预训练大模型的训练速度。在实际应用中, 训练提速 60% ,满足了下游业务应用对模型训练速度的要求。通
    的头像 发表于 05-26 07:15 444次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> 技术<b class='flag-5'>助力</b> vivo 文本预训练大<b class='flag-5'>模型</b>性能提升

    NVIDIA微软合作加速企业就绪的生成式 AI

    NVIDIA AI Enterprise 与 Azure 机器学习集成,提供端到端云平台,供开发者构建、部署和管理大型语言模型AI 应用 微软
    的头像 发表于 05-25 09:15 375次阅读
    <b class='flag-5'>NVIDIA</b> 与<b class='flag-5'>微软</b>合作加速企业就绪的生成式 <b class='flag-5'>AI</b>

    NVIDIA 携手微软,在生成式 AI 的新时代推动 Windows PC 创新

    )等游戏渲染技术为代表,正在迅速为生产力、内容创作、游戏等开创计算的新时代。 在 微软 Build 开发者大会 上,NVIDIA微软展示了一系列搭载
    的头像 发表于 05-25 09:15 529次阅读
    <b class='flag-5'>NVIDIA</b> 携手<b class='flag-5'>微软</b>,在生成式 <b class='flag-5'>AI</b> 的新时代推动 Windows PC 创新