NVIDIA Merlin GPU推荐系统加速大模型训练和推理-电子发烧友网

在每周的预告中，你可以：

了解一周的在线研讨会时间及详细内容，选择感兴趣的研讨会并提前安排收听时间；

找到每场研讨会的参会方式，保存并转发到朋友圈及微信群，与朋友分享精彩内容。

NVIDIA Merlin GPU 推荐系统

加速大模型训练和推理

内容

暌违两年，NVIDIA Merlin 推荐系统公开课将于 7 月 5 日全面上新。本次公开课将由 NVIDIA 高级产品经理高文雯和 NVIDIA 高级开发经理王泽寰分别进行主讲和直播答疑。

NVIDIA Merlin 是专为 GPU 上推荐系统工作流程设计的一款端到端的开源框架，其中包括了数据预处理、功能转换、训练、优化和部署等功能，旨在加速推荐系统工作者的工作流程，简化推荐系统的构建。在今年 3 月，NVIDIA 发布了 NVIDIA Merlin 1.0 超大规模推荐系统。最新版本的 NVIDIA Merlin 提供了对功能、模型的快速迭代，以及部署经过充分训练的推荐程序管道，将功能转换、检索和排名模型作为推理微服务等功能。Merlin 在 GPU 上的加速优化方案包括用于构建基于深度学习的系统的工具，能够处理 TB 级的数据，以便提供更精准的预测并增加点击量。数据科学家可以用不到 50 行代码来训练和部署推荐模型，机器学习工程师也可以轻松地利用分级存储以低延迟高精确率将大模型轻松部署到 Triton 推理平台，同时也支持 TensorFlow 用户使用大规模多 GPU 、多节点模型并行式训练。

「 NVIDIA Merlin 推荐系统公开课」也将在智东西公开课知识店铺上以视频直播的形式进行。感兴趣的朋友千万别错过！

通过本次在线研讨会您将了解以下内容：

端到端推荐系统 NVIDIA Merlin 介绍及最新动态

高达 12 倍加速的高性能训练

低成本训练和部署 TB 级大模型

灵活易用：短短几行代码实验各种模型

日程

7 月 5 日，周二，19:00 – 20:00

演讲嘉宾

高文雯

NVIDIA 高级产品经理

王泽寰

NVIDIA 高级开发经理

当零售遇上 AI

NVIDIA 人工智能平台在购物中心的应用

内容

有这样一群人，他们虽不是零售老兵，却一直以数字化、智能化的独特角度理解并赋能零售；他们的思考从未停歇过：线下零售的核心挑战是什么？人工智能带来的帮助是什么？线下零售的数字化、智能化的最好方案是什么？

如果您也有相同的问题，希望了解 AI 驱动的零售行业解决方案和运营理念，欢迎报名本次线上研讨会。我们将带着您和 NVIDIA、AIBEE以及中电港的专家们一起探讨全球零售 AI 的特点和趋势，分享国内外商场数智化的精彩案例，以及本地的最优实践。

一场零售+ AI 的饕餮盛宴，精彩不容错过。

通过本次在线研讨会您将了解以下内容：

零售数智化的观察和思考

NVIDIA 人工智能平台加速零售行业边缘计算

驱动边缘 AI – NVIDIA Jetson 及相关产品介绍

客流系统 4.0 时代，购物中心如何真正实现精细化运营

日程

7 月 6 日，周三，14:00 – 16:00

演讲嘉宾

任建斌

NVIDIA 零售及工业 IBD

张轶博

NVIDIA 行业开发者关系总监

王之卓

中电港 NVIDIA 产品线 FAE

徐昆

爱笔智能智慧商业地产产品负责人

开创智慧零售新时代

快速完成 NLU 中的意图识别任务 ——

NVIDIA NeMo 实战

内容

意图识别和槽位填充是 NLU 语义理解领域中两个子任务，二者可以联合进行。大部分基于语义理解的智能会话相关的应用都会用到这项技术，它是用来对一段语句所表达的意图进行分类，并查询语句中所有相关的槽位(实体)。例如：明天早上北京是什么样天气? 我们希望将查询分类意图为“天气”，将“北京”检测为位置槽，将“明天早上“检测为日期时间槽。意图识别和槽位填充用以辅助基于语义理解的会话系统返回更加精准的回答。这些需求我们通过 NVIDIA NeMo 就可以快速的完成。

NVIDIA NeMo 是一个用于构建先进的对话式 AI 模型的工具包，它内置集成了自动语音识别 (ASR)、自然语言处理 (NLP) 和语音合成 (TTS)的模型及方法，方便调用先进的预训练模型快速完成对话式 AI 中各类子任务，每个模块都可以轻松地定制、扩展和组合用以创建新的会话式AI模型架构。

本次网络研讨会主要面向有 NLP 和语音 AI 开发需求的开发者。

通过本次在线研讨会您将了解以下内容：

意图识别和槽位填充任务介绍

NVIDIA NeMo 工具简介

适用于 NeMo 的数据集格式

如何使用 NeMo 初始化并训练模型

如何使用 NeMo 进行意图识别模型评估和推理

日程

7 月 7 日，星期四，20:00 – 21:30

演讲嘉宾

李奕澎

NVIDIA 企业开发者社区经理

拥有多年数据分析建模、人工智能自然语言处理开发经验。在自动语音识别、自然语言处理、语音合成等对话式 AI 技术领域有丰富的实战经验与见解。曾开发法律、金融、保险文档中基于实体抽取的智能问答系统，曾开发基于 NLP 知识抽取， KG 知识图谱的建立的科研文档智能检索系统。

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4598

浏览量
101786
gpu

gpu

+关注

关注
27

文章
4426

浏览量
126772
AI

AI

+关注

关注
87

文章
26487

浏览量
264180

原文标题：一周预告丨本周 NVIDIA 在线研讨会精彩亮点抢先看

文章出处：【微信号：NVIDIA_China，微信公众号：NVIDIA英伟达】欢迎添加关注！文章转载请注明出处。

NVIDIA加速微软最新的Phi-3 Mini开源语言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库，用于优化从 PC 到云端的

发表于 04-28 10:36 •138次阅读

利用NVIDIA组件提升GPU推理的吞吐

本实践中，唯品会 AI 平台与 NVIDIA 团队合作，结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）将

发表于 04-20 09:39 •176次阅读

使用NVIDIA Triton推理服务器来加速AI预测

这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。

发表于 02-29 14:04 •224次阅读

NVIDIA 为部分大型亚马逊 Titan 基础模型提供训练支持

本文将介绍亚马逊如何使用 NVIDIA NeMo 框架、GPU 以及亚马逊云科技的 EFA 来训练其最大的新一代大语言模型（LLM）。大语言模型

发表于 11-29 21:15 •329次阅读

NVIDIA Merlin 助力陌陌推荐业务实现高性能训练优化

通过 Merlin 大幅提升大规模深度多目标精排模型训练性能本案例中，NVIDIA 团队与陌陌推荐系统团队深度合作，共同使用

发表于 11-09 10:45 •147次阅读

如何让网络模型加速训练

的博文，对 Pytorch的AMP ( autocast与Gradscaler 进行对比) 自动混合精度对模型训练加速。注意Pytorch1.6+，已经内置torch.cuda.amp，因此便不需要加载

发表于 11-03 10:00 •1130次阅读

如何搭建高效推荐系统？用Milvus和NVIDIA Merlin搭建高效推荐系统

如何搭建一个高效的推荐系统？简单来说，现代推荐系统由训练/推断流水线（pipeline）组成，涉及数据获取、数据预处理、模型训练和调整检索

发表于 11-01 09:30 •668次阅读

周四研讨会预告 | 注册报名 NVIDIA AI Inference Day - 大模型推理线上研讨会

由 CSDN 举办的 NVIDIA AI Inference Day - 大模型推理线上研讨会，将帮助您了解 NVIDIA 开源大型语言模型

发表于 10-26 09:05 •200次阅读

Oracle 云基础设施提供新的 NVIDIA GPU 加速计算实例

生成式 AI 和大语言模型（LLM）不断推动突破性创新，训练和推理对算力的需求也随之急剧上升。这些现代生成式 AI 应用需要全栈加速计算，首先要有能够快速、准确处理大量工作负载的先进

发表于 09-25 20:40 •290次阅读

深度学习框架区分训练还是推理吗

深度学习框架区分训练还是推理吗深度学习框架是一个非常重要的技术，它们能够加速深度学习的开发与部署过程。在深度学习中，我们通常需要进行两个关键的任务，即训练和

发表于 08-17 16:03 •1040次阅读

如何提高YOLOv4模型的推理性能？

使用 PyTorch 对具有非方形图像的 YOLOv4 模型进行了训练。将权重转换为 ONNX 文件，然后转换为中间表示（IR）。无法确定如何获得更好的推理性能。

发表于 08-15 06:58

SIGGRAPH 2023 | NVIDIA 与全球数据中心系统制造商大力推动 AI 与工业数字化的发展

OVX 服务器采用全新 NVIDIA GPU 以加速训练和推理以及图形密集型工作负载，将通过戴尔科技、慧与、联想、超微等公司提供。洛杉矶

发表于 08-09 19:10 •286次阅读

NVIDIA DLI 实战培训 | 加速大语言模型开发的核心技能

实战开发技能 | 实时讲师授课实验用 GPU 环境 | 实名 NVIDIA 证书大语言模型的发展宛如一场风潮席卷全球，激发了企业、学术界和科研机构的无限热情。其庞大且复杂的规模和计算需求，令

发表于 07-14 19:40 •276次阅读

如何使用NVIDIA Triton 推理服务器来运行推理管道

使用集成模型在 NVIDIA Triton 推理服务器上为 ML 模型管道提供服务

发表于 07-05 16:30 •1172次阅读

NVIDIA GPU 助力三维家打造 3D 垂类大模型，引领家居设计变革

案例简介广东三维家信息科技有限公司（以下简称“三维家”），通过采用 NVIDIA GPU 和 NVIDIA 推理加速引擎 TensorRT

发表于 05-17 05:55 •307次阅读