0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA AI Enterprise 加速 LLM 与推荐系统开发在线研讨会

NVIDIA英伟达 来源:未知 2023-07-10 20:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

生成式 AI 的大火,让 AI 不再是一个学术层面的概念竞赛,而是能够有效提升各行各业的生产力。但是在应用开发的层面上,AI 技术面临着不少挑战。尤其是在企业级 AI 应用中,如何将模型部署到生产环境,如何确保模型部署后的可用性和可靠性,以及如何监控和维护模型的性能等都是开发中需要解决的问题以及困难所在,这些问题也极大地制约了企业在开发 AI 应用上的生产力提升。

NVIDIA AI Enterprise是一款面向企业级 AI 应用的一站式开发平台,也被视作 NVIDIA AI 加速平台的操作系统,为 NVIDIA 的加速基础架构提供稳定可靠的软件及开发环境,借助开发和部署优化的云原生和加速 SDK 软件套件和框架,实现 AI 工作流的快速开发和应用部署。

7 月 11 日下午 2 点,智东西公开课联合 NVIDIA 策划推出「 NVIDIA AI Enterprise 加速 LLM 与推荐系统开发在线研讨会」。研讨会邀请到 NVIDIA 开发者发展经理崔晓楠、NVIDIA 消费互联网事业部解决方案团队高级机器学习架构师张海辰和 NVIDIA 产品经理高文雯参与主讲。

其中,崔晓楠将以《NVIDIA AI Enterprise 助力并延展大模型 AI 工作流》为主题,分享 NVIDIA AI Enterprise 的最新更新内容及特性。之后,张海辰将围绕主题于 NVIDIA NeMo 框架的 LLM 部署实践》,着重介绍端到端云原生框架 NVIDIA NeMoTM,以及其是如何支持开发者构建、定制以及部署 AI 模型。

最后,来自 NVIDIA 总部的 Merlin 产品经理高文雯,将就主题《利用 NVIDIA Merlin 训练部署高性能推荐系统》,为大家介绍 NVIDIA MerlinTM 是如何助力数据科学家、机器学习工程师和研究院大规模的构建高性能推荐系统,从而获得更好的预测、更高的点击率和更快的系统部署。

NVIDIA AI Enterprise 加速LLM

与推荐系统开发在线研讨会

直播时间

2023 年 7 月 11 日 1400

演讲嘉宾&主题

14:00 - 14:20

NVIDIA AI Enterprise 助力

并延展大模型 AI 工作流

针对大模型等场景,在最新的 NVIDIA AI Enterprise 软件堆栈中,包含了针对 NeMo Framework 的官方支持。同时,针对推荐系统,语音,视觉大模型,多模态等应用方向也会在 NVIDIA AI Enterprise 的堆栈中获得支持。

在应用的部署上,NVIDIA AI Enterprise 支持应用的加速再到任意位置的大规模部署,甚至延展到多云部署的架构。本次分享将会对 NVIDIA AI Enterprise 软件套件的最新更新进行深度讲解。

演讲嘉宾

94f703a4-1f1c-11ee-962d-dac502259ad0.jpg

崔晓楠

NVIDIA 开发者发展经理

14:20 - 14:40

基于 NVIDIA NeMo 框架

的 LLM 部署实践

NVIDIA NeMo 是 NVIDIA AI 平台的一部分,是一个端到端云原生企业框架,用于构建、客户化和部署具有数十亿参数的生成式 AI 模型。

NeMo 框架通过多 GPU 和多节点配置,通过 3D 并行技术加速训练工作流程,提供多种客户化技术选择,以及针对语言和图像应用的大规模模型的优化推理。NeMo 使企业的生成式 AI 模型开发变得简单、经济、快速。

本次分享会深度讲解 NVIDIA NeMo 框架,以及面向开发者的 LLM 模型构建、定制和部署。

演讲嘉宾

9517ea42-1f1c-11ee-962d-dac502259ad0.jpg

张海辰

NVIDIA 消费互联网事业部解决方案团队

高级机器学习架构师

14:40 - 15:00

利用 NVIDIA Merlin

训练部署高性能推荐系统

NVIDIA Merlin 是 NVIDIA AI 平台的一部分,提供训练和部署推荐模型的解决方案。本次分享将围绕 Merlin 的上层 API 和底层加速包展开。

其中,上层 API 包括 Merlin models 和 Merlin systems 。Merlin models 可以帮助开发者轻松搭建 session-based 以及 transformer 模型,而 Merlin systems 则提供工具搭建端到端的多个 stage 的推荐系统。

底层加速包包括 Distributed-Embeddings (TFDE) 和 Hierarchical Parameter Server (HPS)。TFDE 可以通过 3 行 TF 的 API 轻松实现多机多卡的大模型同步训练,HPS 则可以通过 GPU cache 和多级存储加速大模型的部署。

演讲嘉宾

953e23ba-1f1c-11ee-962d-dac502259ad0.jpg

高文雯

NVIDIA 产品经理

扫描二维码即刻报名

9577e47e-1f1c-11ee-962d-dac502259ad0.png

相关资料

958931c0-1f1c-11ee-962d-dac502259ad0.png

扫描上方二维码试用

NVIDIA AI Enterprise

959a4b22-1f1c-11ee-962d-dac502259ad0.png

扫描上方二维码试用 NVIDIA Merlin

95ab8d38-1f1c-11ee-962d-dac502259ad0.png

扫描上方二维码立即下载

NVIDIA NeMo Framework

点击“阅读原文”,或扫描下方海报二维码观看 NVIDIA 创始人兼 CEO 黄仁勋在 COMPUTEX 2023 的主题演讲直播回放,主题演讲中文字幕版已上线,了解 AI、图形及其他领域的最新进展!


原文标题:NVIDIA AI Enterprise 加速 LLM 与推荐系统开发在线研讨会

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4115

    浏览量

    99633
  • LLM
    LLM
    +关注

    关注

    1

    文章

    350

    浏览量

    1394

原文标题:NVIDIA AI Enterprise 加速 LLM 与推荐系统开发在线研讨会

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2026简仪科技全国巡回研讨会青岛站即将举办

    2026简仪科技全国巡回研讨会以“人工智能 (AI) 全面改写测试系统开发模式——模块仪器领域的变革与实践”为主题,聚焦AI技术与测试测量系统
    的头像 发表于 03-24 11:28 530次阅读
    2026简仪科技全国巡回<b class='flag-5'>研讨会</b>青岛站即将举办

    2026简仪科技全国巡回研讨会洛阳站即将举办

    2026简仪科技全国巡回研讨会以“人工智能 (AI) 全面改写测试系统开发模式——模块仪器领域的变革与实践”为主题,聚焦AI技术与测试测量系统
    的头像 发表于 03-19 09:47 577次阅读
    2026简仪科技全国巡回<b class='flag-5'>研讨会</b>洛阳站即将举办

    12月19日,武汉见!| AI×系统工程:2025汽车电子软件研发技术研讨会

    12月19日,经纬恒润将在武汉举办2025汽车电子软件研发技术研讨会。本次研讨会将深度剖析AI如何作为核心驱动力,赋能汽车电子的系统工程。期待您的参会!
    的头像 发表于 12-10 15:55 1649次阅读
    12月19日,武汉见!| <b class='flag-5'>AI</b>×<b class='flag-5'>系统</b>工程:2025汽车电子软件研发技术<b class='flag-5'>研讨会</b>

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVID
    的头像 发表于 12-01 09:25 1441次阅读

    特瑞仕电压检测器网络研讨会问题解答

    11月14日举办了电压检测器(复位IC)网络研讨会。现将研讨会答疑环节中各位提出的问题及解答内容予以公开。
    的头像 发表于 11-26 09:28 801次阅读

    e络盟与 Analog Devices 共同举办ADI Trinamic 智能控制方案在线研讨会

    e络盟将于2025 年10 月23 日与Analog Devices Inc. (ADI) 联合举办网络研讨会。本次会议将重点介绍ADI Trinamic最新的智能电机控制解决方案,旨在为工程师和开发人员提供前沿的工具和见解,以加速
    的头像 发表于 10-22 10:13 1138次阅读
    e络盟与 Analog Devices 共同举办ADI Trinamic 智能控制方案<b class='flag-5'>在线</b><b class='flag-5'>研讨会</b>

    2025 Cadence 中国技术巡回研讨会即将开启 ——系统设计与分析专场研讨会(上海站)

    电子设计自动化领域领先的供应商 Cadence,诚邀您参加“ 2025 Cadence 中国技术巡回研讨会”,会议将集聚 Cadence 的开发者与 Cadence 资深技术专家,探索
    的头像 发表于 10-20 16:09 937次阅读
    2025 Cadence 中国技术巡回<b class='flag-5'>研讨会</b>即将开启 ——<b class='flag-5'>系统</b>设计与分析专场<b class='flag-5'>研讨会</b>(上海站)

    广和通AIoT解决方案亮相2025 STM32研讨会

    近期,由意法半导体主办的STM32全国研讨会先后在北京和上海成功举办。大会聚焦嵌入式与边缘AI技术,吸引众多行业专家、生态合作伙伴及开发者参会,共探AIoT应用趋势。作为意法半导体的长期战略合作伙伴
    的头像 发表于 09-26 12:42 896次阅读

    Votee AI借助NVIDIA技术加速方言小语种LLM开发

    Votee AI 利用 NVIDIA 的 GPU 硬件、NeMo Curator 数据处理软件、NeMo Framework 模型训练框架及 Auto Configurator 优化工具,高效构建
    的头像 发表于 08-20 14:21 1029次阅读

    如何在魔搭社区使用TensorRT-LLM加速优化Qwen3系列模型推理部署

    TensorRT-LLM 作为 NVIDIA 专为 LLM 推理部署加速优化的开源库,可帮助开发者快速利用最新
    的头像 发表于 07-04 14:38 2428次阅读

    安世半导体汽车LED驱动方案在线研讨会回顾

    近日,安世半导体在线研讨会聚焦汽车车身照明系统挑战,深度解读满足ASIL-B 功能安全标准的12/16/24通道线性LED驱动器设计,并探讨如何同步优化系统散热与通信性能。
    的头像 发表于 06-30 10:35 1166次阅读

    LM Studio使用NVIDIA技术加速LLM性能

    随着 AI 使用场景不断扩展(从文档摘要到定制化软件代理),开发者和技术爱好者正在寻求以更 快、更灵活的方式来运行大语言模型(LLM)。
    的头像 发表于 06-06 15:14 1448次阅读
    LM Studio使用<b class='flag-5'>NVIDIA</b>技术<b class='flag-5'>加速</b><b class='flag-5'>LLM</b>性能

    Rambus邀您相约Keysight设备安全研讨会

    ,特别是在加密技术、AI安全、后量子密码学等前沿领域。研讨会涵盖了从嵌入式系统到大规模数据中心的安全挑战与解决方案以及汽车领域的相关安全认证。与会者将有机会了解最新的市场动态、技术突破以及如何应对现代安全威胁。
    的头像 发表于 06-03 15:25 1318次阅读

    广和通与火山引擎AI玩具创新研讨会圆满落幕

    近日,由广和通与火山引擎联合主办的"智趣未来 玩转AIAI玩具创新研讨会”在汕头圆满落幕。研讨会聚焦AI玩具商业增长与技术革新,吸引了政府
    的头像 发表于 05-19 13:42 1081次阅读

    光庭信息超级软件工场闭门圆桌研讨会成功举办

    日前,由光庭信息主办的"AI赋能汽车软件开发新范式——超级软件工场闭门圆桌研讨会"在上海成功举办。本次研讨会汇聚了来自知名主机厂、Tier1、科技企业及行业机构的技术专家代表
    的头像 发表于 05-06 11:41 1128次阅读