0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA AI Enterprise 加速 LLM 与推荐系统开发在线研讨会

NVIDIA英伟达 来源:未知 2023-07-10 20:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

生成式 AI 的大火,让 AI 不再是一个学术层面的概念竞赛,而是能够有效提升各行各业的生产力。但是在应用开发的层面上,AI 技术面临着不少挑战。尤其是在企业级 AI 应用中,如何将模型部署到生产环境,如何确保模型部署后的可用性和可靠性,以及如何监控和维护模型的性能等都是开发中需要解决的问题以及困难所在,这些问题也极大地制约了企业在开发 AI 应用上的生产力提升。

NVIDIA AI Enterprise是一款面向企业级 AI 应用的一站式开发平台,也被视作 NVIDIA AI 加速平台的操作系统,为 NVIDIA 的加速基础架构提供稳定可靠的软件及开发环境,借助开发和部署优化的云原生和加速 SDK 软件套件和框架,实现 AI 工作流的快速开发和应用部署。

7 月 11 日下午 2 点,智东西公开课联合 NVIDIA 策划推出「 NVIDIA AI Enterprise 加速 LLM 与推荐系统开发在线研讨会」。研讨会邀请到 NVIDIA 开发者发展经理崔晓楠、NVIDIA 消费互联网事业部解决方案团队高级机器学习架构师张海辰和 NVIDIA 产品经理高文雯参与主讲。

其中,崔晓楠将以《NVIDIA AI Enterprise 助力并延展大模型 AI 工作流》为主题,分享 NVIDIA AI Enterprise 的最新更新内容及特性。之后,张海辰将围绕主题于 NVIDIA NeMo 框架的 LLM 部署实践》,着重介绍端到端云原生框架 NVIDIA NeMoTM,以及其是如何支持开发者构建、定制以及部署 AI 模型。

最后,来自 NVIDIA 总部的 Merlin 产品经理高文雯,将就主题《利用 NVIDIA Merlin 训练部署高性能推荐系统》,为大家介绍 NVIDIA MerlinTM 是如何助力数据科学家、机器学习工程师和研究院大规模的构建高性能推荐系统,从而获得更好的预测、更高的点击率和更快的系统部署。

NVIDIA AI Enterprise 加速LLM

与推荐系统开发在线研讨会

直播时间

2023 年 7 月 11 日 1400

演讲嘉宾&主题

14:00 - 14:20

NVIDIA AI Enterprise 助力

并延展大模型 AI 工作流

针对大模型等场景,在最新的 NVIDIA AI Enterprise 软件堆栈中,包含了针对 NeMo Framework 的官方支持。同时,针对推荐系统,语音,视觉大模型,多模态等应用方向也会在 NVIDIA AI Enterprise 的堆栈中获得支持。

在应用的部署上,NVIDIA AI Enterprise 支持应用的加速再到任意位置的大规模部署,甚至延展到多云部署的架构。本次分享将会对 NVIDIA AI Enterprise 软件套件的最新更新进行深度讲解。

演讲嘉宾

94f703a4-1f1c-11ee-962d-dac502259ad0.jpg

崔晓楠

NVIDIA 开发者发展经理

14:20 - 14:40

基于 NVIDIA NeMo 框架

的 LLM 部署实践

NVIDIA NeMo 是 NVIDIA AI 平台的一部分,是一个端到端云原生企业框架,用于构建、客户化和部署具有数十亿参数的生成式 AI 模型。

NeMo 框架通过多 GPU 和多节点配置,通过 3D 并行技术加速训练工作流程,提供多种客户化技术选择,以及针对语言和图像应用的大规模模型的优化推理。NeMo 使企业的生成式 AI 模型开发变得简单、经济、快速。

本次分享会深度讲解 NVIDIA NeMo 框架,以及面向开发者的 LLM 模型构建、定制和部署。

演讲嘉宾

9517ea42-1f1c-11ee-962d-dac502259ad0.jpg

张海辰

NVIDIA 消费互联网事业部解决方案团队

高级机器学习架构师

14:40 - 15:00

利用 NVIDIA Merlin

训练部署高性能推荐系统

NVIDIA Merlin 是 NVIDIA AI 平台的一部分,提供训练和部署推荐模型的解决方案。本次分享将围绕 Merlin 的上层 API 和底层加速包展开。

其中,上层 API 包括 Merlin models 和 Merlin systems 。Merlin models 可以帮助开发者轻松搭建 session-based 以及 transformer 模型,而 Merlin systems 则提供工具搭建端到端的多个 stage 的推荐系统。

底层加速包包括 Distributed-Embeddings (TFDE) 和 Hierarchical Parameter Server (HPS)。TFDE 可以通过 3 行 TF 的 API 轻松实现多机多卡的大模型同步训练,HPS 则可以通过 GPU cache 和多级存储加速大模型的部署。

演讲嘉宾

953e23ba-1f1c-11ee-962d-dac502259ad0.jpg

高文雯

NVIDIA 产品经理

扫描二维码即刻报名

9577e47e-1f1c-11ee-962d-dac502259ad0.png

相关资料

958931c0-1f1c-11ee-962d-dac502259ad0.png

扫描上方二维码试用

NVIDIA AI Enterprise

959a4b22-1f1c-11ee-962d-dac502259ad0.png

扫描上方二维码试用 NVIDIA Merlin

95ab8d38-1f1c-11ee-962d-dac502259ad0.png

扫描上方二维码立即下载

NVIDIA NeMo Framework

点击“阅读原文”,或扫描下方海报二维码观看 NVIDIA 创始人兼 CEO 黄仁勋在 COMPUTEX 2023 的主题演讲直播回放,主题演讲中文字幕版已上线,了解 AI、图形及其他领域的最新进展!


原文标题:NVIDIA AI Enterprise 加速 LLM 与推荐系统开发在线研讨会

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4041

    浏览量

    97695
  • LLM
    LLM
    +关注

    关注

    1

    文章

    341

    浏览量

    1258

原文标题:NVIDIA AI Enterprise 加速 LLM 与推荐系统开发在线研讨会

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    12月19日,武汉见!| AI×系统工程:2025汽车电子软件研发技术研讨会

    12月19日,经纬恒润将在武汉举办2025汽车电子软件研发技术研讨会。本次研讨会将深度剖析AI如何作为核心驱动力,赋能汽车电子的系统工程。期待您的参会!
    的头像 发表于 12-10 15:55 287次阅读
    12月19日,武汉见!| <b class='flag-5'>AI</b>×<b class='flag-5'>系统</b>工程:2025汽车电子软件研发技术<b class='flag-5'>研讨会</b>

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVID
    的头像 发表于 12-01 09:25 535次阅读

    e络盟与 Analog Devices 共同举办ADI Trinamic 智能控制方案在线研讨会

    e络盟将于2025 年10 月23 日与Analog Devices Inc. (ADI) 联合举办网络研讨会。本次会议将重点介绍ADI Trinamic最新的智能电机控制解决方案,旨在为工程师和开发人员提供前沿的工具和见解,以加速
    的头像 发表于 10-22 10:13 790次阅读
    e络盟与 Analog Devices 共同举办ADI Trinamic 智能控制方案<b class='flag-5'>在线</b><b class='flag-5'>研讨会</b>

    2025 Cadence 中国技术巡回研讨会即将开启 ——系统设计与分析专场研讨会(上海站)

    电子设计自动化领域领先的供应商 Cadence,诚邀您参加“ 2025 Cadence 中国技术巡回研讨会”,会议将集聚 Cadence 的开发者与 Cadence 资深技术专家,探索
    的头像 发表于 10-20 16:09 542次阅读
    2025 Cadence 中国技术巡回<b class='flag-5'>研讨会</b>即将开启 ——<b class='flag-5'>系统</b>设计与分析专场<b class='flag-5'>研讨会</b>(上海站)

    Votee AI借助NVIDIA技术加速方言小语种LLM开发

    Votee AI 利用 NVIDIA 的 GPU 硬件、NeMo Curator 数据处理软件、NeMo Framework 模型训练框架及 Auto Configurator 优化工具,高效构建
    的头像 发表于 08-20 14:21 653次阅读

    如何在魔搭社区使用TensorRT-LLM加速优化Qwen3系列模型推理部署

    TensorRT-LLM 作为 NVIDIA 专为 LLM 推理部署加速优化的开源库,可帮助开发者快速利用最新
    的头像 发表于 07-04 14:38 1768次阅读

    Rambus邀您相约Keysight设备安全研讨会

    ,特别是在加密技术、AI安全、后量子密码学等前沿领域。研讨会涵盖了从嵌入式系统到大规模数据中心的安全挑战与解决方案以及汽车领域的相关安全认证。与会者将有机会了解最新的市场动态、技术突破以及如何应对现代安全威胁。
    的头像 发表于 06-03 15:25 913次阅读

    广和通与火山引擎AI玩具创新研讨会圆满落幕

    近日,由广和通与火山引擎联合主办的"智趣未来 玩转AIAI玩具创新研讨会”在汕头圆满落幕。研讨会聚焦AI玩具商业增长与技术革新,吸引了政府
    的头像 发表于 05-19 13:42 784次阅读

    在线研讨会 | 4/22 Microchip 助力AI更智能

    随着人工智能(AI)技术向边缘计算、实时响应和低功耗场景加速渗透,高性能、高能效的方案成为推动AI创新的核心驱动力。本次研讨会聚焦"Microchip如何赋能
    的头像 发表于 04-08 16:33 675次阅读
    <b class='flag-5'>在线</b><b class='flag-5'>研讨会</b> | 4/22 Microchip 助力<b class='flag-5'>AI</b>更智能

    NVIDIA AI Enterprise助力AI智能体重构工作模式

    无论是为人道主义援助、客户服务还是医疗健康而开发,基于NVIDIA AI Enterprise软件平台构建的 AI 智能体构成了新型数字劳动
    的头像 发表于 03-25 14:59 837次阅读

    Oracle 与 NVIDIA 合作助力企业加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速计算和推理软件与 Oracle 的 AI 基础设施以及生成式 AI 服务首
    发表于 03-19 15:24 471次阅读
    Oracle 与 <b class='flag-5'>NVIDIA</b> 合作助力企业<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> 推理

    3月13日在线研讨会 | 主驱电机系统的功能安全设计

    本次研讨会,经纬恒润将结合自身在功能安全方面咨询和实践经验,针对主驱电机系统,从系统架构设计、扭矩监控方案、关断路径设计等多个维度出发,分析探讨主驱电机系统的功能安全实现方案,帮助客户
    的头像 发表于 03-06 13:59 595次阅读
    3月13日<b class='flag-5'>在线</b><b class='flag-5'>研讨会</b> | 主驱电机<b class='flag-5'>系统</b>的功能安全设计

    在线研讨会 | 加速游戏和AI应用,全面认识Imagination DXTP GPU

    近日,Imagination宣布推出ImaginationDXTPGPUIP,该产品重新定义了智能手机和其他功耗受限设备的图形和计算加速。它专为高效的效率而设计,能够提供运行AI、游戏和用户界面
    的头像 发表于 03-05 08:33 448次阅读
    <b class='flag-5'>在线</b><b class='flag-5'>研讨会</b> | <b class='flag-5'>加速</b>游戏和<b class='flag-5'>AI</b>应用,全面认识Imagination DXTP GPU

    PI在线研讨会活动预告

    PI公司诚邀您参加由21ic举办的在线研讨会。我们的技术专家将介绍多款高集成电源开关IC产品,在不牺牲空载或峰值负载性能的情况下,在整个负载范围内(包括待机和睡眠模式)实现最大功率变换效率。
    的头像 发表于 01-08 16:41 1054次阅读

    2025电子设计与制造技术研讨会

    本帖最后由 jf_32813774 于 2024-12-26 16:14 编辑 电子工程师不可错过的技术研讨会,终于火热启动了! 为了让广大电子行业从业者共聚一堂,探索前沿科技,共话创新未来
    发表于 12-18 10:23