0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

周四研讨会预告 | 注册报名 NVIDIA AI Inference Day - 大模型推理线上研讨会

NVIDIA英伟达 来源:未知 2023-10-26 09:05 次阅读

由 CSDN 举办的 NVIDIA AI Inference Day - 大模型推理线上研讨会,将帮助您了解 NVIDIA 开源大型语言模型(LLM)推理加速库 TensorRT-LLM及其功能,使用 NVIDIA TritonTM推理服务器进行端到端部署 LLM Serving,以及金融行业的 AI、NLP/LLM 应用场景、客户案例。


通过本次活动,您将了解基于上述产品的 LLM 推理加速和部署的服务化实现管道、性能收益,以及金融行业加速计算解决方案,为您 LLM 和生成式 AI 开发的增效降本提供领先的技术路线参考和知识储备。建议 AI 领域的数据科学家、AI 开发者程序员、MLOps,DevOps,IT 运维及 leader,参与本次线上研讨会。


NVIDIA TensorRT-LLM 和 Triton 是 NVIDIA AI Enterprise 的一部分(https://www.nvidia.cn/data-center/products/ai-enterprise/), 这是一款端到端的 AI 软件平台,为企业级的安全、稳定、管理和支持任务提供至关重要的 AI 推理解决方案。


注册报名 NVIDIA AI Inference

Day - 大模型推理线上研讨会


活动日程



2023/10/26 19:30 – 21:00


研讨会将涵盖以下主题:


1. 利用 NVIDIA TensorRT-LLM 加速大模型推理


  • NVIDIA TensorRT-LLM 简介:产品定位,与原有产品的关系

  • 现支持的模型

  • 现支持的主要功能,如 KV-cache,各种量化方法等

  • 性能

  • 未来路线图


2. 基于 NVIDIA Triton 推理服务器端到端部署 LLM serving


  • NVIDIA TensorRT-LLM 的任务调度方案,in-flight batching 的基础原理

  • NVIDIA Triton 推理服务器的 TensorRT-LLM backend 介绍

  • 基于 Triton 端到端部署 LLM 的完整解决方案(以 Llama 2 70B 为例)

  • 相关 benchmark 参考结果


3. 金融行业 AI 应用场景分享与 NVIDIA 加速计算解决方案介绍


  • 金融行业 AI 应用场景及客户案例

  • NLP/LLM 在金融行业的潜在应用场景

  • NVIDIA 针对金融场景的加速计算解决方案


演讲嘉宾


季光

NVIDIA GPU 加速计算专家团队经理


卢翔龙

NVIDIA 资深解决方案架构师


史永明

NVIDIA 工程与解决方案架构经理


参与方式


微信识别上方二维码,注册参加本次活动


相关资料


快速上手 TensorRT-LLM 的资源如下:


  • 访问 GitHub 仓库,获取开源代码:https://github.com/NVIDIA/TensorRT-LLM

  • 探索 TensorRT-LLM 的示例代码:https://github.com/NVIDIA/TensorRT-LLM/tree/release/0.5.0/examples

    benchmark:https://nvidia.github.io/TensorRT-LLM/performance.html

    以及用户手册:https://nvidia.github.io/TensorRT-LLM/index.html




GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击“阅读原文”扫描下方海报二维码,关注更多会议及活动信息



原文标题:周四研讨会预告 | 注册报名 NVIDIA AI Inference Day - 大模型推理线上研讨会

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3329

    浏览量

    87774

原文标题:周四研讨会预告 | 注册报名 NVIDIA AI Inference Day - 大模型推理线上研讨会

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【大大速递】与技术专家在线交流,12月热门研讨会正在报名

    大联大友尚 ST智慧科技,玩转IoT技术与AI生态系 在线研讨会 研讨会时间: 2023年12月12日 1000 点击查看研讨会详情 报名
    的头像 发表于 12-07 10:55 208次阅读
    【大大速递】与技术专家在线交流,12月热门<b class='flag-5'>研讨会</b>正在<b class='flag-5'>报名</b>中

    【北京线下】开始报名!数字设计与签核研讨会专场 — 2023 Cadence 中国技术巡回研讨会

    ,与您分享数字设计与签核解决方案,并与技术专家们面对面直接沟通交流。Cadence 期待您的参与! 会议报名 Cadence 将在 北京 开展 “数字设计与签核研讨会 专场 ” 。 您可以 扫描下方二维码
    的头像 发表于 11-16 16:30 215次阅读
    【北京线下】开始<b class='flag-5'>报名</b>!数字设计与签核<b class='flag-5'>研讨会</b>专场 — 2023 Cadence 中国技术巡回<b class='flag-5'>研讨会</b>

    【大大速递】11月热门研讨会已开启报名,满满技术干货等您参加!

    大联大世平集团 NXP BLE 产品在 Smart Car Access 的应用 在线研讨会 研讨会时间: 2023年11月07日 1000 点击查看研讨会详情 报名快速通道 观看视频
    的头像 发表于 11-02 18:15 253次阅读
    【大大速递】11月热门<b class='flag-5'>研讨会</b>已开启<b class='flag-5'>报名</b>,满满技术干货等您参加!

    这场研讨会硬件工程师不要错过

    加工等环节深入讲解,全程干货分享,通过实际案例方便大家理解。华秋也希望通过研讨会活动,拉近与客户之间的距离,倾听客户的心声,不断学习进步,“让华秋更好地服务客户”。 如果您也想参与本次研讨会,欢迎点击
    发表于 10-27 11:48

    【华秋研讨会】这场研讨会硬件工程师不要错过

    加工等环节深入讲解,全程干货分享,通过实际案例方便大家理解。华秋也希望通过研讨会活动,拉近与客户之间的距离,倾听客户的心声,不断学习进步,“让华秋更好地服务客户”。 如果您也想参与本次研讨会,欢迎点击
    发表于 10-27 11:44

    【大大速递】了解物联网应用、getTMR传感器技术,赶紧报名热门研讨会

    大联大品佳集团 智慧零售创意无限 - MediaTek Genio IoT 平台 在线研讨会 研讨会时间: 2023年10月26日 1000 点击查看研讨会详情 报名快速通道 观看视频
    的头像 发表于 10-20 01:10 217次阅读
    【大大速递】了解物联网应用、getTMR传感器技术,赶紧<b class='flag-5'>报名</b>热门<b class='flag-5'>研讨会</b>!

    STM32研讨会9月场完美收官,10月场火热报名

    · 时隔近两年, STM32全国巡回研讨会 于9月12 日 在杭州官宣回归! 今年的研讨会 由半天延长至全天 为蝶粉带来更新的新品 更前沿的技术方案 更完备的开发工具链 更全面的产品生态 我们已走过
    的头像 发表于 09-27 17:10 274次阅读
    STM32<b class='flag-5'>研讨会</b>9月场完美收官,10月场火热<b class='flag-5'>报名</b>中

    【大大速递】工程师必看车用主题研讨会,正在火热报名中!

    大联大友尚集团 ST 疲劳驾驶与舱内监控专用智能影像传感器解决方案 在线研讨会 研讨会时间: 2023年9月19日 1000 点击查看研讨会详情 报名快速通道 观看视频get更多本场
    的头像 发表于 09-14 18:15 284次阅读
    【大大速递】工程师必看车用主题<b class='flag-5'>研讨会</b>,正在火热<b class='flag-5'>报名</b>中!

    【大大速递】速速报名!热门研讨会,技术干货福利多多!

    大联大诠鼎集团 新一代立锜高整合 USB PD 3.1车载充电器电源解决方案 在线研讨会 研讨会时间: 2023年8月29日 1000 点击查看研讨会详情 报名快速通道 观看视频get
    的头像 发表于 08-24 18:05 616次阅读
    【大大速递】速速<b class='flag-5'>报名</b>!热门<b class='flag-5'>研讨会</b>,技术干货福利多多!

    2023年电机驱动与控制技术研讨会报名通知

    2023’(线上)电机驱动与控制技术研讨会正式开启报名!8月12日,期待您的参与! 尊敬的各位电机驱动与控制技术领域的专家、学者和工程师们: 我们诚挚地邀请您参加即将于2023年举办的“(线上
    的头像 发表于 08-02 11:21 618次阅读

    【大大速递】了解AI、USB PD前沿应用技术,这两场研讨会你一定要看!

    大联大品佳集团 沐曦首发,人工智能推理 GPU 曦思 N100 产品及应用 在线研讨会 研讨会时间: 2023年7月13日 1000 点击查看研讨会详情
    的头像 发表于 07-06 18:05 216次阅读

    周二研讨会预告 | 使用 NeMo 结合 AI21 studio 搭建中文场景对话引擎

    在每周的预告中,你可以: 了解 一周的在线研讨会时间及详细内容 ,选择感兴趣的研讨会并提前安排收听时间; 找到 每场研讨会的参会方式 ,保存并转发到朋友圈及微信群,与朋友分享精彩内容。
    的头像 发表于 06-26 19:35 242次阅读
    周二<b class='flag-5'>研讨会</b><b class='flag-5'>预告</b> | 使用 NeMo 结合 <b class='flag-5'>AI</b>21 studio 搭建中文场景对话引擎

    【大大速递】干货多,福利多,技术研讨会火热报名中!

    详情 大联大世平集团 拥抱功能安全,尽享创新科技 在线研讨会 研讨会时间: 2023年7月4日 1000 点击查看研讨会详情 报名快速通道 观看视频get更多本场
    的头像 发表于 06-22 18:15 260次阅读
    【大大速递】干货多,福利多,技术<b class='flag-5'>研讨会</b>火热<b class='flag-5'>报名</b>中!

    6 月 27 日研讨会 | 使用 NeMo 结合 AI21 studio 搭建中文场景对话引擎

    在每周的预告中,你可以: 了解 一周的在线研讨会时间及详细内容 ,选择感兴趣的研讨会并提前安排收听时间; 找到 每场研讨会的参会方式 ,保存并转发到朋友圈及微信群,与朋友分享精彩内容。
    的头像 发表于 06-19 19:15 294次阅读
    6 月 27 日<b class='flag-5'>研讨会</b> | 使用 NeMo 结合 <b class='flag-5'>AI</b>21 studio 搭建中文场景对话引擎

    5月迪文全国巡回研讨会活动预告

    2023年迪文全国巡回研讨会已全面开启。继上海、广州研讨会成功举办后,为响应广大客户需求,迪文科技将陆续在武汉、长沙、东莞、深圳、佛山、杭州、苏州、南京、郑州、青岛、北京、重庆、成都等城市举办“开放
    的头像 发表于 05-05 10:39 296次阅读
    5月迪文全国巡回<b class='flag-5'>研讨会</b>活动<b class='flag-5'>预告</b>