0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

学习资源 | NVIDIA TensorRT 全新教程上线

NVIDIA英伟达 来源:未知 2023-08-04 17:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA TensorRT是一个用于高效实现已训练好的深度学习模型推理过程的软件开发工具包,内含推理优化器和运行环境两部分,其目的在于让深度学习模型能够在 GPU 上以更高吞吐量和更低的延迟运行,目前已在业界得到广泛应用与部署。

为了帮助广大开发者更好地了解 TensorRT,NVIDIA GPU 计算专家团队(Devtech)工程师李玮、王猛基于最新的 8.6.1 版本录制了NVIDIA TensorRT 教程。本系列教程预计 4 小时,包含五个章节,旨在相对全面地介绍 TensorRT。该教程浓缩了 NVIDIA TensorRT 开发团队的技术和经验,以及与客户在合作过程中遇到的各种问题和相应的解决方法,期待开发者们在观看该教程及配套代码库后能有所收获,为学习、科研和工作添砖加瓦。

需要注意的是,在未来版本的 TensorRT 中,部分 API 和用法可能发生变化,该教程内容也会随之进行更新,请在配合代码进行学习的时候,注意开发环境和软件版本,避免兼容性方面的问题。

立即扫码充电!

TensorRT教程介绍

第一部分:TensorRT 简介(时长: 41 分钟)

TensorRT 基本特性和用法Workflow:使用 TensorRT API 搭建Workflow:使用 ONNX-ParserWorkflow:使用框架内 TensorRT 接口 本章节将介绍 TensorRT 的基本特性和用法,并介绍使用 TensorRT 的三种常见工作流程。在该章节中,将从头搭建一个可以在 TensorRT 中运行推理计算的程序,方便了解一些基本 API 的用法,然后分别使用 TensorRT 的原生 API 搭建、使用 Parser 解析 ONNX 模型,以及使用 TensorFlow 和 Pytorch 等平台自带的 TensorRT 接口这三种方法将 TensorRT 用起来。

第二部分:开发辅助工具(时长:24 分钟)

trtexecNetronpolygraphyonnx-graphsurgeonNsightSystems

本章节介绍使用 TensorRT 过程中五个常用的开发辅助工具,它们在性能测试、网络可视化、模型迁移、精度检验、计算图编辑、模型整体性能优化等方面都起到了重要的作用。第二章节将逐一介绍这五个工具,并列举在实际工作中使用这些工具的范例和经验。

第三部分:插件书写(时长:18 分钟)

使用 Plugin 的简单例子关键 API结合使用 Parser 和 PluginPlugin 高级话题使用 Plugin 的例子

本章节将着重介绍 TensorRT Plugin 的相关技术,将从一个最简单的标量加法的 Plugin 例子开始,讲解 Plugin 的原理、特性、用法等,然后介绍一个把 Plugin 和 Parser 结合使用的例子,最后补充一些 Plugin 的高级用法,以及在工作中使用 Plugin 的一些案例。

第四部分:TensorRT高级用法(时长: 28 分钟)

多 OptimizationProfile多 Stream多 ContextCUDAGraphTimingCacheRefitTacticSource硬件兼容+版本兼容更多工具

本章节将介绍 TensorRT 的一些高级话题。这些技术在 TensorRT 的使用过程中不是必须的,但在复杂的实际应用场景中,这些技术对于改善模型性能和内存占用、模型的调试分析、算法精确控制等方面有重要的作用。建议在完成前三个章节的学习后,浏览本章节,将对 TensorRT 的使用起到锦上添花的作用。

第五部分:常见优化策略(时长:1 小时 42 分钟)

概述性能分析工具性能优化实例

本章节将介绍 TensorRT 工作流程中常见的模型优化方法。该部分内容将深入讲解 TensorRT 相关性能分析工具,并以实例方式讲述曾经遇到过的一个模型在移植、优化、部署的过程中使用的优化策略。

wKgaomToPMCACEEQAABDYMZ-TIM441.gif

TensorRT Hackathon、

生成式 AI 模型优化赛

wKgaomToPMCASfeVAAAKhK271LE512.gif

由阿里云、 NVIDIA 联合举办,由阿里云天池平台组织运营的“NVIDIA TensorRT Hackathon 2023 生成式 AI 模型优化赛”正在火热报名中,截止时间 8 月 14 日上午 10:00。该赛事面向全社会开放,接受个人或不多于三人的组队形式参赛。

扫码报名参赛!

wKgaomToPMCAWwrxAAAcWoAng38399.png                    

相关资源链接:

»TensorRT 介绍https://developer.nvidia.com/tensorrt»TensorRT下载:https://developer.nvidia.com/nvidia-tensorrt-download

»TensorRT Cookbook(本教程配套代码,包含视频以外的更多范例代码):https://github.com/NVIDIA/trt-samples-for-hackathon-cn/tree/master/cookbook

»TensorRT文档:https://docs.nvidia.com/deeplearning/tensorrt/developer-guide/index.html

»C++ API文档:https://docs.nvidia.com/deeplearning/tensorrt/api/c_api/

»Python API文档:https://docs.nvidia.com/deeplearning/tensorrt/api/python_api/ 点击“阅读原文”,查看 TensorRT 全新教程! 扫描下方海报二维码,在 8 月 8日聆听NVIDIA 创始人兼 CEO 黄仁勋在 SIGGRAPH 现场发表的 NVIDIA 主题演讲,了解 NVIDIA 的新技术,包括屡获殊荣的研究,OpenUSD 开发,以及最新的 AI 内容创作解决方案。


原文标题:学习资源 | NVIDIA TensorRT 全新教程上线

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97669

原文标题:学习资源 | NVIDIA TensorRT 全新教程上线

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服务为 A
    的头像 发表于 11-03 14:48 592次阅读

    NVIDIA TensorRT LLM 1.0推理框架正式上线

    TensorRT LLM 作为 NVIDIA 为大规模 LLM 推理打造的推理框架,核心目标是突破 NVIDIA 平台上的推理性能瓶颈。为实现这一目标,其构建了多维度的核心实现路径:一方面,针对需
    的头像 发表于 10-21 11:04 754次阅读

    NVIDIA 利用全新开源模型与仿真库加速机器人研发进程

    科研人员及开发者打造功能更强大、适应性更强的机器人。   全新NVIDIA Isaac GR00T 开源基础模型将为机器人赋予接近人类的推理能力,使其能够拆解复杂指令,并借助已有知识与常识执行任务
    的头像 发表于 09-30 09:52 2783次阅读
    <b class='flag-5'>NVIDIA</b> 利用<b class='flag-5'>全新</b>开源模型与仿真库加速机器人研发进程

    DeepSeek R1 MTP在TensorRT-LLM中的实现与优化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上创下了 DeepSeek-R1 推理性能的世界纪录,Multi-Token Prediction (MTP) 实现了大幅提速
    的头像 发表于 08-30 15:47 3967次阅读
    DeepSeek R1 MTP在<b class='flag-5'>TensorRT</b>-LLM中的实现与优化

    NVIDIA RTX AI加速FLUX.1 Kontext现已开放下载

    NVIDIA RTX 与 NVIDIA TensorRT 现已加速 Black Forest Labs 的最新图像生成和编辑模型;此外,Gemma 3n 现可借助 RTX 和 NVIDIA
    的头像 发表于 07-16 09:16 1862次阅读

    如何在魔搭社区使用TensorRT-LLM加速优化Qwen3系列模型推理部署

    TensorRT-LLM 作为 NVIDIA 专为 LLM 推理部署加速优化的开源库,可帮助开发者快速利用最新 LLM 完成应用原型验证与产品部署。
    的头像 发表于 07-04 14:38 1756次阅读

    使用NVIDIA Triton和TensorRT-LLM部署TTS应用的最佳实践

    针对基于 Diffusion 和 LLM 类别的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能显著提升推理速度。在单张 NVIDIA Ada Lovelace
    的头像 发表于 06-12 15:37 1300次阅读
    使用<b class='flag-5'>NVIDIA</b> Triton和<b class='flag-5'>TensorRT</b>-LLM部署TTS应用的最佳实践

    NVIDIA Isaac Sim与NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了机器人仿真参考应用 NVIDIA Isaac Sim 和机器人学习框架 NVIDIA Isaac Lab 的更新,以加速各种形态
    的头像 发表于 05-28 10:06 1753次阅读

    NVIDIA携手合作伙伴提升AI智能体的交互能力

    NVIDIA Enterprise AI Factory 的经验证设计和全新NVIDIA AI Blueprint 可帮助企业部署具有沟通、研究和学习能力的智能 AI 成员至日常运
    的头像 发表于 05-22 09:52 800次阅读

    SOLIDWORKS教育版——全方面的学习资源与教程

    功能,更以其全方面的学习资源与教程,为学生构建了一个从理论到实践、从基础到进阶的完整学习体系。本文将深入探讨SOLIDWORKS教育版如何凭借其丰富的学习
    的头像 发表于 04-23 11:03 666次阅读
    SOLIDWORKS教育版——全方面的<b class='flag-5'>学习</b><b class='flag-5'>资源</b>与教程

    NVIDIA NeMo Guardrails引入三项全新NIM微服务

    NVIDIA NeMo Guardrails 包含全新 NVIDIA NIM 微服务,能够为各行业构建 AI 的企业提高 AI 的准确性、安全性和可控性。
    的头像 发表于 01-18 09:39 1130次阅读

    NVIDIA技术助力Pantheon Lab数字人实时交互解决方案

    本案例中,Pantheon Lab(万想科技)专注于数字人技术解决方案,通过 NVIDIA 技术实现数字人实时对话与客户互动交流。借助 NVIDIA GPU、NVIDIA TensorRT
    的头像 发表于 01-14 11:19 927次阅读

    NVIDIA TensorRT-LLM中启用ReDrafter的一些变化

    Recurrent Drafting (简称 ReDrafter) 是苹果公司为大语言模型 (LLM) 推理开发并开源的一种新型推测解码技术,该技术现在可与 NVIDIA TensorRT-LLM 一起使用。
    的头像 发表于 12-25 17:31 1233次阅读
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT</b>-LLM中启用ReDrafter的一些变化

    【AIBOX应用】通过 NVIDIA TensorRT 实现实时快速的语义分割

    NVIDIA系列AIBOXAIBOX-OrinNano和AIBOX-OrinNX均搭载NVIDIA原装JetsonOrin核心板模组,标配工业级全金属外壳,铝合金结构导热,顶盖外壳侧面采用条幅格栅
    的头像 发表于 12-18 16:33 1134次阅读
    【AIBOX应用】通过 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT</b> 实现实时快速的语义分割

    解锁NVIDIA TensorRT-LLM的卓越性能

    NVIDIA TensorRT-LLM 是一个专为优化大语言模型 (LLM) 推理而设计的库。它提供了多种先进的优化技术,包括自定义 Attention Kernel、Inflight
    的头像 发表于 12-17 17:47 1605次阅读