基于NVIDIA Triton的AI模型高效部署实践-电子发烧友网

在每周的预告中，你可以：

了解一周的在线研讨会时间及详细内容，选择感兴趣的研讨会并提前安排收听时间;

找到每场研讨会的参会方式，保存并转发到朋友圈及微信群，与朋友分享精彩内容。

基于 NVIDIA Triton 的 AI 模型高效部署实践

内容

NVIDIA Triton 推理服务器(以前称为 TensorRT 推理服务器)是一款开源软件，可简化深度学习模型在生产环境中的部署。借助 Triton 推理服务器，Devops 和 MLops 团队可以将各类框架(TensorFlowPyTorch、TensorRT、ONNX Runtime、MXNet、XGBoost 等或自定义框架后端)训练的 AI 模型，在基于 GPU 或 CPU 的本地、数据中心、云、边缘云等平台，快速可靠地部署在诸如 Kubernetes、KFServing、Prometheus、Grafana 等大规模生产环境中，并轻松扩展。

借助 NVIDIA Ampere 架构 Tensor Core 和多实例并行运行多个工作负载( MIG )，Triton 推理服务器可以最大化 A100 GPU 和 A30 GPU 的利用率。它不仅可在单个 NVIDIA GPU 上同时运行多个模型，以更大限度地提高利用率，与 Kubernetes 集成以用于编排、指标和自动扩展，还可以让多个用户共享一个 GPU ，通过将单个 GPU 划分为多个 GPU 实例，让每个实例都有专用的内存和计算资源，在确保执行工作负载的同时，保证服务质量和故障隔离。

本次研讨会 NVIDIA 解决方案架构师张萌将参与主讲环节， NVIDIA 解决方案架构师申意则将主要参与问答环节。

通过本次在线研讨会您将了解以下内容：

应用 Triton 的收益

基于 Ampere 架构多实例 GPU 特性和 K8s 实现 Triton 大规模部署

如何使用 Triton 部署端到端的 CV 模型

Triton 在行业内的一些应用案例

日程

6 月 28 日，周二，19:00 – 20:00

演讲嘉宾

张萌

NVIDIA 解决方案架构师

申意

NVIDIA 解决方案架构师

内容

随着人工智能、数据科学、虚拟仿真等数据流量负载呈现指数增长，企业需要在任何位置都有足够的处理能力，这对传统的数据中心基础设施带来全新挑战与巨大冲击，需要构建现代数据中心来支撑企业业务应用。

NVIDIA BlueField DPU 是一款非常强大的片上数据中心基础设施，可用于卸载、加速和隔离在主机 CPU 上运行的各种软件定义基础设施服务，将数据中心基础设施与业务应用解耦，提升在云计算、数据中心或边缘计算的性能、安全性和效率，突破性能和可扩展性的瓶颈，并消除现代数据中心的安全威胁，简化运营并降低总拥有成本( TCO)。

为了充分发挥 BlueField DPU 这一强大的片上数据中心基础设施硬件能力，简单、高效的 NVIDIA DOCA 软件框架应运而生，为开发者打造一个全面、开放的开发平台，支持广大的开发者在 BlueField DPU 上进行简单、灵活的软件开发，让开发者可以快速创建 BlueField DPU 加速的、高性能应用程序和服务。

本次课程将帮助开发者深入了解如下内容：

什么是 DPU?

NVIDIA BlueField DPU 简介

NVIDA DOCA 软件框架

NVIDIA BlueField DPU 加速功能

日程

6 月 30 日，星期四，20:00 – 21:00

演讲嘉宾

崔岩

NVIDIA 网络技术专家

负责以技术角度推进 DPU 和 DOCA 产品及联合解决方案在中国的市场营销，驱动 DOCA 开发者社区在中国的增长与发展，促进客户与合作伙伴在未来数据中心基础设施上取得成功。

原文标题：一周预告丨本周 NVIDIA 在线研讨会精彩亮点抢先看

文章出处：【微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4599

浏览量
101791
gpu

gpu

+关注

关注
27

文章
4430

浏览量
126780
服务器

服务器

+关注

关注
12

文章
8138

浏览量
82622
AI

AI

+关注

关注
87

文章
26533

浏览量
264208

原文标题：一周预告丨本周 NVIDIA 在线研讨会精彩亮点抢先看

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

NVIDIA数字人技术加速部署生成式AI驱动的游戏角色

NVIDIA 在 GDC 2024 大会上宣布，Inworld AI 等领先的 AI 应用程序开发者，正在使用 NVIDIA 数字人技术加速部署

发表于 04-09 10:08 •232次阅读

NVIDIA与恩智浦联手，在边缘设备上部署AI模型

恩智浦工业及IoT边缘高级副总裁Charles Dachs表示，人工智能的创新将塑造智能互联世界的未来，融入Nvidia先进的AI培训技术以及恩智浦在工业及物联网边缘科研实力，将产生协同效益，让用户能更迅速地将自家AI

发表于 03-25 16:05 •514次阅读

使用CUBEAI部署tflite模型到STM32F0中，模型创建失败怎么解决？

看到CUBE_AI已经支持到STM32F0系列芯片，就想拿来入门嵌入式AI。生成的模型很小，是可以部署到F0上的，但是一直无法创建成功。查阅CUBE

发表于 03-15 08:10

使用NVIDIA Triton推理服务器来加速AI预测

这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。

发表于 02-29 14:04 •225次阅读

利用NVIDIA产品技术组合提升用户体验

本案例通过利用NVIDIA TensorRT-LLM加速指令识别深度学习模型，并借助NVIDIA Triton推理服务器在NVIDIA V1

发表于 01-17 09:30 •375次阅读

不要错过！NVIDIA “大模型没那么泛！”主题活动

2024 新年首发！ NVIDIA 大模型日系列活动将于 2024 年 1 月正式启动，由 NVIDIA 和业界专家携手分享大模型应用开发的洞见和最佳

发表于 12-20 19:35 •364次阅读

周四研讨会预告 | 注册报名 NVIDIA AI Inference Day - 大模型推理线上研讨会

，使用 NVIDIA Triton TM 推理服务器进行端到端部署 LLM Serving，以及金融行业的 AI、NLP/LLM 应用场景、客户案例。通过本次活动，您将了解基于上述

发表于 10-26 09:05 •202次阅读

【KV260视觉入门套件试用体验】Vitis AI 构建开发环境，并使用inspector检查模型

量化七、Vitis AI 通过迁移学习训练自定义模型八、Vitis AI 将自定义模型编译并部署到KV260中铺垫 Vitis

发表于 10-14 15:34

在线公开课 | NVIDIA AI 气象预报模型

9 月 12 日 14 点，NVIDIA 联合智东西公开课策划推出「NVIDIA AI 气象预测模型在线研讨会」。研讨会邀请到 NVIDIA

发表于 09-11 19:55 •423次阅读

浪潮信息发布大模型智算软件栈OGAI，为大模型创新打造高效生产力

的全栈全流程的智算软件栈。OGAI由浪潮信息基于大模型自身实践与服务客户的专业经验而开发，旨在为大模型研发与应用创新全力打造高效生产力，加速生成式A

发表于 08-28 08:08 •386次阅读

使用 NVIDIA TAO Toolkit 5.0 体验最新的视觉 AI 模型开发工作流程

NVIDIA TAO 工具套件提供了一个低代码 AI 框架，无论是新手还是数据科学专家都可以使用这个平台加速视觉 AI 模型开发。有了 TAO 工具套件，开发人员可以进行迁移学习，通

发表于 07-31 20:45 •426次阅读

如何使用NVIDIA Triton 推理服务器来运行推理管道

使用集成模型在 NVIDIA Triton 推理服务器上为 ML 模型管道提供服务

发表于 07-05 16:30 •1175次阅读

如何使用NVIDIA Triton Inference Server

如何使用 PyTriton 在 Python 中部署 AI 模型

发表于 07-05 16:30 •553次阅读

边缘AI应用越来越普遍，AI模型在边缘端如何部署？

电子发烧友网报道（文/李弯弯）在人工智能时代，越来越多的AI应用需要从云端扩展到边缘端，比如智能耳机、智能摄像机、智能手环、物流机器人等，在边缘端部署AI已经成为趋势。如今AI大

发表于 07-04 00:11 •1977次阅读

NVIDIA 与微软合作加速企业就绪的生成式 AI

NVIDIA AI Enterprise 与 Azure 机器学习集成，提供端到端云平台，供开发者构建、部署和管理大型语言模型的 AI 应用

发表于 05-25 09:15 •383次阅读