0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Triton的概念、特性及主要功能

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-07-18 10:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA Triton 推理服务器是 NVIDIA AI 平台的一部分,它是一款开源推理服务软件,可助力标准化模型的部署和执行,并在生产环境中提供快速且可扩展的 AI。

什么是 NVIDIA Triton?

NVIDIA Triton 推理服务器可助力团队在任意基于 GPUCPU 的基础设施上部署、运行和扩展任意框架中经过训练的 AI 模型,进而精简 AI 推理。同时,AI 研究人员和数据科学家可在不影响生产部署的情况下,针对其项目自由选择合适的框架。它还帮助开发者跨云、本地、边缘和嵌入式设备提供高性能推理。

NVIDIA Triton特性

支持多个框架

NVIDIA Triton 推理服务器支持所有主流框架,例如 TensorFlow、NVIDIA TensorRT、PyTorch、MXNet、Python、ONNX、RAPIDS FIL(用于XGBoost、scikit-learn 等)、OpenVINO、自定义 C++ 等。

高性能推理

NVIDIA Triton 支持所有基于 NVIDIA GPU、x86 和 ArmCPU 的推理。它具有动态批处理、并发执行、最优模型配置、模型集成和串流输入等功能,可更大限度地提高吞吐量和利用率。

专为 DevOps 和 MLOps 设计

Triton 与 Kubernetes 集成,可用于编排和扩展,导出 Prometheus 指标进行监控,支持实时模型更新,并可用于所有主流的公有云 AI 和 Kubernetes 平台。它还与许多 MLOps 软件解决方案集成。

各项应用中快速且可扩展的AI

高推理吞吐量

0f9e53ee-0431-11ed-ba43-dac502259ad0.jpg

NVIDIA Triton 可在单个 GPU 或 CPU 上并行指定相同或不同框架下的多个模型。在多 GPU 服务器中,NVIDIA Triton 会自动为基于每个 GPU 的每个模型创建一个实例,以提高利用率。

它还可在严格的延迟限制条件下优化实时推理服务,通过支持批量推理来更大限度地提高 GPU 和 CPU 利用率,并内置对音频和视频流输入的支持。对于需要使用多个模型来执行端到端推理(例如对话式 AI)的用例,Triton 支持模型集成。

模型可在生产环境中实时更新,无需重启 Triton 或应用。Triton 支持对单个 GPU 显存无法容纳的超大模型进行多 GPU 以及多节点推理。

高度可扩展的推理

0faecbe8-0431-11ed-ba43-dac502259ad0.jpg

作为一个 Docker 容器,Triton 与 Kubernetes 集成,用于编排、指标和自动缩放。Triton 还与 Kubeflow 和 Kubeflow 工作流集成,实现端到端的 AI 工作流,并导出 Prometheus 指标,用于监控 GPU 利用率、延迟、内存使用率和推理吞吐量。它支持标准的 HTTP / gRPC 接口,可与 load balancer 等其他应用连接,并可轻松扩展到任意数量的服务器,以为任意模型处理日益增长的推理负载。

Triton 可通过一个模型控制 API 来服务于数十或数百个模型。您可基于为适应 GPU 或 CPU 显存而进行的改动,将模型加载到推理服务器中或从推理服务器中卸载。支持兼具 GPU 和 CPU 的异构集群有助于跨平台实现推理标准化,并动态扩展到任意 CPU 或 GPU 以处理峰值负载。

NVIDIA Triton的主要功能

Triton Forest Inference Library (FIL) 后端

新的 Forest Inference Library (FIL) 后端支持在 CPU 和 GPU 上对基于树的模型进行具有可解释性(Shapley 值)的高性能推理。它支持来自 XGBoost、LightGBM、scikit-learn RandomForest、RAPIDS cuML RandomForest 以及其他 Treelite 格式的模型。

Triton 模型分析器

Triton 模型分析器是一种自动评估 Triton 部署配置(例如目标处理器上的批量大小、精度和并发执行实例)的工具。它有助于选择优化配置,以满足应用的服务质量(QoS)限制(延迟、吞吐量和内存要求),并且可以将找到优化配置所需的时间从数周缩短到数小时。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109086
  • 服务器
    +关注

    关注

    13

    文章

    10094

    浏览量

    90880
  • Triton
    +关注

    关注

    0

    文章

    28

    浏览量

    7275

原文标题:DevZone | NVIDIA Triton推理服务器

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    综合配电柜主要功能喝应用场景是什么

    是综合配电柜的主要功能和应用场景的详细说明: 一、核心功能 电能分配 将输入的电力(如三相电或单相电)通过断路器、隔离开关等设备分配到多个输出回路,为不同负载(如电机、照明、空调等)提供独立电源。 支持多路输出,满足复
    的头像 发表于 10-10 10:41 281次阅读

    医院专用数据记录仪主要功能有哪些

    数据记录仪的主要功能在于采集、存储并分析各类数据,在众多领域有着广泛而深入的应用,为不同行业的发展带来了新的活力与变革。那么,医院专用数据记录仪主要功能有哪些?有何产品推荐?下面就让小编来为大家简单
    发表于 09-28 14:53

    窗口看门狗定时器(WWDT)的主要功能是什么?

    窗口看门狗定时器(WWDT)的主要功能是什么?
    发表于 08-26 06:23

    手持采集器是干什么用的 PDA采集器的主要功能与应用场景

    的“得力助手”。下面就来详细说说手持采集器的主要功能和常见应用场景。一、手持采集器的核心功能1.多形式数据采集手持采集器最核心的能力就是“采集”,它支持条形码、二维码
    的头像 发表于 08-20 15:09 827次阅读
    手持采集器是干什么用的 PDA采集器的<b class='flag-5'>主要功能</b>与应用场景

    PLC温度控制系统的主要功能

    PLC温度控制系统作为工业加热、恒温场景的核心控制单元,通过整合传感器、执行器与逻辑控制算法,实现对温度的精准调控,其主要功能可归纳为以下六大核心模块: 一、实时温度检测与采集 系统
    的头像 发表于 08-07 17:59 738次阅读

    一维二维码条码识读器的主要功能有哪些

    在信息化快速发展的当下,一维二维码条码识读器已成为各行各业高效处理信息的重要工具。从超市收银到物流追踪,它凭借快速准确的信息识别能力,大幅提升了工作效率。那么,一维二维码条码识读器的主要功能有哪些呢
    的头像 发表于 08-01 15:59 741次阅读
    一维二维码条码识读器的<b class='flag-5'>主要功能</b>有哪些

    图像采集卡的主要功能与应用

    图像采集卡是一种安装在计算机内部(通常是PCIe插槽)或通过外部接口(如USB3.0,)连接的硬件设备。它的主要功能是将来自摄像头、摄像机、传感器或其他视频源的模拟或数字视频信号,捕获、数字化并传输
    的头像 发表于 07-23 13:47 707次阅读
    图像采集卡的<b class='flag-5'>主要功能</b>与应用

    直流负载箱的主要功能有哪些?

    直流负载箱是专门用于模拟和测试直流电源系统负载的设备,其主要功能包括以下几点: 直流负载箱可以模拟各种不同类型的负载,如电阻、电感、电容等,以满足不同应用场景的需求。通过调整负载箱的参数,可以实现
    发表于 06-17 13:34

    使用NVIDIA Triton和TensorRT-LLM部署TTS应用的最佳实践

    针对基于 Diffusion 和 LLM 类别的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能显著提升推理速度。在单张 NVIDIA Ada Lovelace
    的头像 发表于 06-12 15:37 1299次阅读
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Triton</b>和TensorRT-LLM部署TTS应用的最佳实践

    Aigtek:功率放大器的主要功能有哪些

    功率放大器是一种重要的电子设备,其主要功能是将输入信号的功率增加到足够高的水平,以便推动负载或驱动输出设备。功率放大器在各个领域中都具有广泛的应用,例如音频系统、射频通信、雷达、无线电等。下面安泰
    的头像 发表于 03-19 10:40 562次阅读
    Aigtek:功率放大器的<b class='flag-5'>主要功能</b>有哪些

    Abaqus软件介绍:主要功能及模块、优势与特点等

    通过有限元方法对各种工程问题进行数值模拟,帮助工程师和研究人员优化设计、提高产品性能和安全性。 2. 主要功能 结构分析:Abaqus能够
    的头像 发表于 02-13 09:44 2805次阅读

    电流感应放大器主要功能_电流感应放大器工作原理

    电流感应放大器是一种基于磁耦合原理的电路,主要功能包括以下几个方面:   一、信号放大   电流感应放大器的主要功能之一是将低电平的信号放大到可以被检测的范围内。在电子测量、工业自动化
    的头像 发表于 01-27 11:39 2128次阅读

    继电器的主要功能与应用

    、温度继电器等。 按工作原理分类 :电磁继电器、静态继电器、固态继电器等。 按用途分类 :保护继电器、控制继电器、信号继电器等。 二、继电器的主要功能 信号放大 :继电器可以将微弱的信号放大到足以驱动其他设备的信号强度。
    的头像 发表于 12-28 09:33 2882次阅读

    Triton编译器在机器学习中的应用

    1. Triton编译器概述 Triton编译器是NVIDIA Triton推理服务平台的一部分,它负责将深度学习模型转换为优化的格式,以便在NVI
    的头像 发表于 12-24 18:13 1627次阅读

    Triton编译器功能介绍 Triton编译器使用教程

    Triton 是一个开源的编译器前端,它支持多种编程语言,包括 C、C++、Fortran 和 Ada。Triton 旨在提供一个可扩展和可定制的编译器框架,允许开发者添加新的编程语言特性和优化技术
    的头像 发表于 12-24 17:23 2686次阅读