NVIDIA TensorRT的数据格式定义-电子发烧友网

TensorRT 支持不同的数据格式。有两个方面需要考虑：数据类型和布局。

数据类型格式

数据类型是每个单独值的表示。它的大小决定了取值范围和表示的精度，分别是FP32（32位浮点，或单精度），FP16（16位浮点或半精度），INT32（32位整数表示），和 INT8（8 位表示）。

布局格式

布局格式确定存储值的顺序。通常，batch 维度是最左边的维度，其他维度指的是每个数据项的方面，例如图像中的C是通道， H是高度， W是宽度。忽略总是在这些之前的批量大小， C 、 H和W通常被排序为CHW （参见图 1 ）或HWC （参见图 2 ）。

图1. CHW的布局格式：图像分为HxW矩阵，每个通道一个，矩阵按顺序存储；通道的所有值都是连续存储的。

图2. HWC的布局格式：图像存储为单个HxW矩阵，其值实际上是 C 元组，每个通道都有一个值；一个点（像素）的所有值都是连续存储的。

为了实现更快的计算，定义了更多格式以将通道值打包在一起并使用降低的精度。因此，TensorRT 还支持NC / 2HW2和NHWC8等格式。

在NC / 2HW2 （ TensorFormat：：kCHW2 ）中，通道值对在每个HxW矩阵中打包在一起（在奇数通道的情况下为空值）。结果是一种格式，其中⌈ C/2 ⌉ HxW矩阵的值是两个连续通道的值对（参见图 3 ）；请注意，如果它们在同一对中，则此排序将维度交错为具有步长1的通道的值，否则将步长为 2xHxW 。

图 3. 一对通道值在每个HxW矩阵中打包在一起。结果是一种格式，其中［C/2］ HxW矩阵的值是两个连续通道的值对

在NHWC8 （ TensorFormat：：kHWC8 ）中， HxW矩阵的条目包括所有通道的值。此外，这些值被打包在⌈ C/8 ⌉ 8 元组中，并且C向上舍入到最接近的 8 倍数。

在这种NHWC8格式中， HxW矩阵的条目包括所有通道的值。

其他TensorFormat遵循与前面提到的TensorFormat：：kCHW2和TensorFormat：：kHWC8类似的规则。

关于作者

Ken He 是 NVIDIA 企业级开发者社区经理 & 高级讲师，拥有多年的 GPU 和人工智能开发经验。自 2017 年加入 NVIDIA 开发者社区以来，完成过上百场培训，帮助上万个开发者了解人工智能和 GPU 编程开发。在计算机视觉，高性能计算领域完成过多个独立项目。并且，在机器人和无人机领域，有过丰富的研发经验。对于图像识别，目标的检测与跟踪完成过多种解决方案。曾经参与 GPU 版气象模式GRAPES，是其主要研发者。

审核编辑：郭婷

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
206

文章
27070

浏览量
201524
NVIDIA

NVIDIA

+关注

关注
14

文章
4598

浏览量
101790
人工智能

人工智能

+关注

关注
1777

文章
43956

浏览量
230952

NVIDIA加速微软最新的Phi-3 Mini开源语言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库，用于优化从 PC 到云端的

发表于 04-28 10:36 •141次阅读

请问TouchGFX支不支持rgb-16bit数据格式

请教下，TouchGFX 支不支持 rgb-16bit 数据格式 ？

发表于 04-23 06:05

Torch TensorRT是一个优化PyTorch模型推理性能的工具

那么，什么是Torch TensorRT呢？Torch是我们大家聚在一起的原因，它是一个端到端的机器学习框架。而TensorRT则是NVIDIA的高性能深度学习推理软件工具包。Torch Te

发表于 01-09 16:41 •406次阅读

VTHD这个寄存器的数据格式是？3.21带符号格式是什么格式？

VTHD这个寄存器的数据格式是？3.21带符号格式是什么格式？没有找到相关说明，那位高人给兄弟指点下，非常感谢！

发表于 12-27 07:56

现已公开发布！欢迎使用 NVIDIA TensorRT-LLM 优化大语言模型推理

NVIDIA 于 2023 年 10 月 19 日公开发布 TensorRT-LLM ，可在 NVIDIA GPU 上加速和优化最新的大语言模型（Large Language Models）的推理性

发表于 10-27 20:05 •549次阅读

行业巨头联手推动AI数据格式标准化，微软打造云时代开源应用平台

大家好，欢迎收看河套IT WALK第119期。今日的科技新闻聚焦于全球技术巨头的联手创新与开放合作。从行业领袖共同推动AI数据格式的标准化，到微软推出面向云时代的开源应用平台Radius，我们看到

发表于 10-20 02:05 •393次阅读

阿里云 & NVIDIA TensorRT Hackathon 2023 决赛圆满收官，26 支 AI 团队崭露头角

2023 年 9 月 29 日，由阿里云、NVIDIA 联合主办，阿里云天池平台承办的 “NVIDIA TensorRT Hackathon 2023 生成式 AI 模型优化赛” 圆满落幕。该赛事

发表于 10-17 03:20 •360次阅读

前处理时图片数据格式转换需要HWC转CHW和NCHW， 1684是否相关接口可以使用？

前处理时图片数据格式转换需要HWC转CHW和NCHW， 1684是否相关接口可以使用？

发表于 09-19 06:41

学习资源 | NVIDIA TensorRT 全新教程上线

NVIDIA TensorRT 是一个用于高效实现已训练好的深度学习模型推理过程的软件开发工具包，内含推理优化器和运行环境两部分，其目的在于让深度学习模型能够在 GPU 上以更高吞吐量和更低

发表于 08-04 17:45 •475次阅读

即刻报名第三届 NVIDIA TensorRT Hackathon 生成式 AI 模型优化赛

近日，由阿里云及 NVIDIA 联合举办的 “NVIDIA TensorRT Hackathon 2023 生成式 AI 模型优化赛”已正式启动。此大赛是由阿里云天池组织运营，TensorRT

发表于 07-17 19:45 •343次阅读

NVIDIA TensorRT与Apache Beam SDK的集成

使用 NVIDIA TensorRT 在 Apache Beam 中简化和加速机器学习预测

发表于 07-05 16:30 •288次阅读

请问如何使用串口产生9位数据格式?

在串口的应用中,9位数据格式保含着8位的数据字节及1位的奇偶校验位。另外在RS485应用中利用奇偶校验位指出这是数据字节还是地址字节。在初始化串口之后,如下表所示,依照奇偶校验位的电平,设定

发表于 06-20 08:07

如何使用串口产生9位数据格式？

在串口的应用中,9位数据格式保含着8位的数据字节及1位的奇偶校验位。另外在RS485应用中利用奇偶校验位指出这是数据字节还是地址字节。在初始化串口之后,如下表所示,依照奇偶校验位的电平,设定

发表于 06-15 10:17

一个工具搞定标注数据格式转换

Datumaro 是支持命令行调用的模式，因此我们可以非常方便地使用 1 行命令完成 2 种不同格式数据的转换，下面我将基于命令行模式，演示一下 Datumaro 处理标注数据格式转化时的基本方法。

发表于 06-13 17:00 •616次阅读

一个工具搞定标注数据格式转换

通常情况下，新模型发布后，其对应的 github 仓库中都会有提供自定数据集训练的任务脚本，开发者可以基于自己的数据集，快速实现对该模型结构的训练与验证。但往往这些训练脚本仅支持部分的数据集格

发表于 05-26 10:28 •467次阅读