我们十分高兴地宣布,Torch-TensorRT 1.1.0 版本正式发布!
软件版本
PyTorch 1.11
CUDA 11.3(在 x86_64 上,默认设置下,兼容的 PyTorch Build 支持较新版本的 CUDA 11)
cuDNN 8.2.4.15
TensorRT 8.2.4.2
由于最近 JetPack 的升级和其发布流程的变化,Torch-TRTv1.1.0 版本不支持Jetson(Jetpack 5.0DP 或其他)。将在中期版本(Torch-TensorRT1.1.x)同时支持 Jetpack 5.0DP 和 TensorRT 8.4。
重要变更
HF BERT性能
算子和性能的进一步优化使 HF BERT 的性能比 V1.1 版本提升了 40%
更多的算子
18 个新的 aten 算子转换器提高了 TensorRT 的模型覆盖范围和性能
查看全部 250+ 个算子
Triton 后端支持
21.12 版本以上的 Triton 现已支持 Torch-TensorRT
将在不久后提供工作流程教程
调试工具
上下文管理器现在允许使用更简洁清晰的调试工作流程
不支持的算子已降级为警告,建议使用上下文管理器进行调查
API 变更
max_batch_size 和 strict_types 由于在 TRT 中不被遵守已被删除
所有与 Torch-TensorRT 相关的 Bug 都应被归入新的 “MachineLearning – TorchTRT” nvbugs 模块。
原文标题:Torch-TensorRT 1.1.0 版本正式发布
文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
-
软件
+关注
关注
69文章
5351浏览量
91866 -
pytorch
+关注
关注
2文章
813浏览量
14921
原文标题:Torch-TensorRT 1.1.0 版本正式发布
文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
Onsemi NTPF150N65S3HF MOSFET:高性能电源解决方案
高性能MOSFET:NTP082N65S3HF的技术剖析与应用前景
探索 onsemi NTHL095N65S3HF:高性能 MOSFET 的卓越之选
深入解析 NTHL082N65S3HF:高性能 MOSFET 的卓越之选
深入解析NTHL065N65S3HF:高性能MOSFET的卓越之选
onsemi NTB095N65S3HF MOSFET:高性能解决方案
Onsemi NTB190N65S3HF MOSFET:高性能功率解决方案
ST95HF:高性能NFC/RFID收发器的深度解析
小型高性能:muRata HF RFID Tag LXTBKYSCNN - 018深度解析
摩尔线程发布Torch-MUSA v2.7.0版本
NVIDIA TensorRT LLM 1.0推理框架正式上线
Perforce QAC 2025.2版本更新:虚拟内存优化、100%覆盖CERT C规则、CI构建性能提升等
DeepSeek R1 MTP在TensorRT-LLM中的实现与优化
HF83311_VC1/HF83311Q_VC1:高性能USB HiFi音频解码器固件技术解析
HF83311_VB1/HF83311Q_VB1:高性能USB HiFi音频解码器固件技术解析
Torch-TensorRT软件更新 HF BERT性能提升40%
评论