0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过NVIDIA Jetson AGX Thor实现7倍生成式AI性能

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-10-29 16:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 软件生态系统的一大显著优势,在于其始终坚持持续优化。今年 8 月,NVIDIA Jetson AGX Thor正式开售,与上一代产品Jetson AGX Orin相比,生成式 AI 性能最高提升至 5 倍。通过发布后的软件更新优化,Jetson Thor 的生成式 AI 吞吐量提升至 7 倍。开发者可以在 Llama、DeepSeek 等模型上体验到性能的提升,未来推出的新模型预计也能带来类似的优势。除了持续优化软件外,NVIDIA 还会为主流模型提供支持,并且往往能在新模型发布后的几天内完成适配,以便开发者能够尽早尝试和测试最新的 AI 模型。

Jetson Thor 平台还支持多种主流量化格式,包括 NVIDIA Blackwell GPU 架构的新 NVFP4 格式,有助于进一步优化推理性能。该平台同时支持推测解码等新技术,为在边缘端加速生成式 AI 工作负载提供了新的途径。

本文将介绍 NVIDIA 如何通过持续优化其 Jetson 平台的软件生态系统,提升生成式 AI 的性能,并说明了实现这些性能提升的关键技术,如量化和预测性解码。

持续性软件优化:随着近期 vLLM 容器的发布,Jetson Thor 在相同模型和量化配置的情况下,性能相比 8 月底首发时提升了最高达 3.5 倍。Jetson Thor 现已支持在 vLLM 容器中运行 Eagle 3 预测性解码,进一步提升了生成式 AI 模型的性能。

借助 Jetson Thor 提升生成式 AI 性能:Jetson Thor 在边缘端生成式 AI 应用中表现出强大的性能,但要充分发挥其潜力,必须采用合适的技术方案。量化与预测解码两种关键技术能够显著加速大语言模型(LLM)和视觉语言模型(VLM)的推理过程。

量化:减小模型体积,提升推理速度。量化的核心在于降低包括权重和激活值等模型数据的数值精度。通常,会将标准的 16 位格式,如 FP16 或 BF16,转换为 8 位或 4 位等更低位的格式,这会带来两大优势:更小的显存占用和更快的内存访问速度。

预测解码:通过草稿验证解码方法提升推理速度。该技术通过结合两个模型来加速推理过程:一个快速的小型“草稿”模型和一个高精度的大型“目标”模型。该“起草和验证”过程在每个周期内生成多个 token,同时确保最终输出与目标模型独立生成的结果保持一致。其效能核心取决于接受率。接受率过低会显著增加延迟,而接受率过高则可能导致计算资源消耗上升,因此使用能够反映实际工作负载的提示进行基准测试尤为关键。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5727

    浏览量

    110298
  • AI
    AI
    +关注

    关注

    91

    文章

    42023

    浏览量

    303097
  • 模型
    +关注

    关注

    1

    文章

    3874

    浏览量

    52341

原文标题:通过 NVIDIA Jetson AGX Thor 实现 7 倍生成式 AI 性能,解锁更快速、更智能的边缘模型

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA Jetson模型赋能AI在边缘端落地

    开源生成 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 ThorNVIDIA
    的头像 发表于 03-16 16:27 793次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b>模型赋能<b class='flag-5'>AI</b>在边缘端落地

    如何在NVIDIA Jetson AGX Thor上部署1200亿参数大模型

    上一期介绍了如何在 NVIDIA Jetson AGX Thor 上使用 Docker 部署 vLLM 推理服务,以及使用 Chatbox 作为前端调用 vLLM 运行的模型(上期文章
    的头像 发表于 12-26 17:06 5385次阅读
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> <b class='flag-5'>Thor</b>上部署1200亿参数大模型

    ZED 相机 × Jetson Thor:赋能机器人全场景高性能视觉,解锁边缘感知无限可能

    Jetson Thor与ZED相机的融合通过ZED SDK 5.1版本推出
    的头像 发表于 12-26 11:45 475次阅读
    ZED 相机 × <b class='flag-5'>Jetson</b> <b class='flag-5'>Thor</b>:赋能机器人全场景高<b class='flag-5'>性能</b>视觉,解锁边缘感知无限可能

    NVIDIA Jetson系列开发者套件助力打造面向未来的智能机器人

    NVIDIA Jetson AGX ThorAGX Orin 以及 Jetson Orin N
    的头像 发表于 12-13 10:20 3482次阅读

    如何在NVIDIA Jetson AGX Thor通过Docker高效部署vLLM推理服务

    继系统安装与环境配置后,本期我们将继续带大家深入 NVIDIA Jetson AGX Thor 的开发教程之旅,了解如何在 Jetson
    的头像 发表于 11-13 14:08 4550次阅读
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> <b class='flag-5'>Thor</b>上<b class='flag-5'>通过</b>Docker高效部署vLLM推理服务

    NVIDIA Jetson AGX Thor Developer Kit开发环境配置指南

    NVIDIA Jetson AGX Thor 专为物理 AI 打造,与上一代产品 NVIDIA
    的头像 发表于 11-08 09:55 7816次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> <b class='flag-5'>Thor</b> Developer Kit开发环境配置指南

    BPI-AIM7 RK3588 AINvidia Jetson Nano 生态系统兼容的低功耗 AI 模块

    资源。 RK3588 AI Module7 (AIM7) 的完整原理图和硬件设计文件将在您的产品通过 Mouser 发货之前发布!这些信息将公开发布,帮助您更好地理解并
    发表于 10-11 09:08

    全新QNX OS for Safety 8集成至NVIDIA DRIVE AGX Thor开发者套件

    DRIVE AGX Thor开发套件中,彰显QNX的关键生态和集成合作伙伴地位。该下一代平台专为赋能未来自动驾驶汽车而打造,凭借前沿的AI性能、强大的功能安全特性和卓越的可扩展性,
    的头像 发表于 09-08 17:31 1228次阅读

    奥比中光3D相机矩阵接入NVIDIA Jetson Thor平台

    8月28日,奥比中光宣布其Gemini 330系列3D深度相机正全面兼容NVIDIA Jetson Thor(物理AI 与机器人应用终极平台)。未来完成适配后,奥比中光双目视觉相机可将
    的头像 发表于 08-30 09:42 2891次阅读

    研华科技推出基于NVIDIA Jetson Thor平台的边缘AI新品MIC-743

    研华重磅推出基于NVIDIA Jetson Thor平台的边缘AI新品 MIC-743,这款突破性产品以高达2070 FP4 TOPS的AI
    的头像 发表于 08-29 14:53 2511次阅读

    ADI借助NVIDIA Jetson Thor平台加速人形机器人研发进程

    当前,人形机器人正逐步迈向实际应用部署阶段,其落地节奏取决于物理智能与实时推理能力的发展。随着NVIDIA Jetson Thor平台的正式面市,Analog Devices, Inc. (ADI)将进一步加速人形机器人与自主移
    的头像 发表于 08-29 14:07 3626次阅读

    NVIDIA Jetson AGX Thor开发者套件重磅发布

    开发者与未来创造者们,准备好迎接边缘AI的史诗级革新了吗?NVIDIA以颠覆性技术再次突破极限,正式推出Jetson AGX Thor开发者
    的头像 发表于 08-28 14:31 1851次阅读

    NVIDIA三台计算机解决方案如何协同助力机器人技术

    NVIDIA DGX、基于 NVIDIA RTX PRO 服务器的 Omniverse 和 Cosmos,以及 Jetson AGX Thor
    的头像 发表于 08-27 11:48 2720次阅读

    基于 NVIDIA Blackwell 的 Jetson Thor 现已发售,加速通用机器人时代的到来

    Jetson AGX Orin,AI 算力提升至 7.5 ,能效提升至 3.5 ,能够实现
    发表于 08-26 09:28 1399次阅读
    基于 <b class='flag-5'>NVIDIA</b> Blackwell 的 <b class='flag-5'>Jetson</b> <b class='flag-5'>Thor</b> 现已发售,加速通用机器人时代的到来

    NVIDIA Jetson AGX Thor开发者套件概述

    TFLOPS 的 AI 计算性能,从而轻松运行最新的生成 AI模型,且功耗不超过 130 W。与 N
    的头像 发表于 08-11 15:03 2160次阅读