0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

借助NVIDIA技术构建实时视觉检测工作流

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-10-21 11:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

构建一套可靠的视觉检测流程来实现缺陷检测和质量控制面临诸多挑战,例如针对特定领域定制通用视觉 AI 模型、在算力受限的边缘设备上优化模型规模,以及高效实时部署以实现最大的推理吞吐量。

NVIDIA Metropolis是一个面向视觉 AI 智能体与应用的开发平台,旨在帮助解决上述挑战。NVIDIA Metropolis 提供了一个统一的框架,包含用于训练和优化视觉 AI 基础模型的NVIDIA TAO 6,以及端到端流分析工具套件NVIDIA DeepStream 8。

DeepStream 8.0 为开发者提供推理构建器等强大工具,简化工作流的创建,并提升复杂环境中的跟踪准确性。TAO 6 通过领域适应性、自监督微调和知识蒸馏,充分释放基础模型的潜力。借助 NVIDIA DeepStream 和 NVIDIA TAO,开发者正在推动视觉 AI 从快速原型设计到大规模部署的演进。

本文将为您介绍如何利用 NVIDIA TAO 和 NVIDIA DeepStream 构建端到端的实时视觉检测工作流,具体步骤如下:

使用 TAO 进行自监督式微调,实现对领域特定未标注数据的高效利用;

使用 TAO 知识蒸馏优化基础模型,以提高吞吐量和效率;

使用 DeepStream Inference Builder 进行部署。

e4cc0250-aa78-11f0-8c8f-92fbcf53809c.gif

利用 NVIDIA TAO 规模化开发基于视觉基础模型的自定义模型:

NVIDIA TAO 支持端到端工作流程,可用于训练、调整和优化面向特定领域用例的大型视觉基础模型。该框架可依托微调微服务对视觉基础模型进行自定义,助力实现高精度和高性能。

e5272de2-aa78-11f0-8c8f-92fbcf53809c.png

使用 NVIDIA TAO 创建高精度、定制化的企业可直接使用的 AI 模型,为视觉 AI 应用提供支持

TAO 提供一系列强大的基础骨干和任务头,可针对工业视觉检测等关键工作负载对模型进行微调。在 TAO 6 中,两个关键的基础骨干是 C-RADIOv2(开箱即用,精度领先)和 NV-DINOv2。TAO 同样支持第三方模型,前提是其视觉骨干和任务头架构与 TAO 兼容。

为提高模型准确性,TAO 支持多种模型自定义技术,例如监督式微调(SFT)和自监督式学习(SSL)。其次,利用 NVIDIA TAO 6,用户可以利用自监督学习技术,充分发掘未标记图像的巨大潜力,从而在标记数据稀缺或采集成本高昂的情况下加速模型定制流程。

在实际场景中,此工作流意味着模型能够从大量未标记图像中学习缺陷的细微特征,再通过有针对性的监督式微调来优化决策能力,即使在自定义的真实数据集上也能实现卓越的性能。

优化视觉基础模型以提高吞吐量:

NVIDIA TAO 利用从大型基础模型中获得的知识,通过“知识蒸馏”(Knowledge Distillation)技术,将其优化为更小的模型尺寸。知识蒸馏通常能够在不牺牲准确性的前提下,将大型、高精度的教师模型压缩为更小、更高效的学生模型。该过程的核心在于引导学生模型不仅模仿教师模型的最终预测,同时要学习其内部特征表示和决策边界,从而在资源受限的硬件上实现实际部署,并支持可扩展的模型优化。

NVIDIA TAO 进一步拓展了知识蒸馏的能力,能够稳定支持多种蒸馏形式,包括骨干、logit 以及空间或特征蒸馏。TAO 的一项显著特性是其专为物体检测设计的单级蒸馏方法。借助这一简化流程,通常更小且更高效的学生模型能够在统一的训练阶段,直接从教师模型学习骨干特征表示以及任务特定的预测结果。这种方法在不牺牲精度的前提下,显著降低了推理延迟和模型尺寸。

使用 DeepStream 8 Inference Builder 打包和部署模型:

全新的 NVIDIA DeepStream 8 Inference Builder 是一款低代码工具,可将模型设想快速转化为独立应用或可部署的微服务。

Inference Builder 的设计目标是根据用户提供的模型和配置文件,自动生成推理服务代码、API 层以及部署所需的构件。通过简单的配置,即可处理与服务器、请求处理和数据流相关的复杂任务,而无需手动编写大量重复性代码。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5732

    浏览量

    110345
  • AI
    AI
    +关注

    关注

    91

    文章

    42209

    浏览量

    303211
  • 模型
    +关注

    关注

    1

    文章

    3880

    浏览量

    52366

原文标题:使用 NVIDIA TAO 6 和 NVIDIA DeepStream 8 构建实时视觉检测工作流

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    扣子AI智能体工作流(完结)

    https://www.bilibili.com/opus/1178756596191199237 扣子工作流:重新定义业务自动化,让技术普惠照进现实 在数字化转型的浪潮中,业务自动化始终是企业
    的头像 发表于 04-25 11:21 443次阅读

    工作流节点说明---工作流节点

    平台提供工作流节点,实现工作流嵌套工作流的效果。 节点说明 在一个工作流中,开发者可以将另一个工作流作为其中的一个步骤或节点,实现复杂任务
    发表于 03-24 21:05

    工作流插件节点节点说明

    插件节点用于在工作流中调用插件运行指定工具。 插件是一系列工具的集合,每个工具都是一个可调用的API。插件广场上架的插件或已上架的团队插件支持以节点形式被集成到工作流中,拓展智能体的能力边界
    发表于 03-23 16:54

    NVIDIA发布面向媒体工作流的AI技术

    在 GTC 2026上,NVIDIA 宣布了多项强大的新技术,旨在变革直播媒体和后期制作工作流
    的头像 发表于 03-23 15:15 577次阅读

    工作流大模型节点说明

    ,单步0.01。 Temperature:用于调整输出结果的随机性(温度越高越随机创新,越低越确定保守);支持调试范围:0-1,单步0.01。 技能 支持为大模型节点配置插件、工作流技能,扩展模型能力
    发表于 03-19 14:56

    工作流节点说明结束节点

    结束节点是工作流的最终节点,用于返回工作流运行后的结果。结束节点支持两种返回方式:返回变量、返回文本。 返回变量 在返回变量模式下,工作流运行结束后会以JSON格式输出所有返回参数,适用于工作
    发表于 03-16 16:43

    NVIDIA和ComfyUI携手简化本地AI视频生成工作流

    借助 ComfyUI 的应用视图、NVIDIA RTX Video 超分辨率和全新的 NVFP4 模型,AI 驱动的视频生成更加易用。
    的头像 发表于 03-14 16:37 2638次阅读
    <b class='flag-5'>NVIDIA</b>和ComfyUI携手简化本地AI视频生成<b class='flag-5'>工作流</b>

    工作流节点说明开始节点

    开始节点是工作流的起始节点,用于设定启动工作流需要的输入信息。开始节点只有输入参数,没有输出等其他参数。开始节点中默认有一个输入参数USER_INPUT,一个默认的输入参数FILES_INPUT(非
    发表于 03-13 14:52

    开发工作流创建工作流

    新建工作流 在小艺智能体平台页面,通过【工作空间】-【工作流】-【新建工作流】,进入新建工作流配置页面。设置
    发表于 03-10 10:05

    虚幻引擎5在建筑可视化中的应用:趋势、挑战与基于Perforce P4的工作流

    UE5正在重塑建筑可视化:实时交互、AI辅助、BIM联动......技术红利已来,工作流却拖了后腿?这篇干货解析了趋势和痛点,更揭秘了如何用Perforce P4打造高效的UE5工作流
    的头像 发表于 02-27 15:26 611次阅读
    虚幻引擎5在建筑可视化中的应用:趋势、挑战与基于Perforce P4的<b class='flag-5'>工作流</b>程

    利用NVIDIA Nemotron开放模型构建智能文档处理系统

    基于 NVIDIA Nemotron 开放模型的 AI 驱动文档智能,增强科学研究、金融和法律等领域工作流
    的头像 发表于 02-25 11:21 821次阅读

    如何在NVIDIA Jetson平台上运行最新的开源AI模型

    在小型、低功耗的边缘设备上运行先进的 AI 和计算机视觉工作流正变得越来越具有挑战性。机器人、智能摄像头和自主设备需要实时智能来感知、理解并做出反应,而无需依赖云端。NVIDIA Je
    的头像 发表于 12-24 10:38 2077次阅读
    如何在<b class='flag-5'>NVIDIA</b> Jetson平台上运行最新的开源AI模型

    使用OpenUSD与NVIDIA Halos构建安全物理AI系统

    如何使用 OpenUSD 和 NVIDIA Omniverse 的最新进展深入改变他们的工作流。 物理 AI 正从研究实验室走向现实世界,为智能机器人和智能汽车 (如无人驾驶出租车) 提供支持,这些系统必须在不可预测
    的头像 发表于 12-24 10:22 1120次阅读

    使用NVIDIA AI Blueprint打造3D世界

    在传统工作流中,建模师必须构建占位模型、低精度资产来填充 3D 场景,优化核心资产以完成场景。之后,可以优化、细化并最终完成视觉效果。
    的头像 发表于 09-23 14:35 1206次阅读

    借助NVIDIA技术实现机器人装配和接触密集型操作

    本期 NVIDIA 机器人研究与开发摘要 (R²D²) 将探讨 NVIDIA 研究中心针对机器人装配任务的多种接触密集型操作工作流,以及它们如何解决传统固定自动化在鲁棒性、适应性和可扩展性等方面的关键挑战。
    的头像 发表于 06-04 13:51 1102次阅读
    <b class='flag-5'>借助</b><b class='flag-5'>NVIDIA</b><b class='flag-5'>技术</b>实现机器人装配和接触密集型操作