0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用NVIDIA DeepStream在Fyma解锁视频管道

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-10-10 16:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在云中提供大规模的计算机视觉是一项复杂的任务。 Fyma ,一家计算机视觉公司,正借助于 NVIDIA DeepStream 。

作为一家相对较新的公司, Fyma 将视频转换为数据——更具体地说,是物理空间中的运动数据。 Fyma 平台每天全天使用客户的实时视频流,并生成移动事件(例如,有人穿过门口或商店过道)。

他们早期学到的一个教训是,他们的视频处理管道必须简单、可扩展,同时具备良好的性能。由于发展资源有限,一开始它们只能拥有这三种资源中的一种。 NVIDIA DeepStream 最近通过缩短开发时间、提高性能和提供优秀的软件组件(如 GStreamer ),解锁了同时拥有这三种功能的能力。

直播视频流的挑战

Fyma 专注于消费实时视频流,以简化其客户的实施。客户可能会犹豫是否在其场所安装传感器或任何其他硬件,因为他们已经投资了安全摄像头。由于这些摄像机可以在任何地方, Fyma 可以提供不同的对象检测模型,以在不同的环境中最大限度地提高精度

消费实时视频流在多个方面具有挑战性:

摄像机有时会产生损坏的视频(呈现/解码时间戳跳跃,报告的帧率错误)

网络问题导致视频流冻结、结巴、跳转或脱机

CPU /内存负载分配和规划并不简单

实时视频流是无限的

实时视频流的无限性意味着 Fyma 的平台必须至少以帧到达的速度执行计算机视觉。基本上,整个管道必须实时工作。否则,帧将无休止地累积。

幸运的是,在过去几年中,目标检测在速度和准确性方面稳步提高。这意味着每秒可以从 1000 多张图像中检测到物体,而地图的比例超过 90% 。这些进步使 Fyma 能够以合理的价格向客户提供大规模的计算机视觉。

使用计算机视觉(特别是实时)提供物理空间分析涉及的不仅仅是对象检测。据 Fyma 软件开发主管 Kaarel Kivistik 称,“要真正从这些对象中提取一些东西,我们需要在帧之间跟踪它们,并使用某种组件来分析其行为。考虑到每个客户都可以选择自己的模型,建立自己的分析,并根据收集的数据生成报告,一个简单的视频处理管道就成了一个巨大的平台。”

版本 1 :你好,世界

Fyma 从将 OpenCV 和 ffmpeg 耦合到一个非常简单的 Python 应用程序开始。除了他们的神经网络,没有任何硬件加速。当时他们正在使用 Yolo v3 和 Darknet 。尽管使用了 AWS g4dn ,但性能很差,约为每秒 50-60 帧。具有 NVIDIA Tesla T4 GPU (他们继续使用)的 xlarge 实例。应用程序的功能如下:

用于捕获视频的 OpenCV

具有 Python 绑定以检测对象的暗网

自制基于 IoU 的多目标跟踪器

虽然实现相当简单,但不足以扩展。表现不佳的原因有三个:

软件视频解码

在进程之间和 CPU / GPU 内存之间复制解码视频帧

软件对输出进行编码,同时在其上绘制检测结果

他们通过硬件视频解码和编码来改进第一个版本。当时,这并没有使整体速度提高多少,因为他们仍然将解码帧从 GPU 复制到 CPU 内存,然后再复制回[Z1K]内存。

版本 2 :自定义 ffmpeg 编码器

在速度方面真正的突破来自自定义 ffmpeg 编码器,它基本上是一个围绕暗网的包装器,将视频帧转换为检测对象。帧速率增加了十倍,因为它们现在在硬件上解码,而不需要在主机和设备内存之间复制视频帧。

但是帧速率的增加意味着他们的部分应用程序现在是用 C 语言编写的,并且由于 ffmpeg 的高度复杂的构建系统而增加了复杂性。尽管如此,他们的新组件不需要太多的改动,并且被证明是相当可靠的。

这个系统的一个缺点是他们现在只能使用暗网。

版本 2.1 : DeepSORT

为了提高目标跟踪精度, Fyma 用 DeepSORT 取代了自制的基于 IoU 的跟踪器。结果很好,但他们需要更改自定义编码器,以输出对象的视觉特征,以及跟踪所需的边界框。

引入 DeepSORT 提高了准确性,但也带来了另一个问题:根据视频内容,它有时会使用大量 CPU 内存。为了缓解这个问题,该团队采用了“异步跟踪”。基本上是一种基于工作人员的方法,它涉及每个工作人员使用由边界框组成的元数据,并生成有关对象移动的事件。虽然这解决了 CPU 使用不均衡的问题,但它再次使整个体系结构更加复杂。

版本 3 : Triton 推理服务器

虽然之前的版本表现良好,但 Fyma 发现他们仍然无法在每个 GPU 上运行足够的摄像头。他们平台上的每个视频流都有其使用的任何模型的单独副本。如果他们能够减少单个摄像头的内存占用,就有可能从 GPU 实例中挤出更多内存。

Fyma 决定重写其应用程序中与 ffmpeg 相关的部分。更具体地说,该应用程序现在通过自定义 Python 绑定直接与 ffmpeg 库( libav )接口

这使 Fyma 能够将其应用程序连接到 NVIDIA Triton 推理服务器,从而实现摄像机流之间的神经网络共享。为了保持目标检测代码的核心不变,他们将自定义 ffmpeg 编码器代码移到了自定义 Triton 后端。

虽然这解决了内存问题,但它将 Fyma 应用程序的复杂性提高了至少三倍。

版本 4 : DeepStream

Fyma 应用程序的最新版本是基于 GStreamer 和 NVIDIA DeepStream 的完全重写。

Kivistik 说:“基于管道的加速 DeepStream 组件方法是真正推动我们前进的原因。”。“此外,在不影响性能的情况下,将所有以前基于 C 的东西扔进回收站的乐趣真的令人难以置信。我们接受了 DeepStream 提供的一切:解码、编码、推理、跟踪和分析。得益于 nvtracker ,我们恢复了同步跟踪, CPU / GPU 使用率稳定。”

这意味着事件现在几乎是实时到达他们的数据库。以前,这些数据会延迟几个小时,这取决于有多少工作人员在场以及一般的“视觉”负载(整个平台看到了多少对象)。

Fyma 的当前实现为每个 GPU 实例运行一个主进程。该主进程依次为添加到平台的每个视频流运行 GStreamer 管道。每个摄像头的内存开销很低,因为所有内容都在一个进程中运行。

关于端到端性能(解码、推断、跟踪、分析), Fyma 实现了高达 10 倍的帧速率(单个视频流约 500 fps ),与第一次实现相比,精度提高了 2-3 倍。 Fyma 能够在不到两个月的时间内实施 DeepStream 。

Kivistik 说:“我想我们终于可以说,我们现在有了一个不那么大的代码库,并且具有可扩展性,因为我们可以轻松地切换模型,改变视频管道和性能。”。

“对于每个想要创建生产级计算机视觉应用程序的软件开发人员或数据科学家来说,使用 DeepStream 真的是一件轻而易举的事。”

总结

通过使用 NVIDIA DeepStream , Fyma 能够释放其 AI 模型的威力,提高其 vision AI 应用程序的性能,同时加快开发时间。

关于作者

Alvin Clark 是 DeepStream 的产品营销经理。阿尔文的职业生涯始于设计工程师,然后转向技术销售和市场营销。他曾与多个行业的客户合作,应用范围从卫星系统、外科机器人到深海潜水器。阿尔文持有圣地亚哥加利福尼亚大学的工程学学位,目前正在乔治亚理工大学攻读硕士学位。

Kaarel Kivistik 领导着 Fyma 的软件部门。他拥有超过 10 年的软件开发经验,精通多种语言和环境。他设计并设计了 Fyma 平台的工作方式。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2577

    文章

    55483

    浏览量

    793828
  • NVIDIA
    +关注

    关注

    14

    文章

    5685

    浏览量

    110111
  • 计算机
    +关注

    关注

    19

    文章

    7839

    浏览量

    93452
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    首届中国NVIDIA DGX Spark黑客松大赛开启报名

    NVIDIA 前沿技术生态,聚焦 DGX Spark 平台的全栈开发能力,以代码为刃,以算力为锋,共同探索 DGX Spark 全栈 AI 开发新前沿,解锁大模型落地新可能!
    的头像 发表于 03-14 16:39 2711次阅读

    NVIDIA和ComfyUI携手简化本地AI视频生成工作流

    借助 ComfyUI 的应用视图、NVIDIA RTX Video 超分辨率和全新的 NVFP4 模型,AI 驱动的视频生成更加易用。
    的头像 发表于 03-14 16:37 2480次阅读
    <b class='flag-5'>NVIDIA</b>和ComfyUI携手简化本地AI<b class='flag-5'>视频</b>生成工作流

    电压放大器超声微机器人及管道研究实验中的应用

    实验名称: 超声微机器人的制备、振动特性表征、运动性能测试及复杂管道环境中的实验研究 实验目的: 探究超声驱动频率、电压及管道尺寸等关键参数对微机器人运动性能的影响,通过MEMS基压电薄膜与频率
    的头像 发表于 03-11 17:46 1042次阅读
    电压放大器<b class='flag-5'>在</b>超声微机器人及<b class='flag-5'>管道</b>研究实验中的应用

    超擎数智为您深度解析NVIDIA Quantum-X800 InfiniBand平台

    NVIDIA
    专精特新
    发布于 :2026年01月08日 19:47:03

    如果CW32芯片锁死有什么方法可以解锁吗?

    之前用别家芯片容易出现芯片锁死的情况,解锁一般可以用ISP,请问,如果CW32芯片锁死,有什么方法可以解锁吗?
    发表于 12-04 07:50

    NVIDIAISC 2025分享最新超级计算进展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代网络和量子技术实现了飞跃。 SC25 上展示的加速系统突显了全球超级计算和 AI 的进展。
    的头像 发表于 11-25 10:59 1088次阅读
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>在</b>ISC 2025分享最新超级计算进展

    NVIDIA DGX Spark平台上对NVIDIA ConnectX-7 200G网卡配置教程

    NVIDIA DGX Spark 平台上对 NVIDIA ConnectX-7 200G 网卡进行配置时,会遇到“4 个逻辑端口”现象。理解背后的真相是后续所有配置的基础。本文将从此现象入手,逐步解析其原理,并提供从基础配置
    的头像 发表于 11-21 09:19 6019次阅读
    <b class='flag-5'>在</b><b class='flag-5'>NVIDIA</b> DGX Spark平台上对<b class='flag-5'>NVIDIA</b> ConnectX-7 200G网卡配置教程

    基于DP1323EL的电动车解锁方案:超高速读写,提升电动车一键解锁体验

    快节奏的都市生活中,电动车已成为许多人的首选出行工具。然而,传统的机械钥匙往往带来诸多不便:容易丢失、操作繁琐,甚至雨天或匆忙时成为负担。 随着物联网和智能科技的快速发展,一键解锁方案应运而生
    发表于 11-10 17:45

    管道运输中的传感器:管道状态监测

    现代工业体系中,管道运输承担着不可或缺的重任,无论是石油、天然气等能源的长距离输送,还是化工原料不同生产环节的流转,管道运输都凭借其高效、连续、低成本的优势,成为工业生产和能源供应
    的头像 发表于 09-05 16:10 617次阅读

    Buildroot 中启用 JPEG格式支持,但它有警告消息:“错误的管道:没有元素 Jpegparse”,怎么解决?

    Buildroot 中启用 JPEG格式支持,但它有警告消息:“错误的管道:没有元素 Jpegparse”
    发表于 09-03 06:41

    NVIDIA助力枢途科技突破视频提取具身数据技术鸿沟

    枢途科技(Synapath AI)基于 NVIDIA GPU、Jetson AGX Orin 等算力底座、成熟的 AI 加速生态、NVIDIA Isaac Sim、Omniverse 平台的仿真合成
    的头像 发表于 08-30 16:11 1971次阅读

    腾视科技AIBOX双版本重磅发布!本地安全与全球适配,解锁视频智能新可能

    未来,腾视科技将继续深耕AI边缘计算与视频分析技术,为更多行业打造“量身定制”的智能解决方案,让科技真正服务于业务创新!即刻联系腾视科技,解锁你的专属视频智能方案,让每一段视频都产生价
    的头像 发表于 08-27 14:00 2135次阅读
    腾视科技AIBOX双版本重磅发布!本地安全与全球适配,<b class='flag-5'>解锁</b><b class='flag-5'>视频</b>智能新可能

    NVIDIA AI助力科学研究领域持续突破

    随着 AI 技术的广泛应用,AI 正在成为科学研究的引擎。NVIDIA 作为重要的技术推手,持续驱动着 AI 系统解锁更多领域的科学突破。
    的头像 发表于 08-05 16:30 1318次阅读

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 开源其物理 AI 平台 NVIDIA Cosmos 中的关键模型——NVIDIA Cosmos Reason-1-7B。这款先进的多模态大模型能够理解视频、进行物理
    的头像 发表于 07-09 10:17 1007次阅读

    NVIDIA Isaac Sim与NVIDIA Isaac Lab的更新

    COMPUTEX 2025 上,NVIDIA 宣布了机器人仿真参考应用 NVIDIA Isaac Sim 和机器人学习框架 NVIDIA Isaac Lab 的更新,以加速各种形态
    的头像 发表于 05-28 10:06 2385次阅读