0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

YOLOv10:引领无NMS实时目标检测的新纪元

新机器视觉 来源:新机器视觉 2024-11-13 17:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来自中国清华大学的研究人员推出了YOLOv10,这是一种具有卓越进步的创新模型,展示了在计算机视觉领域的重要突破。这次发布体现了让AI既易于使用又功能强大的承诺,标志着重大进展和改进。

YOLO(You Only Look Once)系列一直是实时目标检测的基准,成功平衡了计算成本和检测性能。尽管在架构设计和优化策略方面取得了进展,但对非最大值抑制(NMS)的依赖阻碍了端到端部署,影响了推理延迟。YOLOv10通过消除NMS并优化模型架构推进了效率和性能的边界。

在这些进展的背景下,OpenSistemas在AI领域脱颖而出,特别是在训练、测试和部署如YOLOv10这样的模型方面。凭借对前沿技术的深刻理解和专长,OpenSistemas能够充分利用YOLOv10的功能,提升目标检测任务的精度和效率。这种合作象征着创新与实际应用的融合,推动了AI技术的可能性。

YOLOv10 的特别之处

YOLOv10的主要显著进步是消除了非最大值抑制(NMS)。NMS是许多目标检测模型中用于消除检测到同一对象的冗余边界框的后处理步骤。它通过保留得分最高的边界框并移除其他重叠显著的框来工作。尽管有效,但NMS增加了计算复杂性并增加了推理延迟,这会减慢实时应用的速度。

YOLOv10通过采用一致的双分配方法进行无NMS训练,改变了模型处理重叠检测的方式。通过将这一过程集成到模型的架构和训练策略中,YOLOv10减少了后处理的需要,大大缩短了推理时间。这种延迟的减少对于速度和效率至关重要的实时应用,如自动驾驶、监控和实时视频分析至关重要。消除NMS不仅简化了部署过程,还通过提高模型的效率和响应能力来提升其性能。

预训练模型

自从Ultralytics发布YOLOv5以来,我们已经习惯了每次YOLO发布时提供各种模型尺寸:nano、small、medium、large和xlarge。YOLOv10也不例外,清华大学的研究人员也提供了一系列预训练模型,可以用于各种目标检测任务。

所有这些模型在延迟和平均精度(AP)方面表现出优于之前YOLO版本的性能,如下图所示:

bcd8dda8-9067-11ef-a511-92fbcf53809c.png

(图:各YOLO模型在延迟(左)和参数数量(右)方面的性能比较)

你可以在下表中查看实际性能:

bcf3f8d6-9067-11ef-a511-92fbcf53809c.png

(表:可用的YOLOv10预训练模型,来源:Ultralytics网站)

使用

我们将尝试使用原始的仓库:

git clone https://github.com/THU-MIG/yolov10
cd yolov10
pip install -e .

# Choose the size of your model I will use the XLarge version
wget https://github.com/THU-MIG/yolov10/releases/download/v1.1/yolov10n/s/m/b/l/x.pt

然后,使用方法类似于YOLOv8:

Python

from ultralytics import YOLOv10 # Note the "v10" in the end
# Load a model
model = YOLOv10('yolov10x.pt') # load an official model
# Predict with the model
model.predict(0) # predict on your webcam

CLI

yolo predict model=yolov10x.pt source=0 # predict with official model on webcam

Ultralytics框架的预测源也可用:

bd235f04-9067-11ef-a511-92fbcf53809c.png

(图:可用于预测的源,来源:Ultralytics文档)

结果

bd4e0d30-9067-11ef-a511-92fbcf53809c.png

(图:YOLOv10的目标检测示例。推理分辨率为384x640)

YOLOv8 vs YOLOv10: 推理延迟

比较YOLOv8和YOLOv10时,最显著的改进之一是推理延迟的减少。推理延迟,即模型处理图像并进行预测所需的时间,对于自动驾驶、视频监控和交互式AI系统等实时应用至关重要。

YOLOv8尽管高效且强大,但依赖于非最大值抑制(NMS)来过滤冗余边界框。这个额外步骤虽然有效地提高了检测准确性,但增加了计算开销并延长了整体推理时间。

而YOLOv10通过一致的双分配方法进行无NMS训练,消除了对NMS的需求。通过将这一过程集成到模型架构中,YOLOv10显著减少了推理过程中所需的计算步骤。这使得处理时间更快,延迟更低,使YOLOv10更适合高速实时应用。

在同一个视频上,我使用NVIDIA GeForce RTX 4060 Laptop GPU, 7940MiB,得到的日志显示差异非常大:

bd7a2e06-9067-11ef-a511-92fbcf53809c.png

(图:YOLOv10在384x640分辨率下的推理延迟)

bd99119a-9067-11ef-a511-92fbcf53809c.png

(图:YOLOv8在384x640分辨率下的推理延迟)

导出模型

如果你想了解导出模型的好处,可以查看这篇详细介绍速度改进的文章。类似于其他任务,如检测、分割和姿势估计,你可以使用Ultralytics框架导出YOLOv10模型。此过程包括将模型转换为ONNX、CoreML、TensorFlow Lite等格式,确保与各种平台和设备的兼容性。

这种多功能性允许在不同环境中更广泛的集成,从移动应用到边缘设备。与前辈一样,YOLOv10框架支持模型导出,便于在各种平台上无缝部署。

Python

from ultralytics import YOLOv10
# Load a model
model = YOLOv10('yolov10x.pt') # load an official model
model = YOLOv10('path/to/best.pt') # load a custom trained model

# Export the model
model.export(format='onnx')

CLI

yolo export model=yolov10x.pt format=onnx # export official model
yolo export model=path/to/best.pt format=onnx # export custom trained model

结论

清华大学研究人员推出的YOLOv10,作为首个无NMS目标检测模型,代表了计算机视觉领域的重大进步。与YOLOv8相比,YOLOv10显著减少了推理延迟,使其更适合高速实时应用,如自动驾驶、视频监控和交互式AI系统。这种推理过程中计算步骤的减少突显了YOLOv10的效率和响应能力。

此外,YOLOv10采用了新的无NMS训练方法,对其各部分进行了微调以提高性能,并在速度和准确性之间达到了很好的平衡。这些升级使得模型的部署更容易,性能更强,速度更快,响应更迅速。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38161

    浏览量

    296840
  • 目标检测
    +关注

    关注

    0

    文章

    230

    浏览量

    16379
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47457

原文标题:YOLOv10:无NMS实时目标检测的先锋

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于迅为RK3588开发板实现高性能机器狗主控解决方案- AI能力实战:YOLOv5目标检测例程

    基于迅为RK3588开发板实现高性能机器狗主控解决方案- AI能力实战:YOLOv5目标检测例程
    的头像 发表于 11-28 11:32 1029次阅读
    基于迅为RK3588开发板实现高性能机器狗主控解决方案- AI能力实战:<b class='flag-5'>YOLOv</b>5<b class='flag-5'>目标</b><b class='flag-5'>检测</b>例程

    2.5MW超充引领重卡续航新纪元!科士达重磅亮相深圳充换电展

    口碑,一举荣获“2025充换电行业年度供应商品牌”大奖,彰显硬核品牌影响力。一、2.5MW充电解决方案,引领重卡续航新纪元在“双碳”目标驱动下,重卡电动化进程持续提
    的头像 发表于 11-24 17:19 1023次阅读
    2.5MW超充<b class='flag-5'>引领</b>重卡续航<b class='flag-5'>新纪元</b>!科士达重磅亮相深圳充换电展

    技术分享 | RK3588基于Yolov5的目标识别演示

    YOLO是一种基于深度神经网络的目标检测算法,用在图像或视频中实时识别和定位多个对象。在其各个版本的迭代中,YOLOv5凭借易用性和性能平衡在工业、医疗、农业、零售等领域被广泛的应用。
    的头像 发表于 09-18 17:27 1048次阅读
    技术分享 | RK3588基于<b class='flag-5'>Yolov</b>5的<b class='flag-5'>目标</b>识别演示

    智慧科研新纪元:善思创兴引领AI与自动化变革

    薄膜性能评估进入三维精准切片的新纪元。它突破传统剥离测试局限,可同时精准测量薄膜不同深度(如20μm、40μm、60μm)的剪切强度以及薄膜与基材间的 剥离强度 ,结果稳定可靠、再现性优异。 ​深度解析
    发表于 09-05 16:55

    步科倍福手拉手,ModbusTCP主转EtherCAT从,伺服压接迈入新纪元

    步科倍福手拉手,ModbusTCP主转EtherCAT从,伺服压接迈入新纪元
    的头像 发表于 07-25 10:38 377次阅读
    步科倍福手拉手,ModbusTCP主转EtherCAT从,伺服压接迈入<b class='flag-5'>新纪元</b>

    Innovative Power Products (IPP) ——高精度微波组件,驱动未来通信新纪元

    Innovative Power Products (IPP) ——高精度微波组件,驱动未来通信新纪元Innovative Power Products(简称IPP)是一家总部位于美国纽约州霍尔
    发表于 07-10 09:42

    YOLOv8水果检测示例代码换成640输入图像出现目标框绘制错误的原因 ?

    官网中的YOLOv8 水果检测关于图片推理的示例源代码: from libs.YOLO import YOLOv8 import os,sys,gc import ulab.numpy as np
    发表于 06-18 06:37

    基于LockAI视觉识别模块:C++目标检测

    (float score_threshold = 0.5, float nms_threshold = 0.3); 作用: 设置目标检测的置信度阈值和NMS阈值。 参数: scor
    发表于 06-06 14:43

    泰芯半导体开启AIOT高效传输新纪元

    今天,Wi-Fi/蓝牙/星闪音视频SOC芯片TXW82x及Wi-Fi Halow TXW8301S正式亮相!开启高效传输的新纪元
    的头像 发表于 05-29 14:30 1320次阅读

    在K230上部署yolov5时 出现the array is too big的原因?

    重现步骤 1将yolov5的kmodel放入k230的data数据 2使用yolo大作战里的视频流推理代码 3运行 期待结果和实际结果 期待的结果 将目标检测的框圈起来 实际看到的结果
    发表于 05-28 07:47

    labview调用yolo目标检测、分割、分类、obb

    labview调用yolo目标检测、分割、分类、obb、pose深度学习,支持CPU和GPU推理,32/64位labview均可使用。 (yolov5~yolov12)
    发表于 03-31 16:28

    深蓝汽车携手华为开创全民智驾新纪元

    2月9日,深蓝汽车与华为在重庆正式签署全面深化业务合作协议。作为普及全民智驾的长期战略合作伙伴,双方宣布将全面推动智能网联汽车领域的合作,共同研发前沿技术,开创全民智驾新纪元,加速推动智驾平权,引领中国智能网联汽车产业的未来。
    的头像 发表于 02-10 10:28 920次阅读

    中国信通院栗蔚:云计算与AI加速融合,如何开启智算时代新纪元

    中国信通院栗蔚:云计算与AI加速融合,如何开启智算时代新纪元
    的头像 发表于 01-17 18:48 1392次阅读
    中国信通院栗蔚:云计算与AI加速融合,如何开启智算时代<b class='flag-5'>新纪元</b>?

    采用华为云 Flexus 云服务器 X 实例部署 YOLOv3 算法完成目标检测

    一、前言 1.1 开发需求 这篇文章讲解: 采用华为云最新推出的 Flexus 云服务器 X 实例部署 YOLOv3 算法,完成图像分析、目标检测。 随着计算机视觉技术的飞速发展,深度学习模型如
    的头像 发表于 01-02 12:00 1027次阅读
    采用华为云 Flexus 云服务器 X 实例部署 <b class='flag-5'>YOLOv</b>3 算法完成<b class='flag-5'>目标</b><b class='flag-5'>检测</b>

    Flexus X 实例 ultralytics 模型 yolov10 深度学习 AI 部署与应用

    前言: ���深度学习新纪元,828 B2B 企业节 Flexus X 实例特惠!想要高效训练 YOLOv10 模型,实现精准图像识别?Flexus X 以卓越算力,助您轻松驾驭大规模数据集,加速
    的头像 发表于 12-24 12:24 1305次阅读
    Flexus X 实例 ultralytics 模型 <b class='flag-5'>yolov10</b> 深度学习 AI 部署与应用