0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

卷积神经网络物体检测SSD

倩倩 来源:三姐的哥 2020-04-17 15:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2015年,YOLO之后,另外一个直接回归的方法SSD,以state-of-the-art的检测效果和检测效率横空出世;

SSD,single shot multibox detector

直接看下图吧,可以看出,YOLO是在卷积层后加了FC,然后预估2*7*7共49个位置98BBox;而SSD显著的不同就是多尺度:1) 多尺度的feature map上提取特征,通过3*3的卷积核,保证特征的细粒度和丰富性; 2) 多尺度feature map上抽取anchor,每张图共有7308个BBox,远大于YOLO的98;

上图中,Conv4_3上面的Conv: 3*3(4*(classes+4)),前面的3*3是卷积核,后面的4是每个点的有4个anchor,所以这一层共有38*38*4个BBox,把7个卷积层加起来,一共就是7308个BBox;

另外,每个正例BBox学习的并不是绝对位置或者相对grid的位置,而是相对于ground truch的偏移,如下图:

因此,其loss function包括两部分,分类的confidence+回归相对ground truth的位置偏移,如下:

在VOC和COCO上的效果

1. 准确率上:VOC达到最高80%,COCO这个小物体也是最高26.8%;

2. 速度上,500尺寸下,SSD和YOLO基本持平,20帧,但是mAP高10点;

另外,16年的YOLOv2在检测效果和速度上更高一层,在效果保持state-of-the-art的基础上,FPS能达到50+,是SSD的2倍+,但是!小物体检测依然是YOLO的短板,COCO上的依然低于SSD5个百分点,如下:

SSD: Single Shot MultiBox DetectorWei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SSD
    SSD
    +关注

    关注

    21

    文章

    3151

    浏览量

    122613
  • voc
    voc
    +关注

    关注

    0

    文章

    111

    浏览量

    16276
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    卷积神经网络如何让自动驾驶识别障碍物?

    自动驾驶的发展过程中,感知系统一直承担车辆“眼睛”的角色,其核心任务是让计算机理解复杂多变的物理世界。卷积神经网络(CNN)作为一种专门用于处理图像和视频等网格状数据结构的深度学习模型,已经成为自动驾驶感知的基石。
    的头像 发表于 04-11 09:59 1461次阅读
    <b class='flag-5'>卷积</b><b class='flag-5'>神经网络</b>如何让自动驾驶识别障碍物?

    神经网络的初步认识

    日常生活中的智能应用都离不开深度学习,而深度学习则依赖于神经网络的实现。什么是神经网络神经网络的核心思想是模仿生物神经系统的结构,特别是大脑中神经
    的头像 发表于 12-17 15:05 461次阅读
    <b class='flag-5'>神经网络</b>的初步认识

    自动驾驶中常提的卷积神经网络是个啥?

    在自动驾驶领域,经常会听到卷积神经网络技术。卷积神经网络,简称为CNN,是一种专门用来处理网格状数据(比如图像)的深度学习模型。CNN在图像处理中尤其常见,因为图像本身就可以看作是由像
    的头像 发表于 11-19 18:15 2253次阅读
    自动驾驶中常提的<b class='flag-5'>卷积</b><b class='flag-5'>神经网络</b>是个啥?

    CNN卷积神经网络设计原理及在MCU200T上仿真测试

    数的提出很大程度的解决了BP算法在优化深层神经网络时的梯度耗散问题。当x&gt;0 时,梯度恒为1,无梯度耗散问题,收敛快;当x&lt;0 时,该层的输出为0。 CNN
    发表于 10-29 07:49

    NMSIS神经网络库使用介绍

    :   神经网络卷积函数   神经网络激活函数   全连接层函数   神经网络池化函数   Softmax 函数   神经网络支持功能
    发表于 10-29 06:08

    构建CNN网络模型并优化的一般化建议

    整个模型非常巨大。所以要想实现轻量级的CNN神经网络模型,首先应该避免尝试单层神经网络。 2)减少卷积核的大小:CNN神经网络是通过权值共享的方式,利用
    发表于 10-28 08:02

    卷积运算分析

    的数据,故设计了ConvUnit模块实现单个感受域规模的卷积运算. 卷积运算:不同于数学当中提及到的卷积概念,CNN神经网络中的卷积严格意义
    发表于 10-28 07:31

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    模型。 我们使用MNIST数据集,训练一个卷积神经网络(CNN)模型,用于手写数字识别。一旦模型被训练并保存,就可以用于对新图像进行推理和预测。要使用生成的模型进行推理,可以按照以下步骤进行操作: 1.
    发表于 10-22 07:03

    CICC2033神经网络部署相关操作

    读取。接下来需要使用扩展指令,完成神经网络的部署,此处仅对第一层卷积+池化的部署进行说明,其余层与之类似。 1.使用 Custom_Dtrans 指令,将权重数据、输入数据导入硬件加速器内。对于权重
    发表于 10-20 08:00

    液态神经网络(LNN):时间连续性与动态适应性的神经网络

    1.算法简介液态神经网络(LiquidNeuralNetworks,LNN)是一种新型的神经网络架构,其设计理念借鉴自生物神经系统,特别是秀丽隐杆线虫的神经结构,尽管这种微生物的
    的头像 发表于 09-28 10:03 1570次阅读
    液态<b class='flag-5'>神经网络</b>(LNN):时间连续性与动态适应性的<b class='flag-5'>神经网络</b>

    神经网络的并行计算与加速技术

    随着人工智能技术的飞速发展,神经网络在众多领域展现出了巨大的潜力和广泛的应用前景。然而,神经网络模型的复杂度和规模也在不断增加,这使得传统的串行计算方式面临着巨大的挑战,如计算速度慢、训练时间长等
    的头像 发表于 09-17 13:31 1299次阅读
    <b class='flag-5'>神经网络</b>的并行计算与加速技术

    基于FPGA的SSD目标检测算法设计

    随着人工智能的发展,神经网络正被逐步应用于智能安防、自动驾驶、医疗等各行各业。目标识别作为人工智能的一项重要应用也拥有着巨大的前景,随着深度学习的普及和框架的成熟,卷积神经网络模型的识别精度越来越高
    的头像 发表于 07-10 11:12 2762次阅读
    基于FPGA的<b class='flag-5'>SSD</b>目标<b class='flag-5'>检测</b>算法设计

    【嘉楠堪智K230开发板试用体验】01 Studio K230开发板Test2——手掌,手势检测,字符检测

    这篇发完就继续去整比赛了,后续看电赛上k230的发挥吧 之前的颜色识别和二维码识别功能,类似于使用基础工具进行图像分析,适用于简单任务,但在复杂场景下能力有限。 KPU(神经网络处理器)则是
    发表于 07-10 09:45

    卷积神经网络如何监测皮带堵料情况 #人工智能

    卷积神经网络
    jf_60804796
    发布于 :2025年07月01日 17:08:42

    无刷电机小波神经网络转子位置检测方法的研究

    MATLAB/SIMULINK工具对该方法进行验证,实验结果表明该方法在全程速度下效果良好。 纯分享帖,点击下方附件免费获取完整资料~~~ *附件:无刷电机小波神经网络转子位置检测方法的研究.pdf
    发表于 06-25 13:06