2015年,YOLO之后,另外一个直接回归的方法SSD,以state-of-the-art的检测效果和检测效率横空出世;
SSD,single shot multibox detector
直接看下图吧,可以看出,YOLO是在卷积层后加了FC,然后预估2*7*7共49个位置98BBox;而SSD显著的不同就是多尺度:1) 多尺度的feature map上提取特征,通过3*3的卷积核,保证特征的细粒度和丰富性; 2) 多尺度feature map上抽取anchor,每张图共有7308个BBox,远大于YOLO的98;
上图中,Conv4_3上面的Conv: 3*3(4*(classes+4)),前面的3*3是卷积核,后面的4是每个点的有4个anchor,所以这一层共有38*38*4个BBox,把7个卷积层加起来,一共就是7308个BBox;
另外,每个正例BBox学习的并不是绝对位置或者相对grid的位置,而是相对于ground truch的偏移,如下图:
因此,其loss function包括两部分,分类的confidence+回归相对ground truth的位置偏移,如下:
在VOC和COCO上的效果
1. 准确率上:VOC达到最高80%,COCO这个小物体也是最高26.8%;
2. 速度上,500尺寸下,SSD和YOLO基本持平,20帧,但是mAP高10点;
另外,16年的YOLOv2在检测效果和速度上更高一层,在效果保持state-of-the-art的基础上,FPS能达到50+,是SSD的2倍+,但是!小物体检测依然是YOLO的短板,COCO上的依然低于SSD5个百分点,如下:
SSD: Single Shot MultiBox DetectorWei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg
-
SSD
+关注
关注
20文章
2689浏览量
115492 -
voc
+关注
关注
0文章
90浏览量
15572
发布评论请先 登录
相关推荐
评论