目标检测SSD相对于YOLO与faster-RCNN做了哪些改进？效果如何呢？

Question

目标检测

深度学习（Deep Learning）

目标检测SSD相对于YOLO与faster-RCNN做了哪些改进？效果如何呢？

fasterRCNN在RCNN的基础上，提出了RPN生成候选框，结合fastRCNN同时做分类与回归，但速度上仍不理想。YOLO对图像划分网格，直接对…

关注者

501

被浏览

80,164

11 个回答

Faster R-CNN 分成了两个阶段:区域提名,细化分类,而SSD就一气呵成.

通俗地讲,是有一位老人在中国南海画了一个圈,,呃,偏了,

通俗地讲,他们都是在原图上预先画了很多个框框,然后判断这些框框是不是前景.这和传统的滑窗有点像,anchor代表了不同size和比例的滑窗.但feature map的感受野更大一点,特征提取的也更好.

总的来说,SSD和rpn相似

rpn二分类,是在conv4 这一层feature map先加上3x3的卷积(经评论区指正)再进行1x1的卷积生成512-d或256-d的向量判断当前9个anchor是不是有Object.

SSD细分类,然后会在多层feature map上面预测,预测预先确定好了'anchor'是什么Object.弥补了yolo只在最后一层分成7x7的框,捡了许多漏检的.而且是很多,最新的ssd512捡了更多.

另外,在训练的时候,SSD按照默认的配置训练起来很慢,而且用resnet提升不高,但是需要24g显存,(ssd500,这导致直接被管理员kill了,郁闷!).ssd在预测上面确实比较快,0.28秒一张(TITan X)

在小物体预测上面,faster rcnn比ssd,yolo要好.最近yolov2出了,之前一直被吐槽的性能好了很多,速度也快,题主可以玩玩,比纯faster rcnn+resnet 还好了.单看论文名字就知道很厉害.

YOLO9000: Better, Faster, Stronger

arxiv: https://arxiv.org/abs/1612.08242
code: http://pjreddie.com/yolo9000/

粗浅的见解,见笑了.

编辑于 2017-08-22 10:33

知乎用户6uI7R8 · Accepted Answer

菜狗来怒答一发，我认为SSD算是YOLO的多尺度版本，由于YOLO对小目标检测效果不好，所以SSD在不同的feature map上分割成grid然后采用类似RPN的方式做回归，例如对于VGG16来说，conv3相对于conv5来说感知小目标的能力较强，同时对目标的位置感知较为准确，而对conv5来说层越深并且语义信息较强，feature map相对于input size来说已经缩小了16倍，对小目标来说决策能力太弱这也是detection比classification难得地方，此外SSD还去掉了两个fc来达到加速detector的目的

编辑于 2016-09-24 12:40