目标检测SSD相对于YOLO与faster-RCNN做了哪些改进?效果如何呢?

fasterRCNN在RCNN的基础上,提出了RPN生成候选框,结合fastRCNN同时做分类与回归,但速度上仍不理想。YOLO对图像划分网格,直接对…
关注者
501
被浏览
80,164

11 个回答

菜狗来怒答一发,我认为SSD算是YOLO的多尺度版本,由于YOLO对小目标检测效果不好,所以SSD在不同的feature map上分割成grid然后采用类似RPN的方式做回归,例如对于VGG16来说,conv3相对于conv5来说感知小目标的能力较强,同时对目标的位置感知较为准确,而对conv5来说层越深并且语义信息较强,feature map相对于input size来说已经缩小了16倍,对小目标来说决策能力太弱这也是detection比classification难得地方,此外SSD还去掉了两个fc来达到加速detector的目的

Faster R-CNN 分成了两个阶段:区域提名,细化分类,而SSD就一气呵成.

通俗地讲,是有一位老人在中国南海画了一个圈,,呃,偏了,

通俗地讲,他们都是在原图上预先画了很多个框框,然后判断这些框框是不是前景.这和传统的滑窗有点像,anchor代表了不同size和比例的滑窗.但feature map的感受野更大一点,特征提取的也更好.

总的来说,SSD和rpn相似

rpn二分类,是在conv4 这一层feature map先加上3x3的卷积(经评论区指正)再进行1x1的卷积生成512-d或256-d的向量判断当前9个anchor是不是有Object.

SSD细分类,然后会在多层feature map上面预测,预测预先确定好了'anchor'是什么Object.弥补了yolo只在最后一层分成7x7的框,捡了许多漏检的.而且是很多,最新的ssd512捡了更多.

另外,在训练的时候,SSD按照默认的配置训练起来很慢,而且用resnet提升不高,但是需要24g显存,(ssd500,这导致直接被管理员kill了,郁闷!).ssd在预测上面确实比较快,0.28秒一张(TITan X)

在小物体预测上面,faster rcnn比ssd,yolo要好.最近yolov2出了,之前一直被吐槽的性能好了很多,速度也快,题主可以玩玩,比纯faster rcnn+resnet 还好了.单看论文名字就知道很厉害.

YOLO9000: Better, Faster, Stronger

粗浅的见解,见笑了.