目标检测SSD相对于YOLO与faster-RCNN做了哪些改进?效果如何呢?
11 个回答
菜狗来怒答一发,我认为SSD算是YOLO的多尺度版本,由于YOLO对小目标检测效果不好,所以SSD在不同的feature map上分割成grid然后采用类似RPN的方式做回归,例如对于VGG16来说,conv3相对于conv5来说感知小目标的能力较强,同时对目标的位置感知较为准确,而对conv5来说层越深并且语义信息较强,feature map相对于input size来说已经缩小了16倍,对小目标来说决策能力太弱这也是detection比classification难得地方,此外SSD还去掉了两个fc来达到加速detector的目的
Faster R-CNN 分成了两个阶段:区域提名,细化分类,而SSD就一气呵成.
通俗地讲,是有一位老人在中国南海画了一个圈,,呃,偏了,
通俗地讲,他们都是在原图上预先画了很多个框框,然后判断这些框框是不是前景.这和传统的滑窗有点像,anchor代表了不同size和比例的滑窗.但feature map的感受野更大一点,特征提取的也更好.
总的来说,SSD和rpn相似
rpn二分类,是在conv4 这一层feature map先加上3x3的卷积(经评论区指正)再进行1x1的卷积生成512-d或256-d的向量判断当前9个anchor是不是有Object.
SSD细分类,然后会在多层feature map上面预测,预测预先确定好了'anchor'是什么Object.弥补了yolo只在最后一层分成7x7的框,捡了许多漏检的.而且是很多,最新的ssd512捡了更多.
另外,在训练的时候,SSD按照默认的配置训练起来很慢,而且用resnet提升不高,但是需要24g显存,(ssd500,这导致直接被管理员kill了,郁闷!).ssd在预测上面确实比较快,0.28秒一张(TITan X)
在小物体预测上面,faster rcnn比ssd,yolo要好.最近yolov2出了,之前一直被吐槽的性能好了很多,速度也快,题主可以玩玩,比纯faster rcnn+resnet 还好了.单看论文名字就知道很厉害.
YOLO9000: Better, Faster, Stronger
粗浅的见解,见笑了.