Fast R-CNN
写在前面
这篇论文出自RGB,发表在ICCV-2015上,是R-CNN与SPPnet的改进版。相比于RCNN,FRCN在训练阶段快9倍,测试阶段快213倍。相比于SPPnet,FRCN在训练阶段快3倍,测试阶段快10倍,并且准确率也有了一定的提高。
主要思想
文章开篇就指出了之前方法的几个不足:
- 训练分了多个阶段组成,因为网络中既有ConvNets也有SVM,非常麻烦
- 训练非常的慢,而且会额外占用硬盘空间
- 检测速度很慢
本文提出的Fast R-CNN计算过程如下图所示
Fast R-CNN的贡献点可以归结为两点:
-
实现了大部分的端到端训练,用Softmax代替了SVM
-
提出了ROI pooling层,可以不用每个proposal都做一次前向计算了
部分细节:
- 论文使用了smooth l1作为回归loss,避免了l2容易梯度爆炸的问题
- 论文将比较大的全链接层用SVD分解了一下使得检测的时候更加迅速。
开源代码
作者开源了他的代码:Caffe