目标检测 | 经典算法笔记—Cascade R-CNN再回首
AI研习图书馆,发现不一样的精彩世界
论文:https://arxiv.org/abs/1712.00726 代码:https://github.com/zhaoweicai/cascade-rcnn
在训练期间过拟合,导致正样本指数消失 检测算法最佳的IOU和假设的IOU间不匹配
为了解决以上问题,在多阶段检测架构中提出了级联R-CNN算法,由一系列随着IOU阈值增加而训练的检测器组成,循序渐进的对接近的负例更具选择性。检测器被阶段性的训练,如果检测器的输出是一个好的分布,则用于训练下一个阶段更好的检测器。
对逐渐改进的假设进行重采样,保证所有的检测器由一组同等大小的正样本组成,缓解过拟合问题。在假设阶段应用同样的级联程序,使得每一个阶段的假设和检测器的质量有更匹配的性能,级联R-CNN算法的简单实现,在COCO数据集上检测性能超过了所有单阶段目标检测算法。
识别问题:区分前景物体与背景,并为其分配类别标签 定位问题:预测目标位置,找到正例,抑制负例
在本文中,作者提出了一种检测器架构Cascade R-CNN来解决这些问题,其是R-CNN的多阶段延伸,级联更深的检测器对接近的负例有更强的选择性。R-CNN的级联是按顺序训练的,一个阶段的输出来训练下一阶段,这是由观察到回归器的输出IoU几乎总是优于输入IoU的动机。用某个IoU阈值训练的检测器的输出是良好的分布以训练下一个较高IoU阈值的检测器。
Cascade R-CNN的实施和端对端训练非常简单。作者的研究结果表明,在没有任何花销的情况下,在很大程度上超过了所有先前的state-of-the-art 的单阶段检测器。
Faster R-CNN
Iterative BBox at inference
Integral Loss
不同的classifer的正样本数量是不一样的 推理时,高质量的分类器需要处理相对低质量的bndbox
因此,Integral loss在很多IoU水平难以表现出高的准确率。相对于原始的two-stage架构,Integral loss的架构收益相对较小。
Cascaded Bounding Box Regression
级联回归为可以改变bndbox分布的重采样过程 级联回归在训练和推理时是一致的 级联回归的多个回归器对于相应阶段的输入分布是最优的
Cascaded Detection
初始的bndbox分布大多落在低质量的区域 regressor都倾向于能够提升bndbox的IoU
不会存在某个阈值的regressor过拟合 高阶段的检测器对于高IoU阈值是最优的
随着阶段的深入,一些离群点会被过滤,这保证了特定阈值检测器的训练。
部分实验设置:
所有回归都带分类,级联架构相同 4个stage,一个为RPN,其余为U={0.5, 0.6, 0.7}的检测器 垂直翻转数据增强及单一图片输入尺寸
u=0.5不是一个好的选择,仅限于低质量锚框 高质量的检测器,高质量的边框输入
Comparison with Iterative BBox and Integral Loss
七、Conclusion
赞 (0)