摘要:
目前目标检测精度最高的是RCNN引导的两阶段的方法,相反,一阶段的方法更快更简单,但是精度落后很多. 我们发现这种根本原因是因为在训练过程中正负样本不均衡。本文提出了改变标准交叉熵损失:降低易分样本的损失权重的方法来解决这种类别不平衡方法。为了检验方法的有效性,还提出了一个RetinaNet,速度可以和一阶段的检测器相媲美而且检测精度也很高。
处理样本不均衡的常用方法:
- SSD+hard negative mining(OHNM):匹配default box之后根据box的confidence排序得到正样本三倍数量的负样本(正负比例1:3)
- Fast RCNN+ONEM:引入read only层先forward一遍样本,选取loss最大的前N个重新送入ROIpooling,仅解决了easy example的问题。
- Class Balanced Loss:分别计算正负样本的loss,引入权重来实现平衡,主要考虑类间平衡。
- Focal Loss:改进的CE loss,动态调整参数均衡正负样本不均衡。