FDDB datasets and evaluation · KaLyo's Notes
DATASETS
人脸数据集,有大约2800多张图片。这里主要讲其用于人脸检测的部分。这个数据集也可以用于做人脸对齐(face alignment)
数据集主要来自于网络上新闻媒体里的图片。经过相似图片剔除后留下大约2800多张。分为10个folder,每个folder300张左右。
EVALUATION
接受输入
人脸检测上的评测接受两种类型的输入。
- 一种是常用的矩形框,包括faster rcnn等目前绝大多数人脸检测算法输出都是矩形框。共有5个参数,包括矩形的4个参数以及置信度confidence。
- 另一种是椭圆框。FDDB给出的ground truth就是椭圆框。以6个参数表示,5个参数表示椭圆,长轴,短轴,中心点坐标以及旋转角度。第六个参数置信度confidence。
评价标准
以两条ROC曲线作为FDDB数据集上的评价标准。
- ContROC (连续)
- DiscROC (离散)
这两条曲线的横轴都是FP(false positive),也就是误检的意思。在人脸检测中,就是说,算法标出了某个框的位置,但是这个框实际上并不存在人脸。所以,对于一个好的算法,这个值应该低,这个用于限制以免算法标出所有可能的矩形框。
对于DiscROC曲线,将算法检测出来的所有框按的信度从高到低排个序,并去除相同置信度的值。
1 | s_1>s_2>...>s_n |
1 |
|
1 | # 连续型的就是将y = y + 1 |
几点理解
- 相同算法,FP越多,检测越精细,y的值越高(好),x也越大(不好),所以曲线越左上角越好。
- DiscROC总是比ContROC高,因为IoU总是小于等于1,尤其是以矩形框作为输入评测的时候,计算过FDDB的矩形框与其椭圆gt的IoU理论上的UpperBound也只有0.8-0.85的样子。
- faster rcnn在Disc上表现优异,在Cont上表现较差。实际上这是关系到以什么样的数据集去训练的问题。个人觉得FDDB这个椭圆形的框还是有点问题的,在其他数据集上的矩形框进行训练还是不太合适。因为在离散上是y=y+1,因此在离散上依然表现优异。
- 要想在ContROC上效果跑好,自己标数据集是可行的一套方法。以及在评测的时候以椭圆框而不是以矩形框作为输入。