容量至关重要!
我们还观察到,为了充分利用3亿张图像,需要更高容量的模型。例如,在ResNet-50的情况下,COCO对象检测的增益(1.87%),比使用ResNet-152(3%)时,要小得多。
长尾训练:我们的数据有相当长的尾巴,表征学习似乎有效。这种长尾似乎不会对卷积神经网络的随机训练产生不利影响(训练仍然趋于收敛)。
最新技术成果:最后,我们的论文使用从JFT-300M获得模型,在几个基准上提出了新成果。例如,一个单一的模型(没有任何bell和whistle)AP(目标检测中衡量检测精度的指标)达到 37.4,而COCO检测基准的AP为34.3。