2020-06-20: 更大规模的数据集是否会进一步地提高时空3DCNN的性能呢?

2020-06-20: Would Mega-scale Datasets Further Enhance Spatiotemporal 3D CNNs?

Posted by kiwi on June 20, 2020

1. Would Mega-scale Datasets Further Enhance Spatiotemporal 3D CNNs?

更大规模的数据集是否会进一步地提高时空3DCNN的性能呢?

结论是可以的。但是边际收益在下降。

  1. 大的数据集预训练能够提升性能。(Kinetics-700 > Kinetics -400)

  2. 大的数据集能训更深的模型 (Kinetics-700 with ResNet-200 √, Kinetics-400 with ResNet-200 X)

  3. 构建数据集时,应该保持类别数补办,然后增加类别的内instance数量。

  4. Released Model and Code on Github

2. Large-scale weakly-supervised pre-training for video action recognition, CVPR 2019

这里facebook提出了更大的数据集IG-Kinetics-19M. Bigger than bigger.