1. Would Mega-scale Datasets Further Enhance Spatiotemporal 3D CNNs?
更大规模的数据集是否会进一步地提高时空3DCNN的性能呢?
结论是可以的。但是边际收益在下降。
-
大的数据集预训练能够提升性能。(Kinetics-700 > Kinetics -400)
-
大的数据集能训更深的模型 (Kinetics-700 with ResNet-200 √, Kinetics-400 with ResNet-200 X)
-
构建数据集时,应该保持类别数补办,然后增加类别的内instance数量。
-
Released Model and Code on Github
2. Large-scale weakly-supervised pre-training for video action recognition, CVPR 2019
这里facebook提出了更大的数据集IG-Kinetics-19M. Bigger than bigger.
-
Previous
CVPR 2020: 时序金字塔网络以动作识别 -
Next
MIST: Multiple Instance Self-Training Framework for Video Anomaly Detection