目前我正在培训类似于Flickrlogos-32的小型徽标数据集,其中包含深度CNN . 为了训练更大的网络,我需要更多的数据集,因此使用扩充 . 最好的国家数据科学碗forum但不能给出here的某些方法的代码,但我不确定什么是有用的 . 除了仿射变换之外,还有哪些其他(或更好)的图像数据增强技术可应用于此类(或任何一般图像)数据集?
目前我正在培训类似于Flickrlogos-32的小型徽标数据集,其中包含深度CNN . 为了训练更大的网络,我需要更多的数据集,因此使用扩充 . 最好的国家数据科学碗forum但不能给出here的某些方法的代码,但我不确定什么是有用的 . 除了仿射变换之外,还有哪些其他(或更好)的图像数据增强技术可应用于此类(或任何一般图像)数据集?
2 回答
可以找到一个很好的回顾here,关于数据增强的第1部分:即 flips , random crops 和 color jittering 以及 lighting noise :
另外,您还可以看看Kaggle Galaxy Zoo的挑战:获胜者写了一个very detailed blog post . 它涵盖了相同的技术:
轮换,
翻译,
zoom,
翻转,
颜色扰动 .
如上所述,他们也“实时地,即在训练期间”这样做 .
例如,这是一个实用的Torch implementation由Facebook(为ResNet培训) .
我在my masters thesis, page 80收集了几种增强技术 . 这包括:
放大,
裁剪
翻转(水平/垂直)
轮换
缩放
剪毛
Channels 转换(rgb,hsv)
对比
噪音,
渐晕