首页 文章

小图像数据集的数据增强技术?

提问于
浏览
13

目前我正在培训类似于Flickrlogos-32的小型徽标数据集,其中包含深度CNN . 为了训练更大的网络,我需要更多的数据集,因此使用扩充 . 最好的国家数据科学碗forum但不能给出here的某些方法的代码,但我不确定什么是有用的 . 除了仿射变换之外,还有哪些其他(或更好)的图像数据增强技术可应用于此类(或任何一般图像)数据集?

2 回答

  • 15

    可以找到一个很好的回顾here,关于数据增强的第1部分:即 flipsrandom cropscolor jittering 以及 lighting noise

    Krizhevsky等 . 在2012年训练着名的Alex-Net时提出了花哨的PCA.Fancy PCA改变了训练图像中RGB通道的强度 .

    另外,您还可以看看Kaggle Galaxy Zoo的挑战:获胜者写了一个very detailed blog post . 它涵盖了相同的技术:

    • 轮换,

    • 翻译,

    • zoom,

    • 翻转,

    • 颜色扰动 .

    如上所述,他们也“实时地,即在训练期间”这样做 .

    例如,这是一个实用的Torch implementation由Facebook(为ResNet培训) .

  • 2

    我在my masters thesis, page 80收集了几种增强技术 . 这包括:

    • 放大,

    • 裁剪

    • 翻转(水平/垂直)

    • 轮换

    • 缩放

    • 剪毛

    • Channels 转换(rgb,hsv)

    • 对比

    • 噪音,

    • 渐晕

相关问题