我尝试使用自定义数据集从头开始训练Inception v1模型(由TensorFlow-Slim提供) .

我的数据集大约是10k个样本 . 此数据集包含两个类(二进制分类),样本大小均匀分布 . 当我使用tf-slim训练初始v1模型时,预测总是相同的,直到150个时期(在测试数据集的准确度也增加之后) .

损失不断减少,准确性增加 . 大约在60个时期之后,损失大约为0.01,模型的训练精度为100% .

  • 批量大小:64

  • Adam Optimizer:学习率0.0001,默认tf设置:beta1 = 0.9,beta2 = 0.999,除了epsilon,它是1.0

  • 损失:Softmax交叉熵

这很奇怪,我不确定这种行为是否正常?可能是什么原因,错误的损失函数,学习率,批量大小?