我正在使用tensorflow训练CNN识别验证码图像 . 我正在使用多字符分类,而不是在个别角色上对网络进行分段和训练 .

我的训练集中有大约60,000张图像 . 问题是我的CNN在几次迭代后开始输出相同的值 . 然后我将输入图像标准化 . 图像是RGB值,因此范围为[0,255] . 归一化后,输入图像为[0,1] . 即使在归一化之后,CNN在几次迭代后输出相同的值 .

我减少了号码 . 训练图像从60,000到10,000 . 问题仍然存在 . 我把它减少到10张图片 . 然后,它没有输出相同的值 .

这种行为的可能原因是什么?

EDIT

我最初有3层,每层有一个Convolutional和Max Pool层,最后有两层完全连接的层 . 我减少了图层并使用了2层CNN和Max池连接到2个完全连接的层 . 我也减少了号码 . 卷积层中的滤波器 . 我在10,000张图像上训练了这个网络,输出结果不一样 . 虽然我只有10%的准确率,但至少网络没有收敛到单一输出 .

所以,现在我将数据从10,000张图像增加到45,000张图像 . 现在,问题又开始了 . 网络开始在时代2中预测相同的输出 .

我注意到了一件事 . 在网络开始预测相同的值之前,损失会大大减少 .

我正在使用50的迷你批量,并打印每50个批次的损失 . 损失正在减缓,但从30000.00(约)到2000.00(约)突然下降 . 然后输出都是一样的 .

怎么了?有人可以解释这个问题以及我该如何处理?