卷积神经网络输出相同的值-Java 学习之路

我正在使用tensorflow训练CNN识别验证码图像 . 我正在使用多字符分类，而不是在个别角色上对网络进行分段和训练 .

我的训练集中有大约60,000张图像 . 问题是我的CNN在几次迭代后开始输出相同的值 . 然后我将输入图像标准化 . 图像是RGB值，因此范围为[0,255] . 归一化后，输入图像为[0,1] . 即使在归一化之后，CNN在几次迭代后输出相同的值 .

我减少了号码 . 训练图像从60,000到10,000 . 问题仍然存在 . 我把它减少到10张图片 . 然后，它没有输出相同的值 .

这种行为的可能原因是什么？

EDIT

我最初有3层，每层有一个Convolutional和Max Pool层，最后有两层完全连接的层 . 我减少了图层并使用了2层CNN和Max池连接到2个完全连接的层 . 我也减少了号码 . 卷积层中的滤波器 . 我在10,000张图像上训练了这个网络，输出结果不一样 . 虽然我只有10％的准确率，但至少网络没有收敛到单一输出 .

所以，现在我将数据从10,000张图像增加到45,000张图像 . 现在，问题又开始了 . 网络开始在时代2中预测相同的输出 .

我注意到了一件事 . 在网络开始预测相同的值之前，损失会大大减少 .

我正在使用50的迷你批量，并打印每50个批次的损失 . 损失正在减缓，但从30000.00（约）到2000.00（约）突然下降 . 然后输出都是一样的 .

怎么了？有人可以解释这个问题以及我该如何处理？

卷积神经网络输出相同的值

相关问题