Tensorflow - 准确度从1.0开始，随着损失而减少-Java 学习之路

我在10K灰度图像上训练CNN . 该网络有6个转换层，1个完全连接层和1个输出层 .

当我开始训练损失的疯狂高但稳步减少，但我的准确率从1.0开始，也减少 . 并且从72％下降到30％并再次回升 . 此外，当我在看不见的图像上运行 acc.eval({x: test_images, y: test_lables}) 时，精度约为16％ .

另外，我有6个类，所有这些类都是单热编码的 .

我想我可能会错误地比较预测输出，但无法看到我的代码中的错误...

这是我的代码

pred = convolutional_network(x)
loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels = y, logits = pred))
train_op = tf.train.AdamOptimizer(learning_rate=0.01).minimize(loss)

prediction = tf.nn.softmax(pred)
correct = tf.equal(tf.argmax(prediction, 1), tf.argmax(y, 1))
acc = tf.reduce_mean(tf.cast(correct, 'float'))

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer()) # Initialize all the variables
    saver = tf.train.Saver()

    time_full_start = time.clock()
    print("RUNNING SESSION...")
    for epoch in range(num_epochs):
        train_batch_x = []
        train_batch_y = []
        epoch_loss = 0
        i = 0
        while i < len(images):
            start = i
            end = i+ batch_size
            train_batch_x = images[start:end]
            train_batch_y = labels[start:end]
            op , ac, loss_value = sess.run([train_op, acc, loss], feed_dict={x: train_batch_x, y: train_batch_y})
            epoch_loss += loss_value
            i += batch_size
        print('Epoch : ', epoch+1, ' of ', num_epochs, ' - Loss for epoch: ', epoch_loss, ' Accuracy: ', ac)

    time_full_end = time.clock()
    print('Full time elapse:', time_full_end - time_full_start)


    print('Accuracy:', acc.eval({x: test_images, y: test_labels}))

    save_path = saver.save(sess, MODEL_PATH)
    print("Model saved in file: " , save_path)

这是输出

时代：1的100 - 时代的损失：8.94737603121e 13准确度：1.0

时代：2的100 - 时代的损失：212052447727.0准确度：1.0

时代：3的100 - 时代的损失：75150603462.2准确度：1.0

时代：4的100 - 时代的损失：68164116617.4准确度：1.0

时代：5的100 - 时代的损失：18505190718.8准确度：0.99

时代：6的100 - 时代的损失：11373286689.0准确度：0.96

时代：7的100 - 时代的损失：3129798657.75准确度：0.07

时代：8的100 - 时代的损失：374790121.375准确度：0.58

时代：9的100 - 时代的损失：105383792.938准确度：0.72

时代：10的100 - 时代的损失：49705202.4844准确度：0.66

时代：11的100 - 时代的损失：30214170.7909准确度：0.36

时代：12的100 - 时代的损失：18653020.5084准确度：0.82

时代：13的100 - 时代的损失：14793638.35准确度：0.39

时代：14 of 100 - 时代的损失：10196079.7003准确度：0.73

时代：15 of 100 - 时代的损失：6727522.37319准确度：0.47

时代：16的100 - 时代的损失：4593769.05838准确度：0.68

时代：17的100 - 时代的损失：3669332.09406准确度：0.44

时代：18 of 100 - 时代的损失：2850924.81662准确度：0.59

时代：19 of 100 - 时代的损失：1780678.12892准确度：0.51

时代：20的100 - 时代的损失：1855037.40652准确度：0.61

时代：21 of 100 - 时代的损失：1012934.52827准确度：0.53

时代：第22页，共100页 - 时代损失：649319.432669准确度：0.55

时代：23 of 100 - 时代的损失：841660.786938准确度：0.57

时代：24 of 100 - 时代损失：490148.861691准确度：0.55

时代：25的100 - 时代的损失：397315.021568准确度：0.5

......................

时代：99的100 - 时代的损失：4412.61703086准确度：0.57

时代：100的100 - 时代的损失：4530.96991658准确度：0.62

全职时间：794.5787720000001

Test Accuracy: 0.158095

我已经尝试了多种学习率和网络规模，但似乎可以让它发挥作用 . 任何帮助，将不胜感激

1 回答

2
请注意，我的回答也通过审核和调试完整的代码（在问题中不可见） . 但我仍然认为，如果有人面临类似的问题，下面的问题通常足以值得审查 - 你可能会得到解决方案在这里！

疯狂的高损失值可能意味着您没有正确地将输入图像从 int8 转换为小 float32 值（事实上，他确实如此）并且您不使用批量标准化和/或正规化（事实上，两者都是缺少 . ）另外，在这段代码中：
```
prediction = tf.nn.softmax(pred)
correct = tf.equal(tf.argmax(prediction, 1), tf.argmax(y, 1))
```
计算softmax值是完全没必要的，因为softmax是一个严格单调的函数，它只是缩放预测， pred 中最大的值将是最大的 prediction ，你得到相同的结果
```
correct = tf.equal(tf.argmax(pred, 1), tf.argmax(y, 1))
```
鉴于你的网络运行的值非常高，有可能 tf.nn.softmax() 何时取幂和除以总和，它无意中将所有内容减少到零，然后 tf.argmax() 只选择0级，直到数字下降一点 . 除此之外，你没有累积 ac ：
```
op , ac, loss_value = sess.run([train_op, acc, loss], feed_dict={x: train_batch_x, y: train_batch_y})
```
所以 epoch accuracy 你're printing is not that, it'只是最后一批的准确性 . 如果您的图像是按类排序的，并且您没有随机化批次，那么您可能会在每个时期结束时获得零级图像 . 这可以解释为什么你在前几个时期获得100％的准确度，直到超高数字下降一点，而softmax不再为零 . （事实证明情况确实如此 . ）

即使在修好了上述内容之后，网络根本没有学到任何东西 . 事实证明，当他添加随机化时，图像和标签的随机化方式不同，自然会产生恒定的精确度 .

解决了所有问题后，网络能够学会达到98％的准确率这个任务在100个时代之后 .

时代：100/100亏损：6.20184610883总损失：25.4021390676 acc：97.976191％
回复于 2024-05-05T12:58:39+08:00

Tensorflow - 准确度从1.0开始，随着损失而减少

1 回答

相关问题