我使用Keras库实现的神经网络以及下面是训练期间的结果 . 最后,它打印测试分数和测试准确性 . 我无法确切地知道得分代表什么,但我认为准确度是运行测试时正确的预测数量 .
大纪元1/15 1200/1200 [==============================] - 4s - 损失:0.6815 - acc:0.5550 - val_loss:0.6120 - val_acc:0.7525 Epoch 2/15 1200/1200 [==============================] - 3s - 损失:0.5481 - acc:0.7250 - val_loss:0.4645 - val_acc:0.8025 Epoch 3/15 1200/1200 [=========================== ===] - 3s - 损失:0.5078 - acc:0.7558 - val_loss:0.4354 - val_acc:0.7975 Epoch 4/15 1200/1200 [==================== ==========] - 3s - 损失:0.4603 - acc:0.7875 - val_loss:0.3978 - val_acc:0.8350 Epoch 5/15 1200/1200 [============= =================] - 3s - 损失:0.4367 - acc:0.7992 - val_loss:0.3809 - val_acc:0.8300 Epoch 6/15 1200/1200 [====== ========================] - 3s - 损失:0.4276 - acc:0.8017 - val_loss:0.3884 - val_acc:0.8350 Epoch 7/15 1200/1200 [==============================] - 3s - 损失:0.3975 - acc:0.8167 - val_loss:0.3666 - val_acc:0.8400 Epoch 8/15 1200/1200 [==============================] - 3s - 损失:0.3916 - acc:0.8183 - val_loss:0.3753 - val_acc:0.845 0 Epoch 9/15 1200/1200 [==============================] - 3s - 损失:0.3814 - acc:0.8233 - val_loss:0.3505 - val_acc:0.8475 Epoch 10/15 1200/1200 [==============================] - 3s - 损失:0.3842 - acc:0.8342 - val_loss:0.3672 - val_acc:0.8450 Epoch 11/15 1200/1200 [=========================== ===] - 3s - 损失:0.3674 - acc:0.8375 - val_loss:0.3383 - val_acc:0.8525 Epoch 12/15 1200/1200 [==================== ==========] - 3s - 损失:0.3624 - acc:0.8367 - val_loss:0.3423 - val_acc:0.8650 Epoch 13/15 1200/1200 [============= =================] - 3s - 损失:0.3497 - acc:0.8475 - val_loss:0.3069 - val_acc:0.8825 Epoch 14/15 1200/1200 [====== ========================] - 3s - 损失:0.3406 - acc:0.8500 - val_loss:0.2993 - val_acc:0.8775 Epoch 15/15 1200/1200 [==============================] - 3s - 损失:0.3252 - acc:0.8600 - val_loss:0.2960 - val_acc:0.8775 400/400 [==============================] - 0s考试成绩:0.299598811865考试准确度:0.88
看着Keras documentation,我仍然不明白得分是多少 . 对于评估函数,它说:
返回测试模式下模型的损失值和指标值 .
我注意到的一件事是,当测试精度较低时,分数较高,而当准确度较高时,分数较低 .
2 回答
供参考,代码的两个相关部分:
Score is the evaluation of the loss function for a given input.
培训网络正在寻找最小化损失函数(或成本函数)的参数 .
这里的成本函数是
binary_crossentropy
.对于目标T和网络输出O,二进制交叉熵可以定义为
f(T,O)= - (T * log(O)(1-T)* log(1-O))
所以你看到的分数是对它的评价 .
如果你给它输入一批输入,它很可能会返回平均损失 .
所以是的,如果你的模型具有较低的损失(在测试时),它通常应该具有较低的预测误差 .
在训练过程中经常使用损失来找到模型的“最佳”参数值(例如神经网络中的权重) . 您尝试通过更新权重来优化培训 .
从应用的角度来看,准确性更高 . 找到上述优化参数后,您可以使用此指标评估模型预测与真实数据的准确度 .
这个答案提供了详细信息:
How to interpret "loss" and "accuracy" for a machine learning model