enter image description here

我在keras训练了一个简单的神经网络 . 在某些时期之后,训练损失和验证损失显示出正常的峰值 . 该图的x轴是历元,y轴是损耗 . 请注意,大的验证损失峰值对应于小的训练损失峰值 . 我用过fit_generator . 我尝试了优化器SGD和Adam,并且仍然出现尖峰 .
有趣的是,改变批量大小不会影响重复周期 .
有关为什么会这样的想法吗?