大家

我训练了一个大模型,它在训练时表现很好 . 但是因为我设置了一个小的纪元数字,当我训练所有时代时,损失和arruarcy仍在改善 . 所以我想继续训练模型从最后一个检查点并加载训练有素的人

但这不是我的想法,损失从比上一个检查点更差的值开始但不是0(与准确度相同) . 我将学习率设置为与上一个检查点lr相同并且没有改变关于模型的任何内容,但是我不能像我想象的那样继续训练模型 .

问:那不是为什么我该怎么办?(ps,我使用张量流)