我是Tensorflow nood . 我按照youtube上的教程创建了一个模型来检测我的自定义对象 . 我的模型现在已经训练超过84500步,损失值似乎在 (0.8,1)
范围内收敛 . 在培训目录(我名为 models/research/object_detection/training
)中,我看到有一些文件:
checkpoint
graph.txt
...
model.ckpt-84500.data-00000-of-00001
model.ckpt-84500.index
model.ckpt-84500.meta
现在,出于某些原因,我必须继续在其他机器上训练我的模型 . 跟着this回答,我将3个文件 mode.ckpt-84500.*
复制到新机器的培训目录中 . 请记住,输入: train.record
,_ test.record
,文件配置 ssd_mobilenet_v1_pets.config
我什么都没改变 .
然后,我运行训练命令 . 我希望损失值将在 (0.8,1)
范围内 . 但不是,从检查站恢复后的损失值 84500
是我第一次跑的时候很高 . 下一个检查点为零,而不是像我预期的那样来自 84501
.
那么,我的模型是从检查点 84500
训练还是从头开始学习?
谢谢 .