我正在使用ResNet101快速R-CNN教程训练牛津数据集 .
我正在本地计算机上运行培训,其中1个GPU不使用Google Cloud .
我的问题是,我可以知道最大迭代次数是多少?
我的步骤已经超过13,000,000并且还没有停止 .
原来更快的r-cnn可以在这里定义最大迭代大小https://github.com/rbgirshick/py-faster-rcnn/blob/master/tools/train_faster_rcnn_alt_opt.py#L80
,但我不确定TensorFlow对象检测API .
我没有更改任何参数,除了input_path和fine_tune_checkpoint(我正在使用COCO预先训练的数据与ResNet) .
我认为最大迭代将在配置文件https://github.com/tensorflow/models/blob/master/object_detection/samples/configs/faster_rcnn_resnet101_pets.config#L100中,但它似乎只定义了某个步骤后的学习率 .
1 回答
根据docs
By default, the training job will run indefinitely until the user kills it
. 因此,同时运行训练和评估工作并终止进程(基于验证准确度饱和度的早期停止) .注意:从Jonathan评论中,您还可以明确添加步骤数num_steps