我尝试在预训练的初始模型之上重新训练(新图像,新类),因此我遵循了初始自述文件的说明:https://github.com/tensorflow/models/tree/master/inception#how-to-construct-a-new-dataset-for-retraining

我使用bazel成功构建并运行 build_image_data ,如教程中所述 . 之后我使用bazel成功构建了inception_train:

~/tensorflowmodels/models/inception# bazel build inception/inception_train
INFO: Found 1 target...
Target //inception:inception_train up-to-date (nothing to build)
INFO: Elapsed time: 0.073s, Critical Path: 0.00s

但是,运行bazel-bin / inception / inception_train我总是得到以下内容:

~/tensorflowmodels/models/inception# bazel-bin/inception/inception_train   --train_dir="/"   --validation_dir="/"   --data_dir="/images_jpg/"   --pretrained_model_checkpoint_path="/tensorflowmodels/models/inception/inception-v3/"   --fine_tune=True   --initial_learning_rate=0.001   --input_queue_memory_factor=1   --num_gpus=1
-bash: bazel-bin/inception/inception_train: No such file or directory

当然,我会说它错误率为99.9999% . 所以我试着用python运行inception_train.py . 我不得不改变一些导入位置,最后运行参数 . 但是,在CUDA驱动程序初始化之后,脚本会停止,而不会显示任何错误消息 .

任何有关如何解决这个问题的帮助(或者在开始时进行微调/再训练)都将非常感激 .

  • tensorflow version :0.9rc0

  • CPU :Xeon 5,24核心

  • GPU :网格K2 8 GB

  • OS :Ubuntu 14.04

顺便说一句,我已经将这个问题发布为Github问题(已关闭,因为Stack Overflow会更多) .