我尝试在预训练的初始模型之上重新训练(新图像,新类),因此我遵循了初始自述文件的说明:https://github.com/tensorflow/models/tree/master/inception#how-to-construct-a-new-dataset-for-retraining
我使用bazel成功构建并运行 build_image_data ,如教程中所述 . 之后我使用bazel成功构建了inception_train:
~/tensorflowmodels/models/inception# bazel build inception/inception_train
INFO: Found 1 target...
Target //inception:inception_train up-to-date (nothing to build)
INFO: Elapsed time: 0.073s, Critical Path: 0.00s
但是,运行bazel-bin / inception / inception_train我总是得到以下内容:
~/tensorflowmodels/models/inception# bazel-bin/inception/inception_train --train_dir="/" --validation_dir="/" --data_dir="/images_jpg/" --pretrained_model_checkpoint_path="/tensorflowmodels/models/inception/inception-v3/" --fine_tune=True --initial_learning_rate=0.001 --input_queue_memory_factor=1 --num_gpus=1
-bash: bazel-bin/inception/inception_train: No such file or directory
当然,我会说它错误率为99.9999% . 所以我试着用python运行inception_train.py . 我不得不改变一些导入位置,最后运行参数 . 但是,在CUDA驱动程序初始化之后,脚本会停止,而不会显示任何错误消息 .
任何有关如何解决这个问题的帮助(或者在开始时进行微调/再训练)都将非常感激 .
-
tensorflow version :0.9rc0
-
CPU :Xeon 5,24核心
-
GPU :网格K2 8 GB
-
OS :Ubuntu 14.04
顺便说一句,我已经将这个问题发布为Github问题(已关闭,因为Stack Overflow会更多) .