我正在尝试使用Google Cloud Machine学习REST-API ml.jobs.project.create
我提交的最新作业显示作业ID' drivermonitoring20180109335 '. Here on completion of the job, message ' job completed successfully '但我在指定位置看不到任何所需的输出文件 . 输出日志见图1
另外,在运行此职位时,我想在你面前留下几点意见:
i) 与之前执行的任何其他工作相比,运行作业的时间要少得多 .
ii) 在之前运行作业之前,每个作业都是通过两个不同的任务执行的,即a) master-replica-0 和b) service (参见图2)
但是这个作业没有master-replica-0任务(参考图3)
我试过Google问题,但无法找到任何与该问题相关的解决方案 .
所以我可以推断出我正在尝试运行的任务正在调度,但是我尝试运行的python脚本从未被安排执行 .
如果您需要更多屏幕截图,或者如果您想查看项目结构以帮助解决问题,请告知我们 .
提前致谢 .
EDIT 1: Added JSON while making API call
POST https://ml.googleapis.com/v1/projects/drivermonitoringsystem/jobs?key={YOUR_API_KEY}
{
"trainingInput": {
"pythonModule": "trainer.retrain",
"args": [
"--bottleneck_dir=ModelTraining/tf_files/bottlenecks \
--model_dir=ModelTraining/tf_files/models/ \
--architecture=mobilenet_0.50_224 \
--output_graph=gs://<BUCKET_NAME>/tf_files/retrained_graph.pb \
--output_labels=gs://<BUCKET_NAME>/tf_files/retrained_labels.txt \
--image_dir=gs://<BUCKET_NAME>/dataset224x224/"
],
"region": "us-central1",
"packageUris": [
"gs://<BUCKET_NAME>/ModelTraining4.tar.gz"
],
"jobDir": "gs://<BUCKET_NAME>/tf_files/",
"runtimeVersion": "1.4"
},
"jobId": "job_id201801101535"
}
1 回答
我只使用gcloud command和REST API运行了一些示例作业,并且在两种情况下一切正常 . 看起来,在您的情况下,作业从未执行过,因为没有为处理作业本身而创建的集群(这就是为什么缺少master-replica-0) .
您之前运行过的作业以及哪些作业也是使用REST API启动的,或者是使用
gcloud
或客户端库启动的?在这里,我分享了一个示例JSON,我在通过您共享的API Explorer链接对ml.projects.jobs.create进行API调用时使用,我建议您尝试根据您的要求进行调整,并检查是否有任何遗漏字段:
如果您尝试运行预测作业而不是训练作业,则将TrainingInput更改为PredictionInput(以及相应的子字段),如本例所示 .