首页 文章

无法从Google机器学习Cloud REST API获得结果

提问于
浏览
0

我正在尝试使用Google Cloud Machine学习REST-API ml.jobs.project.create

我提交的最新作业显示作业ID' drivermonitoring20180109335 '. Here on completion of the job, message ' job completed successfully '但我在指定位置看不到任何所需的输出文件 . 输出日志见图1
logs on running the job

另外,在运行此职位时,我想在你面前留下几点意见:

i) 与之前执行的任何其他工作相比,运行作业的时间要少得多 .

ii) 在之前运行作业之前,每个作业都是通过两个不同的任务执行的,即a) master-replica-0 和b) service (参见图2)
enter image description here
但是这个作业没有master-replica-0任务(参考图3)
enter image description here
我试过Google问题,但无法找到任何与该问题相关的解决方案 .

所以我可以推断出我正在尝试运行的任务正在调度,但是我尝试运行的python脚本从未被安排执行 .

如果您需要更多屏幕截图,或者如果您想查看项目结构以帮助解决问题,请告知我们 .

提前致谢 .

EDIT 1: Added JSON while making API call

POST https://ml.googleapis.com/v1/projects/drivermonitoringsystem/jobs?key={YOUR_API_KEY}



{
 "trainingInput": {
  "pythonModule": "trainer.retrain",
  "args": [
   "--bottleneck_dir=ModelTraining/tf_files/bottlenecks \
    --model_dir=ModelTraining/tf_files/models/ \
    --architecture=mobilenet_0.50_224 \
    --output_graph=gs://<BUCKET_NAME>/tf_files/retrained_graph.pb \
    --output_labels=gs://<BUCKET_NAME>/tf_files/retrained_labels.txt \
    --image_dir=gs://<BUCKET_NAME>/dataset224x224/"
  ],
  "region": "us-central1",
  "packageUris": [
   "gs://<BUCKET_NAME>/ModelTraining4.tar.gz"
  ],
  "jobDir": "gs://<BUCKET_NAME>/tf_files/",
  "runtimeVersion": "1.4"
 },
 "jobId": "job_id201801101535"
}

1 回答

  • 1

    我只使用gcloud commandREST API运行了一些示例作业,并且在两种情况下一切正常 . 看起来,在您的情况下,作业从未执行过,因为没有为处理作业本身而创建的集群(这就是为什么缺少master-replica-0) .

    您之前运行过的作业以及哪些作业也是使用REST API启动的,或者是使用 gcloud 或客户端库启动的?

    在这里,我分享了一个示例JSON,我在通过您共享的API Explorer链接对ml.projects.jobs.create进行API调用时使用,我建议您尝试根据您的要求进行调整,并检查是否有任何遗漏字段:

    POST https://ml.googleapis.com/v1/projects/<YOUR_PROJECT>/jobs?key={YOUR_API_KEY}
    
    {
     "jobId": "<JOB_ID>",
     "trainingInput": {
      "jobDir": "gs://<LOCATION_TO_STORE_OUTPUTS>",
      "runtimeVersion": "1.4",
      "region": "<REGION>",
      "packageUris": [
       "gs://<PATH_TO_YOUR_TRAINER>/trainer-0.0.0.tar.gz"
      ],
      "pythonModule": "<PYTHON_MODULE_TO_RUN>",
      "args": [
       "--train-files",
       "gs://<PATH_TO_YOUR_TRAINING_DATA>/data.csv",
       "--eval-files",
       "gs://<PATH_TO_YOUR_TEST_DATA>/test.csv",
       "--train-steps",
       "100",
       "--eval-steps",
       "10",
       "--verbosity",
       "DEBUG"
      ]
     }
    }
    

    如果您尝试运行预测作业而不是训练作业,则将TrainingInput更改为PredictionInput(以及相应的子字段),如本例所示 .

相关问题