-
1 votesanswersviews
在Sagemaker模型培训中,设备上没有剩余空间
我正在使用AWS Sagemaker在p2实例上运行Docker镜像的自定义算法运行(有点类似于https://github.com/awslabs/amazon-sagemaker-examples/blob/master/advanced_functionality/scikit_bring_your_own/scikit_bring_your_own.ipynb) 在训练过程结束时,我尝试将... -
1 votesanswersviews
Sagemaker:DeepAR超参数调整错误
在尝试初始化超参数调整作业时,在SageMaker上调试DeepAR时遇到新问题 - 调用测试时也会发生此错误:mean_wQuantileLoss . 我升级了sagemaker包,重新启动了我的实例,重新启动了内核(使用juptyer笔记本),但问题仍然存在 . ClientError: An error occurred (ValidationException) when calling ... -
0 votesanswersviews
有窗户的Sagemaker
我正在尝试使用带有Docker的Windows使用aws sagemaker:这是docker文件: # Build an image that can do training and inference in SageMaker # This is a Python 2 image that uses the nginx, gunicorn, flask stack # for serving ... -
1 votesanswersviews
在AWS SageMaker上重新托管经过培训的模型
我从这些examples provided by AWS开始探索AWS SageMaker . 然后,我对此特定设置进行了一些修改,以便它使用我的用例中的数据进行培训 . 现在,当我继续研究这个模型和调优时,在我删除推理 endpoints 一次后,我希望能够重新创建相同的 endpoints - 即使在停止并重新启动笔记本实例后(因此笔记本/内核会话是不再有效) - 使用已经训练过的模型工件上... -
0 votesanswersviews
如何将更大的.csv文件传递给亚马逊sagemaker,以便使用批量转换作业进行预测
我创建了一个自定义模型并将其部署在sagemaker上 . 我正在使用批转换作业调用 endpoints . 如果输入文件很小,即csv文件中的行数较少,则它可以工作 . 如果我上传了大约200000行的文件,我在cloudwatch日志中收到此错误 . 2018-11-21 09:11:52.666476: W external/org_tensorflow/tensorflow/core/f... -
0 votesanswersviews
Kubernetes的Sagemaker证书问题
我创建了一个通过java sdk使用Sagemaker的docker容器 . 此容器部署在具有多个副本的k8s群集上 . 容器正在向Sagemaker发出简单请求,列出我们已经培训和部署的一些模型 . 但是我们现在遇到了一些java证书的问题 . 我是k8s和证书的新手,所以如果你能提供一些帮助来解决这个问题,我将不胜感激 . 以下是尝试列出 endpoints 时日志中的一些跟踪: org.ap...