我正在使用Steam尝试使用python预处理脚本构建预测服务 . 当python将清理后的数据传递给预测服务时
variable:value var2:value2 var3:value3
格式(如Spam Detection Example所示)我得到了一个
ERROR PredictPythonServlet - Failed to parse
来自服务的错误 . 当我查看PredictPythonServlet.java文件时,它似乎只使用 strMapToRowData
函数,该函数假定输入字符串中的每个值都是一个数字:
for (String p : pairs) {
String[] a = p.split(":");
String term = a[0];
double value = Float.parseFloat(a[1]);
row.put(term, value);
}
是否不允许以此格式发送字符值?如果有,是否有办法让 PredictPythonServlet
文件使用已定义但从未使用的 csvToRowData
函数?我不想对我的模型使用One-Hot编码,因此能够传递实际的字符串表示是理想的 .
另外,我传递了模型pojo文件中的数字表示,用于分类变量并收到错误:
hex.genmodel.easy.exception.PredictUnknownTypeException: Unexpected object type java.lang.Double for categorical column home_team
所以看起来服务需要一个字符串,但我无法弄清楚如何将它传递给实际的模型 . 任何帮助将不胜感激!
1 回答
预测服务使用EasyPredictModelWrapper,它只能使用底层模型使用的内容 . 这里不清楚你使用的模型,但大多数使用数值浮点值 . 在for循环代码片段中,您可以看到该数字必须为float .