我正在尝试开发一个Azure ML实验,该实验使用R来执行连续响应变量的预测 . 最初的实验相对简单,仅包含一些实验项目,包括“创建R模型”,“列车模型”和“评分模型”,以及一些数据输入 .
我编写了一个训练脚本和一个评分脚本,当我在ML Studio中运行实验时,这两个脚本似乎都没有错误地执行 . 但是,当我检查评分数据集时,分数值都是缺失值 . 所以我担心我的得分脚本可能会错误地返回分数 . 任何人都可以建议我应该返回什么类型?它意味着是单列data.frame,还是其他什么?
虽然我在R Studio中运行了训练和评分脚本,但是我的分数也可能没有在评分脚本中正确计算,这显示了预期的结果 . 如果有人可以建议如何以某种方式调试我的评分脚本也是有帮助的,这样我就可以确定代码无法按预期运行的行踪 .
谢谢,保罗
2 回答
我的建议是在进行数据输入之前进行数据预处理 . 清除缺失值和异常值 . 使用相关的数据预处理技术来执行这些操作 .
尝试使用此示例并与您的示例进行比较 - https://gallery.cortanaintelligence.com/Experiment/Compare-Sample-5-in-R-vs-Azure-ML-1