我们使用 Azure Machine Learning Studio 来构建训练模型,为此我们使用了 Two Class Bayes Point Machine Algorithm . 对于示例数据,我们导入了包含以下列的.CSV文件: Tweets and Label .
部署Web服务后,我们得到了不正确的输出 . 我们希望我们的算法根据已经存储在数据集中的不同类型的推文将Label的结果预测为0或1 .
在使用数据集中的推文对其进行测试时,它会给出正确的结果,但在使用其他推文(数据集中没有)测试时会出现问题 .
您可以在此处查看我们的实验:Experiment
1 回答
您是否计划根据推文上的文本数据进行二进制分类?如果是这样,您应该在进行分类之前尝试进行特征哈希 .