线性回归得分低（sklearn）-Java 学习之路

我正在尝试为以下功能训练LR模型（X_train）（50k示例）：

day  month  year  Rank  CountryId
9       1  2013     1         18
10      1  2013     1         18
29      4  2009     1          6
 7      6  2006     1          6
 7      3  2007     1          6
14     12  2006     1          2
 5     10  2011     1          6
...
[50000 rows x 5 columns]

和预测分数（y_train）：

当我尝试用它进行交叉验证时，它给了我非常糟糕的分数：

model = LinearRegression(copy_X=True, normalize=False, n_jobs=3)
scores = cross_validation.cross_val_score(model, X_train, y_train, cv=4)
print(scores)
[ 0.1782062   0.18358134  0.18338371  0.18420599]

我能想到的唯一可能是模型不合适，但这可能是其他原因？

线性回归得分低（sklearn）

相关问题