我正在尝试为以下功能训练LR模型(X_train)(50k示例):

day  month  year  Rank  CountryId
9       1  2013     1         18
10      1  2013     1         18
29      4  2009     1          6
 7      6  2006     1          6
 7      3  2007     1          6
14     12  2006     1          2
 5     10  2011     1          6
...
[50000 rows x 5 columns]

和预测分数(y_train):

0.264498
0.264498
0.494186
0.033319
0.222304
0.013010
3.210939
....

当我尝试用它进行交叉验证时,它给了我非常糟糕的分数:

model = LinearRegression(copy_X=True, normalize=False, n_jobs=3)
scores = cross_validation.cross_val_score(model, X_train, y_train, cv=4)
print(scores)
[ 0.1782062   0.18358134  0.18338371  0.18420599]

我能想到的唯一可能是模型不合适,但这可能是其他原因?