我有一个 dataframe
来预测能源消耗 . 列 . 是 Timestamp
和 Daily KWH system
.
在SVM模型中使用时,我得到 Value error
如下: ValueError: Unknown label type: array([ 0. , 127.2264855 , 80.74373643, ..., 7.67569729, 3.32998307, 2.08538807])
数据集包括从9月到12月每半小时的能耗 . 这是一个样本数据集
Timestamp Daily_KWH_System
0 2016-09-07 19:47:07 148.978580
1 2016-09-07 19:47:07 104.084760
2 2016-09-07 19:47:07 111.850947
3 2016-09-07 19:47:07 8.421390
4 2016-12-15 02:48:07 13.778317
5 2016-12-15 02:48:07 0.637790
到目前为止我做了:
阅读CSV
data = pd.read_csv('C:/Users/anagha/Documents/Python Scripts/Half_Ho.csv')
索引
data['Timestamp'] = pd.to_datetime(data['Timestamp'])
data.index = data['Timestamp']
del data['Timestamp']
data
绘制图表
data.resample('D', how='mean').plot()
分裂成火车和测试
from sklearn.utils import shuffle
test = shuffle(test)
train = shuffle(train)
trainData = train.drop('Daily_KWH_System' , axis=1).values
trainLabel = train.Daily_KWH_System.values
testData = test.drop('Daily_KWH_System' , axis=1).values
testLabel = test.Daily_KWH_System.values
SVM模型
from sklearn import svm
model = svm.SVC(kernel='linear', gamma=1)
model.fit(trainData,trainLabel)
model.score(trainData,trainLabel)
预测输出
predicted= model.predict(testData)
print(predicted)
1 回答
SVC
是支持向量分类 . 使用它将明确地处理您的标签 . 看起来你真的想做回归 . (注意你的错误,"unknown label type") . 一个很好的第一步是检查SVR
. 或者您可以将值分类到类,例如0-10,10-20等:sklearn SVR