首页 文章

无法在SVM模型中使用日期时间数据

提问于
浏览
0

我有一个 dataframe 来预测能源消耗 . 列 . 是 TimestampDaily KWH system .

在SVM模型中使用时,我得到 Value error 如下: ValueError: Unknown label type: array([ 0. , 127.2264855 , 80.74373643, ..., 7.67569729, 3.32998307, 2.08538807])

数据集包括从9月到12月每半小时的能耗 . 这是一个样本数据集

Timestamp                 Daily_KWH_System
0        2016-09-07  19:47:07        148.978580
1        2016-09-07  19:47:07        104.084760
2        2016-09-07  19:47:07        111.850947
3        2016-09-07  19:47:07          8.421390
4        2016-12-15  02:48:07         13.778317
5        2016-12-15  02:48:07          0.637790

到目前为止我做了:

阅读CSV

data = pd.read_csv('C:/Users/anagha/Documents/Python Scripts/Half_Ho.csv')

索引

data['Timestamp'] = pd.to_datetime(data['Timestamp'])
 data.index = data['Timestamp']
 del data['Timestamp']
 data

绘制图表

data.resample('D', how='mean').plot()

分裂成火车和测试

from sklearn.utils import shuffle

 test  = shuffle(test)
 train = shuffle(train)

 trainData  = train.drop('Daily_KWH_System' , axis=1).values
 trainLabel = train.Daily_KWH_System.values

 testData  = test.drop('Daily_KWH_System' , axis=1).values
 testLabel = test.Daily_KWH_System.values

SVM模型

from sklearn import svm
  model = svm.SVC(kernel='linear', gamma=1) 
  model.fit(trainData,trainLabel)
  model.score(trainData,trainLabel)

预测输出

predicted= model.predict(testData)
   print(predicted)

1 回答

  • 1

    SVC 是支持向量分类 . 使用它将明确地处理您的标签 . 看起来你真的想做回归 . (注意你的错误,"unknown label type") . 一个很好的第一步是检查 SVR . 或者您可以将值分类到类,例如0-10,10-20等:

    sklearn SVR

相关问题