我正在尝试从Scikit-learn库中挑选一个经过训练的SVM分类器,这样我就不必一遍又一遍地训练它 . 但是当我将测试数据传递给从pickle加载的分类器时,我得到了异常高的准确度,f测量值等 . 如果测试数据直接传递给未被pickle的分类器,则它会给出更低的值 . 我不明白为什么pickling和unpickling分类器对象正在改变它的行为方式 . 有人可以帮我解决这个问题吗?
我正在做这样的事情:
from sklearn.externals import joblib
joblib.dump(grid, 'grid_trained.pkl')
这里, grid
是训练有素的分类器对象 . 当我取消它时,它与直接使用时的行为非常不同 .
1 回答
@AndreasMueller说不应该有任何区别,这是http://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html#loading-the-20-newgroups-dataset使用
pickle
的修改示例:使用_2462688时也是如此: