首页 文章
  • 3 votes
     answers
     views

    Python机器学习,功能选择

    我正在开展与书面文本相关的分类任务,我想知道为了改进分类结果,执行某种“特征选择”程序是多么重要 . 我正在使用与该主题相关的许多功能(大约40个),但我不确定所有功能是否真正相关,以及哪些组合 . 我正在使用SVM(scikits)和LDAC(mlpy) . 如果a具有相关和不相关的特征,我认为我的分类结果会很差 . 我应该在分类之前执行“功能选择程序”吗? Scikits有an RFE pro...
  • 5 votes
     answers
     views

    scikits混淆矩阵与交叉验证

    我正在使用scikits接口训练带有交叉验证(stratifiedKfold)的svm分类器 . 对于每个测试集(k),我得到一个分类结果 . 我想要一个包含所有结果的混淆矩阵 . Scikits有一个混淆矩阵接口:sklearn.metrics.confusion_matrix(y_true,y_pred)我的问题是我应该如何累积y_true和y_pred值 . 它们是数组(numpy) . ...
  • 6 votes
     answers
     views

    在scikit-learn中进行10 * 10倍交叉验证?

    是 class sklearn.cross_validation.ShuffleSplit( n, n_iterations=10, test_fraction=0.10000000000000001, indices=True, random_state=None ) 在scikit-learn中10 * 10倍CV的正确方法? (通过将rand...
  • 3 votes
     answers
     views

    如何使用虚拟变量来表示python scikit中的分类数据 - 学习随机森林

    我正在为scikit-learn的随机森林分类器生成特征向量 . 特征向量代表9个蛋白质氨基酸残基的名称 . 有20个可能的残留名称 . 因此,我使用20个虚拟变量来表示一个残基名称,对于9个残基,我有180个虚拟变量 . 例如,如果滑动窗口中的9个残基是:ARNDCQEGH(每个字母代表一个蛋白质残基的名称),我的特征向量将是: "True\tFalse\tFalse\tFalse\t...
  • 2 votes
     answers
     views

    导入scikits.talkbox时出错

    我想使用scikits.talkbox,但导入scikits.talkbox时出现以下错误 . 回溯(最近一次调用最后一次):文件“/ home / seref / Desktop / machine learning code / MFCC / main.py”,第3行,来自scikits.talkbox.features.mfcc import mfcc文件“/ usr / local / ...
  • 4 votes
     answers
     views

    在Scikit-learn中,F1小于精度和召回

    我正在进行多级分类,具有不 balancer 的类别 . 我注意到f1总是小于精度和召回的直接调和平均值,在某些情况下,f1甚至小于精度和召回率 . 仅供参考,我打电话给 metrics.precision_score(y,pred) 以获得精确度等等 . 我知道微观/宏观平均值的差异,并通过使用 precision_recall_fscore_support() 的类别结果测试它们不是微观的 ....
  • 0 votes
     answers
     views

    Python scikits SVM网格搜索和分类

    我是scikits和svm的初学者,我想查看几个问题 . 我有700个项目和35个功能的样本,我有3个 class . 我有一个数组X,我的样本和功能使用"preprocessing.scale(X)"进行缩放 . 第一步是找到合适的SVM参数,我使用嵌套交叉验证的网格搜索(参见http://scikit-learn.org/stable/auto_examples/grid...
  • 3 votes
     answers
     views

    如何用scikit-learn评估预测的置信度得分

    我写了一个简单的代码,它接受一个参数“query_seq”,进一步的方法计算描述符,最后预测可以使用“LogisticRegression”(或随函数提供的任何其他算法)算法为“0”(对于给定的情况为负) )“或”1(给定案例为正)“ def main_process(query_Seq): LR = LogisticRegression() GNB = GaussianNB() ...

热门问题