首页 文章

即使对于用于训练它的文件,libSVM也会给出非常不准确的预测

提问于
浏览
1

这是交易 . 我正在尝试制作基于SVM的POS标记器 . SVM的特征向量是在格式转换器的帮助下创建的 . 现在这是我正在使用的培训文件的屏幕截图 . http://tinypic.com/r/n4fn2r/8

我有25个标签用于各种POS标签 . 当我使用java实现或命令行工具进行预测时,我得到以下结果 . http://tinypic.com/r/2dtw5ky/8

我已经尝试了所有可用的内核,但它给出了或多或少相同的结果 . 即使将训练文件用作测试文件,也会发生这种情况 . 请帮帮我.. !!附:我不能分享超过两个链接 . 因此,这是模型文件的片段

svm_type c_svc
    kernel_type rbf
gamma 0.000548546
nr_class 25
total_sv 431
rho -0.929467 1.01073 1.0531 1.03472 1.01585 0.953263 1.03027 -0.921365 0.984535 1.02796 1.01266 1.03374 0.949463 0.977925 0.986551 -0.920912 0.940926 -0.955562 0.975386 -0.981959 -0.884042 0.0516955 -0.980884 -0.966095 0.995091 1.023 1.01489 1.00308 0.948314 1.01137 -0.845876 0.968034 1.0076 1.00064 1.01335 0.942633 0.965703 0.979212 -0.861236 0.935055 -0.91739 0.970223 -0.97103 0.0743777 0.970321 -0.971215 -0.931582 0.972377 0.958193 0.931253 0.825797 0.954894 -0.972884 -0.941726 0.945077 0.922366 0.953999 -1.00503 0.840985 0.882229 -0.961742 0.791631 -0.984971 0.855911 -0.991528 -0.951211 -0.962096 -0.99213 -0.99708 -0.957557 -0.308987 -0.455442 -0.94881 -0.995319 -0.974945 -0.964637 -0.902152 -0.955258 -1.05287 -1.00614 -0.

更新刚刚训练SVM的svm类型为c-SVC,内核类型为线性 . 这给出了非零(虽然很差)的准确性 .

1 回答

  • 0

    正如@Pedrom所提到的,参数选择在训练SVM时绝对至关重要 . 我建议你看看this practical guide . 此外,431个单词远远不足以训练25级模型 . 您肯定需要更多数据 .

    也就是说,0%的准确度确实很奇怪 . 您能否告诉我们您用于训练和评估模型的命令?

相关问题