我使用mlr训练R中的随机森林分类器进行二元分类 .
我的 class 很 balancer .
0 1
0.5162791 0.4837209
我通过修改树木和mtry的数量以各种方式调整了我的各种模型 .
但我无法选择正确的准确度指标并确定截止值应该是多少 .
目前我有
tpr.test.mean fpr.test.mean fnr.test.mean fpr.test.mean acc.test.mean mmce.test.mean
0.7908072 0.2872358 0.2091928 0.2872358 0.7531250 0.2468750
f1.test.mean
0.7736447
如何确定我 class 的理想截止点?到目前为止,我发现45/55工作得最好但是有更好的方法吗?对于二元分类器,哪些准确度指标通常最佳?
1 回答
F1通常是一个安全的赌注 . 它不允许分类器通过100%召回或100%精确度来“欺骗”该措施;因为谐波均值需要并排增加以获得良好的结果 .
当然,也有例外,例如评估回忆的精确度高于精确度(例如在癌症诊断中) .
因此,该指标应反映您最终要优化的内容 .