首页 文章

R中二元分类的随机森林截止和精度度量

提问于
浏览
1

我使用mlr训练R中的随机森林分类器进行二元分类 .

我的 class 很 balancer .

0         1 
0.5162791 0.4837209

我通过修改树木和mtry的数量以各种方式调整了我的各种模型 .

但我无法选择正确的准确度指标并确定截止值应该是多少 .

目前我有

tpr.test.mean  fpr.test.mean  fnr.test.mean  fpr.test.mean   acc.test.mean mmce.test.mean 
 0.7908072      0.2872358      0.2091928      0.2872358      0.7531250      0.2468750 

f1.test.mean 
0.7736447

如何确定我 class 的理想截止点?到目前为止,我发现45/55工作得最好但是有更好的方法吗?对于二元分类器,哪些准确度指标通常最佳?

1 回答

  • 3

    F1通常是一个安全的赌注 . 它不允许分类器通过100%召回或100%精确度来“欺骗”该措施;因为谐波均值需要并排增加以获得良好的结果 .

    当然,也有例外,例如评估回忆的精确度高于精确度(例如在癌症诊断中) .

    因此,该指标应反映您最终要优化的内容 .

相关问题