首页 文章

多项式朴素贝叶斯参数alpha设置? scikit学习

提问于
浏览
7

在进行朴素贝叶斯分类时,有没有人知道如何设置alpha的参数?

例如 . 我首先使用了一堆词来构建特征矩阵,矩阵的每个单元都是单词的计数,然后我使用tf(术语频率)对矩阵进行归一化 .

但是当我使用朴素贝叶斯构建分类器模型时,我选择使用多项式N.B(我认为这是正确的,而不是伯努利和高斯) . 默认的alpha设置是1.0(文档说拉普拉斯平滑,我不知道是什么) .

结果非常糟糕,只有21%的人回想起找到积极的类(目标类) . 但是当我设置alpha = 0.0001(我随机选择)时,结果得到95%的回忆得分 .

此外,我检查了多项式NB formula,我认为这是因为alpha问题,因为如果我使用单词计数作为特征,则alpha = 1不会影响结果,但是,因为tf介于0- 1,alpha = 1确实会影响这个公式的结果 .

我也测试了结果不使用tf,只使用了一堆字数,结果也是95%,那么,有没有人知道如何设置alpha值?因为我必须使用tf作为特征矩阵 .

谢谢 .

1 回答

  • 8

    在Multinomial Naive Bayes中, alpha 参数就是所谓的hyperparameter;即控制模型本身形式的参数 . 在大多数情况下,确定超参数最佳值的最佳方法是通过可能的参数值,使用cross validation来评估模型在每个值上的数据性能 . 阅读以上链接,了解如何使用scikit-learn执行此操作的详细信息 .

相关问题