我们如何使用TFIDF向量与多项式朴素贝叶斯？-Java 学习之路

假设我们使用TFIDF转换将文档编码为连续值特征 .

我们现在如何使用它作为朴素贝叶斯分类器的输入？

Bernoulli naive-bayes已经出局了，因为我们的功能不再是二进制了 .
似乎我们也不能使用Multinomial naive-bayes，因为这些值是连续的而不是分类的 .

作为替代方案，使用高斯朴素贝叶斯代替它是否合适？在高斯分布假设下，TFIDF向量是否可能保持良好状态？

关于MultionomialNB的sci-kit学习文档建议如下：

多项式朴素贝叶斯分类器适用于具有离散特征的分类（例如，用于文本分类的字数） . 多项分布通常需要整数特征计数 . 然而，在实践中，诸如tf-idf的分数计数也可以起作用 .

从根本上不可能使用MultinomialNB的小数值吗？
据我了解，似然函数本身假设我们正在处理离散计数（since it deals with counting/factorials）

TFIDF值如何使用此公式？

1 回答