首页 文章

计算朴素贝叶斯分类中的概率

提问于
浏览
1

我有一个由分类和连续属性组成的数据集 . 我想应用Naive Bayes分类方法对数据进行分类 .

如何计算这两种类型的概率?

我应该使用计数方法计算分类数据并假设一些分布并根据连续数据进行计算吗?

1 回答

  • 1

    由于朴素贝叶斯假设您拥有一个类别标签,因此每个特征的独立性都是独立的

    P(cat1, con1|y) =  P(cat1|y)P(con1|y)
    

    其中 cat1 是某个分类变量且 con1 是连续的,您可以完全独立地对每个概率进行建模 . 正如你所建议的那样,对于分类,你可以使用简单的经验估计(但要记住一些平滑技术,这样你就不会得到0概率),而对于连续,你需要一些更复杂的估计(如使用固定分布族的MLE - 例如高斯;或更复杂的东西 - 如任何概率分类器/模型)

相关问题