首页 文章

scikit-learn GMM产生正对数概率

提问于
浏览
7

我正在使用python scikit-learn包中的高斯混合模型来训练我的数据集,但是,当我编码时,我想到了

  • G =混合物.GMM(...)

  • G.fit(...)

  • G.score(总和特征)

得到的对数概率是正实数...为什么?不是对数概率保证为负数?

我知道了 . 高斯混合模型返回给我的是对数概率“密度”而不是概率“质量”,所以正值是完全合理的 .

如果协方差矩阵接近单数,那么GMM将不会很好地表现,并且通常意味着数据不适合这样的生成任务

1 回答

  • 12

    正日志概率是可以的 .

    请记住,GMM计算的概率是概率密度函数(PDF),因此在任何单个点都可以大于1 .

    限制是PDF必须通过数据域集成到一个 .

    如果对数概率变得非常大,则推理算法可能已达到退化解(如果您有一个小数据集,则与最大似然估计相同) .

    要检查GMM算法是否未达到简并解决方案,您应该查看每个组件的差异 . 如果任何差异接近零,那么这是不好的 . 作为替代方案,您应该使用贝叶斯模型而不是最大似然估计(如果您还没有这样做) .

相关问题