首页 文章

如何报告似然比检验结果

提问于
浏览
0

我正在使用似然比检验(在R中)在我的模型中寻找具有三个固定因子(地点,年份,栖息地)的主效应,如下所示:

model1<-glm(tot.mass~hab, data=biom, family = Gamma(link = "log"))
anova(model1, test="Chisq")
model2<-glm(tot.mass~year, data=biom, family = Gamma(link = "log"))
anova(model2, test="Chisq")
model3<-glm(tot.mass~site, data=biom, family = Gamma(link = "log"))
anova(model3, test="Chisq")

我被告知通过使用“anova(model3,test =”Chisq“)”我会发现(在这个例子中)添加术语“site”是否显着改善了模型 . 根据我的理解,由于我的p值> 0.5,因此站点对我的模型没有显着影响(例如,这不是该响应变量的主要影响) . 我的输出如下:

Df Deviance Resid. Df Resid. Dev Pr(>Chi)
NULL                   687     1681.2         
site  2   16.543       685     1664.7   0.2884

我的问题是1)我是否正确地解释了这一点; 2)我将如何报告这些结果?我会报告Deviance和pvalue(“Pr(> Chi)”)吗?

谢谢!

1 回答

  • 1

    回答之前的一些评论,

    1)始终牢记您在模型中测试术语的顺序在其统计意义中起着重要作用 . 发生这种情况是因为您按顺序将模型相互比较(例如,在您的情况下,您将NULL模型(无预测变量)与具有“site”作为唯一预测变量的模型进行比较) . 如果添加一个额外的变量,则将仅包含“site”的模型与包含“site”和“some other variable”的模型进行比较 .

    2)一种容易记住的方法是将偏差视为两个模型之间的“距离”(chisq仅取正值),因此它们相距较远是两个模型,变量最后增加的可能性最大,因为最后模型比前一个模型更优越 .

    3)当我谈论第一,第二,第三,......,最后一个模型时,我在谈论你在R中的anova表上看到的这些顺序 .

    4)这个问题最好放在统计部分 .

    在你的问题中,

    Df Deviance Resid. Df Resid. Dev Pr(>Chi)
    NULL                   687     1681.2         
    site  2   16.543       685     1664.7   0.2884
    

    1)鉴于上表,包含“site”的模型在您提到的置信水平上没有提供任何显着的改进(与NULL模型相比),这可能意味着变量“site”在给定的置信水平下是统计无关紧要的,接近你的解释 .

    但是,如果你想100%正确你从那个表得到的只是这样:“鉴于上面的表包含”site“的模型在你提到的置信水平上没有提供任何显着的改进(与NULL模型相比) ” . 我认为这是问题的正确答案 .

    *也许如果您重新排列变量并首先添加一些其他变量然后“站点”,您可能会发现“站点”统计显着,但我认为这不太可能 . (评论1)

    *同样使用不同的模型(即后勤)可能会给你一个不同的结果 . 所以请记住,您正在测试的是,如果模型在统计上与另一个模型相比更好 . 例如,变量可能是响应的良好预测因子,但由于模型的功能形式不正确,您可能会推断变量在统计上无关紧要,这是错误的 .

    这是您解释此结果的方式 .

    2)你应该报告Deviance 16.543 ,自由度 DF=2 和p值 0.2884

相关问题