如何报告似然比检验结果-Java 学习之路

我正在使用似然比检验（在R中）在我的模型中寻找具有三个固定因子（地点，年份，栖息地）的主效应，如下所示：

model1<-glm(tot.mass~hab, data=biom, family = Gamma(link = "log"))
anova(model1, test="Chisq")
model2<-glm(tot.mass~year, data=biom, family = Gamma(link = "log"))
anova(model2, test="Chisq")
model3<-glm(tot.mass~site, data=biom, family = Gamma(link = "log"))
anova(model3, test="Chisq")

我被告知通过使用“anova（model3，test =”Chisq“）”我会发现（在这个例子中）添加术语“site”是否显着改善了模型 . 根据我的理解，由于我的p值> 0.5，因此站点对我的模型没有显着影响（例如，这不是该响应变量的主要影响） . 我的输出如下：

Df Deviance Resid. Df Resid. Dev Pr(>Chi)
NULL                   687     1681.2         
site  2   16.543       685     1664.7   0.2884

我的问题是1）我是否正确地解释了这一点; 2）我将如何报告这些结果？我会报告Deviance和pvalue（“Pr（> Chi）”）吗？

谢谢！

1 回答

1
回答之前的一些评论，

1）始终牢记您在模型中测试术语的顺序在其统计意义中起着重要作用 . 发生这种情况是因为您按顺序将模型相互比较（例如，在您的情况下，您将NULL模型（无预测变量）与具有“site”作为唯一预测变量的模型进行比较） . 如果添加一个额外的变量，则将仅包含“site”的模型与包含“site”和“some other variable”的模型进行比较 .

2）一种容易记住的方法是将偏差视为两个模型之间的“距离”（chisq仅取正值），因此它们相距较远是两个模型，变量最后增加的可能性最大，因为最后模型比前一个模型更优越 .

3）当我谈论第一，第二，第三，......，最后一个模型时，我在谈论你在R中的anova表上看到的这些顺序 .

4）这个问题最好放在统计部分 .

在你的问题中，
```
Df Deviance Resid. Df Resid. Dev Pr(>Chi)
NULL                   687     1681.2         
site  2   16.543       685     1664.7   0.2884
```
1）鉴于上表，包含“site”的模型在您提到的置信水平上没有提供任何显着的改进（与NULL模型相比），这可能意味着变量“site”在给定的置信水平下是统计无关紧要的，接近你的解释 .

但是，如果你想100％正确你从那个表得到的只是这样：“鉴于上面的表包含”site“的模型在你提到的置信水平上没有提供任何显着的改进（与NULL模型相比） ” . 我认为这是问题的正确答案 .

*也许如果您重新排列变量并首先添加一些其他变量然后“站点”，您可能会发现“站点”统计显着，但我认为这不太可能 . （评论1）

*同样使用不同的模型（即后勤）可能会给你一个不同的结果 . 所以请记住，您正在测试的是，如果模型在统计上与另一个模型相比更好 . 例如，变量可能是响应的良好预测因子，但由于模型的功能形式不正确，您可能会推断变量在统计上无关紧要，这是错误的 .

这是您解释此结果的方式 .

2）你应该报告Deviance 16.543 ，自由度 DF=2 和p值 0.2884
回复于 2024-05-17T10:06:59+08:00

如何报告似然比检验结果

1 回答

相关问题