我正在分析有关鳟鱼生长的观察性研究的数据 . 因此数据框中有很多NA . 此外,不同的治疗方法具有不同的观察数量 . 所以我认为这可以称为不 balancer 设计?

Year    Site    FishID  Size    Cover   AGE L1
2010    LT1 10_LT1 _ 11 Large   Heavy   2   5.88
2010    LT3 10_LT3 _ 14 Large   Heavy   2   5.228571429
2010    SO4 10_SO4 _ 8  Small   Open    0   NA
2010    SO5 10_SO5 _ 22 Small   Open    0   NA
2011    LT1 11_LT1 _ 14 Large   Heavy   1   6.44
2011    LT1 11_LT1 _ 15 Large   Heavy   1   6.25
2011    LT1 11_LT1 _ 16 Large   Heavy   1   6.421052632
2011    LT1 11_LT1 _ 18 Large   Heavy   1   7.74
2011    SO5 11_SO5 _ 6  Small   Open    1   7.7625
2011    SO5 11_SO5 _ 8  Small   Open    1   6.914285714
2011    SO5 11_SO5 _ 13 Small   Open    1   6.5
2011    SO5 11_SO5 _ 16 Small   Open    1   7.2
2011    ST1 11_ST1 _ 21 Small   Heavy   0   NA
2011    ST2 11_ST2 _ 10 Small   Heavy   0   NA
2011    ST2 11_ST2 _ 5  Small   Heavy   0   NA
2011    ST3 11_ST3 _ 20 Small   Heavy   0   NA
2011    ST4 11_ST4 _ 5  Small   Heavy   0   NA
2011    ST1 11_ST1 _ 9  Small   Heavy   1   7.521428571
2011    ST1 11_ST1 _ 17 Small   Heavy   1   8.169230769
2011    ST1 11_ST1 _ 20 Small   Heavy   1   7.03125

我的固定效果是流大小:2级流覆盖:2级,年级:2级和年龄:3级 .

我还勉强选择了一堆网站来检查流大小和流覆盖效果 . 所以我认为网站被归类为随机效应?

L1 是增长率的代表 .

在这个阶段,我的最大模型看起来像这样:

m1=lme(L1~Year*Age*Size*Cover, random=~1|Site ,data=Trout_Growth,method="ML",na.action=na.exclude)

qqnorm(residuals(m1))
qqline(residuals(m1)) # Normality OK

plot(density(residuals(m1),na.rm=T))   ***## heteroscedasticity present (lme should handle this??) ##***

summary(m1)
anova(m1,test=T,type="marginal")    ***## marginal used because of unbalanced design?? ##***

我当然好好看看这个网站很好,但我仍然不确定包含随机因素Site的正确表示法 . (lme和lmer似乎使用不同的符号 . 这是正确的吗?)

我假设我在问这是否是改进模型的正确起点 . 我开始真的很喜欢R但是没有关于R代码的常规大拇指,诱惑是回到舒适的基于Windows的统计软件 .

任何意见或建议将不胜感激 .

Diarm