我在 R 没有太多经验,所以我可能要求一些明显的东西 . 我有一个数据框( INs3 ),每列都有一个变量 .

head(INs3)

Dependant <- (1280.75, 1317.70, 1166.35, 1663.10, ...)  
X1 <- (0.029, 0.033, ...)  
X2 <- (0.076, 0.78, ...)  
Xn

我正在尝试使用 bootstrap 估算 R squared95% confident interval . 我设法编写了用两个变量进行计算的代码 .

boot.test <- boot(INs3,function(data,indices)                          
summary(lm(Dependant~X1,data[indices,]))$r.squared,R=100)

ci <- boot.ci(boot.test, type="bca")   
ci

BOOTSTRAP信心间隔计算
基于100个bootstrap重复

电话:
boot.ci(boot.out = boot.test,type =“bca”)

间隔:
等级BCa
95%(0.0070,0.6189)

我想估计将变量“Dependent”与每个变量( X1X2 等)配对的置信区间 . 我的数据集有超过 100000 个变量,因此我想实现一个循环来进行所有这些计算并将它们存储在数据框或列表中 . 我设法生成一个列表,存储与 bootstrap 相关的数据摘要,但我只对 R squared 的置信区间感兴趣 . 另外,我无法在下面的代码中使用合适的函数来估计那些置信区间 .

test5 <- as.data.table(INs3)[, 
  list(MyFits = lapply(.SD[, -1, with = F], function(x) boot(INs3,function(data,indices) summary(lm(Dependant~x,data[indices,]))$adj.r.squared, R=100)))
  ]

谁能就这个问题给我一些建议? . 谢谢!!