Java 学习之路

1 votes

answers

views

使用MICE包导致缺失值插补错误

我有一个数据缺失的巨大数据 (4M x 17) . 两列是分类的，其余都是数字的 . 我想使用MICE包来减少 Value . 这是我试过的： > testMice <- mice(myData[1:100000,]) # runs fine > testTot <- predict(testMice, myData) Error in UseMethod(&quo...

r missing-data r-mice imputation
0 votes

answers

views

我是否可以在Mice中使用quickpred来嵌套嵌套纵向（和长）数据帧中较大变量集的变量子集？

我试图创建一个测试 data.frame 以展示我的问题，但我的容量还不够强，甚至不能做到这一点 . 我无法分享我真正的数据库 . 我希望我的问题可以独立存在 . 我正在使用嵌套的纵向数据集，该数据集保存为长文件（1000个主题嵌套在8个站点中，4个潜在时间点/主题，68个潜在预测变量） . 在对纵向结果进行lme之前，我想在4个静态预测因子（例如，母亲教育，家庭收入）上计算缺失值，以便为所有模型...

r imputation r-mice
0 votes

answers

views

在Python中使用Fancy Impute的MICE算法时出现TypeError

我正在尝试填充数据集中缺少的数据，我的导师建议我使用Python中的Fancy Impute包，特别是MICE算法 . 首先，正如我读到的关于MICE，很明显，如果我的遗漏数据不是随机的，这是一个不好的选择（我怀疑，因为看起来缺失的数据更可能是在特定的国家/年） . 那么有人推荐不同的算法吗？（我的项目基于世界银行性别统计数据） . 技术问题：我在我的数据帧上运行了这段代码： filled = ...

python imputation fancyimpute
0 votes

answers

views

从另一个变量（R，MICE）估算稀疏数据集

我有一个依赖时间序列变量（月水位）与第二个变量（月降水量）非常强相关 . 这可以通过分析我们有许多长期观察（n> 500）的位置来显示 . 就我的目的而言，它将假设因变量的变化等于自变量的变化 . 鉴于这种关系，我想预测降水已知的水位，但很少有历史观测水位......比如说n = 5左右 . 使用R中的MICE包，我随机选择长期水位数据的小子样本，并使用降水变量的z得分估算缺失的变量，没有丢...

r normalization imputation r-mice
0 votes

answers

views

R中时间序列缺失数据的插补模型

时间序列数据包括：产品（分类）; ProductGroup（分类）;国家（分类）; YearSinceProductLaunch（数字）; SalesAtLaunchYear（数字）只有“SalesAtLaunchYear”数据有一些需要估算的缺失值 . 对于某些产品，存在完整的数据，即销售年份1,2和截至目前的销售数据 . 但是，其他一些产品仅包含自发布以来的早期销售数据 . 产品有不同的年...

r time-series missing-data imputation r-mice
1 votes

answers

views

包MICE中的预测平均匹配（pmm）是否仅使用没有任何丢失数据的行来估计其系数？

我有一个数据框，其中包含连续5年不同植物的丰度（每年1个值;从T2到T6），用于不同的地点（15个地点）和处理（浏览与未浏览） . T2到T6在列中，我有一列指定物种 . 对于某些网站，T5系统性缺失 . 对于其他站点，T4和T6都丢失了 . T2和T3适用于所有站点 . 这是一个虚构的例子： > data = matrix(c(0.02, 0.02, 0.03, NA, 0.06, +...

r imputation r-mice
0 votes

answers

views

MICE中的Stripplot

我在R中使用MICE包进行多次插补 . 我只使用数值变量进行了几次插补，插补方法是预测均值匹配，当我使用命令stripplot（插入数据集的名称）时，我可以看到所有变量的观察值和估算值 . 当我尝试对分类和数值变量的组合进行插补时，会出现问题 . 然后，插补方法是数值变量的PMM，以及分类变量的逻辑回归 . stripplot-command只显示数值变量 . 我试图用这些命令指定edu是一个带...

imputation r-mice
1 votes

answers

views

MICE池可以完成GLM输出二进制逻辑回归吗？

我正在对使用MICE多次估算的数据运行二元结果变量的逻辑回归 . 汇总glm模型的系数似乎很简单：imp = mice（nhanes2，print = F） imp$meth fit0=with(data=imp, glm(hyp~age, family = binomial)) fit1=with(data=imp, glm(hyp~age+chl, family = binomial)...

r logistic-regression imputation r-mice
1 votes

answers

views

R中看似无关的回归与推算数据 - 汇总结果

我正在尝试使用R中的systemfit包来完成看似无关的回归（SUR） . 但是，使用多重插补数据（使用鼠标包）完成这些分析并不是直截了当的 . 在谷歌上搜索这个问题，我看到有一个关于相同问题的删除帖子，似乎使用了以下示例（信用到海报，小编辑） library(systemfit) library(mice) nhanes2 r1 <- bmi ~ hyp r2 <- bmi ~...

r regression pool imputation r-mice
1 votes

answers

views

R中MI数据的描述性统计：取3

作为R初学者，我发现很难弄清楚如何计算多重估算数据的描述性统计数据（比运行一些其他基本分析更重要，例如关联和回归） . 这些类型的问题以道歉（Descriptive statistics (Means, StdDevs) using multiply imputed data: R）开头，但尚未得到回答（https://stats.stackexchange.com/questions/29619...

r summary imputation r-mice
0 votes

answers

views

r包鼠标中的as.mids在`row.names < - . data.frame`（`* tmp *`，value = value）中产生“错误”：无效'row.names'长度“

当我试图将鼠标与我的数据集一起使用时，R一直崩溃，所以我在SPSS v.24中做了我的mi . 然后我将多次估算的数据导入R作为Imp5N2NPV4_2_17 . 我想将该数据帧转换为mids以继续我的分析，但是我收到了一个错误，我无法找到帮助 . 以下是数据帧的一瞥： > head(Imp5N2NPV4_2_17) # A tibble: 6 × 137 Imputation_ ...

r imputation r-mice
0 votes

answers

views

多级数据的多重插补

我在R中使用Mice包来多次插入多级数据，其中重复测量嵌套在个体内 . 但是在小鼠中存在一个错误，我们需要将组变量（此处为个体）转换为整数类型，以便使用“mice.2l.norm / mice.2l.pan”方法对小鼠进行插补以考虑聚类 . （我无法发布我的数据的快照）我的分组变量（STIDnum）是一个因子变量，因为我想检查插补前后的ICC值对于Imputation我已将STIDnum转换为整...

r missing-data imputation r-mice multilevel-analysis
0 votes

answers

views

原始数据在小鼠汇总估算中的作用（R包）？

我想知道在R中使用鼠标包进行插补数据时原始数据集的作用是什么 . 在将长数据集转换回as.mids对象之前，我需要估算我的数据，然后计算一些其他变量 . 我注意到在计算我的附加变量（下面的代码中的"total"）时，我是否使用了 na.rm=TRUE 受估计和我的理解影响，它不应该是一个可重现的例子： # Add required package require(mice)...

r missing-data imputation r-mice
0 votes

answers

views

平均估算缺失值

我有几个问题，除非我遗漏某些内容或者不理解插补过程/逻辑，否则我无法在文档中找到任何内容 . 基本上最重要的是，因为有时“估算的”值是不同的，我想取平均值 - 如果它是数字 - 或模式，如果它是一个分类值 . 我看到的所有示例都显示“完成（miced_model，1）” . 如果我在运行具有5或10次不同迭代的鼠标模型时，我看不到仅仅选择1的重点 . 我想要所有这些的平均值 . 谁能告诉我怎么做？...

r missing-data imputation r-mice
2 votes

answers

views

R中的多重插补（小鼠）和“条件缺失”

我在 R 中使用 mice 来估算随机丢失的数据 . 尝试在数据集中考虑条件或结构化 NAs 时，我遇到了问题 . 一个简单的数据集来说明问题： TestData <- data.frame(Condition= c(1,1,1,1,2,NA,2,2), Dependent1=c(1,NA,2,3,NA,NA,NA,NA), Dependent2=c(1,12,44,1,NA,NA,NA,...

r imputation r-mice
1 votes

answers

views

丢失数据的估算：小鼠在R中得到不稳定的结果

我使用库鼠标运行一些简单的代码，使用鼠标功能来估算缺失的数据 . 我使用airquality数据集（基本R）运行代码没有问题，但是当我使用基础R --mtcars中的另一个数据集运行相同的代码时 - 我收到一个错误（“未定义列选择”） . 见下文：代码为文本如下： library(dplyr) library(mice) data = airquality data[4:10,3] = r...

r imputation r-mice
1 votes

answers

views

Hotdeck imputation（VIM）：奇怪的插补值修复

我有一个包含一些缺失值的面板数据集，因为缺少值我正在使用VIM包中的hotdeck插补来估算这些值 . 我也看过MICE（不幸的是Amelia崩溃了），但考虑到我特意选择了随时间变化不大的变量，我想选择最近的时间观察进行估算 . 但是，我的问题是，对于某些条目，我得到的 Value 1.00返回 . 现在我查看了我的数据，似乎当绝对没有可用的数据（这很好）时返回值1.00，但是也有一些1.00条目...

r missing-data imputation
2 votes

answers

views

使用具有聚类数据的小鼠进行插补

所以我使用 mice 包来估算丢失的数据 . 我已经达到了一定程度，但已经遇到了陡峭的学习曲线 . 举一个玩具的例子： library(mice) # Using nhanes dataset as example df1 <- mice(nhanes, m=10) 因此，您可以看到我使用大多数默认设置将df1估算10次 - 我很乐意在回归模型，汇总结果等中使用此结果 . 但在我的现实生活...

r multi-level r-mice imputation
1 votes

answers

views

是否可以在R中使用推算数据进行交互？

我想在使用R的回归中指定仅包含交互项（在两个分类变量之间）的模型 . 使用MICE估算数据 . 模型看起来像： fit=with(data=imp, lm(Y~A*B)) 而不是： fit=with(data=imp, lm(Y~A+B+A*B)) 当然，两种模型都产生相同的输出，包括所有级别的分类变量的两个主要效果和交互效应 . 有没有办法调用一个仅限INTERCEPT模型，这样我就能在R中...

r regression interaction chi-squared imputation
1 votes

answers

views

'R'，'mice'，缺少变量插补 - 如何只在稀疏矩阵中做一列

我有一个半稀疏的矩阵 . 所有细胞中有一半是空白的（na）所以当我尝试运行“老鼠”时，它会尝试对所有细胞进行处理 . 我只对一个子集感兴趣 . 问题：在下面的代码中，如何使“鼠标”仅在前两列上运行？有没有一种干净的方法可以使用行延迟或行引导来实现这一点，以便前一行的内容可以帮助修补当前行中的空洞？ set.seed(1) #domain x <- seq(from=0,to=10,leng...

r imputation r-mice
1 votes

answers

views

用小鼠估算在没有NAs-R的变量中改变原始值

我正在用鼠标进行多次插补但我很惊讶地看到没有NA的变量中的原始值被改变和扭曲 . 有关可重复的示例，请参见下文 . 我将使用mtcars（base R）并在其中嵌入2列中的随机NAs - disp和hp . 我将标记这些NA的位置 . 然后我会将缺失值归为真，并将其与原始值进行比较 . 最后，我将在散点图中绘制结果：原始值与推算值 . 我希望原始值与没有NA的列的估算值一致，因为不应该有任何插...

r imputation r-mice
2 votes

answers

views

R - 鼠标 - 添加一列，将列与推算值相加

我有一个缺少数据的数据库 . 我需要输入数据（我正在使用鼠标），然后根据原始列创建新列（使用插补数据） . 我需要对这些新列进行统计分析 . 具体来说，我的参与者使用7点浓度比例填写了几份问卷 . 有些人没有回答所有问题 . 我需要对值进行估算，然后对列中的值进行求和，并根据此总和访问此新值以进行统计分析，将参与者划分为“温和，中等，高”，并将其用于统计分析 . 我根据stackoverflow的...

r dataframe statistics sum imputation
0 votes

answers

views

使用鼠标在data.frame的所有列中输入值

我试图使用鼠标使用线性模型来估算值 . 我对老鼠的理解是它遍历行 . 对于具有NA的列，它使用所有其他列作为预测变量，拟合模型，然后从该模型中采样以填充NA . 这是一个我生成一些数据的例子，而不是使用ampute引入缺失的数据 . n <- 100 xx<-data.frame(x = 1:n + rnorm(n,0,0.1), y =(1:n)*2 + rnorm(n,0,...

r imputation r-mice
0 votes

answers

views

从多个插补列表中过滤出na或缺失值行（观察值）

（编辑：完全提炼的问题）使用包mitools和调查并遵循Anthony Damico的代码，我正在使用Survey of Consumer Finance数据集几天 . 原始的数据集列表是“scf_imp”，并且插补强加的数据集列表是“scf_design” . 问题如下： 5个多重插补数据帧具有不同的列，因此如果我使用该列变量（在我的情况下为“house”）制作样本的子集，则“house”列中...

r survey imputation
0 votes

answers

views

R-自举面板数据

我试图在数据集上运行 glm ，其中包含13,319个40个变量的观测值 . 这是1945 - 2005年170个国家的国家年度数据 . 我的回归是在10个自变量上运行的 . 由于数据稀缺，很多年来一个国家没有每个自变量的条目 . 我想归咎于缺少的数据，以便我的结果很稳健 . 我可以用一个包来输入多变量时间序列的数据吗？我尝试过使用boot并尝试使用Amelia软件包，但它们都没有工作 . ...

r imputation
4 votes

answers

views

R中的估算

我是R编程语言的新手 . 我只是想知道有没有办法在我们的数据集中包含 just one column 的空值 . 因为我看到的所有插补命令和库都会归因于整个数据集的空值 .

r imputation
0 votes

answers

views

使用R中的ImputeTS在时间序列中缺少值插补

我有一个包含多个产品的月度时间序列的数据集 . 每行具有相同的终点但起点不同（因为该产品的时间戳可能已经开始较晚）我需要估算中间缺失值，即实际起点和终点之间的值 . 估算需要分三步完成，即使用na.seadec获取系列长度超过24的时间序列使用na.kalman作为时间序列，长度在12到24之间使用na.ma表示长度小于12的时间序列注意：时间序列的起点是沿着行的第一个非零...

r time-series imputation imputets
2 votes

answers

views

在R中多次插补后计算预测平均值（或预测概率）和SE

我想计算预测值和标准误差，但我不能简单地使用predict（），因为我正在使用15个多重插补数据集（生成Amelia包） . 我在每个数据集上运行回归模型 . 然后，使用使用鲁宾规则的Amelia函数mi.meld（）将结果组合成一组模型系数和标准误差 . 示例数据和代码： dd<-list() for (i in 1:15){ dd[[i]] <- data.frame( Age...

r regression predict imputation
0 votes

answers

views

R中的Predict（）函数 . 如何使用它来预测因变量

我有一个关于如何使用函数predict（）的问题 . 我有一个包含n行和10列的数据集 . 第一列是因变量，其他变量是独立的 . 我在第一个变量上有50％的缺失数据，即x1，其他变量被完全观察到 . 我想通过使用以下模型中的对应案例和回归系数来预测x1（缺失部分）： lm(new_A[,1]~new_A[,2]+new_A[,3]+new_A[,4]+new_A[,5]+new_A[,6]+new...

r linear-regression missing-data predict imputation
1 votes

answers

views

R的时间序列是否自动生成缺失数据？

我想知道是否有人从统计数据包中了解R的时间序列可以帮助我 . 我目前正在使用stat的ts函数生成时间序列 . 我正在传递ts函数一个数据集（每天有3年的日期和数值），已经解析为十进制日期的开始和结束日期，以及365的频率 . 但是，有一定的缺少日期范围（例如，2016年4月30日至2017年1月2日的日期和值缺失） . 但是，当我查看或绘制时间序列时，我注意到丢失的数据会自动填充值 . 我不确定...

r time-series missing-data imputation

热门问题