首页 文章
  • 1 votes
     answers
     views

    使用MICE包导致缺失值插补错误

    我有一个数据缺失的巨大数据 (4M x 17) . 两列是分类的,其余都是数字的 . 我想使用MICE包来减少 Value . 这是我试过的: > testMice <- mice(myData[1:100000,]) # runs fine > testTot <- predict(testMice, myData) Error in UseMethod(&quo...
  • 0 votes
     answers
     views

    我是否可以在Mice中使用quickpred来嵌套嵌套纵向(和长)数据帧中较大变量集的变量子集?

    我试图创建一个测试 data.frame 以展示我的问题,但我的容量还不够强,甚至不能做到这一点 . 我无法分享我真正的数据库 . 我希望我的问题可以独立存在 . 我正在使用嵌套的纵向数据集,该数据集保存为长文件(1000个主题嵌套在8个站点中,4个潜在时间点/主题,68个潜在预测变量) . 在对纵向结果进行lme之前,我想在4个静态预测因子(例如,母亲教育,家庭收入)上计算缺失值,以便为所有模型...
  • 0 votes
     answers
     views

    在Python中使用Fancy Impute的MICE算法时出现TypeError

    我正在尝试填充数据集中缺少的数据,我的导师建议我使用Python中的Fancy Impute包,特别是MICE算法 . 首先,正如我读到的关于MICE,很明显,如果我的遗漏数据不是随机的,这是一个不好的选择(我怀疑,因为看起来缺失的数据更可能是在特定的国家/年) . 那么有人推荐不同的算法吗? (我的项目基于世界银行性别统计数据) . 技术问题:我在我的数据帧上运行了这段代码: filled = ...
  • 0 votes
     answers
     views

    从另一个变量(R,MICE)估算稀疏数据集

    我有一个依赖时间序列变量(月水位)与第二个变量(月降水量)非常强相关 . 这可以通过分析我们有许多长期观察(n> 500)的位置来显示 . 就我的目的而言,它将假设因变量的变化等于自变量的变化 . 鉴于这种关系,我想预测降水已知的水位,但很少有历史观测水位......比如说n = 5左右 . 使用R中的MICE包,我随机选择长期水位数据的小子样本,并使用降水变量的z得分估算缺失的变量,没有丢...
  • 0 votes
     answers
     views

    R中时间序列缺失数据的插补模型

    时间序列数据包括: 产品(分类); ProductGroup(分类);国家(分类); YearSinceProductLaunch(数字); SalesAtLaunchYear(数字) 只有“SalesAtLaunchYear”数据有一些需要估算的缺失值 . 对于某些产品,存在完整的数据,即销售年份1,2和截至目前的销售数据 . 但是,其他一些产品仅包含自发布以来的早期销售数据 . 产品有不同的年...
  • 1 votes
     answers
     views

    包MICE中的预测平均匹配(pmm)是否仅使用没有任何丢失数据的行来估计其系数?

    我有一个数据框,其中包含连续5年不同植物的丰度(每年1个值;从T2到T6),用于不同的地点(15个地点)和处理(浏览与未浏览) . T2到T6在列中,我有一列指定物种 . 对于某些网站,T5系统性缺失 . 对于其他站点,T4和T6都丢失了 . T2和T3适用于所有站点 . 这是一个虚构的例子: > data = matrix(c(0.02, 0.02, 0.03, NA, 0.06, +...
  • 0 votes
     answers
     views

    MICE中的Stripplot

    我在R中使用MICE包进行多次插补 . 我只使用数值变量进行了几次插补,插补方法是预测均值匹配,当我使用命令stripplot(插入数据集的名称)时,我可以看到所有变量的观察值和估算值 . 当我尝试对分类和数值变量的组合进行插补时,会出现问题 . 然后,插补方法是数值变量的PMM,以及分类变量的逻辑回归 . stripplot-command只显示数值变量 . 我试图用这些命令指定edu是一个带...
  • 1 votes
     answers
     views

    MICE池可以完成GLM输出二进制逻辑回归吗?

    我正在对使用MICE多次估算的数据运行二元结果变量的逻辑回归 . 汇总glm模型的系数似乎很简单:imp = mice(nhanes2,print = F) imp$meth fit0=with(data=imp, glm(hyp~age, family = binomial)) fit1=with(data=imp, glm(hyp~age+chl, family = binomial)...
  • 1 votes
     answers
     views

    R中看似无关的回归与推算数据 - 汇总结果

    我正在尝试使用R中的systemfit包来完成看似无关的回归(SUR) . 但是,使用多重插补数据(使用鼠标包)完成这些分析并不是直截了当的 . 在谷歌上搜索这个问题,我看到有一个关于相同问题的删除帖子,似乎使用了以下示例(信用到海报,小编辑) library(systemfit) library(mice) nhanes2 r1 <- bmi ~ hyp r2 <- bmi ~...
  • 1 votes
     answers
     views

    R中MI数据的描述性统计:取3

    作为R初学者,我发现很难弄清楚如何计算多重估算数据的描述性统计数据(比运行一些其他基本分析更重要,例如关联和回归) . 这些类型的问题以道歉(Descriptive statistics (Means, StdDevs) using multiply imputed data: R)开头,但尚未得到回答(https://stats.stackexchange.com/questions/29619...
  • 0 votes
     answers
     views

    r包鼠标中的as.mids在`row.names < - . data.frame`(`* tmp *`,value = value)中产生“错误”:无效'row.names'长度“

    当我试图将鼠标与我的数据集一起使用时,R一直崩溃,所以我在SPSS v.24中做了我的mi . 然后我将多次估算的数据导入R作为Imp5N2NPV4_2_17 . 我想将该数据帧转换为mids以继续我的分析,但是我收到了一个错误,我无法找到帮助 . 以下是数据帧的一瞥: &gt; head(Imp5N2NPV4_2_17) # A tibble: 6 × 137 Imputation_ ...
  • 0 votes
     answers
     views

    多级数据的多重插补

    我在R中使用Mice包来多次插入多级数据,其中重复测量嵌套在个体内 . 但是在小鼠中存在一个错误,我们需要将组变量(此处为个体)转换为整数类型,以便使用“mice.2l.norm / mice.2l.pan”方法对小鼠进行插补以考虑聚类 . (我无法发布我的数据的快照)我的分组变量(STIDnum)是一个因子变量,因为我想检查插补前后的ICC值 对于Imputation我已将STIDnum转换为整...
  • 0 votes
     answers
     views

    原始数据在小鼠汇总估算中的作用(R包)?

    我想知道在R中使用鼠标包进行插补数据时原始数据集的作用是什么 . 在将长数据集转换回as.mids对象之前,我需要估算我的数据,然后计算一些其他变量 . 我注意到在计算我的附加变量(下面的代码中的&quot;total&quot;)时,我是否使用了 na.rm=TRUE 受估计和我的理解影响,它不应该是一个可重现的例子: # Add required package require(mice)...
  • 0 votes
     answers
     views

    平均估算缺失值

    我有几个问题,除非我遗漏某些内容或者不理解插补过程/逻辑,否则我无法在文档中找到任何内容 . 基本上最重要的是,因为有时“估算的”值是不同的,我想取平均值 - 如果它是数字 - 或模式,如果它是一个分类值 . 我看到的所有示例都显示“完成(miced_model,1)” . 如果我在运行具有5或10次不同迭代的鼠标模型时,我看不到仅仅选择1的重点 . 我想要所有这些的平均值 . 谁能告诉我怎么做?...
  • 2 votes
     answers
     views

    R中的多重插补(小鼠)和“条件缺失”

    我在 R 中使用 mice 来估算随机丢失的数据 . 尝试在数据集中考虑条件或结构化 NAs 时,我遇到了问题 . 一个简单的数据集来说明问题: TestData &lt;- data.frame(Condition= c(1,1,1,1,2,NA,2,2), Dependent1=c(1,NA,2,3,NA,NA,NA,NA), Dependent2=c(1,12,44,1,NA,NA,NA,...
  • 1 votes
     answers
     views

    丢失数据的估算:小鼠在R中得到不稳定的结果

    我使用库鼠标运行一些简单的代码,使用鼠标功能来估算缺失的数据 . 我使用airquality数据集(基本R)运行代码没有问题,但是当我使用基础R --mtcars中的另一个数据集运行相同的代码时 - 我收到一个错误(“未定义列选择”) . 见下文: 代码为文本如下: library(dplyr) library(mice) data = airquality data[4:10,3] = r...
  • 1 votes
     answers
     views

    Hotdeck imputation(VIM):奇怪的插补值修复

    我有一个包含一些缺失值的面板数据集,因为缺少值我正在使用VIM包中的hotdeck插补来估算这些值 . 我也看过MICE(不幸的是Amelia崩溃了),但考虑到我特意选择了随时间变化不大的变量,我想选择最近的时间观察进行估算 . 但是,我的问题是,对于某些条目,我得到的 Value 1.00返回 . 现在我查看了我的数据,似乎当绝对没有可用的数据(这很好)时返回值1.00,但是也有一些1.00条目...
  • 2 votes
     answers
     views

    使用具有聚类数据的小鼠进行插补

    所以我使用 mice 包来估算丢失的数据 . 我已经达到了一定程度,但已经遇到了陡峭的学习曲线 . 举一个玩具的例子: library(mice) # Using nhanes dataset as example df1 &lt;- mice(nhanes, m=10) 因此,您可以看到我使用大多数默认设置将df1估算10次 - 我很乐意在回归模型,汇总结果等中使用此结果 . 但在我的现实生活...
  • 1 votes
     answers
     views

    是否可以在R中使用推算数据进行交互?

    我想在使用R的回归中指定仅包含交互项(在两个分类变量之间)的模型 . 使用MICE估算数据 . 模型看起来像: fit=with(data=imp, lm(Y~A*B)) 而不是: fit=with(data=imp, lm(Y~A+B+A*B)) 当然,两种模型都产生相同的输出,包括所有级别的分类变量的两个主要效果和交互效应 . 有没有办法调用一个仅限INTERCEPT模型,这样我就能在R中...
  • 1 votes
     answers
     views

    'R','mice',缺少变量插补 - 如何只在稀疏矩阵中做一列

    我有一个半稀疏的矩阵 . 所有细胞中有一半是空白的(na)所以当我尝试运行“老鼠”时,它会尝试对所有细胞进行处理 . 我只对一个子集感兴趣 . 问题:在下面的代码中,如何使“鼠标”仅在前两列上运行?有没有一种干净的方法可以使用行延迟或行引导来实现这一点,以便前一行的内容可以帮助修补当前行中的空洞? set.seed(1) #domain x &lt;- seq(from=0,to=10,leng...
  • 1 votes
     answers
     views

    用小鼠估算在没有NAs-R的变量中改变原始值

    我正在用鼠标进行多次插补但我很惊讶地看到没有NA的变量中的原始值被改变和扭曲 . 有关可重复的示例,请参见下文 . 我将使用mtcars(base R)并在其中嵌入2列中的随机NAs - disp和hp . 我将标记这些NA的位置 . 然后我会将缺失值归为真,并将其与原始值进行比较 . 最后,我将在散点图中绘制结果:原始值与推算值 . 我希望原始值与没有NA的列的估算值一致,因为不应该有任何插...
  • 2 votes
     answers
     views

    R - 鼠标 - 添加一列,将列与推算值相加

    我有一个缺少数据的数据库 . 我需要输入数据(我正在使用鼠标),然后根据原始列创建新列(使用插补数据) . 我需要对这些新列进行统计分析 . 具体来说,我的参与者使用7点浓度比例填写了几份问卷 . 有些人没有回答所有问题 . 我需要对值进行估算,然后对列中的值进行求和,并根据此总和访问此新值以进行统计分析,将参与者划分为“温和,中等,高”,并将其用于统计分析 . 我根据stackoverflow的...
  • 0 votes
     answers
     views

    使用鼠标在data.frame的所有列中输入值

    我试图使用鼠标使用线性模型来估算值 . 我对老鼠的理解是它遍历行 . 对于具有NA的列,它使用所有其他列作为预测变量,拟合模型,然后从该模型中采样以填充NA . 这是一个我生成一些数据的例子,而不是使用ampute引入缺失的数据 . n &lt;- 100 xx&lt;-data.frame(x = 1:n + rnorm(n,0,0.1), y =(1:n)*2 + rnorm(n,0,...
  • 0 votes
     answers
     views

    从多个插补列表中过滤出na或缺失值行(观察值)

    (编辑:完全提炼的问题) 使用包mitools和调查并遵循Anthony Damico的代码,我正在使用Survey of Consumer Finance数据集几天 . 原始的数据集列表是“scf_imp”,并且插补强加的数据集列表是“scf_design” . 问题如下: 5个多重插补数据帧具有不同的列,因此如果我使用该列变量(在我的情况下为“house”)制作样本的子集,则“house”列中...
  • 0 votes
     answers
     views

    R-自举面板数据

    我试图在数据集上运行 glm ,其中包含13,319个40个变量的观测值 . 这是1945 - 2005年170个国家的国家年度数据 . 我的回归是在10个自变量上运行的 . 由于数据稀缺,很多年来一个国家没有每个自变量的条目 . 我想归咎于缺少的数据,以便我的结果很稳健 . 我可以用一个包来输入多变量时间序列的数据吗? 我尝试过使用boot并尝试使用Amelia软件包,但它们都没有工作 . ...
  • 4 votes
     answers
     views

    R中的估算

    我是R编程语言的新手 . 我只是想知道有没有办法在我们的数据集中包含 just one column 的空值 . 因为我看到的所有插补命令和库都会归因于整个数据集的空值 .
  • 0 votes
     answers
     views

    使用R中的ImputeTS在时间序列中缺少值插补

    我有一个包含多个产品的月度时间序列的数据集 . 每行具有相同的终点但起点不同(因为该产品的时间戳可能已经开始较晚)我需要估算中间缺失值,即实际起点和终点之间的值 . 估算需要分三步完成,即 使用na.seadec获取系列长度超过24的时间序列 使用na.kalman作为时间序列,长度在12到24之间 使用na.ma表示长度小于12的时间序列 注意:时间序列的起点是沿着行的第一个非零...
  • 2 votes
     answers
     views

    在R中多次插补后计算预测平均值(或预测概率)和SE

    我想计算预测值和标准误差,但我不能简单地使用predict(),因为我正在使用15个多重插补数据集(生成Amelia包) . 我在每个数据集上运行回归模型 . 然后,使用使用鲁宾规则的Amelia函数mi.meld()将结果组合成一组模型系数和标准误差 . 示例数据和代码: dd&lt;-list() for (i in 1:15){ dd[[i]] &lt;- data.frame( Age...
  • 0 votes
     answers
     views

    R中的Predict()函数 . 如何使用它来预测因变量

    我有一个关于如何使用函数predict()的问题 . 我有一个包含n行和10列的数据集 . 第一列是因变量,其他变量是独立的 . 我在第一个变量上有50%的缺失数据,即x1,其他变量被完全观察到 . 我想通过使用以下模型中的对应案例和回归系数来预测x1(缺失部分): lm(new_A[,1]~new_A[,2]+new_A[,3]+new_A[,4]+new_A[,5]+new_A[,6]+new...
  • 1 votes
     answers
     views

    R的时间序列是否自动生成缺失数据?

    我想知道是否有人从统计数据包中了解R的时间序列可以帮助我 . 我目前正在使用stat的ts函数生成时间序列 . 我正在传递ts函数一个数据集(每天有3年的日期和数值),已经解析为十进制日期的开始和结束日期,以及365的频率 . 但是,有一定的缺少日期范围(例如,2016年4月30日至2017年1月2日的日期和值缺失) . 但是,当我查看或绘制时间序列时,我注意到丢失的数据会自动填充值 . 我不确定...

热门问题