首页 文章
  • 0 votes
     answers
     views

    性别概要

    我正在运行我的数据摘要,当我做摘要(sn $ Gender)时,我得到: 长度:202(我有202条回复)类别:字符模式:字符 它应该说女99和男103.任何想法为什么会发生这种情况?
  • 1 votes
     answers
     views

    dplyr:在group_by之后总结管道

    我有这个data.frame: df_test = structure(list(`MAE %` = c(-0.0647202646339709, -0.126867775585001, -1.81159420289855, -1.03092783505155, -2.0375491194877, -0.160783192796913, -0.585827216261999, -0.05298...
  • -1 votes
     answers
     views

    R&dplyr:为选定的组成员分配组级特征

    我有一个大型数据集,通过分组变量= grp 分成许多小组;组中的所有成员按较大数据集的顺序连续 . 每个组的成员都有一个id代码(= id ),并从1开始按顺序编号 . 在一个组中,某些成员符合逻辑标准= is_child . 每个成员都有一个变量( momloc ),其中包含零或另一个组成员(母亲,如果存在)的ID号 . 我希望为数据集中的每个人分配momloc等于其ID的组成员数,如果...
  • 1 votes
     answers
     views

    R中MI数据的描述性统计:取3

    作为R初学者,我发现很难弄清楚如何计算多重估算数据的描述性统计数据(比运行一些其他基本分析更重要,例如关联和回归) . 这些类型的问题以道歉(Descriptive statistics (Means, StdDevs) using multiply imputed data: R)开头,但尚未得到回答(https://stats.stackexchange.com/questions/29619...
  • 0 votes
     answers
     views

    每个需要使用if限制时的许多变量的汇总表

    我在Stata中有三个不同的变量, var1 , var2 和 var3 . 我需要创建这三个变量的汇总表,以便我将观察数,mean,sd,min,max作为结果汇总表中的字段 . 我使用以下代码: su var1 if restriction == 2 su var2 if restriction == 3 su var3 if restriction == 4 由于摘要表是根据...
  • -1 votes
     answers
     views

    如何在Stata中“table”和“制表”中对数据进行排序和过滤

    命令 tab x 和 table x 返回按 x 排序的摘要统计信息 . 有没有办法按汇总统计数据汇总统计数据表,如手段和频率? 例如,我想有一个按手段分类的方法表 . 有一个 collapse 和 sort 的组合,但它们替换了内存中的数据集 . 尼克提供的答案是唯一的选择:Stata: Summary stats with table. Order by N?
  • 0 votes
     answers
     views

    当存在三个二分解释变量时,在Stata中总结统计(均值,sd)

    当有三个二分法IV时,我正在尝试为DV创建一个汇总统计表(mean,sd) . 使用命令 tab IV1 Iv2, sum (DV) 我可以仅为两个IV变量创建汇总统计表,但不能为三个变量创建 . 但是,我需要三个IV及其相互作用的摘要统计数据 . 有什么办法吗?另一个命令?谢谢!
  • 0 votes
     answers
     views

    如何在Stata中生成摘要统计信息

    我正在尝试为在一个工作中工作,在另一个工作中工作的人创建某些变量的汇总统计信息,然后将其与那些既不从事这些工作的人进行比较 . 我能够为那些在任一工作中工作的人获取摘要代码,但我不确定如何创建排除这些工作的摘要 . 这是我到目前为止: tabstat lwage educ hours exper, by(construc) stat(mean sd min max) nototal tabsta...
  • -1 votes
     answers
     views

    在Stata中使用If和摘要统计

    我有一个面板数据 . 我想计算2007年之前和2007年之后的数据的摘要统计 . 我尝试使用以下命令,但它不起作用 . 总结变量,如果年份= <2007
  • 1 votes
     answers
     views

    使用d中的dplyr的summarize()获取中位数

    我有一个按日期和时间间隔列出的整数计数观察数据框 . 我想使用dplyr软件包按日期查找这些观察结果的中位数 . 我已经正确格式化了日期列,并使用了group_by,如下所示: data.bydate <- group_by(data.raw, date) 当我使用summarize()来查找每个日期组的中位数时,我得到的只是一堆零 . 数据中有NA,所以我用na.rm = TRUE剥离它...
  • 0 votes
     answers
     views

    R - dplyr变量活动摘要

    我遇到了一些摘要解决方案proposed here的问题 . 我只是想通过 activities 和两个变量 (gender and children) 尝试 summarise 序列数据 . 这是我的序列数据集 dta = structure(c("d nuclear", "d nuclear", "e nuclear and acquainta...
  • 0 votes
     answers
     views

    摘要会记住以前的'garbage'值

    我有一个列的数据,提到了一个人的性别 . 不幸的是,很少有错误的列/错误的值 . summary(data$gender) 给出类似的东西 boy : 19232 girl : 14565 Maths : 3 Science : 4 ... some 20 garbage values : 1 我写了一个代码来将 boy, girl 以外的值替换为 error . 现在 summary(da...
  • -4 votes
     answers
     views

    如何计算描述性统计[关闭]

    我有类的数据框,包含名称,性别(女性,男性)和身高的变量 . 我需要按性别计算身高变量的描述性统计数据 . 我想在输出中有以下内容,任何帮助将不胜感激 . Gender , Freq , Mean , Median , Mode , Std , Dev , min , max
  • 2 votes
     answers
     views

    R - 摘要(数据)和摘要(数据$变量)中的差异

    我有一个data set,有61个观察值和2个变量 . 当我总结整个数据时,第二个变量的分位数,中位数,平均值和最大值有时不同于我从第二个变量汇总得到的结果 . 这是为什么? data <- read.csv("testdata.csv") head(data) # Group.1 x # 1 10/1/12 0 # 2 10/2/12 126 ...
  • 0 votes
     answers
     views

    keras:返回model.summary()vs scikit学习包装器

    在使用keras时,我了解到使用包装器会对keras产生负面影响,并且scikit会学习api请求 . 我对两者都有解决方案感兴趣 . Variant 1: scikit Wrapper from keras.wrappers.scikit_learn import KerasClassifier def model(): model = Sequential() ...
  • 1 votes
     answers
     views

    用于计算摘要统计信息并应用于R中的列的函数

    我需要编写一个带有数字输入向量的函数,以便计算最小值,平均值,中值和最大值的汇总统计量 . 结果应该是长度为4的向量 . 然后我需要将它应用于我的数据框中的所有列,并生成一个新的数据框,其中包含5列这些结果 . 原始数据框看起来像这样(部分): > dput(head(commodities,4)) structure(c(2054.86, 2131.01, 1978.38, 1932.46...
  • 0 votes
     answers
     views

    在混合模型中运行Summary()后出现Colnames错误

    R version 3.1.0 (2014-04-10) lmer package version 1.1-6 lmerTest package version 2.0-6 我目前正在使用lmer和lmerTest进行分析 . 每次我向随机结构添加效果时,运行summary()时会出现以下错误: #Fitting a mixed model: TRT5ToVerb.lmer3 = lmer(T...
  • 1 votes
     answers
     views

    R多个分类变量的频率表

    我已经将SPSS .SAV文件中的访谈数据导入 data.frame ,现在我'm trying to create a frequency table based on the question number and interview location. Here'是一个例子 data.frame : loc<-c("city1","city2",...
  • 0 votes
     answers
     views

    r多个文件的行摘要

    我有大约100个文本文件,我已加载到R: myFiles <- (Sys.glob("C:/../.../*.txt")) dataFiles <- lapply(myFiles, read.table) 文件具有不同的行数,但都有4列 . 第一列是名称,最后三列是坐标 . 文件示例: [[1]] n x y ...
  • 0 votes
     answers
     views

    如何向esttab添加更多行汇总摘要统计表

    我正在尝试使用esttab使用summarize命令创建带有摘要统计信息的LaTeX表 . 如果我一次汇总多个变量,我可以使用如下代码来执行此操作: sysuse auto, clear global vars price mpg headroom eststo clear eststo: estpost sum $vars, listwise esttab est*, cells("c...
  • 0 votes
     answers
     views

    如何在Stata中创建更高维度的表格?

    我有面板数据,我想要概述 . 我想创建一个如下所示的表格,其中性别的相对频率取决于该人是否受雇 . 我正在使用Stata 14.我尝试使用“tabout”包,但我没有找到一个特定的例子来解决这个问题 . 作为一种解决方法,我为一个“男性和就业”,“女性和就业”等人生成了一个变量,但是我正在寻找一个不需要生成额外变量的解决方案 . table example
  • -1 votes
     answers
     views

    从许多线性模型创建自定义结果表[重复]

    这个问题与以下内容完全相同: how to create many linear models at once and put the coefficients into a new matrix? 2个答案 我在一个分析实验室工作,生成大量数据 . 我们进行模型拟合,并对模型系数(截距,a,b),r_squared和残差标准误差感兴趣 . 最多70个因变量(响应)的数量相当大 . 我想从my...
  • 1 votes
     answers
     views

    从家庭“二项式”的PipeLineModel获取系数的替代方法

    环境 . R:3.2.2“消防安全”火花:1.5.2 > obj <- glm(response ~ . , family = "binomial", data = df ) > class(df) [1] "DataFrame" attr(,"package") [1] "SparkR" &g...

热门问题