我有大约40个数据帧(df1,df2,df3等)具有相同的结构,每个数据帧有25列 . 我可以运行摘要(df1),摘要(df2)等 . 摘要包括几个列,我对摘要的这一列感兴趣:
对于df1,它是
stage
stage1 :2222
stage2 :1212
stage3 :8898
对于df2,它是
stage
stage1 :2334
stage2 :9887
stage3 :2344
对于df3,它是
stage
stage1 :5334
stage2 :4887
stage3 :344
等等
我想创建一个新的df:
df1 df2 df3 ...
stage1 2222 2334 5334 ...
stage2 1212 9887 4887 ...
stage3 8898 2344 344 ...
谢谢!
2 回答
您的数据框中的列
stage
似乎是3个级别的因子:stage1
,stage2
,stage3
. 我无法确定,因为您没有提供可重复的示例,但如果是这种情况:假设您有数据帧
您可以使用
summary()
询问出现的数量使用
rbind()
组合结果,您就可以在一个数据帧中出现阶段 .通过向每个帧添加数据帧名称并使用
table()
可以避免必须通过summary()
处理数据帧中的所有变量,只是为了获得一列的频率计数 . 这是使用包含数据框名称的table()
的另一种方法生成样本数据后,我们将数据帧分配给列表以添加数据帧名称的列,然后使用
table()
计算频率 . 通过在表中包含数据框名称作为第二维,我们获得了所需的输出:具有stage
变量值的行,具有数据框名称的列 .......和输出: