我有以下5个变量的29个观测数据框(df):
age height_seca1 height_chad1 height_DL weight_alog1
1 19 1800 1797 180 70
2 19 1682 1670 167 69
3 21 1765 1765 178 80
4 21 1829 1833 181 74
5 21 1706 1705 170 103
6 18 1607 1606 160 76
7 19 1578 1576 156 50
8 19 1577 1575 156 61
9 21 1666 1665 166 52
10 17 1710 1716 172 65
11 28 1616 1619 161 66
12 22 1648 1644 165 58
13 19 1569 1570 155 55
14 19 1779 1777 177 55
15 18 1773 1772 179 70
16 18 1816 1809 181 81
17 19 1766 1765 178 77
18 19 1745 1741 174 76
19 18 1716 1714 170 71
20 21 1785 1783 179 64
21 19 1850 1854 185 71
22 31 1875 1880 188 95
23 26 1877 1877 186 106
24 19 1836 1837 185 100
25 18 1825 1823 182 85
26 19 1755 1754 174 79
27 26 1658 1658 165 69
28 20 1816 1818 183 84
29 18 1755 1755 175 67
我希望获得每个变量的均值,标准差,中位数,最小值,最大值和样本大小,并获得输出作为数据帧 . 我尝试使用下面的代码,但随后我无法使用和使用tapply或聚合似乎超出了我作为新手R程序员 . 我的任务要求我不要使用任何“额外”R套餐 .
apply(df, 2, mean)
apply(df, 2, sd)
apply(df, 2, median)
apply(df, 2, min)
apply(df, 2, max)
apply(df, 2, length)
理想情况下,这是输出数据框的外观,包括每个统计函数的行 Headers :
age height_seca1 height_chad1 height_DL weight_alog1
mean 20 1737 1736 173 73
sd 3.3 91.9 92.7 9.7 14.5
median 19 1755 1755 175 71
minimum 17 1569 1570 155 50
maximum 31 1877 1880 188 106
sample size 29 29 29 29 29
任何帮助将不胜感激 .
4 回答
或者使用您已经完成的工作,您只需将这些摘要放入列表并使用
do.call
要么...
尝试使用fBasics包中的
basicStats
您还可以将输出子集化以获得所需内容:
另一种方法是在this post中定义自己的函数 .
更新:
(我没有读过“我的任务要求我不要使用任何额外的'R套餐 . ”部分)
正如我之前所说,您可以使用
*apply
族函数定义自己的函数并循环遍历每一列:您可以使用
lapply
遍历每一列和一个匿名函数来执行每个计算:到目前为止我遇到了同样的问题,我写了......
它应该与flist中指定的任何函数一起使用,只要该函数返回单个值;即它不适用于范围
请注意,flist的元素应该以其他方式命名,您将获得结果data.frame的奇怪row.names