我有一个数据框,列出了特定年份的名称,名称数量 . 当我将其子集化以找到特定名称时,例如 James
,我无法绘制子集 . 它来自一个数据框,其中一列列出了名称(数千个),一个列出年份,一个列出性别(M或F),以及一个列表编号 . 我也按性别分开了 . 主数据帧称为df1 .
这是df1的第10行 . 没有列被称为年...
Name Gender Number Date
1 Mary F 7065 ob1880
2 Anna F 2604 ob1880
3 Emma F 2003 ob1880
4 Elizabeth F 1939 ob1880
5 Minnie F 1746 ob1880
6 Margaret F 1578 ob1880
7 Ida F 1472 ob1880
8 Alice F 1414 ob1880
9 Bertha F 1320 ob1880
10 Sarah F 1288 ob1880
df.james = subset(df1,df1 =="James")
df.split = split(df.james,df.james$Gender)
df.male = df.split$M
tbl = table(df.male) #this is the bit that doesn't work.
我收到以下错误:
向量中的错误(“整数”,长度):向量大小不能为NA另外:警告消息:1:在pd *中(as.integer(cat) - 1L):整数溢出产生的NAs 2:在bin pd *中(as.integer(cat) - 1L):整数溢出产生的NAs 3:在pd * nl中:由整数溢出产生的NAs
此外,当我尝试将该子集中的两列列表时,它似乎包含来自原始数据框的许多值 .