大熊猫 - 分类变量的百分比计数-Java 学习之路

我有一只大熊猫喜欢

df_test = pd.DataFrame({'A': 'a a a b b'.split(), 'B': ['Y','N','Y','Y','N']})

我想要的输出是 df_test2 = pd.DataFrame({'A': 'a b'.split(), 'B': [2/3,1/2]}) 你如何做一个groupby（） . 按A列应用以获得B列中'Y'的百分比？

我一直在搜索groupby.apply（）但到目前为止没有任何工作谢谢！

2 回答

一种方法可能是

In [10]: df_test.groupby('A').B.apply(lambda x: (x == 'Y').mean())
Out[10]:
A
a    0.666667
b    0.500000

或者，如果您不介意在此过程中更改 df_test ，

In [15]: df_test['C'] = df_test.B == 'Y'
In [17]: df_test.groupby('A').C.mean()
Out[17]:
A
a    0.666667
b    0.500000
Name: C, dtype: float64

回复于 2024-04-24T09:57:29+08:00