我想将列表中的列名称提取到按行中每个值过滤的系列
In [1]: import pandas as pd
In [2]: df =pd.DataFrame({'colA':[1,0,1], 'colB':[0,0,1], 'colC':[1,0,0]})
In [3]: print(df)
colA colB colC
0 1 0 1
1 0 0 0
2 1 1 0
生成的系列应如下所示:
0 [colA, colC]
1 []
2 [colA, colB]
dtype: object
这是我提出的折磨解决方案:
In [4]: df2 = df.T
In [5]: l = [df2[df2[i]>0].index.values.tolist() for i in range(3)]
In [6]: print(pd.Series(l))
0 [colA, colC]
1 []
2 [colA, colB]
dtype: object
这样做是否有一种不那么折磨的方式?
1 回答
您可以使用np.where假设您的数据帧由0 's and 1' s构成,并从结果创建一个Series: