逐行从DataFrame中将列名称提取到Series中

loading...


2

我想将列表中的列名称提取到按行中每个值过滤的系列

In [1]: import pandas as pd   

In [2]: df =pd.DataFrame({'colA':[1,0,1], 'colB':[0,0,1], 'colC':[1,0,0]})    

In [3]: print(df)

   colA  colB  colC
0     1     0     1
1     0     0     0
2     1     1     0

生成的系列应如下所示:

0    [colA, colC]
1              []
2    [colA, colB]
dtype: object

这是我提出的折磨解决方案:

In [4]: df2 = df.T

In [5]: l = [df2[df2[i]>0].index.values.tolist() for i in range(3)]

In [6]: print(pd.Series(l))

0    [colA, colC]
1              []
2    [colA, colB]
dtype: object

这样做是否有一种不那么折磨的方式?

loading...

1回答

  • 2

    您可以使用np.where假设您的数据帧由0 's and 1' s构成,并从结果创建一个Series:

    x = np.where(df,df.columns,'')
    pd.Series([' '.join(i).split() for i in x])
    0    [colA, colC]
    1              []
    2    [colA, colB]
    
评论

暂时没有评论!