首页 文章

根据“未处于”状态从数据帧中删除行

提问于
浏览
29

当日期列的值在日期列表中时,我想从pandas数据帧中删除行 . 以下代码不起作用:

a=['2015-01-01' , '2015-02-01']

df=df[df.datecolumn not in a]

我收到以下错误:

ValueError:系列的真值是不明确的 . 使用a.empty,a.bool(),a.item(),a.any()或a.all() .

2 回答

  • 55

    你可以使用pandas.Dataframe.isin .

    pandas.Dateframe.isin 将返回布尔值,具体取决于每个元素是否在列表 a 内 . 然后使用 ~ 将其反转以将 True 转换为 False ,反之亦然 .

    import pandas as pd
    
    a = ['2015-01-01' , '2015-02-01']
    
    df = pd.DataFrame(data={'date':['2015-01-01' , '2015-02-01', '2015-03-01' , '2015-04-01', '2015-05-01' , '2015-06-01']})
    
    print(df)
    #         date
    #0  2015-01-01
    #1  2015-02-01
    #2  2015-03-01
    #3  2015-04-01
    #4  2015-05-01
    #5  2015-06-01
    
    df = df[~df['date'].isin(a)]
    
    print(df)
    #         date
    #2  2015-03-01
    #3  2015-04-01
    #4  2015-05-01
    #5  2015-06-01
    
  • 16

    你可以使用Series.isin

    df = df[~df.datecolumn.isin(a)]
    

    虽然错误消息表明可以使用 all()any() ,但仅当您希望将结果减少为单个布尔值时,它们才有用 . 然而,这不是你现在要做的,即测试系列中每个值与外部列表的成员资格,并保持结果完整(即布尔系列,然后将用于切片原始DataFrame) ) .

    您可以在Gotchas中阅读更多相关信息 .

相关问题