首页 文章

在多索引Pandas Dataframe中设置值的正确方法

提问于
浏览
3

我正在尝试在多索引数据框中设置一个值 . 我正在使用.loc但我仍然得到了SettingsWithCopyWarning . 我已经阅读了文档,但我不确定我应该怎么做 . 我究竟做错了什么?

“SettingWithCopyWarning:尝试在DataFrame的切片副本上设置一个值 . 尝试使用.loc [row_indexer,col_indexer] = value

请参阅文档中的警告:http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy self.obj [item] = s“

arrays = [np.array(['A', 'A', 'B', 'B', 'C', 'C', 'D', 'D']),
         np.array(['one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight'])]

df = pd.DataFrame(np.random.randn(6, 8), columns=arrays)

mask = df.loc[:,('A','one')].ge(0)
df[mask].loc[:,('B')] = "A"

1 回答

  • 4

    发生SettingWithCopyWarning是因为您正在对DataFrame的子集执行 .loc[] . 使用 .loc[] 直接选择子集,您将不会收到此错误 .

    arrays = [np.array(['A', 'A', 'B', 'B', 'C', 'C', 'D', 'D']),
             np.array(['one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight'])]
    
    df = pd.DataFrame(np.random.randn(6, 8), columns=arrays)
    
    mask = df.loc[:,('A','one')].ge(0)
    df.loc[mask,('B')] = "A"
    

    您还可以简化计算掩码的行,因为您不需要 .loc[] .

    mask = df[('A','one')].ge(0)      # or, df[('A','one')] >= 0
    

相关问题