我已经阅读了一个镶木地板文件,我想用准备好的dict过滤行 . 数据框中有两列名为col1和col2,它们是string类型 . 我的字典中有一组字符串,我想要一些行,其中列col1和col2中字符串的串联在字典中 . 我试过了
df.filter((df['col1']+df['col2']) in my_dict)
但似乎 df['col1']+df['col2']
不是字符串,即使这是列的类型 .
我也试过了
df.filter(lambda x: (x['col1']+df['col2']) in my_dict)
这样做的正确方法是什么?
1 回答
因此,您的问题中有两个组件:
字符串列连接
使用字典过滤
关于第一部分 - 这是使用玩具数据帧的字符串列连接的示例:
关于第二部分,你需要
.isin
方法 - 不确定它是否适用于字典,但它肯定适用于列表(['foo 1', 'foo 2']
)或集合({'foo 1', 'foo 2'}
):希望这足够有用......
EDIT (评论后):将连接列与初始
df
的列保持在一起: