我试图使用合并功能比较两个数据帧,但我发现这有问题 .
例如,下面给出的是df1是:
id,date,ref_col
101,1/7/2018,1011/7/2018
101,2/7/2018,1012/7/2018
101,3/7/2018,1013/7/2018
df2具有以下数据集:
id,date,ref_col
101,1/7/2018,1011/7/2018
101,3/7/2018,1013/7/2018
我正在尝试使用以下合并:
new_df = df1.merge(df2, left_on=['ref_col'], right_on=['ref_col'])
以上只返回一行,但不返回两行 . 但是,如果我手动签入电子表格,则两行完全相同 .
预期产量:
101,1/7/2018,1011/7/2018
101,3/7/2018,1013/7/2018
但它只返回
101,1/7/2018,1011/7/2018