我有两个数据帧,我想“按照某些条件组合它们” . 我的第一个数据帧具有星期几的平均Sms(avgSms)(1 =星期日,2 =星期一,3 =星期二......),小时和分钟:
df1:
I | Day_of_week | hour | min | AvgSms
#1 1 0 0 12
#2 1 0 30 20
#3 1 1 0 19
#4 1 1 30 11
#5 1 2 0 12
#6 1 2 30 7
... ... ... ... ....
#10 2 0 0 14
#11 2 0 30 20
#12 2 1 0 19
#13 2 1 30 11
... ... ... ... ....
#222 7 23 30 13
第二个数据帧有时间和短信,如下所示:
df2: Time Sms
1 2012-01-01 00:00:00 10
2 2012-01-01 00:30:00 11
3 2012-01-01 01:00:00 13
4 2012-01-01 01:30:00 10
5 2012-01-01 02:00:00 7
6 2012-01-01 02:30:00 3
7 2012-01-01 03:00:00 3
8 2012-01-01 03:30:00 2
.......................
400 2015-12-31 23:30:00 16
我想添加到数据帧2,dataframe1的相应avgSms取决于变量时间,无论是第二个还是第三个以及x小时和y和min .
我想要这样的东西:
Time Sms avg
1 2012-01-01 00:00:00 10 12 --> 2012-01-01 was Sunday=1, h=0 and min=0
2 2012-01-01 00:30:00 11 20
3 2012-01-01 01:00:00 13 19
4 2012-01-01 01:30:00 10 11
5 2012-01-01 02:00:00 7 ..
6 2012-01-01 02:30:00 3
7 2012-01-01 03:00:00 3
8 2012-01-01 03:30:00 2
.......................
400 2015-12-31 23:30:00 16
1 回答
在df2中的日期/时间格式之后考虑
merge
并使用这些字段作为by值:Data
Date/Time Conversion
Merge