我正在尝试使用数据块从以下数据中过滤日期范围,数据块返回null作为响应 . 我的csv数据看起来像:
ID, Desc, Week_Ending_Date
100, AAA, 13-06-2015
101, BBB, 11-07-2015
102, CCC, 15-08-2015
103, DDD, 05-09-2015
100, AAA, 29-08-2015
100, AAA, 22-08-2015
我的查询是:
df.select(df("ID"), date_format(df("Week_Ending_Date"), "yyyy-MM-dd"))
.filter(date_format(df("Week_Ending_Date"), "yyyy-MM- dd").between("2015-07-05", "2015-09-02"))
任何帮助深表感谢 .
1 回答
从我的头脑中,我会通过在阅读时转换日期列然后使用别名来应用过滤器来完成以下操作: