我有一个文本文件,每行有以下内容:
2018-11-27T08:06:11, 4.000000, 6.000000
2018-11-27T08:06:13, 9.000000, -1.000000
2018-11-27T08:06:15, 2.000000, -3.000000
2018-11-27T08:06:17, 1.000000, 9.000000
2018-11-27T08:06:19, 5.000000, -1.000000
我需要的是应用Map-Reduce输出后如下所示:
2018-11-27T08:06:00 -> 2018-11-27T08:06:30, 9.000000, 9.000000
[Values]只是30秒间隔的最大值,但我很难创建“时间间隔”键 . 基本上我希望我的密钥是30秒的时间间隔 .
我是Hadoop和Map-Reduce的新手,因此非常感谢任何建议,想法,资源或代码snipet .
先感谢您!