我是Hadoop的新手 . 我有一个以下格式的文件:
123textfinderlater . 它是一个固定宽度的文件 . 我想添加一个分隔符 . 假设我的第一个字段是123,即长度为3,第二个字段是textfinder,即:长度为10,第三个字段为ie.length 5.每个字段都有一个预定义的长度 . 现在我需要添加一个分隔符来分隔我的字段 . 我的输出应该是123 | textfinder |之后 . 我只有值(文件中的行) . 应该是mapper和reducer程序的关键 .
提前致谢
1 回答
你甚至不需要在你的特定情况下使用reducer,mapper的键值仍然像往常一样
line no. - line
,那么你只需要将你添加分隔符的行写回作为键 . 检查以下代码: