MapReduce作业不处理Flume存储的所有事件-Java 学习之路

我说有12个事件发送到Flume，将它们存储到HDFS接收器中 . 由Flume创建的文件具有.tmp扩展名，因为它配置为根据文件大小滚动文件 . 当我执行 hdfs dfs -cat /some/path/file-stored-by-flume.1526623078683.tmp 时，打印出所有10个事件 . 不幸的是，在该文件上安排MapReduce作业只会导致映射器消耗的前几行 . 任何想法如何强制MapReduce作业处理 hdfs dfs -cat 命令实际可用的所有行？

相关问题

117 在Hadoop中链接多个MapReduce作业
0 Apache Ignite Hadoop Accelerator MapReduce作业不在JobHistory服务器中
2 配置flume来查看新日志的目录
1 HDFS Flume接收器 - 按文件滚动
0 为什么MapReduce Job没有完全加载附加文件？
1 Flume不会将数据存储到hbase
0 Apache Flume HDFS接收器文件写入有哪些保证？
2 自定义Flume拦截器：intercept（）方法为同一事件多次调用
4 Flume用例：从HTTP读取并通过Kafka推送到HDFS
1 多个MapReduce作业，包含多个文件作为输入和多个reducer