首页 文章

Flume HDFS-200附加

提问于
浏览
1

页面https://cwiki.apache.org/confluence/display/FLUME/Getting+Started表示HDFS接收器支持附加但我无法找到有关如何启用它的任何信息,每个示例都在滚动文件上 . 所以,如果可能的话,我会很感激有关如何将水槽附加到现有文件的任何信息

Update

可以将所有滚动属性设置为0,这将使得水槽写入单个文件,但它不会关闭文件,并且新记录对其他进程不可见 . 有一个类似于我的话题:Flume NG and HDFS,德米特里说Flume不支持附加,但答案是一年前,文档说的相反,所以我想也许水槽得到改善或我误解了一些东西,任何线索将不胜感激 .

Update

我意识到这个问题不清楚,所以让我描述一下我想要实现的目标:我希望将日志写在一个文件中,并希望能够在将它们摄入hdfs后立即读取它们 . 目前我正在使用Cloudera Impala执行搜索查询,即使Flume配置为立即在磁盘上刷新它们也不会看到新事件,至少这是我的信念 . 我的调查表明,人们通常会将HBase用于这些目的,但据我所知,除非使用像Solr这样的外部索引,否则它对临时搜索查询无效 . 问题是我需要一个解决方案尽快,所以我希望它可以更容易完成,例如Fluentd可以附加到现有文件,但它只适用于纯文本文件,我更喜欢一些二进制格式 .

1 回答

  • 1

    我还没有找到让Flume做我想做的事的方法,所以最终我决定使用Cloudera Search进行日志流,特别是Solr用于摄取和检索 . 似乎Flume没有在hdfs中实时摄取的能力而没有创建大量相对较小的文件,希望他们将来修复它 .

相关问题