首页 文章
  • 3 votes
     answers
     views

    如何在Hadoop map / reduce作业输出文件中过滤键或值?

    通常,Hadoop map / reduce作业会生成写入作业输出文件的键值对列表(使用OutputFormat class) . 很少,键和值都很有用,通常键或值都包含所需信息 . 是否有一个选项(在客户端)来抑制输出文件中的键或抑制输出文件中的值?如果我只想为一个特定的工作做这个,我可以创建一个忽略键或值的新OutputFormat实现 . 但我需要可以重复使用的通用解决方案 . EDIT: ...

热门问题