通过spark工作创建配置表-Java 学习之路

我试图在hadoop集群（BigInsight 4.1发行版）上创建hive表作为我的spark（1.5.1版本）作业的输出，并且我正面临权限问题 . 我的猜测是spark使用默认用户（在这种情况下是'yarn'而不是作业提交者的用户名）来创建表，因此无法这样做 .

我尝试自定义hive-site.xml文件以设置具有创建配置单元表权限的经过身份验证的用户，但这不起作用 .

我还尝试将Hadoop用户变量设置为经过身份验证的用户，但它也不起作用 .

我想避免保存txt文件，然后创建hive表以优化性能并通过orc压缩减小输出的大小 .

我的问题是：

谢谢 . Hatak！

1 回答