当我尝试将数据框保存为 pyspark 中的 Hive 表时
df_writer.saveAsTable('hive_table', format='parquet', mode='overwrite')
我收到以下错误:
由以下原因引起:org.apache.hadoop.mapred.InvalidInputException:输入路径不存在:org.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:287 处 hdfs://hostname:8020/apps/hive/warehouse/testdb.db/hive_table)org.apache.hadoop.mapred.FileInputFormat.listStatus(FileInputFormat.java:229 处)
我有通往“ hdfs://hostname:8020/apps/hive/warehouse/testdb.db/”的路
请提供您的输入
1 回答
尝试将 DataFrameWriter 用作