我有一个带有以下架构的镶木地板文件:
|日期| ID |
我想将它转换为带有制表符分隔符的文本文件,如下所示:
20170403 15284503
我怎样才能在pyspark中这样做?
在Spark 2.0中
spark.read.parquet(input_path)
将镶木地板文件读入数据框 . DataFrameReader
spark.write.csv(output_path, sep='\t')
将数据帧写为制表符分隔符 . DataFrameWriter
1 回答
在Spark 2.0中
将镶木地板文件读入数据框 . DataFrameReader
将数据帧写为制表符分隔符 . DataFrameWriter