用火花读一块镶木地板文件
df = spark.read.parquet("path_to_file")
df.show(2)
我的df包含
**Output**
+------+-----------------+
| col1 | col2 |
+------+-----------------+
| "A1" | {"x":1,"y":2} |
+------+-----------------+
| "A2" | {"z":3} |
+------+-----------------+
我想将数据帧转换为喜欢
+------+------+------+------+
| col1 | x | y | z |
+------+------+------+------+
| "A1" | 1 | 2 | Null |
+------+------+------+------+
| "A2" | Null | Null | 3 |
+------+------+------+------+
初始数据帧的模式显示
DataFrame[col1: string, col2: string]
我在Windows 7机器上使用pyspark 2.3.2
1 回答
这个解决方案并不完全是你所要求的,但也许你并没有这么想 . 因此,请添加评论,如果它不适合您 .