我有一个数据帧“x”,其中有两列“x1”和“x2”
x1(status) x2
kv,true 45
bm,true 65
mp,true 75
kv,null 450
bm,null 550
mp,null 650
我想将此数据帧转换为根据其状态和值过滤数据的格式
x1 true null
kv 45 450
bm 65 550
mp 75 650
有没有办法做到这一点,我正在使用pyspark datadrame
1 回答
是的,有一种方法 . 首先使用split函数将第一列拆分为
,
,然后将此数据帧拆分为两个数据帧(使用where
两次),并在第一列上简单地连接这些新数据帧 .在Spark API for Scala中,它如下: