我有一个Spark Dataframe,我想用一个键对元素进行分组,并将结果作为一个排序列表
目前我正在使用:
df.groupBy("columnA").agg(collect_list("columnB"))
如何使列表中的项目按升序排序?
您可以尝试functions包中提供的函数 sort_array :
sort_array
import org.apache.spark.sql.functions._ df.groupBy("columnA").agg(sort_array(collect_list("columnB")))
1 回答
您可以尝试functions包中提供的函数
sort_array
: