首页 文章

Spark Dataframe groupBy并将结果排序到列表中

提问于
浏览
5

我有一个Spark Dataframe,我想用一个键对元素进行分组,并将结果作为一个排序列表

目前我正在使用:

df.groupBy("columnA").agg(collect_list("columnB"))

如何使列表中的项目按升序排序?

1 回答

  • 16

    您可以尝试functions包中提供的函数 sort_array

    import org.apache.spark.sql.functions._
    df.groupBy("columnA").agg(sort_array(collect_list("columnB")))
    

相关问题