如何将具有以下结构的RDD转换为scala中的数据帧
org.apache.spark.rdd.RDD[(Long, org.apache.spark.mllib.linalg.Vector)] = MapPartitionsRDD[42]
这里RDD的每一行包含索引 Long
和向量 org.apache.spark.mllib.linalg.Vector
.
我想将 org.apache.spark.mllib.linalg.Vector
的每个组件放在一行数据帧的单独列中 .
1 回答
以下示例有效 . 为简洁起见,我假设矢量大小为10.您应该可以将其缩放到1000