现在,我无法在Apche Ignite中保存Spark DataFrame . 它将包含在Apache Ignite 2.2版本中,如https://issues.apache.org/jira/browse/IGNITE-3084所述 . 我正在使用Apache Spark的结构化流API和Kafka来使用数据 . 我想做一些聚合,比如特定列的平均值或消耗数据的最小值 .
我的问题是我是否应该使用Spark SQL DataFrame API来执行上面提到的聚合,还是应该等待Apache Ignite 2.2版本?他们在文档中提到Ignite SQL比Spark SQL快100秒 .
1 回答
实际上,这取决于你 . 您现在可以继续使用Spark,然后等待Ignite中的DataFrames支持准备就绪,比较这两种方法并选择更适合您需求的方法 .