如何在版本的spark scala代码中设置以下Cassandra写入参数 - DataStax Spark Cassandra Connector 1.6.3 .
Spark版本 - 1.6.2
spark.cassandra.output.batch.size.rows
spark.cassandra.output.concurrent.writes
spark.cassandra.output.batch.size.bytes
spark.cassandra.output.batch.grouping.key
谢谢,钱德拉
2 回答
在DataStax Spark Cassandra Connector 1.6.X中,您可以将这些参数作为
SparkConf
的一部分传递 .有关更多信息,请参阅此readme .
最灵活的方法是在文件中添加这些变量,例如 spark.conf :
等等...然后在你的应用程序中创建你的spark上下文,例如:
最后,当您提交应用程序时,您可以使用以下命令指定属性文件:
Spark会在创建spark上下文时自动从spark.conf读取您的配置 . 这样,您可以修改spark.conf上的属性,而无需每次都重新编译代码 .