我已经得到了建议,并且在一些地方读到,在数据节点上运行Spark大大提高了批处理的性能 . 我还得到了保持Kafka服务在专用节点上隔离的建议 .

如果Kafka数据的大多数消费者都是Spark Streaming ETL进程,这些进程将转换后的数据版本放回到Kafka或其他一些存储机制上,那么它是否会在相同的节点上运行这些进程,即运行Spark服务与Kafka专用集群上的Kafka服务一起?

谢谢