我们有一个Kafka 0.9.0.1集群,有4个经纪人,几百个主题,20-50个消费者和10-15个 生产环境 者 .

通常我们必须对集群配置进行更改,并且我们通过受控关闭来进行滚动重启 . 但是,我们的消费者和 生产环境 者在以下情

  • 经纪人正在关闭

  • 代理再次加入集群

  • 群集执行重新 balancer

客户端生成的异常类型包括:

  • NotLeaderForPartitionException

  • NotEnoughReplicasException

  • NotEnoughReplicasAfterAppendException

  • TimeoutException NetworkException

我的问题是,有没有办法减轻影响,还是认为kafka和客户正常运作?

应该是集群拓扑(分区负责人和ISR)的任何变化都会导致这些异常吗?

谢谢,