我们运营着一个相对低吞吐量的Kafka集群,在2个数据中心拥有经纪人 . 复制因子设置为保证两个数据中心都托管一整套数据 .

数据中心具有低延迟的高速互连 . 这种配置使我们能够热/热地运行我们的应用程序它已经以这种方式运行了大约8个月 .

群集似乎运行正常(没有数据丢失),但kafka代理日志中存在频繁的错误(如下所示) . 有什么建议?

  • FollowerRequestProcessor:导致错误的意外异常

  • StateChangeFailedException:选择分区[alert20,4]的leader时遇到错误,原因是:分区的首选副本34 [alert20,4 [在isr中不活动或不活动] . 现任领导人和ISR:[{"leader":32,"leader_epoch":49,"isr":[32]}]

  • LearnerHandler:在袜子仍然打开时导致关闭的意外异常 .

  • NotLeaderForPartitionException:此服务器不是该主题分区的领导者