在我们的cassandra集群中,我们在Cassandra DB中每秒获得4-5k消息,现在我们想要将所有这些消息从cassandra加载到Solr中(通过使用DataImport Handler将Solr与Cassandra同步) . 我们的要求是,每当在cassandra表中发生写入时,它也应该写入Solr . 我们不能使用DSE,因为DSE不支持Solr的完全聚合查询,因为我们的查询类似于多个字段的分组,然后查找每个组的另一列的最小值 . 因此DSE Solr不支持这些类型的查询 . 只有当我们在Cassandra每秒写40-50条消息时,Solr才与Cassandra完全同步 . 但是在500-600或更多的情况下,它不起作用(花费太多时间进行索引) . 因此,如果在Cassandra中每秒有4000条消息的大型数据集,请建议我使用Cassandra同步solr .

提前致谢