我有一个用例,需要在Cassandra上选择Stratio cassandra-lucene-indexElastic Search . 我更倾向于 Stratio implementation ,因为它不需要创建/管理ES集群 . 但是,以下方案将解决方案实施置于困境 .

Cassandra lucene Index 在高基数列上创建,例如 colA 在密钥空间 Test (Keyspace有超过10,000个colA的唯一记录),并且使用Cassandra-lucene-index执行以下查询 .

select * from Test where colA like “1%”

现在,上面的查询将需要命中Cassandra集群中的所有节点,因为Cassandra Lucene索引是本地索引 .

那么,在这样一个场景中的查询性能是否会与 Cassandra-lucene-index 相比,从 ElasticSearch 返回的结果与来自Cassandra的数据源相比,Keyspace中的数据会增加?

工具版本:Cassandra 3.10,Stratio cassandra-lucene-index 3.10