我有一个带有14个节点的Cassandra 2.1.4集群 . 我主要用它来存储通过KairosDB收集的时间序列数据 .

插入名为data_points(最大列族)的列族中的数据的默认TTL为12小时 . 我还将gc_grace_seconds设置为12小时 . 尽管如此,我的磁盘空间不断增加,看起来墓碑永远不会被丢弃 .

看起来压缩正在定期发生 . SSTable计数似乎也没有那么令人发指 . 它一直在~10到22之间 . 我使用的压缩策略是DTCS .

DESC键空间 - > http://pastebin.com/RW4rU76m

Cassandra Disk Usage Over Time

Live SSTable Count

我做错了吗?有没有办法缓解这种情况?

UPDATE: 当我手动触发压缩时,我发现磁盘使用量急剧减少 . 它从大约40GB到大约16GB . 我还发布了Cassandra用户列表,并建议转移到更新版本的Cassandra . 显然在2.1.4中,这可能导致不丢弃旧数据:https://issues.apache.org/jira/browse/CASSANDRA-8359