首页 文章

cql使用默认配置写入性能和写入超时

提问于
浏览
0

我有一个csv文件,大约有30列和1百万行(大小不到1GB) .

我在localhost上使用单个机器/节点,我的密钥空间具有:

WITH REPLICATION = {'class' : 'SimpleStrategy', 'replication_factor' : 1};

这些列大多是双打的,有几个字符串 .

我已经尝试了两种方法使用默认的cassandra.yaml将其加载到cassandra中:

1)直接从CQL使用 COPY 函数

2)使用包含CQL的cqlengine python驱动程序,在一组破碎的csv文件上使用多个脚本和批处理插入

这两种方法似乎都花了一个多小时在linux / windows上使用默认的cassandra设置 . 这真的是我应该期待的速度吗?我期待着几分钟的事情 .

如果没有,我应该关注哪些关键选项,或者如何快速诊断瓶颈是什么?这似乎是一个微不足道的用例(诚然不是Cassandra的焦点),所以我很难理解为什么它应该如此具有挑战性 .

我已经尝试禁用提交日志,并更改其他选项 . 我试图了解这种性能影响的来源 .

1 回答

相关问题