首页 文章
  • 0 votes
     answers
     views

    Cassandra插入/写入失败

    我已经在CentOS6.5服务器上安装了Cassandra 2.0,并且在测试简单记录时一切正常,现在我必须上传6000亿行,当我在cqlsh上使用COPY时,它在5分钟后失败,并且插入的大约行是20万行rpc超时,然后我选择了pycasso并解析了csv并尝试使用insert命令导入,在每10K记录之后,我们选择关闭连接并再次开发新连接 . 但在大约6万条记录之后,它因超时而失败 . 我的调试跟...
  • 1 votes
     answers
     views

    Cassandra在集群上插入限制

    我遇到了 Cassandra 的奇怪问题 . 我的理解是Cassandra可以扩展插入 . 这意味着,如果我使用2台服务器的集群获得1500次写入/秒,我可以将其增加到4台服务器并接近1500次写入/秒 . 我知道写入/ s可能不会随着集群中节点的数量线性增加,但我现在看到在添加更多节点时写入数量没有增加 . 我目前的设置是这样的: 使用Pycassa批量插入,批量大小为20行 . 复制因子为2 ...
  • 9 votes
     answers
     views

    如何使用pyspark在cassandra数据上创建RDD对象

    我正在使用cassandra 2.0.3,我想使用pyspark(Apache Spark Python API)从cassandra数据创建一个RDD对象 . 请注意:我不想从pyspark API执行导入CQL和CQL查询,而是想创建一个RDD,我想在其上做一些转换 . 我知道这可以在Scala中完成,但我无法找到如何通过pyspark完成 . 真的很感激,如果有人能指导我这个 .

热门问题