-
12 votesanswersviews
Apache Drill vs Spark
我对Apache Spark和Spark-SQL有一些了解 . 最近我已经阅读Fast Hadoop Analytics (Cloudera Impala vs Spark/Shark vs Apache Drill)但这个话题对我来说仍然不清楚 . -
3 votesanswersviews
pyarrow可以将多个镶木地板文件写入fastparquet 's file_scheme=' hive'选项这样的文件夹吗?
我有一个数百万的记录SQL表,我打算使用pyarrow库写出文件夹中的许多镶木地板文件 . 数据内容似乎太大而无法存储在单个拼花文件中 . 但是,我似乎无法找到pyarrow库的API或参数,允许我指定类似的东西: file_scheme="hive" 由fastparquet python库支持 . 这是我的示例代码: #!/usr/bin/python import p... -
0 votesanswersviews
将Apache Drill连接到Kudu
有没有办法将Apache Drill连接到Kudu? 我看过Drill 1.5在github上添加了对Kudu和drill-storage-kudu的实验性支持,但是我无法弄清楚如何让它工作......这现在不太实验了吗? 谢谢 -
1 votesanswersviews
在Drill上获取PostGIS几何字段
我有一个带有几何列的表,如果我使用PostGIS查询它,它会显示正确的记录: PostGIS查询图片: 问题是当我使用Apache Drill执行查询时,因为它显示除了几何之外的所有记录都很好,它显示为null . 钻查询图像: 查看日志,它显示以下错误: WARN o.a.d.e.store.jdbc.JdbcRecordReader - 忽略不受支持的列 . org.apache.d...