Java 学习之路

12 votes

answers

views

Apache Drill vs Spark

我对Apache Spark和Spark-SQL有一些了解 . 最近我已经阅读Fast Hadoop Analytics (Cloudera Impala vs Spark/Shark vs Apache Drill)但这个话题对我来说仍然不清楚 .

hadoop apache-spark bigdata apache-drill
3 votes

answers

views

pyarrow可以将多个镶木地板文件写入fastparquet 's file_scheme=' hive'选项这样的文件夹吗？

我有一个数百万的记录SQL表，我打算使用pyarrow库写出文件夹中的许多镶木地板文件 . 数据内容似乎太大而无法存储在单个拼花文件中 . 但是，我似乎无法找到pyarrow库的API或参数，允许我指定类似的东西： file_scheme="hive" 由fastparquet python库支持 . 这是我的示例代码： #!/usr/bin/python import p...

python hadoop parquet apache-drill pyarrow
0 votes

answers

views

将Apache Drill连接到Kudu

有没有办法将Apache Drill连接到Kudu？我看过Drill 1.5在github上添加了对Kudu和drill-storage-kudu的实验性支持，但是我无法弄清楚如何让它工作......这现在不太实验了吗？谢谢

apache-drill apache-kudu
1 votes

answers

views

在Drill上获取PostGIS几何字段

我有一个带有几何列的表，如果我使用PostGIS查询它，它会显示正确的记录： PostGIS查询图片：问题是当我使用Apache Drill执行查询时，因为它显示除了几何之外的所有记录都很好，它显示为null . 钻查询图像：查看日志，它显示以下错误： WARN o.a.d.e.store.jdbc.JdbcRecordReader - 忽略不受支持的列 . org.apache.d...

postgresql postgis apache-drill

Apache Drill vs Spark

pyarrow可以将多个镶木地板文件写入fastparquet 's file_scheme=' hive'选项这样的文件夹吗？

将Apache Drill连接到Kudu

在Drill上获取PostGIS几何字段

热门问题