我的 hive table
是2.7 MB(以镶木地板格式存储) . 当我使用 impala-shell
将此hive表转换为 kudu
时,我注意到 /tserver/
文件夹大小增加了大约300 MB . 在进一步探索后,我发现 /tserver/wals/
文件夹占据了这一增长的大部分 . 由于这个原因,我面临着严重的问题 . 如果2.7 MB文件生成300 MB WAL,那么我无法真正处理更大的数据 . 这个问题有方法解决吗?
我的 kudu
版本是 1.1.0
,impala是 2.7.0
.
1 回答
我从来没有使用过KUDU,但是我可以通过谷歌搜索一些关键词,并阅读一些文档 .
来自Kudu configuration reference部分"Unsupported flags" ...
看起来每台平板电脑的最小磁盘要求为(2 1)x64 MB,仅适用于WAL . 如果某些平板电脑正在分散并无法赶上,它可以长到10x64 MB .
加上一些临时磁盘空间用于压实等 .
[Edit] 这些默认值在 Kudu 1.4 (2017年6月发布)中已更改;引用发行说明......