我正在使用带有pandas / pytables的HDFStore .
删除表或对象后,hdf5文件大小不受影响 . 当将额外的对象添加到存储中时,似乎此空间会被重用,但如果浪费大的空间则可能会出现问题 .
我没有在pandas或pytables API中找到任何可能用于恢复hdf5内存的命令 .
您知道在hdf5文件中改进数据管理的任何机制吗?
见here
你需要 ptrepack 它,它会重写文件 .
ptrepack
ptrepack --chunkshape=auto --propindexes --complevel=9 --complib=blosc in.h5 out.h5
作为一个例子(这也将压缩文件) .
1 回答
见here
你需要
ptrepack
它,它会重写文件 .作为一个例子(这也将压缩文件) .