想象一下,2016年2月和2016年4月有一个hdf5文件有浮动值(1天间隔;例如温度),我想在2016年3月之后添加数据 .
这看起来像这样(在hdf5数据集中):
01-02-2016 5.6
02-02-2016 6.6
...
28-02-2016 7.0
01-04-2016 7.1
...
30-04-2016 9.2
现在我想在使用带有python的h5py库之间添加March的数据 .
我目前在做什么:
-
加载数据集
-
调整数据集的大小(maxshape设置为(None,2)),因此如果形状为(58,2)之前我将其调整为(89,2)(在3月添加31天) .
-
从4月份读取数据到变量 .
-
堆叠三月和四月的数据 .
-
将数据放入数据集中:
dset [amountOfDaysInFebruary:] = stacked_data_of_march_and_april
数据库中存在的数据越多,每次我想在其间插入数据时,我总是需要读取和保存的数据越多 . 有没有更好的方法在两者之间插入数据而不必经历我之前提到的所有步骤?