我对熊猫提供的轴索引非常感兴趣 . 我最近和numpy合作并且有一个数组,它可以保持多个粒子(1 ... N)的位置(XYZ)很多次(0.0 ... T) . 这将是一个三维(T,N,3)阵列 .
D = random((10,20,3))
现在我想将pandas索引添加到适当的轴,以便更容易访问某些时间帧或某些原子选择 . 假设我想将以下索引标签附加到数据:
T_index = arange( 10, dtype='f' )
N_index = arange( 20 )
P_index = ["x","y","z"]
我环顾四周,但没有找到一种以方便的方式将它们添加到熊猫数据框中的好方法 . 我也不太确定pandas数据帧是否真的是我应该使用的数据结构,因为它可能会将最初形成的numpy ndarray制成一个方便的numpy函数,如mean()或sum()会很多慢点 .
1 回答
由于您有3个轴,因此定义Panel可能是最方便的:
然后,如果您希望将其转换为DataFrame,请使用:
pan
中的基础数据仍然是一个numpy数组形状(10,20,3):所以我不希望速度有任何明显的恶化 . 如果需要,你可以随时回到numpy数组
pan.values
上的numpy操作,但是,希望这是不必要的 .