我是熊猫和numpy的初学者
我正在使用this paper中提到的数据集,
我有几个图像,每个图像由某些视觉描述符描述,如CM,CN,GLRLM(这些描述符的含义并不重要),这些视觉描述符基本上是列表 .
所以我的数据结构是:
idsDict = {
12312: {
"CM": [2, 3, 1, 5, 1],
"CN" : [1, 4, 5, 1]
},
21367: {
"GLRLM": [9, 4, 1, 4, 5, 12, 67, 12],
"CM" : [1, 6, 8, 1, 34]
}
}
12312,21336是图像的图像ID
我想将其转换为张量/小数组(3D)/ pandas-dataframe(3D),以便我可以根据描述符找到图像之间的距离 .
基本上张量/ numpy-array(3D)/ pandas-dataframe(3D)的结构将是一个长方体,其中行作为图像ID,列作为描述符,z轴将包含描述符的值
我读过了,
1 回答
在计算速度方面,你可能最好使用Numpy:
哪个输出:
不幸的是,没有好的方法可以将图像ID保存在Numpy结构化数组中 . 如果您需要,可以使用Pandas . 以下是如何在单个Pandas 3D数据帧中压缩所有数据:
这输出: