完整列的有效计算（pytables，hdf5，numpy）-Java 学习之路

我有一个简单的HDF5文件（由PyTables创建），有十列和100000行 . 对于每个值，我必须应用一个简单的线性方程，每列使用不同的参数并将内容写入CSV .

我天真的做法是在 table 上循环：

for row in table.iterrows():
    print "%f,%f,..." % (row['a'] * 1.0 + 2.0, row['b'] * 3.0 + 4.0, ...)

但我想知道，选择列并以这种方式计算它们以及稍后迭代生成的数组是否更有效：

a = numpy.add(numpy.multiply(table.cols.a, 1.0), 2.0)
b = numpy.add(numpy.multiply(table.cols.b, 3.0), 4.0)

但这似乎更慢 .

做这个的最好方式是什么？

1 回答