scipy稀疏CSR矩阵的快速切片和乘法-Java 学习之路

我有一个scipy稀疏 CSR 矩阵，大小为2M x 50k，有200M非零值（每行100个） . 我需要通过（随机分布的）索引（它是一个pandas Series ）对其120k行进行切片，然后将该子矩阵乘以大小为1x50k的稀疏向量（同样具有100个非零值） .

我这样做：

slice = matrix[index.tolist(), :]
result = slice.dot(vector.T).T.toarray()[0]  # returns 1x120k array

切片需要 0.7s （慢），然后乘法需要 0.05s .

相反，我可以先将整个矩阵相乘，然后对结果进行切片：

result = matrix.dot(vector.T).T.toarray()[0]
result_sliced = result[index.tolist()]  # returns 1x120k array

在这种情况下，乘法需要 0.65s 然后切片需要 0.015s .

问题：

1 回答