我刚刚开始学习cython,所以请原谅我的无知 . 简单地将两个数组一起添加,cython可以改进numpy吗?我非常糟糕地尝试添加两个数组a b来给出一个新的数组c:
import numpy as np
cimport numpy as np
DTYPE = np.int
ctypedef np.int_t DTYPE_t
def add_arrays(np.ndarray[DTYPE_t, ndim=2] a, np.ndarray[DTYPE_t, ndim=2] b, np.ndarray[DTYPE_t, ndim=2] c):
cdef int x = a.shape[0]
cdef int y = a.shape[1]
cdef int val_a
cdef int val_b
for j in range(x):
for k in range(y):
val_a = a[j][k]
val_b = b[j][k]
c[j][k] = val_a + val_b
return c
但是,当传递这些数组时,此版本的速度要慢700倍(* edit:而不是numpy):
n = 1000
a = np.ones((n, n), dtype=np.int)
b = np.ones((n, n), dtype=np.int)
c = np.zeros((n, n), dtype=np.int)
我显然缺少一些非常大的东西 .
3 回答
问题是你正在索引二维数组,如
c[j][k]
,实际上你应该做c[j,k]
,否则Cython正在使用buf=c[j]
的中间缓冲区,它将从中获取buf[k]
,导致速度减慢 . 您应该使用此正确的索引以及@XavierCombelle指定的cdef
声明 .您可以通过执行以下操作来检查此中间缓冲区是否导致速度减慢:
然后,在循环内:
这个声明的缓冲区应该提供与以下相同的速度(或接近):
我想你错过了
所以你的变量循环是python对象而不是c
这是两个例子:
“numpy方式”
循环索引方式
同样的事情,快20倍 .
有了这一切,我知道我还没有完全回答你的问题,但也许它可以为你的比较提供更好的视角?
[编辑]对于1000x1000表,时差更明显;我怀疑是由于构建表的开销的摊销 .
这是一个200因素