在我之前的问题回答this回答的基础上,我想制作一些记忆视图 .
问题1
使用固定长度构建具有固定长度的2D存储器视图阵列,例如
mv1 = memoryview(b'1234')
mv2 = memoryview(b'abcd')
cdef const unsigned char[:,:] tmv = (mv1, mv2)
有了这个我得到:
TypeError: a bytes-like object is required, not 'tuple'
我尝试使用C指针数组:
ctypedef const unsigned char[:] k_t
cdef unsigned char* mva[2]
mv1 = memoryview(b'1234')
mv2 = memoryview(b'abcd')
cdef k_t mvk1 = mv1
cdef k_t mvk2 = mv2
mva = (&mvk1, &mvk2)
但这也不起作用:
Cannot take address of memoryview slice
问题2
构建一个任意长的3D数组,基本上是上面的2D数组对象的列表 . This对类似问题的其他答案和分配内存的Cython docs让我更接近(我相信我应该使用 malloc
和指针,如果没有必要我不想介绍C)但我仍然坚持问题#1 . 欢迎任何建议!
Edit (problem #1) :即使在混合中抛出一个Cython数组也会出现同样的错误:
from cython cimport view
mv1 = memoryview(b'1234')
mv2 = memoryview(b'abcd')
cvarr = view.array(shape=(2,1), itemsize=sizeof(char), format='B')
cvarr = (mv1, mv2)
print(cvarr[0][1])
# So far so good... this prints `50` as expected.
cdef const unsigned char[:,:] cvw = cvarr
# Adding this last line throws `a bytes-like object is required, not 'tuple'`
现在我真的很困惑 . 为什么元组对Cython数组有好处而对memview不好?
2 回答
Note: Not even close to a complete solution (at least at the moment!)
我同意@DavidW,如果一个连续的cython类型的memoryview拥有所有的数据并且数据从你的python内存视图中复制到它中可能会更好 . 这是真的,特别是如果你计划只创建一次巨型cython类型的内存视图,但计划多次迭代它 .
但是,您可以使用
PyMemoryView_GET_BUFFER
获取指向python内存视图内容的指针,以获取属于该内存视图的底层缓冲区 . 然后,您可以将数据转换为更大的数据结构(以便更快地复制)或者只是跟踪指针数组,每个元素都指向一个内存视图的数据(由于您将跳转,因此在迭代期间速度较慢)内存从memoryview缓冲区指针到memoryview缓冲区指针) .这是一种获取指向python memoryview对象的基础数据的指针的方法 . 从cython github的cpython folder,没有提到
PyMemoryView
,所以我不得不手动包装它:Update 1:
不是100%确定3D阵列结构应该是什么样子,所以我只是采用2D情况 . 既然你说你不想引入C,我就创建了这个行为类似于向量的
array_t
数据类型(好吧,指向一堆void*
的指针) . 很多丑陋的样板,但在这里:这似乎解决了问题#1:
然而,它在第4行发出两个警告
我想我可以忽略那些警告,因为我实际上正在使用
cvw
这是一个常数 .