首页 文章

Cython错误消息:缓冲区的维数错误(预期1,得2)

提问于
浏览
1

我正在尝试在Cython中编写最小二乘估计器用于学习目的 . 我得到了这个基本版本:

import cython
import numpy as np
from scipy.linalg import inv
cimport numpy as np


def ols_c(np.ndarray x, np.ndarray y):
  cdef int nrowx = x.shape[0]
  cdef int ncolx = x.shape[1]
  cdef np.ndarray beta = np.zeros([ncolx,1], dtype=float) 
  cdef np.ndarray a1 = np.zeros([ncolx, ncolx], dtype=float)
  cdef np.ndarray a2 = np.zeros([ncolx, nrowx], dtype=float)
  a1 = inv(np.dot(x.T,x))
  a2 = np.dot(a1,x.T)
  beta = np.dot(a2,y)
  return(beta)

这比Numpy版本略慢:

import numpy as np
from scipy.linalg import inv

def ols(x,y):
  a1 = inv(np.dot(x.T,x))
  a2 = np.dot(a1,x.T)
  beta = np.dot(a2,y)
  return(beta)

我想这可能是由于数组索引效率低下造成的 . 按照互联网上的教程,我修改了基本的Cython版本,如下所示:

import cython
import numpy as np
from scipy.linalg import inv
cimport numpy as np
DTYPE = np.float
ctypedef np.float_t DTYPE_t


def ols_c(np.ndarray[DTYPE_t, ndim=2] x, np.ndarray[DTYPE_t, ndim=1] y):
  cdef int nrowx = x.shape[0]
  cdef int ncolx = x.shape[1]
  cdef np.ndarray[DTYPE_t, ndim=1] beta = np.zeros([ncolx,1], dtype=float) 
  cdef np.ndarray[DTYPE_t, ndim=2] a1 = np.zeros([ncolx, ncolx], dtype=float)
  cdef np.ndarray[DTYPE_t, ndim=2] a2 = np.zeros([ncolx, nrowx], dtype=float)
  a1 = inv(np.dot(x.T,x))
  a2 = np.dot(a1,x.T)
  beta = np.dot(a2,y)
  return(beta)

但现在它不起作用,我收到以下错误消息:

ValueError: Buffer has wrong number of dimensions (expected 1, got 2)

是什么导致这个错误?我还有一些其他问题:

这两条线实际上做了什么?

DTYPE = np.float
ctypedef np.float_t DTYPE_t

此外,如果我理解正确键入此cdef np.ndarray [DTYPE_t,ndim = 2] x = np.zeros([ncol,nrow],dtype = float)创建一个二维数组x,其列数等于ncol和行等于nrow,包含浮点数 . 但是[DTYPE_t,ndim = 2]实际上做了什么?我还没有找到任何相关文档 .

提前感谢您的回答!

编辑:看起来如果我用双取代DTYPE_t并注释这两行:

DTYPE = np.float
ctypedef np.float_t DTYPE_t

HOwever,执行仍然很慢 . 我该怎么做才能加快速度?

2 回答

  • 1

    关于你的速度看看@ http://simula.no/research/sc/publications/Simula.SC.578/simula_pdf_file

    出于同样的原因,尝试对代码进行矢量化也导致性能非常差 . Vectorization使用切片,切片是未在Cython中实现的Python对象 .

    取消代码可能会加快速度 .

  • 1

    这两条线实际上做了什么?

    DTYPE = np.float
    ctypedef np.float_t DTYPE_t
    

    它将 np.float (Python-)类型分配给名为 DTYPE 的变量,并声明C类型定义(ctypedef) .

    在Cython中使用 ctypedef 关键字将使它在编译的Cython代码中添加具有给定类型的C / C typedef 语句 .

    typedef -fed类型等于它定义的类型,但编译器会在给它一个另一种类型的值时警告你(即使它是从中定义的类型) .

    使用Cython时,您应该对C或C有一点了解 .

相关问题