首页 文章
  • 2 votes
     answers
     views

    使用Numba Vectorize目标的负速度增益= 'cuda'

    我正在尝试使用CUDAcast#10中提供的代码片段here来测试使用Python Numba模块's @vectorize decorator for speeding up a code snippet relevant to my actual code. I' m的有效性,如下所示: import numpy as np from timeit import default_timer a...
  • 0 votes
     answers
     views

    import pycuda.autoinit返回分段错误(Pycuda 2017.1.1 Cuda 9.0)

    使用基于nvidia / cuda:9.0-devel-ubuntu16.04的泊坞窗图像(https://hub.docker.com/r/activeeon/pycuda/),我得到以下分段错误 python2.7 -c“import pycuda.autoinit”分段错误(核心转储) 有更多的调试细节 python2.7-dbg -c“import pycuda.autoinit”T...
  • 1 votes
     answers
     views

    PyCuda:非平方矩阵的稀疏矩阵向量乘法?

    我正在尝试使用pycuda实现稀疏矩阵向量运算 . 我能够找到的唯一例子是他们的wiki,它实现了一个稀疏的求解例程,但是我只对矩阵向量乘法部分感兴趣 . 矩阵是块对角线NxM矩阵,并且我具有密集长度M向量 . 下面是一些虚拟代码,可以执行我想要的操作,但应该为任何人运行(并且失败) . 它使用scipy稀疏例程制作块对角矩阵,该例程是块对角线格式的100(100x7)矩阵 . 然后我调用这个'P...
  • 1 votes
     answers
     views

    ubuntu上的pycuda安装错误:/ usr / bin / ld:找不到-lcuda

    我是初学者并在ubuntu 11.10上安装pycuda2011.2.2,但无法完成它 . Cuda是4.0 . 我已经安装了库: $ sudo apt-get install build-essential python-dev python-setuptools libboost-python-dev libboost-thread-dev -y 像这样调用configure.py: ...
  • 1 votes
     answers
     views

    (py)CUDA中的网格和块维[重复]

    这个问题在这里已有答案: How do I choose grid and block dimensions for CUDA kernels? 3个答案 我对(py)CUDA中的块和网格的尺寸有疑问 . 我知道块的总大小有限,但不是网格 并且实际的块大小会影响运行时 . 但我想知道的是:如果我有一个256个线程的块,启动它像(256,1)或像(128,2)那样启动它,如(64,4)等,它会有...

热门问题