首页 文章
  • 3 votes
     answers
     views

    在NVIDIA硬件上运行OpenCL程序

    我已经构建了一个简单的基于OpenCL的程序(在C中),并在使用AMD FirePro V4900卡的Windows 8系统上进行了测试 . 我使用的是AMD APP SDK . 当我将我的二进制文件复制到另一台机器(带有NVIDIA Quadro 4000卡的Windows 8)时,我得到“程序入口点clReleaseDevice无法位于动态链接库(我的程序的exe文件)”中 . 第二台机器安装...
  • 24 votes
     answers
     views

    如何管理CUDA内存?

    当我运行仅分配少量全局内存(低于20 M)的CUDA程序时,出现“内存不足”错误 . (从其他人的帖子中,我认为问题与内存碎片有关)我试着理解这个问题,并意识到我有几个与CUDA内存管理有关的问题 . CUDA中是否有虚拟内存概念? 如果只允许一个内核同时在CUDA上运行,在终止后,它使用或分配的所有内存都将被释放?如果没有,这些内存何时免费发布? 如果允许在CUDA上运行多个内核,...
  • 0 votes
     answers
     views

    没有调用CUDA内核函数

    我开始使用CUDA了,我遇到了一些问题 . 我在下面发布的代码基本上是NVIDIA网站上最简单的例子,添加了一些内存副本和一个打印语句,以确保它正常运行 . 代码编译并运行没有抱怨,但是当我打印向量c时它会全部出现零,好像根本没有调用GPU内核函数 . 这与此帖子Basic CUDA - getting kernels to run on the device using C++几乎完全相同 . ...
  • 0 votes
     answers
     views

    打包OpenCV中的像素数据

    每当我通过cv :: imread读取带有3个通道的彩色图像时;它的数据对齐有点笨拙(既不是字节也不是整数),当我读取GPU内存上的单个像素数据时,我的速度会慢下来 . 而且似乎cv :: Mat类的对齐背后的逻辑与我最初的想法有点不同 . 它不会在一行中的两个像素之间添加额外的字节,以便每4个字节开始一行中的每个像素;而是在每行的END处填充一些额外的字节,任何行都可以在每4字节边界处开始 . ...
  • 43 votes
     answers
     views

    nvidia-smi易失性GPU利用率解释?

    我知道 nvidia-smi -l 1 将每秒钟提供一次GPU使用(类似于以下内容) . 但是,我很感激 Volatile GPU-Util 的真正含义 . 这是使用的SM数量超过总SM数,占用数量还是其他数量? +-----------------------------------------------------------------------------+ | NVIDIA-SMI ...
  • 1 votes
     answers
     views

    'Wrong major API version for gpuarray:',-9997,'Make sure Theano and libgpuarray/pygpu are in sync.'

    错误(theano.sandbox.gpuarray):无法初始化pygpu,支持禁用 Traceback(最近一次调用最后一次): 文件“/home/mesayantan/.local/lib/python2.7/site-packages/theano/sandbox/gpuarray/ init .py”,第95行,in init_dev(config.device) 在init_de...
  • 2 votes
     answers
     views

    在经过训练和重新加载的Keras模型中更改设备分配

    我有一个Keras模型,在8 gpu的训练 . 这意味着该模型具有如下块: with tf.device('gpu:0') . 现在我想用另一台有4 gpus 's. However, this results in an error, most likely because the model was trained on more gpus' s( error: could not set ...
  • 0 votes
     answers
     views

    CUDA GPU按位置选择,但如何将默认设置为设备0以外的其他东西?

    我最近在家里的机器上安装了第二个GPU(Tesla K40),我的搜索建议第一个PCI插槽成为CUDA作业选择的默认GPU . 一个很棒的链接正在解释它可以在这里找到: Default GPU Assignment 我的原始GPU是TITAN X,也支持CUDA,但它最适合单精度计算,特斯拉更适合双精度 . 我对该小组的问题是,是否有办法将我的默认CUDA编程设备设置为第二个?显然我每次都可以在代...
  • 1 votes
     answers
     views

    使用OpenMP CUDA对CPU的速度不是很快?

    我试图计算每个大小为20000的450个向量之间的互相关 . 在CPU上执行此操作时,我将数据存储在2D矩阵中,行= 20000且cols = 450 . 计算的序列代码如下 void computeFF_cpu( float * nSamples, float * nFeatures, float ** data, float ** corr #pragma omp parall...
  • 8 votes
     answers
     views

    我可以在英特尔处理器显卡I7(第3代或第4代)上运行Cuda或OpenCl

    我正在开发SBC(其中有Intel I7 3ed或4ed,并且没有外置GPU)我正在使用linux . 我想利用英特尔处理器显卡的优势 . 我想用Cuda或OpenCl来学习开发 . 我读过一些旧帖子(几年前)(我不确定现在有更好的技术): Can i run CUDA on Intel GPU Programming, CUDA or OpenCL 我可以在英特尔处理器显卡上运行cuda代码...

热门问题