Java 学习之路

3 votes

answers

views

在NVIDIA硬件上运行OpenCL程序

我已经构建了一个简单的基于OpenCL的程序（在C中），并在使用AMD FirePro V4900卡的Windows 8系统上进行了测试 . 我使用的是AMD APP SDK . 当我将我的二进制文件复制到另一台机器（带有NVIDIA Quadro 4000卡的Windows 8）时，我得到“程序入口点clReleaseDevice无法位于动态链接库（我的程序的exe文件）”中 . 第二台机器安装...

opencl gpgpu gpu-programming
24 votes

answers

views

如何管理CUDA内存？

当我运行仅分配少量全局内存（低于20 M）的CUDA程序时，出现“内存不足”错误 . （从其他人的帖子中，我认为问题与内存碎片有关）我试着理解这个问题，并意识到我有几个与CUDA内存管理有关的问题 . CUDA中是否有虚拟内存概念？如果只允许一个内核同时在CUDA上运行，在终止后，它使用或分配的所有内存都将被释放？如果没有，这些内存何时免费发布？如果允许在CUDA上运行多个内核，...

cuda nvidia gpu-programming
0 votes

answers

views

没有调用CUDA内核函数

我开始使用CUDA了，我遇到了一些问题 . 我在下面发布的代码基本上是NVIDIA网站上最简单的例子，添加了一些内存副本和一个打印语句，以确保它正常运行 . 代码编译并运行没有抱怨，但是当我打印向量c时它会全部出现零，好像根本没有调用GPU内核函数 . 这与此帖子Basic CUDA - getting kernels to run on the device using C++几乎完全相同 . ...

c cuda gpu gpu-programming
0 votes

answers

views

打包OpenCV中的像素数据

每当我通过cv :: imread读取带有3个通道的彩色图像时;它的数据对齐有点笨拙（既不是字节也不是整数），当我读取GPU内存上的单个像素数据时，我的速度会慢下来 . 而且似乎cv :: Mat类的对齐背后的逻辑与我最初的想法有点不同 . 它不会在一行中的两个像素之间添加额外的字节，以便每4个字节开始一行中的每个像素;而是在每行的END处填充一些额外的字节，任何行都可以在每4字节边界处开始 . ...

opencv pixel gpu-programming mat
43 votes

answers

views

nvidia-smi易失性GPU利用率解释？

我知道 nvidia-smi -l 1 将每秒钟提供一次GPU使用（类似于以下内容） . 但是，我很感激 Volatile GPU-Util 的真正含义 . 这是使用的SM数量超过总SM数，占用数量还是其他数量？ +-----------------------------------------------------------------------------+ | NVIDIA-SMI ...

cuda gpu nvidia gpgpu gpu-programming
1 votes

answers

views

'Wrong major API version for gpuarray:'，-9997，'Make sure Theano and libgpuarray/pygpu are in sync.'

错误（theano.sandbox.gpuarray）：无法初始化pygpu，支持禁用 Traceback（最近一次调用最后一次）：文件“/home/mesayantan/.local/lib/python2.7/site-packages/theano/sandbox/gpuarray/ init .py”，第95行，in init_dev(config.device) 在init_de...

opencl theano amd gpu-programming
2 votes

answers

views

在经过训练和重新加载的Keras模型中更改设备分配

我有一个Keras模型，在8 gpu的训练 . 这意味着该模型具有如下块： with tf.device('gpu:0') . 现在我想用另一台有4 gpus 's. However, this results in an error, most likely because the model was trained on more gpus' s（ error: could not set ...

python tensorflow neural-network keras gpu-programming
0 votes

answers

views

CUDA GPU按位置选择，但如何将默认设置为设备0以外的其他东西？

我最近在家里的机器上安装了第二个GPU（Tesla K40），我的搜索建议第一个PCI插槽成为CUDA作业选择的默认GPU . 一个很棒的链接正在解释它可以在这里找到： Default GPU Assignment 我的原始GPU是TITAN X，也支持CUDA，但它最适合单精度计算，特斯拉更适合双精度 . 我对该小组的问题是，是否有办法将我的默认CUDA编程设备设置为第二个？显然我每次都可以在代...

cuda nvidia gpu-programming
1 votes

answers

views

使用OpenMP CUDA对CPU的速度不是很快？

我试图计算每个大小为20000的450个向量之间的互相关 . 在CPU上执行此操作时，我将数据存储在2D矩阵中，行= 20000且cols = 450 . 计算的序列代码如下 void computeFF_cpu( float * nSamples, float * nFeatures, float ** data, float ** corr #pragma omp parall...

cuda gpu gpgpu gpu-programming
8 votes

answers

views

我可以在英特尔处理器显卡I7（第3代或第4代）上运行Cuda或OpenCl

我正在开发SBC（其中有Intel I7 3ed或4ed，并且没有外置GPU）我正在使用linux . 我想利用英特尔处理器显卡的优势 . 我想用Cuda或OpenCl来学习开发 . 我读过一些旧帖子（几年前）（我不确定现在有更好的技术）： Can i run CUDA on Intel GPU Programming, CUDA or OpenCL 我可以在英特尔处理器显卡上运行cuda代码...

graphics opencl intel gpu-programming

热门问题