Java 学习之路

4 votes

answers

views

使用OpenGL从使用CUDA生成的顶点缓冲区对象中绘制图像

我正在使用CUDA生成此ABGR输出图像 . 有问题的图像存储在uchar4数组中 . 数组的每个元素表示图像中每个像素的颜色 . 显然，这个输出数组是一个2D图像，但它在CUDA中被分配为交错字节的线性存储器 . 我知道CUDA可以轻松地将此数组映射到OpenGL顶点缓冲区对象 . 我的问题是，假设我拥有图像中每个像素的RGB值，以及图像的宽度和高度，我如何使用OpenGL将此图像绘制到屏幕？我...

c opengl cuda jcuda
0 votes

answers

views

在Hadoop-2.6.0中，容器因虚拟内存不足而被杀死

我正在尝试在hadoop上实现jcuda代码，并且它在本地模式下工作，但是当我在hadoop集群上运行作业时，它给了我一个错误：容器在这里被杀死是特定的错误报告： 16/04/29 10:18:07 INFO mapreduce.Job：任务ID：attempt_1461835313661** r_000009_2，状态：FAILED容器[pid = 19894，containerID = con...

hadoop mapreduce jcuda
0 votes

answers

views

JCuda固定内存示例

JCuda GEForce Gt640问题：我试图减少在GPU计算结果后将内存从设备复制到主机相关的延迟 . 做简单的Vector Add程序我发现大部分延迟确实是将结果缓冲区复制回主机端 . 源缓冲区到设备端的传输延迟可以忽略不计〜 . 30ms，而复制结果的时间大约是20ms . 我做了研究，发现复制结果的更好的替代方法是使用固定内存 . 根据我的学习，这个内存在主机端分配，但内核可以通过p...

cuda jcuda
0 votes

answers

views

在GTX1080上使用~2.2GB内存后，CUDA内存不足消息

我在使用JCuda的GTX1080 GPU上进行矩阵乘法，使用CUDA 8.0版本为0.8.0RC . 我将两个矩阵A和B以行主矢量形式加载到设备中，并从设备读取产品矩阵 . 但我发现我的设备内存耗尽了我的预期 . 例如，如果矩阵A的尺寸为100000 * 5000 = 5亿个条目= 2GB值的浮点值，则： cuMemAlloc(MatrixA, 100000 * 5000 * Sizeof.FL...

cuda out-of-memory jcuda

使用OpenGL从使用CUDA生成的顶点缓冲区对象中绘制图像

在Hadoop-2.6.0中，容器因虚拟内存不足而被杀死

JCuda固定内存示例

在GTX1080上使用~2.2GB内存后，CUDA内存不足消息

热门问题