首页 文章
  • 4 votes
     answers
     views

    使用OpenGL从使用CUDA生成的顶点缓冲区对象中绘制图像

    我正在使用CUDA生成此ABGR输出图像 . 有问题的图像存储在uchar4数组中 . 数组的每个元素表示图像中每个像素的颜色 . 显然,这个输出数组是一个2D图像,但它在CUDA中被分配为交错字节的线性存储器 . 我知道CUDA可以轻松地将此数组映射到OpenGL顶点缓冲区对象 . 我的问题是,假设我拥有图像中每个像素的RGB值,以及图像的宽度和高度,我如何使用OpenGL将此图像绘制到屏幕?我...
  • 0 votes
     answers
     views

    在Hadoop-2.6.0中,容器因虚拟内存不足而被杀死

    我正在尝试在hadoop上实现jcuda代码,并且它在本地模式下工作,但是当我在hadoop集群上运行作业时,它给了我一个错误:容器在这里被杀死是特定的错误报告: 16/04/29 10:18:07 INFO mapreduce.Job:任务ID:attempt_1461835313661** r_000009_2,状态:FAILED容器[pid = 19894,containerID = con...
  • 0 votes
     answers
     views

    JCuda固定内存示例

    JCuda GEForce Gt640问题: 我试图减少在GPU计算结果后将内存从设备复制到主机相关的延迟 . 做简单的Vector Add程序我发现大部分延迟确实是将结果缓冲区复制回主机端 . 源缓冲区到设备端的传输延迟可以忽略不计〜 . 30ms,而复制结果的时间大约是20ms . 我做了研究,发现复制结果的更好的替代方法是使用固定内存 . 根据我的学习,这个内存在主机端分配,但内核可以通过p...
  • 0 votes
     answers
     views

    在GTX1080上使用~2.2GB内存后,CUDA内存不足消息

    我在使用JCuda的GTX1080 GPU上进行矩阵乘法,使用CUDA 8.0版本为0.8.0RC . 我将两个矩阵A和B以行主矢量形式加载到设备中,并从设备读取产品矩阵 . 但我发现我的设备内存耗尽了我的预期 . 例如,如果矩阵A的尺寸为100000 * 5000 = 5亿个条目= 2GB值的浮点值,则: cuMemAlloc(MatrixA, 100000 * 5000 * Sizeof.FL...

热门问题