首页 文章
  • -2 votes
     answers
     views

    cuda运行时错误(48):没有内核映像可用于在设备上执行

    我是pytorch的新手 . 我从这个存储库https://github.com/ruotianluo/ImageCaptioning.pytorch获取代码,并希望为图像制作 Headers . 安装"CUDA",当我运行脚本来创建注释时,会产生以下结果: $ CUDA_LAUNCH_BLOCKING = 1 python eval.py --model model.pt...
  • 0 votes
     answers
     views

    对于大批量或使用此脚本,PyTorch培训是否存在错误?

    我正在关注Joshua L. Mitchell的this PyTorch tutorial . 本教程的最后一个结局是以下PyTorch训练脚本 . 一个元素,批量大小,我在脚本的第一行参数化,我在新启动的Jupyter笔记本中运行 . 有问题的关键参数是BIGGER_BATCH,最初设置为4: BIGGER_BATCH=4 import numpy as np import torch # T...
  • 0 votes
     answers
     views

    使用GPU使用OpenCV在视频的所有4个方向上搜索面部的最有效方法是什么?

    我是GPU编程的新手,我已经开始将haarcascade_frontalface_alt.xml和一个视频文件传递给这个编译的例子: https://github.com/Itseez/opencv/blob/master/samples/gpu/cascadeclassifier.cpp 将视频加载到GPU中需要大约3秒钟,然后再用2秒钟来搜索面部 . 这很好但视频可以在任何方向录制,所以如果没...
  • 0 votes
     answers
     views

    如何安装opencv而不构建空间约束YOLO暗网

    所以基本上我的最终目标是使用gpu和opencv支持编译YOLO darknet库 . https://pjreddie.com/darknet/yolo/ 直到现在我一直在使用我用pip安装的opencv . pip install opencv-python 到目前为止,这已经很棒了,但是在Makefile中使用opencv = 1制作darknet时,这无法获得所需的opencv模块 ...
  • 0 votes
     answers
     views

    ModuleNotFoundError:没有名为'tensorflow' Windows 10的模块,使用pip和conda install cmd

    我安装了Anaconda(OS Windows 10),然后创建了env tensorflow-gpu和conda cmd安装tensorflow-gpu,tensorflow,jupyter notebook . 我从本教程中做了每一步 - https://medium.com/@viveksingh.heritage/how-to-install-tensorflow-gpu-version...
  • 0 votes
     answers
     views

    Tensorflow ImageDataGenerator关闭错误:'Image'对象没有属性'fp'

    我试图用ImageDataGenerator构建一个CNN,它可以工作,但我之间得到这个错误 . 有谁知道如何解决这一问题? Error closing: 'Image' object has no attribute 'fp' 我使用Python 3.5和Tensorflow 1.12.0 LOG 2018-12-07 18:50:07.930812:I tensorflow / core / ...
  • 0 votes
     answers
     views

    如何在使用自定义着色器时裁剪纹理?

    我尝试使用 clipRect 和 offset 属性使用Apple提供的默认过滤器裁剪 MTLTexture ,它可以与实时视频过滤一起使用 . 但是对于自定义过滤器(使用 custom shaders ),属性 clipRect 和 offset 对裁剪 MTLTexture 无效,我尝试使用 MPSImageLanczosScale 引用Crop and scale MTLTexture进行裁...
  • 2 votes
     answers
     views

    OpenCL(GPU)中的慢随机内存访问

    基本上,我正在编写一个以随机/不可预测的方式访问全局内存的OpenCL内核(当前未优化的光线跟踪器的路径跟踪组件),这几乎完全否定了GPU相对于CPU的并行化性能优势(供参考,我正在使用i7-2630QM CPU,GTX 560m GPU - 性能数据如下) . 为了便于调整/测试,我编写了一个模拟这种内存访问模式的“测试”内核;它本质上为GPU提供了一个大的三角形坐标数组和一个要处理的inde...
  • 1 votes
     answers
     views

    如何编程INTEL GPU

    我是GPU计算领域的新手 . 所以我真的希望有人向我解释一下这些基础知识 . 我必须使用以下GPU的英特尔芯片组: GMA4500 高清显卡 我感兴趣的是在GPU中运行具有大数据集的代数和按位函数,例如数组的转置或数组行的按位移位 . 目标当然是获得更多的表现 . 我的主要问题是如何在GPU上编程?在过去,我使用CUDA在nVIDIA显卡上进行编程 . 我从之前的主题中了解到,我不能将...
  • 0 votes
     answers
     views

    使用anaconda升级到tensorflow中的gpu会显示错误消息

    我使用了如何在带有anaconda的Windows 10上安装Tensorflow的答案中描述的技术?这对我有用 . 然后我尝试使用以下消息运行升级到GPU pip install --ignore-installed --upgrade https://storage.googleapis.com/tensorflow/windows/gpu/tensorflow_gpu-1.0.0-cp35-...
  • 3 votes
     answers
     views

    TensorFlow无法使用gpu

    我开始使用TensorFlow,但我无法使用TensorFlow 1.2.1来使用GPU而不是CPU . 我的笔记本电脑配备了NVIDIA GTX 850M,兼容CUDA 5.0 . CUDA Toolkit安装了最新版本 . cuDNN安装了最新版本 . 我已经设置了环境变量,如下所示:https://nitishmutha.github.io/tensorflow/2017/01/22/Ten...
  • 0 votes
     answers
     views

    tensorflow-gpu-nightly包的Tensorflow CPU警告

    当我启动tensorflow会话时,我收到以下错误:您的CPU支持此TensorFlow二进制文件未编译使用的指令:AVX AVX2 我已经为Windows安装了GPU nightly版本并安装了CUDA GPU工具包9.0 . 这是一个CPU警告,不应该因为我有GPU并使用它来运行tensorflow模型 . 以下是我在训练模型时的GPU使用情况(任务管理器):GPU Usage link - ...
  • 2 votes
     answers
     views

    使用OpenGL时是否可以在GPU上执行浮点运算?

    在大学,我们已经介绍了OpenGL,并且's first time I' m正在使用它 . 到目前为止,我已经实现了像Sierpinski carpet之类的简单操作,我注意到大多数(固定和浮点)计算都是在CPU上执行的 . OpenGL是否提供了一些API,这些算法能够对GPU进行这些计算吗? 我知道,有OpenCL或CUDA这样的框架,但我想知道OpenGL是否可以使用GPU进行典型的图形计...
  • 2 votes
     answers
     views

    OpenCL中的HyperQ支持

    我想运行在异步上在单个GPU上执行的异构内核 . 我认为这可以在Nvidia Kepler K20(或具有计算能力3.5的任何设备)中通过将每个内核启动到不同的流并且运行时系统基于资源可用性将它们映射到不同的硬件队列来实现 . OpenCL中是否可以访问此功能?如果是这样,那么OpenCL中的CUDA“Stream”相当于什么? Nvidia驱动程序是否通过OpenCL支持在K20卡上执行此类操...
  • 2 votes
     answers
     views

    CUDA纹理内存绑定全局内存的子部分

    我有问题绑定到纹理内存全局设备内存的子部分 . 我有一个充满内存的大型全局设备数组,如下所示: double * device_global; cudaMalloc((void )&device_global,sizeof(double) N)); cudaMemcpy(device_global,host,sizeof(double) N,cudaMemcpyHostToDevice)); ...
  • 1 votes
     answers
     views

    CIFAR-10尺寸误差Keras

    我试图在我的机器的GPU中运行Cifar-10 CNN代码,但我面临以下问题: 尺寸(-1)必须在[0,2]范围内,其中2是输入中的尺寸数 . 对于具有输入形状的'metrics / acc / ArgMax'(op:'ArgMax'):[?,?],[] . 这是我的代码: import os os.environ["THEANO_FLAGS"] = "mode=FA...
  • 14 votes
     answers
     views

    从cmake测试cuda功能GPU存在的最简单方法?

    我们有一些夜间构建的机器安装了cuda libraries但没有安装cuda的GPU . 这些机器能够构建启用cuda的程序,但它们无法运行这些程序 . 在我们的自动夜间构建过程中,我们的cmake脚本使用cmake命令 find_package(CUDA) 确定是否安装了cuda软件 . 这会在安装了cuda软件的平台上设置cmake变量 CUDA_FOUND . 这很棒,而且效果很好 . 设...
  • 21 votes
     answers
     views

    CUDA如何为GPU分配设备ID?

    当计算机具有多个支持CUDA的GPU时,每个GPU都会分配一个 device ID . 默认情况下,CUDA内核在 device ID 0 上执行 . 您可以使用 cudaSetDevice(int device) 选择其他设备 . 假设我的机器中有两个GPU:GTX 480和GTX 670. How does CUDA decide which GPU is device ID 0 and ...
  • -2 votes
     answers
     views

    在cuda中计算矩阵A.transpose * A.

    当我在cuda中计算`A.transpose * A'时有一些问题 . 假设A是M * N矩阵并存储在column-major中,我尝试使用此函数 cublasSgemm_v2 这是Cublas中的Matrix-Matrix乘法API 像这样 : cublasSgemm_v2(handle,CUBLAS_OP_T,CUBLAS_OP_N,N,N,M,&al,A,N,A,M,&bet...
  • 2 votes
     answers
     views

    Tensorflow:GPU上的稀疏张量的梯度计算

    我 Build 了一个类似于CIFAR10的GPU实现的张量流模型 . 我有一个在每个GPU上执行的基本模型,而网络的变量在CPU上 . 只要我不使用稀疏张量作为图层中的权重矩阵,一切都可以正常工作 . 我的稀疏权重矩阵用函数 tf.sparse_to_dense() 或 tf.diag() 构造 . 当我在CPU上运行它时一切正常,但是当我在GPU上运行它时,我得到的消息是 no GPU imp...
  • 1 votes
     answers
     views

    tensorflow将softmax op放在cpu而不是gpu上

    我有一个具有多个输入和多个层的张量流模型,以及最终的softmax层 . 该模型使用Python进行训练(使用Keras框架),然后使用C程序完成保存和推理,该程序有助于构建TensorFlow的CMake(基本上遵循这些指令:https://github.com/tensorflow/tensorflow/tree/master/tensorflow/contrib/cmake) . 在pyth...
  • 4 votes
     answers
     views

    如何在Metal中的片段着色器中获取片段坐标?

    这个最小的金属着色器对基于顶点的颜色属性在屏幕上呈现简单的插值渐变(当提供顶点四边形/三角形时): #include <metal_stdlib> using namespace metal; typedef struct { float4 position [[position]]; float4 color; } vertex_t; vertex verte...
  • 1 votes
     answers
     views

    金属防护设备地址模式

    我正在创建一个使用Metal来渲染所有内容的图形应用程序 . 当我在所有绘制调用的管道统计信息下进行帧调试时,有一个!! Headers 为“预防设备地址模式加载”的优先级警报,详细信息如下: Indexing using unsigned int for offset prevents addressing calculation in device. To prevent this extra...
  • 3 votes
     answers
     views

    如何使用CPU而不是GPU处理CIFilter?

    有谁知道怎么告诉核心图像使用CPU而不是GPU通过CIFilter处理CIImage?我需要处理一些非常大的图像,并且使用GPU会得到奇怪的结果 . 我不关心CPU需要多长时间就可以了 .
  • 24 votes
     answers
     views

    如何获取OpenCL SDK?

    我正在浏览http://www.khronos.org/网站,只发现OpenCL的 Headers (不是我不关心的OpenGL) . 我如何获得OpenCL SDK?
  • 0 votes
     answers
     views

    我无法在Windows 10中为GPU启动mxnet R.

    嗨,我尝试在Windows中安装mxnet R.接下来是mxnet.com网页,https://mxnet.incubator.apache.org/get_started/install.html,我运行了prebuild包 . 该命令看起来已成功运行 . 但是当我通过"library(mxnet)"启动mxnet时,我看到以下错误 . library(mxnet)错误:'m...
  • 0 votes
     answers
     views

    张量流宽线性模型推理对gpu的缓慢影响

    我正在训练一个关于张量流的稀疏逻辑回归模型 . 该问题具体涉及推理部分 . 我正在尝试对cpu和gpu进行基准测试 . 我在我目前的GCE盒子上使用Nvidia P100 gpu(4个模具) . 我是gpu的新手,很抱歉天真的问题 . 该模型相当大〜54k操作(与dnn或imagenet模型相比,它被认为是大的吗?) . 当我记录设备放置时,我只看到正在使用的gpu:0,其余的未使用?我不会在训练...
  • 0 votes
     answers
     views

    使用带有Tensorflow后端的Keras的TFE_Py_RecordGradient错误

    我试图在Nvidia GPU上使用Keras和Tensorflow训练卷积神经网络 . 我已经尝试使用代码和数据来实现非常简单的模型模型而没有锁定 . 我尝试定义的每个网络都给出了同样的错误: 文件“”,第2行,在model.add中(Dense(12,input_dim = 5,kernel_initializer ='normal',activation ='relu'))>文件“bu...
  • 1 votes
     answers
     views

    可以争夺GPU会导致线程阻塞吗?如果是这样,如何解决?

    我有一个Objective-C iOS应用程序,它使用第三方C库渲染到屏幕外的OpenGL帧缓冲区 . 渲染在一个单独的线程中异步发生 . 它使用使用sharegroup创建的上下文,以便生成的帧缓冲内容可以直接作为纹理访问,以供主线程呈现 . myContext = [[EAGLContext alloc] initWithAPI:kEAGLRenderingAPIOpenGLES2 share...
  • 2 votes
     answers
     views

    固定在CUDA和cudamemcpy()中的内存

    据我所知,当主机和设备之间的复制操作开始使用cudaMemcpy时,主机指针会自动固定 . 那么有一个单独的API cudAHostAlloc()用于分配固定主机内存的含义和必要性是什么?

热门问题