首页 文章
  • 0 votes
     answers
     views

    Intellij异常构建进程终止

    所以,我刚刚将我的NVIDIA图形驱动程序(GeForce游戏就绪驱动程序)更新为378.49,现在当我尝试构建任何Java项目时,我收到此错误: 错误:异常构建过程终止:“C:\ Program Files \ Java \ jdk1.8.0_101 \ bin \ java”-Xmx700m -Djava.awt.headless = true -Djava.endorsed.dirs = ...
  • 0 votes
     answers
     views

    GPU利用率如何在神经网络训练的背景下工作?

    我正在使用带有Deep Learning AMI(DLAMI)的AWS p3.2xlarge实例 . 这个实例有一个Tesla V100(640个Tensor核心和5,120个CUDA核心) . 当我运行PyTorch Seq2Seq Jupyter笔记本时,我注意到只使用了25%的GPU . 我使用以下命令 watch -n 1 nvidia-smi 监控GPU使用情况 . 我的问题是,是什么决...
  • 2 votes
     answers
     views

    从NVIDIA_GPU_Computing_SDK为GTK设置cuda模板项目

    我'm developing CUDA with Eclipse Indigo on Ubuntu 11.10. To set up a new CUDA project, i use the template project from the NVIDIA_GPU_Computing_SDK and customize the makefile. For gui development i'm在...
  • 5 votes
     answers
     views

    Nvidia GPU passthrough失败,代码为43

    我正在尝试使用qemu 2.5和libvirt 1.3.5将nvidia GPU传递给Windows 10来宾 . 我在设备管理器中的Nvidia GPU上看到“错误43” . 我试图通过添加“kvm = off”和“hv_vendor_id = 123456780ab”来隐藏虚拟机管理程序,但它对我不起作用 . 我在谷歌搜索,人们以这种方式解决了问题 . 我还看到了虚拟机:在任务管理器中是的 ....
  • 13 votes
     answers
     views

    nvidia-smi无法初始化NVML:操作系统阻止了GPU访问

    什么时候要求 nvidia-smi 它给出了这个错误: Failed to initialize NVML: GPU access blocked by the operating system 其他信息: $ nvcc --verion nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2015 NVIDIA Corporat...
  • 43 votes
     answers
     views

    nvidia-smi易失性GPU利用率解释?

    我知道 nvidia-smi -l 1 将每秒钟提供一次GPU使用(类似于以下内容) . 但是,我很感激 Volatile GPU-Util 的真正含义 . 这是使用的SM数量超过总SM数,占用数量还是其他数量? +-----------------------------------------------------------------------------+ | NVIDIA-SMI ...
  • 0 votes
     answers
     views

    NVIDIA-SMI失败了 . 无法与Nvidia司机沟通

    我在gpu节点上运行 Cloud 实例 . 我安装了CUDA和nvidia-smi显示了驱动程序的详细信息,内存使用情况 . 几天之后,我遇到了这个错误“NVIDIA-SMI因为无法与NVIDIA驱动程序通信而失败 . 请确保安装并运行最新的NVIDIA驱动程序” . 我安装了最新的驱动程序(特斯拉M40 Gpus的Nvidia-375.39) . 我仍然面临同样的问题 . 有没有办法i)调试为什...
  • 128 votes
     answers
     views

    NVIDIA NVML驱动程序/库版本不匹配

    当我运行 nvidia-smi 时,我收到以下消息: Failed to initialize NVML: Driver/library version mismatch 一小时前我收到了同样的消息并卸载了我的cuda库,我能够运行 nvidia-smi ,得到以下结果: 在此之后我从the official NVIDIA page下载了 cuda-repo-ubuntu1604-8-0-lo...
  • 2 votes
     answers
     views

    NVIDIA-SMI在工作了几个月后失败了

    在我的Ubuntu 16.04机器上工作了好几个月后,TensorFlow自动停止工作 . 使用NVIDIA-SMI探测我的3个Titan X GPU产量: NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is ...
  • 8 votes
     answers
     views

    在执行Tensorflow或Theano代码期间GPU丢失

    当训练两个不同神经网络中的一个时,一个用Tensorflow,另一个用Theano,有时候经过一段随机的时间(可能是几个小时或几分钟,大多数几个小时),执行冻结,我得到这个消息运行“nvidia-smi”: “无法确定GPU 0000:02:00.0的设备句柄:GPU丢失 . 重新启动系统以恢复此GPU” 我试图监控GPU性能13小时执行,一切似乎都很稳定: 我正在与: Ubuntu 14.0...
  • 7 votes
     answers
     views

    错误:NVIDIA-SMI失败,因为它无法与NVIDIA驱动程序通信

    NVIDIA-SMI抛出了这个错误: NVIDIA-SMI因为无法与NVIDIA驱动程序通信而失败 . 确保已安装并运行最新的NVIDIA驱动程序 我按照提到的步骤here清除了NVIDIA并再次安装 . 我的设备规格如下: 带特斯拉M40的服务器 在Ubuntu 16.04上运行 内核版本Linux 4.4.0-116-通用x86_64 司机:nvidia-384 有人可...
  • 119 votes
     answers
     views

    CUDA如何阻止/扭曲/线程映射到CUDA核心?

    我已经使用CUDA几个星期,但我对块/ warps /线程的分配有一些疑问 . I am studying the architecture from a didactic point of view (大学项目),所以达到最佳表现不是我的关注 . 首先,我想了解我是否直截了当地得到了这些事实: 程序员编写内核,并在线程块网格中组织执行 . 每个块都分配给一个流式多处理器(SM) . ...
  • 0 votes
     answers
     views

    在ubuntu18.04中导入错误tensorflow-gpu

    我在导入tensorflow时遇到一些错误 . 我的电脑规格: 操作系统:ubuntu 18.04 Nvidia RTX 2080 Ti * 2 Nvidia司机-415 CUDA:10.0 cuDNN:7.3.0 tensorflow:1.11.0 import tensorflow 错误: Traceback(最近一次调用最后一次):文件“/usr/local/lib/python3.6/...
  • 2 votes
     answers
     views

    即使nvidia.icd存在且包含'libcuda.so',getPlatformIDs()也会返回-1001

    我最近在Ubuntu 12.04机器上玩过OpenCL . 当我调用 cl::Platform::get 时,我得到的错误代码为-1001 . 经过一些研究,我发现当c调用 getPlatformIDs 无法找到有效平台时会发生这种情况,并且当/ etc / OpenCL / vendors /目录中没有.icd文件或者实现时(例如) s)通过调用 dlopen 无法打开文件引用的文件 .然而,我...
  • 0 votes
     answers
     views

    Python进程与Jupyter笔记本访问GPU内存

    在尝试调整我在Google Cloud 平台上安装的Tesla K80上的推荐引擎时,我做了一个非常有趣的观察 . 不幸的是,我找不到任何可能指向正确方向的文献是不成功的 . 这是我的困境...... 我使用python脚本和jupyter笔记本运行相同的代码来安装完全连接的模型 . 令人惊讶的是,使用相同的超参数(批量大小等),代码运行速度更快,使用jupyter笔记本内核并且在GPU上使用的内...
  • 0 votes
     answers
     views

    无法加载本机TensorFlow运行时 . Windows 10上的Python 3.6

    我在Windows 10上为Python 3.6安装CUDA GPU工具(版本9.2) . 我收到以下错误: 回溯(最近的呼叫最后): 文件“D:\ Python \ Python36 \ lib \ site-packages \ tensorflow \ python \ pywrap_tensorflow.py”,第58行,来自tensorflow.python.pywrap_tensorf...
  • 3 votes
     answers
     views

    OpenCL - 多GPU缓冲同步

    我有一个OpenCL内核,它计算系统中其他粒子施加的粒子上的总力,然后是另一个整合粒子位置/速度的粒子 . 我想在多个GPU上并行化这些内核,基本上为每个GPU分配一些粒子 . 但是,我必须多次运行此内核,并且每个GPU都会使用每个GPU的结果 . 让我再解释一下: 假设你在GPU 0上有粒子0,在GPU 1上有粒子1.粒子0上的力被改变,粒子1上的力也是如此,然后它们的位置和速度由积分器相应地改...
  • 101 votes
     answers
     views

    NVIDIA与AMD:GPGPU性能

    我想听听有两种编码经验的人的意见 . 我自己,我只有NVIDIA的经验 . NVIDIA CUDA似乎比竞争对手更受欢迎 . (只计算这个论坛上的问题标签,'cuda'优于'opencl'3:1,'nvidia'优于'ati '15:1,并且根本没有'ati-stream'标签 . 另一方面,根据维基百科,ATI / AMD显卡应该具有更大的潜力,特别是每美元 . 目前市场上最快的NVIDIA显...
  • 8 votes
     answers
     views

    OpenCL AMD与NVIDIA的表现

    我实现了一个简单的内核,它是某种卷积 . 我在NVIDIA GT 240上进行了测量 . 在CUDA上写入时需要70 ms,在OpenCL上写入时需要100 ms . 好吧,我想,NVIDIA编译器更适合CUDA(或者我做错了) . 我需要在AMD GPU上运行它,所以我迁移到了AMD APP SDK . 完全相同的内核代码 . 我做了两次测试,他们的结果让我感到沮丧:HD 6670为200 ms...
  • 8 votes
     answers
     views

    在Nvidia和AMD硬件上使用OpenCL FFT?

    我正在开发一个需要在Nvidia和AMD显卡上使用FFT的项目 . 我最初寻找一个可以同时工作的库(认为这将是OpenCL方式),但我没有运气 . 有人向我建议我必须使用每个供应商的FFT实现并编写一个包装器,根据平台选择做什么 . 我很容易发现AMD的实现,但实际上我正在使用Nvidia卡(这对我的特定应用来说更重要) . 我能找到的唯一Nvidia实现是CUFFT实现 . 有谁知道我如何实际使...
  • 2 votes
     answers
     views

    Direct3D 11.1在OpenGL中的目标无关光栅化(TIR)等效(包括扩展)

    独立于目标的光栅化(TIR)是DirectX 11.1中的一个新的hardware功能,Microsoft used to improve Direct2D in Windows 8 . AMD声称TIR improved performance in 2D vector graphics by some 500% . 并且有一些"war of words"与Nvidia的,...
  • 2 votes
     answers
     views

    自nvidia的375.63驱动程序更新以来,使用OpenTK创建图形上下文返回1.1 OpenGL上下文

    问题描述 我已经使用OpenTK在各种Windows配置(7,8,8.1,10)和硬件(各种AMD,nvidia GPU和intel的图形芯片组)上创建OpenGL上下文两年多没有问题 . 但是自从nvidia的375.63驱动程序更新和所有后续驱动程序更新(甚至是昨天发布的最新378.49),当我尝试使用OpenTK创建OpenGL上下文时,我最终得到了一个OpenGL 1.1.0上下文(供应商...
  • 7 votes
     answers
     views

    2-GPU卡上的PCI-e通道分配?

    cudaMemcpy 操作的数据速率受到分配用于从CPU运行到GPU的PCI-e 3.0(或2.0)通道数量的严重影响 . 我很好奇PCI-e通道如何在包含两个GPU的Nvidia设备上使用 . Nvidia有一些产品在一个PCI-e设备上有两个GPU . 例如: GTX 590包含两个Fermi GF110 GPU GTX 690包含两个Kepler GK104 GPU 与许多较新的...
  • 0 votes
     answers
     views

    CUDA GPU按位置选择,但如何将默认设置为设备0以外的其他东西?

    我最近在家里的机器上安装了第二个GPU(Tesla K40),我的搜索建议第一个PCI插槽成为CUDA作业选择的默认GPU . 一个很棒的链接正在解释它可以在这里找到: Default GPU Assignment 我的原始GPU是TITAN X,也支持CUDA,但它最适合单精度计算,特斯拉更适合双精度 . 我对该小组的问题是,是否有办法将我的默认CUDA编程设备设置为第二个?显然我每次都可以在代...
  • 2 votes
     answers
     views

    如果有两个gpu,如何设置Torch只使用一个gpu?

    我的电脑有两个GPU . 这是我第一次使用两个GPU . 当我有一个GPU时,我只运行Cuda程序,它只在一个GPU上运行 . 但是,我不知道如何控制程序使用哪个GPU以及如何在唯一的GPU上运行程序 . 我搜索了互联网,post说 导出CUDA_VISIBLE_DEVICES = 0 必须在运行程序之前使用它 . 我有两个程序要运行 . 一个是火炬脚本,另一个是Cuda脚本 . 我打开了两个...
  • 0 votes
     answers
     views

    CUDA - 更多SM或更高的时钟频率?

    当CUDA内核速度执行至关重要时,更重要的是什么?核心的频率或SM的数量? 我可以在Quadro K5000和Gtx 670之间进行选择,我无法决定 . 在两种情况下内存似乎都足够了,但是quadro有更多的SM,而Gtx有更高的时钟频率(我想这个值是每个核心) .
  • 10 votes
     answers
     views

    CUDA中的矩阵向量乘法:基准测试和性能

    我正在用一些新的基准测试结果更新我的问题(我还重新提出了更具体的问题并更新了代码)... 我使用共享内存在CUDA C Programming Guide之后在CUDA C中实现了用于矩阵向量乘法的内核 . 让我首先介绍一些我在Jetson TK1(GPU:Tegra K1,计算能力3.2)上做的基准测试结果以及与cuBLAS的比较: 在这里,我猜cuBLAS做了一些魔术,因为它的执行似乎不受...
  • 1 votes
     answers
     views

    L1缓存的CUDA银行冲突?

    在NVIDIA的2.x架构中,每个warp都有64kb的内存,默认情况下分为48kb的共享内存和16kb的L1缓存(服务 global 和 constant 内存) . 我们都知道访问共享内存的银行冲突 - 内存分为32个大小为32位的存储区,允许所有32个线程同时独立访问 . 另一方面,全局内存虽然慢得多,但不会遇到银行冲突,因为内存请求在整个warp中合并 . Question: 假设来自全局...
  • 0 votes
     answers
     views

    CUDA 5.5:我不能在内核方法中使用“printf”,我应该在VisualStucio2010“compute_xx,sm_xx”中选择哪个设备?

    这是deviceQuery.exe的propaty Device 0: "NVS 4200M" CUDA Driver Version / Runtime Version 5.5 / 5.5 CUDA Capability Major/Minor version number: 2.1 ( 1) Multiprocessors, ( 48) CUDA C...
  • 0 votes
     answers
     views

    “make”命令是使用错误的clang编译器(编译CUDA示例) - 如何解决这个问题?

    我使用的是MacOS Sierra 10.12.4,并尝试使用兼容CUDA的NVIDIA GeForce GT 750M在我的MacBook Pro(2013年末)上运行CUDA 8.0 . 我按照NVIDIA installation guide安装了Xcode 8.2和相应的命令行工具,但是当我尝试编译样本时,我收到以下错误: $ make -C 1_Utilities / deviceQu...

热门问题