首页 文章
  • 1 votes
     answers
     views

    Numba和guvectorize for CUDA目标:代码运行速度低于预期

    值得注意的细节 大型数据集(1000万x 5),(200 x 1000万x 5) 大多数是Numpy 每次运行后需要更长时间 使用Spyder3 Windows 10 首先是尝试使用以下函数的guvectorize . 我传递了一堆numpy数组并尝试使用它们在两个数组中相乘 . 如果使用cuda以外的目标运行,则此方法有效 . 但是,当切换到cuda时,会导致未知错误: ...
  • 1 votes
     answers
     views

    CUDA分析:nvprof导致系统冻结,即使在退出后也是如此

    我创建了一个在GPU上运行的简单C程序 . 它通过.exe运行时效果很好但是,每当我使用nvprof进行性能分析时,它会导致我的系统变得不稳定(它每隔x秒冻结一次)并需要重新启动才能使系统再次正常运行 . 任何见解将不胜感激 . I DO get this Warning when starting nvprof ,这可能是问题,我该如何纠正? (我有相同的卡片,如下面的信息所示:) . == 7...

热门问题