首页 文章

如何设置专用GPU以对CUDA内核进行基准测试?

提问于
浏览
0

我想在linux下使用第二个GPU设备作为专用设备,以便对内核进行基准测试 .

我正在测试的内核是没有减少的SIMD计算内核而且没有X-Server连接到GPU,该设备是GeForge GTX-480所以我认为计算能力是2.因此,高级功能作为动态并行和其他人,都是残疾人 .

使用nvidia-smi实用程序可以使用各种模式来设置GPU

"Default" means multiple contexts are allowed per device.
"Exclusive Process" means only one context is allowed per device, usable from multiple threads at a time.
"Prohibited" means no contexts are allowed per device (no compute apps).

哪个是设置GPU以获得尽可能忠实的基准的最佳模式?

为了进行永久性设置,我应该使用什么命令?

我正在使用以下标志编译内核:

nvcc --ptxas-options=-v -O3   -w   -arch=sm_20 -use_fast_math -c -o

是否存在更好的标志组合,以便从编译器获得更多帮助以获得更快的执行时间?

任何建议将非常感谢 .

1 回答

  • 1

    我的问题与什么更合适有关?将GPU设置为计算专用模式与否 .

    无论您是将GPU设置为独占处理还是默认,只要只有一个进程尝试使用该GPU即可 .

    除了在特定情况下,您通常不希望使用独占线程,因为独占线程可能会阻止多线程GPU应用程序正常运行,并且还可能干扰其他功能,例如分析器功能 .

    为了进行永久性设置,我应该使用什么命令?

    如果您参考nvidia-smi命令行帮助( nvidia-smi --help )或nvidia-smi手册页( man nvidia-smi ),则可以确定进行更改的命令 . 您所做的任何更改都将是永久性的,直到再次明确更改为止 .

相关问题