如何设置专用GPU以对CUDA内核进行基准测试？-Java 学习之路

我想在linux下使用第二个GPU设备作为专用设备，以便对内核进行基准测试 .

我正在测试的内核是没有减少的SIMD计算内核而且没有X-Server连接到GPU，该设备是GeForge GTX-480所以我认为计算能力是2.因此，高级功能作为动态并行和其他人，都是残疾人 .

使用nvidia-smi实用程序可以使用各种模式来设置GPU

"Default" means multiple contexts are allowed per device.
"Exclusive Process" means only one context is allowed per device, usable from multiple threads at a time.
"Prohibited" means no contexts are allowed per device (no compute apps).

哪个是设置GPU以获得尽可能忠实的基准的最佳模式？

为了进行永久性设置，我应该使用什么命令？

我正在使用以下标志编译内核：

nvcc --ptxas-options=-v -O3   -w   -arch=sm_20 -use_fast_math -c -o

是否存在更好的标志组合，以便从编译器获得更多帮助以获得更快的执行时间？

任何建议将非常感谢 .

1 回答

1

我的问题与什么更合适有关？将GPU设置为计算专用模式与否 .

无论您是将GPU设置为独占处理还是默认，只要只有一个进程尝试使用该GPU即可 .

除了在特定情况下，您通常不希望使用独占线程，因为独占线程可能会阻止多线程GPU应用程序正常运行，并且还可能干扰其他功能，例如分析器功能 .

为了进行永久性设置，我应该使用什么命令？

如果您参考nvidia-smi命令行帮助（ nvidia-smi --help ）或nvidia-smi手册页（ man nvidia-smi ），则可以确定进行更改的命令 . 您所做的任何更改都将是永久性的，直到再次明确更改为止 .

回复于 2024-04-30T03:56:31+08:00

如何设置专用GPU以对CUDA内核进行基准测试？

1 回答

相关问题