我知道CUDA内核可以通过将它们放入单独的流中来“重叠”,但我想知道在内核执行期间是否可以传输内存 . CUDA内核是异步的
您可以运行内核,从主机到设备的传输以及从设备到主机的同时传输 .
http://developer.download.nvidia.com/CUDA/training/StreamsAndConcurrencyWebinar.pdf
只是为了澄清,上述内容仅在您的设备支持时才有效 . 您可以检查它运行设备查询并检查属性并发复制和执行
2 回答
您可以运行内核,从主机到设备的传输以及从设备到主机的同时传输 .
http://developer.download.nvidia.com/CUDA/training/StreamsAndConcurrencyWebinar.pdf
只是为了澄清,上述内容仅在您的设备支持时才有效 . 您可以检查它运行设备查询并检查属性并发复制和执行