这是问题...我试图在我自己的向量容器中从主机到主机进行复制,如下面的代码所示
T* data_t = 0;
size_t msize = sizeof(T) * capacity;
checkCudaErrors( cudaHostAlloc((void**)&data_t, msize, cudaHostAllocPortable) );
msize = sizeof(T) * count;
checkCudaErrors( cudaMemcpy(data_t, data, msize, cudaMemcpyDefault) );
//data is also allocated using cudaHostAlloc with flag cudaHostAllocPortable
我能够在我的机器中使用我的机器(使用Ubuntu 10.04 64位和我的GPU GTX 590以及使用CUDA 5.0)成功编译该代码
-gencode arch = compute_20,code = sm_20 -gencode arch = compute_30,code = sm_30
但是,当我尝试运行它时,它导致cuda错误,并显示错误消息 invalid argument
Note: 使用 cudaHostAlloc
的内存分配只是临时的测试,因为我设计自己的容器,以便能够自动从主机复制到设备或主机复制到主机 .
有没有人可以帮我解决这个问题?谢谢 .
Update:
我试图使用 cudaMemcpyHostToHost
内存的副本(分配为带有标志 cudaHostAllocPortable
的固定内存)它只能达到一定的内存大小限制,在超过该限制后,副本将给出错误消息 segmentation fault .