这是问题...我试图在我自己的向量容器中从主机到主机进行复制,如下面的代码所示

T* data_t = 0;
size_t msize = sizeof(T) * capacity;
checkCudaErrors( cudaHostAlloc((void**)&data_t, msize, cudaHostAllocPortable) );

msize = sizeof(T) * count;
checkCudaErrors( cudaMemcpy(data_t, data, msize, cudaMemcpyDefault) ); 
//data is also allocated using cudaHostAlloc with flag cudaHostAllocPortable

我能够在我的机器中使用我的机器(使用Ubuntu 10.04 64位和我的GPU GTX 590以及使用CUDA 5.0)成功编译该代码

-gencode arch = compute_20,code = sm_20 -gencode arch = compute_30,code = sm_30

但是,当我尝试运行它时,它导致cuda错误,并显示错误消息 invalid argument

Note: 使用 cudaHostAlloc 的内存分配只是临时的测试,因为我设计自己的容器,以便能够自动从主机复制到设备或主机复制到主机 .

有没有人可以帮我解决这个问题?谢谢 .

Update:

我试图使用 cudaMemcpyHostToHost 内存的副本(分配为带有标志 cudaHostAllocPortable 的固定内存)它只能达到一定的内存大小限制,在超过该限制后,副本将给出错误消息 segmentation fault .