J'appelle cudaMemcpy et la copie retourne avec succès, mais les valeurs source ne sont pas copiées vers la destination. J'ai écrit une pièce similaire en utilisant memcpy() et ça marche bien. Qu'est-ce que j'oublie ici?cudaMemcpy ne parvient pas à copier les valeurs
// host externs
extern unsigned char landmask[DIMX * DIMY];
// use device constant memory for landmask
unsigned char *tempmask;
__device__ unsigned char *landmask_d;
..
void checkCUDAError(const char* msg) {
cudaError_t err = cudaGetLastError();
if (cudaSuccess != err) {
fprintf(stderr, "Cuda error: %s: %s.\n", msg, cudaGetErrorString(err));
exit(EXIT_FAILURE);
}
}
..
// try a memcpy
size_t landMemSize_t landMemSize = DIMX * DIMY * sizeof(char);
tempmask = (unsigned char*)malloc(landMemSize);
memcpy(tempmask, landmask, DIMX * DIMY);
if (landmask[0] != *tempmask) printf("FAILURE!\n");
// allocate device memory for landmask
cudaMalloc((void **)&landmask_d, landMemSize);
printf("allocating %ld Kbytes for landmask\n", landMemSize/1024);
checkCUDAError("memory allocation");
// copy landmask from host to device
cudaMemcpy(landmask_d, landmask, landMemSize, cudaMemcpyHostToDevice);
checkCUDAError("memory copy");
if (landmask[0] != *landmask_d) printf("FAILURE!\n");
Aucun des CUDAErrors signaler tout problème mais le deuxième échec est appelé ..?
se débarrasser de « __device__ » – Anycorn