Chers Cuda chercheurs,
Vous recherchez une solution pour le problème ci-dessousConversion Cuda Array1 de Typename1 à LeTableau2 de Typename2
a) j'ai deux tableaux 1) array1 de taille1 qui est de typename1 2) array2 de taille1 qui est de typename2
b) Je suis désireux d'écrire un noyau du prototype suivant
__global__ kernel(void* dest, void* src, int dest_sizeoftype, int src_sizeoftype, int num_array_elts);
c) Supposons que je crée des threads cuda num_array_elts, chaque thread copiant son elt de src à destination.
Problème: a) L'endroit où je suis bloqué est la fonction à utiliser pour copier num_bytes de src vers dest dans le noyau.
vous remerciant à l'avance Cordialement, Nagaraju
Parfois cuda ne supporte pas le double, puis-je l'utiliser aussi pour le double? Si src est double et dst est court, c'est le scénario ... Merci. – Naga
Le code ci-dessus fonctionnera pour les doubles si le périphérique CUDA les prend en charge. En principe, vous pouvez convertir des doubles en shorts sur des appareils antérieurs (Compute Capability 1.0 et 1.1), mais cela serait difficile et fastidieux. – wnbell