cuda

    19La chaleur

    1Répondre

    Existe-t-il des moyens pour que je puisse avoir une fonction dans le noyau cuda? Je veux dire que mon noyau cuda devient assez long et difficile à déboguer à un moment donné. Merci.

    1La chaleur

    1Répondre

    Je suis passé par le guide de programmation CUDA et je ne peux pas comprendre la méthode d'allocation de fil indiqué ci-dessous: dim3 dimGrid(2, 2, 1); dim3 dimBlock(4, 2, 2); KernelFunction<<< dimG

    4La chaleur

    4Répondre

    Comment compiler l'application CUDA est Visual Studio 2010? Voici mes étapes: 1. Créer un projet vide C++ sans en-têtes précompilés 2. Ajouter main.cpp int main() { return 0; } Ajouter kernels.cu

    2La chaleur

    1Répondre

    Je rencontre un problème très étrange: Mu 9800GT ne semble pas calculer du tout. J'ai essayé tous les hello-mondes que j'ai trouvé sur internet, voici l'un d'eux: ce programme crée un tableau 1..100 s

    0La chaleur

    1Répondre

    disons que je veux charger un tableau de court de mémoire globale à la mémoire partagée. Je ne suis pas sûr de savoir comment fonctionne la coalescence ici. Dans le guide des meilleures pratiques, il

    3La chaleur

    1Répondre

    J'ai utilisé l'indicateur CL_MEM_ALLOC_HOST_PTR avec mes appels clCreateBuffer, mais le profileur de calcul affiche tout mon "type de transfert mem d'hôte" comme pouvant être paginé. Je l'ai essayé da

    0La chaleur

    1Répondre

    J'ai d'énormes matrices énormes et je veux que la sortie de la matrice soit de la même taille que la matrice d'entrée, juste avec chaque cellule obtenant la somme des nombres de la cellule adjacente.

    1La chaleur

    2Répondre

    Il semble évident que chaque cœur du GPU pourrait permettre la gestion d'une requête, plutôt qu'un processeur principal (la CPU du système) traitant toutes les requêtes. Sur la surface, il semble que

    0La chaleur

    1Répondre

    À la page 51 du Visual Profiler Compute Guide de l'utilisateur, il indique que: Notez que dans le cas où le nombre blocs dans un noyau est inférieur ou non nombre de multiprocesseurs multiples valeurs

    5La chaleur

    2Répondre

    J'ai utilisé Visual Studio 2008 pour compiler et exécuter des applications CUDA auparavant. Je suis passé à Visual Studio 2010 et Windows 7. J'ai essayé de mettre en place l'intégration toute la matin