Dans la fenêtre de calcul de Nvidia, il y a une colonne appelée "static private mem par groupe de travail" et l'info-bulle indique "Taille de la mémoire partagée statiquement allouée". bloc". Mon application montre que je reçois 64 (octets je suppose) par bloc. Est-ce que cela signifie que j'utilise quelque part entre 1-64 de ces octets ou est-ce que le profileur me dit simplement que cette quantité de mémoire partagée a été allouée et qui sait si elle a été utilisée?Taille de la mémoire partagée allouée statiquement par bloc avec Compute Prof (Cuda/OpenCL)
1
A
Répondre
1
S'il est alloué, c'est probablement parce que vous l'avez utilisé. AFAIK CUDA passe les paramètres aux noyaux via la mémoire partagée, donc ça doit être ça.