J'écris le programme matlab (cuda) pour générer la clé. Comment optimiser le programme cuda pour obtenir de meilleures performances?comment optimiser le programme cuda pour obtenir de meilleures performances?
Répondre
Vous avez besoin de passer du temps à apprendre les outils de programmation CUDA et l'architecture. Il y a beaucoup de bonnes informations au developer.nvidia.com et ils ont des forums actifs et utiles là pour les développeurs CUDA - un excellent endroit pour que noobs se familiarise avec le développement de CUDA.
Il y a une tonne de matériel de formation sur le NVIDIA website, la caisse spécifiquement le training page et inscrivez-vous pour au moins l'un des online seminars libres (sessions pré-enregistrées disponibles, même lien).
Une fois que vous avez commencé, postez du code sur le NVIDIA CUDA forums ou ici sur StackOverflow et la communauté vous aidera, mais vous aurez besoin de questions plus spécifiques pour obtenir des réponses plus précises!
- Tout d'abord, en utilisant une combinaison d'accès de mémoire algorithme parallèle
- Tune (coalesce lit, etc)
- utiliser des textures, la mémoire partagée
- occupation Tune de noyau (vérifier cuda feuille de calcul Excel)
- utiliser les flux
Vous devriez lire le guide de programmation et les meilleures pratiques. Les gemmes de programmation sont également très bonnes.
Si vous avez fourni plus de détails, il pourrait être plus facile de répondre à la question. –
Je pense que cette question est très floue – shuvalov