J'essaie d'optimiser une partie de l'arithmétique en utilisant les jeux d'instructions MMX et SSE avec l'assemblage en ligne. Cependant, j'ai été incapable de trouver de bonnes références pour les temps et les utilisations de ces ensembles d'instructions améliorés. Pourriez-vous m'aider s'il vous plaît à trouver des références qui contiennent des informations sur le débit, la latence, les opérandes, et peut-être de courtes descriptions des instructions?Référence d'instruction concise SSE et MMX avec des latences et un débit
, j'ai trouvé jusqu'à présent:
Intel Instruction Références Intel 64 and IA-32 Architectures Developer's Manual: Vol. 2A et Intel 64 and IA-32 Architectures Developer's Manual: Vol. 2B
Intel Guide d'optimisation http://www.intel.com/Assets/PDF/manual/248966.pdf
Les synchronisations des opérations entières http://gmplib.org/~tege/x86-timing.pdf
Le guide Agner est génial. Exactement ce dont j'ai besoin. – Joe