2009-07-15 18 views
0

Je souhaite calculer la somme de contrôle pour un fichier tiff volumineux qui ne tient peut-être pas en mémoire. Vais-je obtenir une valeur fiable si je calcule plutôt la somme de contrôle de chaque page et ensuite calcule la somme de contrôle du tableau des sommes de contrôle de page ou vais-je rencontrer un problème mathématique que je ne vois pas et la seule façon correcte fait travailler avec le tout?Somme de contrôle pour le document tiff multipage

Merci!

Répondre

0

Je ne sais pas si j'ai bien compris la question, mais avec la plupart des algorithmes de total de contrôle, vous n'avez qu'à charger un small part of the message to memory. En raison de cela, opérer sur les flux au lieu des emplacements de mémoire est possible et a été fait before.

Modifier:

Je ne sais que vous devez être prudent avec Adler-32 lorsque la somme de contrôle des messages courts, vous ne seriez pas couvrant tout l'espace de hachage et les faux positifs sont plus susceptibles (yest, le tableau des sommes de contrôle serait probablement un message court).

Avec les hachages crypto je ne sais pas honnêtement. Mon intuition est que md5 (msg1 + msg2 + ...) est aussi fiable que md5 (md5 (msg1) + md5 (msg2) + ...) mais nous devrons attendre quelqu'un de plus intelligent que moi pour donner une réponse définitive :)

+0

Merci pour le lien - mais à quelle distance serais-je si je calcule le chechsum des checksums de la page, au lieu de la somme de contrôle de l'ensemble du document de plusieurs pages? –