J'ai besoin de sérialiser certaines données dans un format binaire pour l'efficacité (datalog où les fichiers 10-100MB sont typiques), et je travaille sur les détails de mise en forme. Je me demande si, de façon réaliste, je dois me soucier de la corruption de fichiers/correction d'erreurs/etcformats de fichiers binaires: besoin de correction d'erreur?
Dans quelles circonstances la corruption de fichiers peut-elle se produire? Dois-je renforcer la robustesse à la corruption dans mon format binaire? Ou devrais-je envelopper mon flux d'octets non -obuste-à-corruption avec une sorte de code de correction d'erreur? (des suggestions? J'utilise Java) Ou devrais-je ne pas m'inquiéter à ce sujet?
edit: Le format binaire préliminaire, comme je l'ai maintenant, contient un tas de segments de longueur variable, donc je suis un peu inquiet que si jamais je corrige des données, je peux le récupérer désynchronisé, et ne peut pas récupérer + je perds le reste du fichier.
Quelle est l'importance des données? si une erreur se produit sur l'octet 1, le fichier entier est-il perdu? pouvez-vous récupérer la plupart des autres données de toute façon? – Randy
Je pense que les codes HAMMING sont une bonne option si vous avez besoin de robustesse. fwiw – Randy
Les codes HAMMING traitent des bits, et cela peut exiger beaucoup de calculs. La redondance XOR (comme dans RAID) peut être préférée. –