2010-10-21 41 views
1

J'ai un fichier de données binaires, dans un format utilisé par un programme relativement ancien, que j'essaie de convertir en quelque chose de sain. Avec l'aide d'un éditeur Hex j'ai essentiellement travaillé sur le format de fichier, sauf qu'il contient des caractères hébreux avec un codage impair.traduire le fichier de données avec l'encodage hébreu impair

Tous les caractères sont 8 bits. Les consonnes «standard» 27 (incluant les consonnes «finales») vont de l'hex 80 à 9A. Ensuite, il y a des voyelles qui semblent commencer autour de l'hex 9B ou plus (je devine juste après la fin des consonnes standard). Ensuite, il y a des consonnes "pointées" qui semblent commencer à l'hex E0. Si je me souviens bien, je pense que c'est une sorte de codage DOS. Quel encodage est-ce et quel encodage devrais-je traduire pour qu'un utilisateur en Israël soit capable de l'ouvrir plus facilement, disons Microsoft Word? Y a-t-il des outils que je pourrais utiliser pour faire la traduction?

Répondre

1

80 à 9A semblent correspondre aux codes dans le CP862, mais je n'ai pas trouvé de correspondance pour les codets de voyelle. Je pense que ce que vous devez faire est juste de faire un mappage personnalisé to Unicode et produire la sortie en UTF-8 ou UTF-16LE fichier texte brut. Si vous ajoutez une nomenclature (Byte-Order-Mark), le Bloc-notes et/ou Word devrait être capable de le lire sans problème. Je ferais probablement un petit script Python, mais ça ne devrait pas être difficile dans n'importe quelle autre langue.