2009-01-23 18 views
0

J'ai un fichier texte codé en UTF-8. Je le lis pour analyser et tracer certaines données. Je voudrais que le fichier soit lu comme ascii. Serait-il préférable d'utiliser le module de codecs ou d'utiliser la méthode de décodage de chaîne intégrée? En outre, le fichier est divisé en csv, de sorte que le module csv peut également être une solution valide?Python: Utiliser le module des codecs ou utiliser le décodage de la fonction chaîne?

Merci pour votre aide.

Répondre

5

Voulez-vous dire que votre fichier est codé en UTF-8? ("Unicode" n'est pas un encodage ... Lectures obligatoires: http://www.joelonsoftware.com/articles/Unicode.html) Je ne suis pas sûr à 100% mais je pense que vous devriez être capable de lire un fichier encodé en UTF-8 avec le module csv, et vous pouvez convertir les chaînes qui contenir des caractères spéciaux pour les chaînes unicode de Python (éditer: si vous devez) après avoir lu.

Il existe quelques exemples d'utilisation de csv avec des données codées UTF-8 à http://docs.python.org./library/csv.html#csv-examples; cela pourrait vous aider à les regarder.

+0

merci pour votre aide et je voulais dire UTF-8 .... je l'ai changé dans la question. Merci encore – Nope