J'essaie de travailler avec plusieurs documents qui ont tous des codages différents - certains utf-8, certains ISO-8859-2, certains ascii, etc. Y at-il un moyen fiable de décoder à un encodage standard pour le traitement?comment décoder de manière fiable divers encodages à l'encodage par défaut du système
J'ai essayé ce qui suit:
import chardet
encoding = chardet.detect(text)
text = unicode(text,encoding['encoding']).decode(sys.getdefaultencoding(),'ignore')
Avec le code ci-dessus je reçois encore des erreurs UnicodeEncodeError
Vous pouvez également jeter un coup d'œil sur [that] (http: // stackoverflow .com/questions/368805 /) question. – tzot