J'essaye d'écrire un script python qui prend en un ou deux fichiers xml et sort un ou deux nouveaux fichiers basés sur le contenu des fichiers d'entrée. J'essayais d'écrire ce script en utilisant le module minidom. Cependant, les fichiers d'entrée contiennent un certain nombre d'instances du caractère d'échappementPréservation des caractères échappés dans l'analyse XML Python
à l'intérieur des attributs de nœud. Malheureusement, dans les fichiers de sortie, ces caractères ont été convertis en caractères différents, qui semblent être des caractères de nouvelle ligne.
Par exemple, une ligne dans le fichier d'entrée tels que:
<Entry text="For English For Hearing Impaired
Press 3 on Keypad"
Serait sortie comme
<Entry text="For English For Hearing Impaired
Press 3 on Keypad"
J'ai lu que minidom cause cela, car elle ne permet pas de caractères d'échappement dans les attributs XML (je pense). Est-ce vrai? Et, si c'est le cas, quel est le meilleur outil/méthode à utiliser pour analyser un fichier xml dans un document python, manipuler des nœuds et les échanger avec d'autres documents, et renvoyer les documents dans de nouveaux fichiers?
Si ça aide, j'ai aussi analysé et sauvegardé ces fichiers en utilisant le codage 'utf-8'. Je ne sais pas si cela fait partie du problème ou non. Merci pour toute aide que quelqu'un peut vous donner.
-Alex Kaiser