Cela semble être facile, mais j'ai du mal à nettoyer le caractère de retour à la ligne dans le contenu collé à partir de Microsoft Word. Pas un saut de ligne complet, mais le caractère CTRL ENTER qui apparaît comme une flèche de retour dans Word. J'ai essayé chr(10)
, chr(13)
, \u000D
, \u000A
et quelques autres, mais je ne peux pas le faire correspondre à un string.replace(). Dois-je chercher un caractère différent ou dois-je utiliser autre chose que la méthode string.replace
?Remplacer le caractère Newline de Microsoft Word en Python
0
A
Répondre
4
Exécuter ceci:
print repr(mystringobject)
qui donnera un soupçon de caractère que vous souhaitez supprimer.
Si toujours aucune idée, collez le résultat de la commande ci-dessus dans la question, et je vais modifier ma réponse.
+0
Merci à vous et Chris. C'était \ x0b – Tom
2
vous pouvez obtenir la valeur ASCII du caractère comme celui-ci:
for c in 'string':
print ord(c), hex(ord(c))
une fois que vous connaissez le code, il devrait être facile de tuer le délinquant.
Vous voulez donner quelques exemples? – sykora
Peut être lu l'octet de texte par octet et l'ordinal d'impression de lui? pour c dans le texte: print ord (c) –