J'ai un tas de HTML, je suis en train d'analyser avec BeautifulSoup et ça se passe plutôt bien, sauf pour un hic mineur. Je veux enregistrer la sortie dans une chaîne unique doublée, avec comme ma sortie de courant:Comment faire pour supprimer des espaces dans BeautifulSoup
<li><span class="plaincharacterwrap break">
Zazzafooky but one two three!
</span></li>
<li><span class="plaincharacterwrap break">
Zazzafooky2
</span></li>
<li><span class="plaincharacterwrap break">
Zazzafooky3
</span></li>
Idéalement, je voudrais
<li><span class="plaincharacterwrap break">Zazzafooky but one two three!</span></li><li><span class="plaincharacterwrap break">Zazzafooky2</span></li>
Il y a beaucoup d'espaces redondants que je serais comme pour se débarrasser de mais il n'est pas nécessairement amovible en utilisant strip()
, je ne peux pas supprimer de manière flagrante tous les espaces parce que je dois conserver le texte. Comment puis-je le faire? Cela semble être un problème assez commun que regex serait exagéré, mais est-ce le seul moyen?
Je n'ai pas d'étiquettes <pre>
pour que je puisse être un peu plus énergique là-bas.
Merci encore une fois!
Comment allez-vous l'impression de votre sortie? – user225312
Vous pouvez faire ce que les navigateurs font: Réduire tous les espaces adjacents (dans le texte) en espaces simples. – delnan