Quelqu'un a-t-il un exemple de code qui illustre comment utiliser Beautiful Soup de Python pour supprimer toutes les balises html, sauf certaines, d'une chaîne de texte?Utilisation de Beautiful Soup pour supprimer les balises html d'une chaîne
Je veux dépouiller tous les javascript et les balises HTML tout sauf:
<a></a>
<b></b>
<i></i>
Et aussi des choses comme:
<a onclick=""></a>
Merci de nous aider - je ne pouvais pas trouver beaucoup sur Internet pour Cet objectif.
Merci - un moyen de supprimer le onclick = « » – ensnare
add « tag.attrs = [ ] 'avant d'imprimer pour supprimer tous les attributs. Si vous avez besoin de plus de contrôle, tag.attrs est juste une liste de paires (nom, valeur) avec lesquelles vous pouvez jouer quand vous en avez besoin. – Spacedman
Hey, c'était vraiment utile, merci beaucoup. – ensnare