2010-07-20 9 views
1

Python Belle étiquette de soupe pour la table tdPython Belle étiquette de soupe pour la table td

<td class="result" valign="top" colspan="3"> 

À l'heure actuelle, ce qui suit ne fonctionne pas:

for header in soup('table', 'td .result'): 

Obtenir erreur:

HTMLParser.HTMLParseError: malformed start tag 
+0

Votre soupe est composée d'une page html entière, ou juste de votre ligne td? –

+0

toute sa page, avec une liste de td – bobsr

Répondre

1

Comme indiqué sur leur website, HTMLParser est quitefragile. Vous devriez plutôt utiliser SGMLParser, car il est plus robuste contre les HTML malformés.

Malheureusement, Python 3.0 a supprimé SGMLParser de la bibliothèque standard. Voir les liens ci-dessus pour des solutions de contournement suggérées, telles que l'utilisation de html5lib.