j'utilise beautifulsoup pour analyser un site Webbeautifulsoup python ajouter des balises supplémentaires fin
request = urllib2.Request(url)
response = urllib2.urlopen(request)
soup = BeautifulSoup.BeautifulSoup(response)
Je l'utilise pour traverser une table. Le problème que je rencontre est que BS ajoute une balise de fin supplémentaire pour la table dans le HTML qui n'existe pas, que j'ai vérifié avec: print soup.prettify(). Ainsi, l'une des balises td est supprimée de la table et je ne peux pas la sélectionner.
Pouvez-vous afficher la structure essentielle du code html qui ne fonctionne pas? –
aimerait une réponse à cela aussi bien. dans mon cas, il semble que BS ajoute des tags qui ne sont * pas * dans le code source de la page. –