J'ai essayé de supprimer certaines données de fichiers HTML. J'ai la logique codée pour obtenir les bonnes cellules. Maintenant, je me bats pour obtenir le contenu réel de la 'cellule':Comment obtenez-vous le texte d'une 'cellule de données' HTML en utilisant BeautifulSoup
voici mon htm snip
headerRows [0] [10] .contents
[<font size="+0"><font face="serif" size="1"><b>Apples Produced</b><font size="3">
</font></font></font>]
Notez que ceci est une liste élément de Python [].
J'ai besoin de la valeur Pommes produites mais je ne peux pas y accéder.
Toutes les suggestions seraient appréciés
suggestions sur un bon livre qui explique cela gagner ma reconnaissance éternelle
Merci pour cette réponse. Cependant, il n'y a pas de réponse plus générale. Qu'advient-il si ma cellule n'a pas d'attribut gras
dire est:
[<font size="+0"><font face="serif" size="1"><I>Apples Produced</I><font size="3">
</font></font></font>]
Pommes Produit
Je suis en train d'apprendre à lire/comprendre la documentation et votre réponse aidera
J'apprécie vraiment cette aide. La meilleure chose à propos de ces réponses, c'est qu'il est beaucoup plus facile de généraliser à partir d'eux puis j'ai été en mesure de le faire à partir de la documentation BeautifulSoup. J'ai appris à programmer dans l'ère Fortran et moi pendant que j'apprécie apprendre Python et suis amzed à son pouvoir-BeautifulSoup est un exemple. faire un ensemble de la documentation est difficile pour moi.
Vive