2010-07-27 16 views
0

Je veux naviguer dans mon html, en particulier, je veux obtenir la première table html qui est AFTER une forme qui ressemble à:avec beautifulsoup, comment référencer la première table après une forme donnée

<form method="POST" action="/parts.html"> 

.. 

<table ...> 
... 

</table> 

.. 

</form> 

Donc, cette table a <tr> pour chaque produit.

Mon but Utlimate est ici à boucle à travers chaque tablerow, puis je dois extraire le nom du produit, le prix, URL de l'image, etc.

Quelle devrait être ma stratégie soit, et quelles sont les méthodes dans la belle soupe devrais-je se concentrer sur?

Répondre

1
+0

mais pour obtenir le texte même de la cellule probablement de la table, je vais avoir besoin d'une regex correcte? – Blankman

+0

@Blankman: Non. Continuez à lire. Le texte est un attribut du noeud. Beautiful Soup fait tout l'analyse pour vous. Aucune regex requise. –