2010-07-05 33 views
0

Je travaille sur un petit projet et j'ai rencontré un petit problème. Le script que j'ai doit aller chercher un site web et trouver une valeur spécifique dans le fichier HTML source. La valeur est comme ceci:Aide pour l'analyse HTML et l'envoi de demandes à un serveur Web

id='elementID'> 

<fieldset> 
    <input type='hidden' name='hash' value='e46c945fe32a3' /> 
</fieldset> 

Maintenant, je suis tenté d'utiliser la bibliothèque ElementTree pour analyser le document HTML pour trouver la valeur mais je n'ai pas eu beaucoup de succès. Je suis vraiment nouveau sur Python, donc je ne sais pas vraiment quoi faire ensuite. J'ai utilisé httplib et urllib/urllib2 pour me connecter au site Web et POST mes informations de connexion et des choses comme ça, mais je ne sais vraiment pas comment obtenir cette valeur de la page. J'ai pensé que je pourrais envoyer une demande pour l'entrée nommée 'hash' mais je n'ai aucune idée de comment faire cela.

Répondre

2

Vous pourriez envisager de regarder la bibliothèque BeautifulSoup - il est conçu pour être rapide et facile à utiliser.

+0

Merci, c'est probablement exactement ce dont j'ai besoin, mais je ne suis pas sûr de savoir comment l'utiliser. Pourriez-vous me donner quelques conseils sur la façon d'utiliser réellement BeautifulSoup pour rechercher le document HTML? –

+0

Jetez un coup d'œil à la section Démarrage rapide de la documentation: http://www.crummy.com/software/BeautifulSoup/documentation.html#Quick Start – Amber