2010-03-29 7 views
3

La classe Browser de mechanize est géniale et sa fonction follow_link() est super aussi. Mais que faire avec ce genre de liens:Python mécanise pour suivre les liens d'image?

<a href="http://example.com"><img src="…"></a> 

Y a-t-il un moyen de suivre ces liens? L'attribut text de ce type de liens est simplement '[IMG]', donc AFAIK, il n'y a aucun moyen de différencier de tels liens. Toute aide serait appréciée.

Répondre

5

Pour suivre ces liens, vous devez ajouter paramètre nr à follow_link() méthode.
Essayez ceci:

import mechanize 
br = mechanize.Browser() 
br.open('http://www.systempuntoout.com') 
for link in br.links(): 
    print(link) 
br.follow_link(text='[IMG]', nr=0) 
print br 
>>><Browser visiting http://www.systempuntoout.com/quiz> 
br.back() 
br.follow_link(text='[IMG]', nr=1) 
>>><Browser visiting http://www.systempuntoout.com/about>