2010-10-03 8 views

Répondre

0

Je recommanderais d'utiliser à la fois mécaniser et etree, mais je ne suis pas programmeur, alors ne prenez pas ma parole. Note: tout le code est en python, et est ver 2.7.1 mais devrait fonctionner jusqu'à 2.7.3.

espoir que je pourrais aider -Juste une autre Dunce

import mechanize 
import lxml.etree as etree 

url = 'something' 

br = mechanize.Browser() 
resp = br.open(url) 
parser = etree.parser() 
tree = etree.parse(resp,parser) 
forms = list(br.forms()) 
id_info = {} 
for form in forms: 
    elements = form.controls 
    for element in elements: 
     id_info[element.attrs['id']]='' 

inputs = tree.findall('.//input') 
for i in inputs: 
    index = list(i.getparent()).index(i) 
    id_info[i.attrib['id']] = list(i.getparent)[index+1] 

for j in id_info: 
    print j,id_info(j)