Comment récupérer le XML brut depuis lxml?

python
xml
html-parsing
lxml

2010-10-24 16 views 4 likes

J'utilise le code suivant pour localiser un div:Comment récupérer le XML brut depuis lxml?

parser = etree.HTMLParser() 
tree = etree.parse(StringIO(page), parser) 

div = tree.xpath("//div[@class='content']")[0]

Mon seul problème est que après avoir fait cela, je ne veux pas compter sur lxml pour extraire le contenu dudit div: Je veux juste récupérer le XML brut que le div contient. Est-ce faisable ou dois-je abandonner complètement cette méthode?

Source

2010-10-24 akosch

Répondre

Je pense que vous cherchez:

etree.tostring(div)

Source

2010-10-24 00:15:27 unutbu

Vous avez raison: merci! – akosch

Avez-vous essayé tostring?

raw_xml = etree.tostring(div)

Source

2010-10-24 00:31:44

Comment récupérer le XML brut depuis lxml?

Répondre

Questions connexes