2010-10-24 16 views
4

J'utilise le code suivant pour localiser un div:Comment récupérer le XML brut depuis lxml?

parser = etree.HTMLParser() 
tree = etree.parse(StringIO(page), parser) 

div = tree.xpath("//div[@class='content']")[0] 

Mon seul problème est que après avoir fait cela, je ne veux pas compter sur lxml pour extraire le contenu dudit div: Je veux juste récupérer le XML brut que le div contient. Est-ce faisable ou dois-je abandonner complètement cette méthode?

Répondre

6

Je pense que vous cherchez:

etree.tostring(div) 
+0

Vous avez raison: merci! – akosch

2

Avez-vous essayé tostring?

raw_xml = etree.tostring(div)