J'ai du mal à essayer d'analyser ce code HTML. Il y a des h2s agissant comme des titres pour les paragraphes. Les deux sont dans des div séparés, et séparés par plus de divs. Le paragraphe n'est pas un enfant de la h2. J'aimerais les regrouper, mais je ne peux pas comprendre comment. Je pensais trouver le ferait, mais cela n'a pas fonctionné:Obtention de l'élément spécifié suivant dans lxml?
html = doc.cssselect('h2.title')
for para in html:
content = para.find('div.content')
Bienvenue sur SO! Soumettre un fragment de HTML rendra les choses plus faciles pour les personnes qui répondent à la question. –