J'essaie d'extraire la méta-description pour les pages Web récupérées. Mais ici, je suis confronté au problème de la sensibilité à la casse de BeautifulSoup. Comme certaines pages ont <meta name="Description
et certaines ont <meta name="description
.Est-il possible que BeautifulSoup fonctionne de manière insensible à la casse?
Mon problème est très similaire à celle de Question on Stackoverflow
La seule différence est que je ne peux pas utiliser lxml .. Je dois rester avec beautifulsoup.
+1 pour éviter l'expression rationnelle. +1 de plus pour le lien xkcd. – FlipMcF
En utilisant bs4 j'obtiens "find_all() a plusieurs valeurs pour l'argument mot-clé 'nom'" avec ceci: / – Joaolvcm