2010-01-29 9 views
0

Comment puis-je imprimer la source d'une page Web, spécifiée dans curl_easy_setopt, sans les balises html? Donc, en imprimant seulement le texte dans la source?Analyse de la source de page html avec libcurl et C

+4

curl est une bibliothèque d'interaction HTTP. Je ne pense pas que cela a quelque chose à voir avec l'analyse HTML. –

Répondre

3

Curl/libcurl est juste pour aller chercher la page HTML. Pour en extraire des informations, vous avez besoin d'autres outils.

La solution la plus générale consiste à utiliser un analyseur HTML. Un bon en C est HTMLparser from libxml.

+0

Ok, merci pour les conseils. –