Je suis à la recherche d'un analyseur syntaxique HTML pour gratter le HTML et extraire des données dans Ruby. J'ai eu du succès en utilisant BeautifulSoup pour ça - quel est l'équivalent de ruby?Quel est l'équivalent de ruby de la bibliothèque python BeautifulSoup?
4
A
Répondre
6
Voir aussi: Nokogiri vs Hpricot avant de faire un choix. Nokogiri semble surpasser les performances hpricot (je ne me suis pas référencé) et possède une belle syntaxe IMO.
0
Il y avait un gem Rubyful Soup, qui était un port Ruby de BeautifulSoup, mais il n'est plus maintenu et leur site recommande maintenant hpricot.
Merci. J'ai utilisé Nokogiri et c'était suffisant pour mes objectifs. Je pense que le HTML que j'ai traversé était bien formé, donc j'ai recherché comment il est tolérant aux fautes. –
Mise à jour pour 2013: le readme Hpricot sur github indique qu'il n'est plus maintenu et recommande Nokogiri à la place. – antinome