J'adore la bibliothèque de grattage Beautiful Soup en Python. Cela fonctionne juste. Existe-t-il un équivalent proche dans Ruby?Quel est l'équivalent le plus proche de Beautiful Soup for Ruby?
Répondre
Cette page de Ruby Toolbox inclut un graphique de la popularité relative de divers parseurs.
Hpricot? Je ne sais pas ce que les autres utilisent ...
Il y a scRUBYt!, Rubyful-soup (plus maintenu), WWW::Mechanize, scrAPI et quelques autres.
Ou vous pouvez simplement utiliser Hpricot ou Nokogiri pour l'analyse.
Nokogiri est un autre analyseur HTML/XML. C'est plus rapide que hpricot selon these benchmarks. Nokogiri utilise libxml2 et remplace le hpricot. Il a aussi un support sélecteur css3 ce qui est plutôt sympa. Editer: Il y a un nouveau test de comparaison entre nokogiri, libxml-ruby, hpricot et rexml here.
Ruby Toolbox a une catégorie sur les analyseurs syntaxiques HTML here.
Mise à jour pour 2013: La page github de Hpricot indique qu'elle n'est plus maintenue et recommande Nokogiri à la place. – antinome
Belle image. Toute possibilité de le trouver et de le télécharger sur imgur? – Will